视频插值方法ViBiDSampler:专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果韩国科学技术研究院推出视频插值方法ViBiDSampler,这种方法专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果。ViBiDSampler引入了一种新颖的双向采样策略,以...新技术# ViBiDSampler# 视频插值方法1年前04220
新型视频生成模型Factorized-Dreamer:用于将文本转换成高质量的视频字节跳动和香港理工大学的研究人员推出新型视频生成模型Factorized-Dreamer,它专门用于将文本转换成高质量的视频(Text-to-Video, T2V)。Factorized-Dreame...新技术# Factorized-Dreamer# 视频生成模型1年前04220
BLIP3-KALE:包含2.18亿个图像-文本对的数据集华盛顿大学、Salesforce Research、斯坦福大学和加州大学伯克利分校推出一个包含2.18亿个图像-文本对的数据集BLIP3-KALE,它弥合了描述性合成字幕和网络规模的事实性替代文本之间...新技术# BLIP3-KALE# 数据集1年前04200
新型图像生成技术“集合自回归模型”(SAR):通过改变图像生成的顺序和方式,使得生成图像的速度和灵活性都得到了极大的提升香港中文大学MMLab 、上海人工智能实验室和南京大学的研究人员推出一种新的图像生成技术“集合自回归模型”(Set AutoRegressive Modeling,简称SAR)。你可以把它想象成一个超...新技术# SAR# 图像生成# 集合自回归模型1年前04200
3D纹理生成框架MVPaint:根据文本指令自动生成高分辨率、无缝的3D纹理腾讯PCG、上海人工智能实验室、南洋理工大学S-Lab和清华大学的研究人员推出3D纹理生成框架MVPaint,它能够根据文本指令自动生成高分辨率、无缝的3D纹理。MVPaint通过同步多视图扩散模型来...新技术# 3D纹理生成# MVPaint1年前04190
新型多模态大语言模型PUMA:不仅能理解文本指令,还能根据这些指令创作出精细的图像,或者对现有图像进行精确的编辑近年来,多模态基础模型在视觉-语言理解领域取得了显著进展,同时也开始探索多模态大语言模型(MLLMs)在视觉内容生成方面的潜力。然而,现有的工作在统一MLLM范式中处理不同图像生成任务的多样化粒度需求...百科# PUMA# 多模态大语言模型1年前04180
新型文本到图像的扩散模型优化方法迭代对象计数优化:准确地生成指定数量的对象特拉维夫大学和巴伊兰大学的研究人员推出一种新的文本到图像的扩散模型优化方法,这个方法被称为“迭代对象计数优化”(Iterative Object Count Optimization)。这个方法主要解...新技术# 迭代对象计数优化1年前04180
谷歌推出基于 Gemini 的新文本嵌入模型Gemini Embedding谷歌于周五在其 Gemini 开发者 API 中添加了一款新的实验性文本“嵌入”模型——Gemini Embedding。这款新型嵌入模型旨在将文本输入(如单词和短语)转化为数值表示,即嵌入(embe...早报# Gemini# Gemini Embedding# 文本嵌入模型10个月前04170
辅导作业逼疯了多少家长?AI教育助手VideoTutor帮你轻松搞定家里有中小学生的家长一定深有体会:孩子的日常学习辅导是个难题。 不是不想帮,而是很多时候我们自己也讲不明白,或者讲了孩子听不懂。面对一道数学题,常常是越辅导越崩溃。 在这样的背景下,AI 技术的进步确...教程# VideoTutor# 教育助手7个月前04160
Liblib AI推出基于 ControlNet 框架RepText:实现中文文本的准确生成在当今的文本到图像生成领域,尽管模型在生成视觉上吸引人的图像方面取得了显著进步,但在处理精确且灵活的排版元素时,尤其是对于非拉丁字母,仍然存在明显的局限性。这种局限性主要源于文本编码器在处理多语言输入...新技术# controlnet# Liblib AI# RepText8个月前04160
微软生成式AI模型WHAMM,让你现在可以在浏览器中玩实时AI渲染的《雷神之锤2》微软昨天推出了一项令人瞩目的技术——WHAMM(World and Human Action MaskGIT Model),这是一个专门用于实时游戏的生成式AI模型。为了展示其强大功能,微软选择了28...早报# WHAMM# 微软# 雷神之锤29个月前04160
微软旗下的AI编程助手GitHub Copilot引入新限制,对高级AI模型的使用收费微软旗下的AI编程助手GitHub Copilot,正在引入新的限制措施,并对高级AI模型的使用收费。这一变化可能会让部分用户感到意外,但也反映了AI模型计算成本上升的现实。 新限制与收费细节 1. ...早报# GitHub Copilot# 微软9个月前04150