Gemini 高级版新增聊天记录功能,提升个性化体验从今天起,Gemini 高级版订阅用户将获得一项新功能:聊天记录记忆。这项功能允许 Gemini 聊天机器人在生成回复时利用之前的交互信息,从而提供更准确、更有针对性的答案。这意味着用户不再需要从头开...早报# Gemini# 记忆# 谷歌10个月前04600
音乐生成系统Seed-Music:能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容字节跳动旗下豆包团队推出音乐生成系统Seed-Music,能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容。Seed-Music结合了自回归语言建模和扩散方法,支持两种关键的音...新技术# Seed-Music# 音乐生成1年前04600
新型文本到图像生成方法FRAP:基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型文本到图像生成方法FRAP,旨在提高由文本提示生成图像的真实性和忠实度,确保生成的图像与文本描述的内容精确匹配。F...新技术# FRAP# 文生图1年前04600
微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程新加坡国立大学和微软研究院的研究团队提出了一种全新的扩散采样策略——区域自适应采样 (Region-Adaptive Sampling, RAS)。这是首个允许采样率在图像不同区域间动态变化的扩散采样...新技术# RAS# 区域自适应采样# 微软研究院10个月前04590
Fluid: 基于连续令牌和随机顺序生成的文生图模型在视觉领域,自回归模型的扩展并没有像在大语言模型中那样取得显著的成功。为了探索这一问题,Google DeepMind 和麻省理工学院的研究人员进行了一项研究,重点探讨了两个关键因素:模型是使用离散还...新技术# Fluid:# 文生图模型1年前04580
3D生成框架ComboVerse:从单张图片中生成复杂的三维资产来自南洋理工大学、上海人工智能实验室和香港中文大学的研究团队推出3D生成框架ComboVerse,它能够从单张图片中生成复杂的三维资产。 项目主页 首先,从模型和数据两个维度对“多物体差距”进行了深入...新技术# 3D# ComboVerse2年前04580
谷歌nano-banana模型落地在即:Flow将添文本转图像功能,同步优化创作者工作流随着谷歌nano-banana模型的发布预期逐渐升温,其生态落地布局也在稳步推进——这款模型不仅计划集成到Gemini、Whisk等现有工具中,最新迹象显示,它还将登陆创意平台Flow,为其带来全新的...早报# nano-banana# 谷歌4个月前04570
RF-Solver和RF-Edit:提高校正流模型在图像和视频编辑中的反演精度基于校正流的DiT模型,如FLUX和OpenSora,在图像和视频生成领域展示了卓越的性能。然而,这些模型在反演过程中存在不准确的问题,这限制了它们在图像和视频编辑等下游任务中的有效性。为了解决这一问...新技术# RF-Edit# RF-Solver1年前04570
新型条件图像生成模型BiGR:不仅能创作出高质量的图像,还能理解和识别图像中的内容香港大学、香港科技大学、云天励飞和香港中文大学的研究人员介绍了一种名为BiGR(Binary Generative Representation)的新型条件图像生成模型。BiGR 使用紧凑的二进制潜在...新技术# BiGR# 条件图像生成模型1年前04540
半策略偏好优化方法SePPO:用于优化和微调文生图模型,使其更好地符合人类的审美和偏好罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO,用于优化和微调扩散模型(如用于生成图像的模型),使其更好地符合人类的审美和偏好,而无需依赖外...新技术# SePPO# 半策略偏好优化# 文生图模型1年前04540
图像编辑方法Click2Mask:通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述耶路撒冷希伯来大学的研究人员推出图像编辑方法Click2Mask,它能够让用户通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述。总的来说,Click2Mask提供了一种直观且高效的...新技术# Click2Mask# 图像编辑1年前04530
Compress3D:从单张图片生成三维模型来自西安交通大学的研究团队推出Compress3D,它是一种从单张图片生成三维模型的方法。想象一下,你有一张你最喜欢的动漫角色的图片,你想在虚拟现实游戏中使用这个角色的三维模型。传统上,这需要3D艺术...新技术# Compress3D# 三维模型2年前04530