新型多概念个性化方法TokenVerse:通过预训练的DiT架构文生图模型实现从单张或多张图像中提取复杂视觉概念,并支持无缝组合这些概念以生成新的图像 谷歌 DeepMind、特拉维夫大学、以色列理工学院和魏茨曼研究所的研究人员推出新型多概念个性化方法TokenVerse,旨在通过预训练的DiT架构文生图模型实现从单张或多张图像中提取复杂视觉概念,并... 新技术# TokenVerse 4周前0740
多智能体协作框架 FILMAGENT:通过大语言模型实现虚拟 3D 空间中的端到端电影自动化制作 哈尔滨工业大学(深圳)和清华大学的研究人员推出多智能体协作框架 FILMAGENT,旨在通过大语言模型(LLMs)实现虚拟 3D 空间中的端到端电影自动化制作。该框架模拟了电影制作中的各种角色(如导演... 新技术# FILMAGENT# 电影 4周前0690
字节跳动推出新型身份保持视频生成方法EchoVideo 字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份... 新技术# EchoVideo# 视频生成 4周前0640
1Prompt1Story:解决文生图模型生成中的一致性问题 南开大学、巴塞罗那自治大学计算机视觉中心、穆罕默德·本·扎耶德人工智能大学,林雪平大学和软银的研究人员推出1Prompt1Story,旨在解决文本到图像(Text-to-Image,T2I)生成中的一... 新技术# 1Prompt1Story 4周前0600
基于扩散模型的视频修复方法DiffuEraser:分解视频修复任务为子问题并给出解决方案 阿里巴巴通义实验室的研究人员推出一种基于扩散模型的视频修复方法DiffuEraser,能够生成更详细、更连贯的结构,并通过引入先验信息和优化时间一致性来提升性能。比如,在一段视频中,如果某个物体被意外... 新技术# DiffuEraser# 视频修复 4周前0690
思维链推理策略在自回归图像生成中的应用潜力 香港中文大学、北京大学和上海人工智能实验室的研究人员探索思维链(Chain-of-Thought, CoT)推理策略在自回归图像生成中的应用潜力。思维链是一种通过逐步分解复杂问题来解决问题的策略,在语... 新技术# 思维链 4周前0550
基于扩散模型的新型零样本人像视频动画生成技术X-Dyna 南加州大学、字节跳动公司、斯坦福大学、加州大学洛杉矶分校和加州大学圣地亚哥分校的研究团队推出一种新型的零样本(zero-shot)人像视频动画生成技术X-Dyna,基于扩散模型(diffusion-b... 新技术# X-Dyna# 人像视频动画 1个月前01100
Textoon:基于文本描述生成Live2D格式2D卡通角色的创新方法 在数字角色创作领域,2D卡通风格因其独特的魅力而深受年轻观众的喜爱。尽管3D角色研究取得了显著进展,但交互式2D卡通角色的发展却显得相对滞后。为了解决这一问题,阿里巴巴通义实验室推出了Textoon,... 新技术# Live2D# Textoon 1个月前0910
NeuralSVG:用于从文本提示生成矢量图形 特拉维夫大学和麻省理工学院的研究人员推出了一种名为 NeuralSVG 的新方法,用于从文本提示生成矢量图形(SVG)。该方法通过隐式神经表示(NeRFs)和分数蒸馏采样(SDS)技术,生成具有层次结... 新技术# NeuralSVG 1个月前0970
micro_diffusion :一种低成本训练文生图模型的方法 索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像(Text-to-Image, T2I)扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”(defe... 新技术# micro_diffusion# 文生图模型 1个月前0900
实时动画生成系统RAIN:能够使用单个 RTX 4090实时生成无限长的视频流 中国科技大学的研究人员推出实时动画生成系统RAIN,能够使用单个 RTX 4090实时生成无限长的视频流。该系统的核心目标是解决现有扩散模型在实时动画生成中的局限性,例如延迟高、视觉质量下降以及无法长... 新技术# RAIN# 动画生成 1个月前0720
新型虚拟试穿方法MN-VTON:通过单个生成网络实现高质量的虚拟试穿效果,挑战了当前依赖双网络范式的主流方法 虚拟试穿(VTON)作为电子商务领域的一项关键技术,能够帮助消费者真实地预览服装在自己身上的效果。然而,早期的VTON技术受限于单一生成网络,在保留细粒度的服装细节方面存在不足。为了解决这个问题,研究... 新技术# MN-VTON# 虚拟试衣 1个月前0850