FlexiDreamer:从单张图片生成三维(3D)模型来自中国科学院大学、清华大学、西安电子科技大学和生数科技的研究人员推出FlexiDreamer,它能够从单张图片生成三维(3D)模型。 项目主页 GitHub 例如,你有一张你喜欢的动漫角色的照片,F...新技术# 3D生成模型# FlexiDreamer2年前05890
图像复制检测模型ICDiff:解决扩散模型生成图像的版权和原创性问题悉尼科技大学、百度和浙江大学的研究人员推出图像复制检测模型ICDiff,这是第一个专门针对扩散模型的ICD(图像复制检测)。为此,研究人员构建了一个扩散-复制(D-Rep)数据集,并相应地提出了一种新...新技术# ICDiff# PDF-Embedding# 图像复制检测1年前05870
统一Transformer模型Show-o:同时处理多模态理解(如图像和文本)和生成任务新加坡国立大学和字节跳动的研究人员推出一种统一的Transformer模型Show-o,,它统一了多模态的理解和生成。不同于完全自回归模型,Show-o结合了自回归和(离散)扩散建模,以自适应地处理各...新技术# Show-o# Transformer模型2年前05870
苹果推出新型图像生成模型Kaleido Diffusion:通过整合自回归的潜在先验来增强采样的图像多样性苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion,此模型旨在通过自回归潜在模型(autoregressive latent modeling)提高扩散模型(dif...新技术# Kaleido Diffusion# 图像生成模型# 苹果2年前05860
Media2Face:集成多种媒体输入(音频、图像和文本)生成同步的面部动画和头部姿势来自上海科技大学、影眸科技、香港大学和叠境数字科技的研究人员提出一个基于扩散的生成模型Media2Face,它能够根据语音信号和多模态条件(如文本、图像)生成同步的面部动画和头部姿势。 项目主页 Me...新技术# Media2Face2年前05860
字节推出TextToon:在实时环境中将真人的头像转换成卡通化的形象罗切斯特大学和字节跳动的研究人员推出TextToon,它能够在实时环境中将真人的头像转换成卡通化的形象。就像魔法一样,这项技术可以把你从视频中的头像变成你想要的任何卡通风格,比如美国漫画风格、皮克斯动...新技术# TextToon# 字节跳动1年前05850
英伟达推出LATTE3D:快速生成3D模型英伟达推出新型大规模文本到3D合成系统LATTE3D,LATTE3D的关键在于构建可扩展的架构,并利用3D数据在优化过程中引入3D感知扩散先验、形状正则化和模型初始化,以确保对不同和复杂的训练提示具有...新技术# 3D模型# LATTE3D2年前05850
OPPO推出多步潜在一致性模型MLCM:用于加速生成图像OPPO推出多步潜在一致性模型MLCM,它用于加速生成图像的潜在扩散模型(LDMs)。简而言之,MLCM能够快速生成高质量的图像,同时保持较低的计算成本。MLCM仅需2-8步采样即可生成高质量、令人愉...新技术# MLCM# OPPO# 多步潜在一致性模型2年前05840
新型视频扩散模型StreamV2V:实现实时的视频到视频转换德克萨斯大学奥斯汀分校和加州大学伯克利分校的研究人员推出新型视频扩散模型StreamV2V,它能够实现实时的视频到视频(Video-to-Video,简称V2V)翻译。这项技术允许用户通过提示(pro...新技术# StreamV2V# 视频扩散模型2年前05840
多模态问答系统Lumos:结合场景文本识别和多模态大语言模型来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景文本识别(Scene Text Recognition, STR)和多模态大语言模型(Multimod...新技术# Lumos# 场景文本识别# 多模态大语言模型2年前05840
FaceChain-SuDe:提高个性化图像生成的属性相关性来自北京大学、阿里巴巴、清华大学和鹏程实验室的研究团队推出FaceChain-SuDe,这是一种用于个性化文本到图像生成的方法,旨在提高个性化图像生成(subject-driven generatio...新技术# FaceChain-SuDe# 个性化图像生成2年前05830
个性化图像生成RealCustom:理解你的描述,并生成符合你要求的个性化图像来自中科大、字节跳动的研究人员推出新型文本到图像定制方法RealCustom。这种方法的目标是为给定的主题生成受文本驱动的图像,这在内容创作领域具有革命性的意义。 项目主页 论文地址 想象一下,你想要...新技术# RealCustom# 个性化图像生成2年前05830