新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

FlexiDreamer：从单张图片生成三维（3D）模型

来自中国科学院大学、清华大学、西安电子科技大学和生数科技的研究人员推出FlexiDreamer，它能够从单张图片生成三维（3D）模型。项目主页 GitHub 例如，你有一张你喜欢的动漫角色的照片，F...

新技术 # 3D生成模型 # FlexiDreamer

2年前

05890

图像复制检测模型ICDiff：解决扩散模型生成图像的版权和原创性问题

悉尼科技大学、百度和浙江大学的研究人员推出图像复制检测模型ICDiff，这是第一个专门针对扩散模型的ICD（图像复制检测）。为此，研究人员构建了一个扩散-复制（D-Rep）数据集，并相应地提出了一种新...

新技术 # ICDiff # PDF-Embedding # 图像复制检测

1年前

05870

统一Transformer模型Show-o：同时处理多模态理解（如图像和文本）和生成任务

新加坡国立大学和字节跳动的研究人员推出一种统一的Transformer模型Show-o，，它统一了多模态的理解和生成。不同于完全自回归模型，Show-o结合了自回归和（离散）扩散建模，以自适应地处理各...

新技术 # Show-o # Transformer模型

2年前

05870

苹果推出新型图像生成模型Kaleido Diffusion：通过整合自回归的潜在先验来增强采样的图像多样性

苹果和弗吉尼亚理工大学的研究人员推出新型图像生成模型Kaleido Diffusion，此模型旨在通过自回归潜在模型（autoregressive latent modeling）提高扩散模型（dif...

新技术 # Kaleido Diffusion # 图像生成模型 # 苹果

2年前

05860

Media2Face：集成多种媒体输入（音频、图像和文本）生成同步的面部动画和头部姿势

来自上海科技大学、影眸科技、香港大学和叠境数字科技的研究人员提出一个基于扩散的生成模型Media2Face，它能够根据语音信号和多模态条件（如文本、图像）生成同步的面部动画和头部姿势。项目主页 Me...

新技术 # Media2Face

2年前

05860

字节推出TextToon：在实时环境中将真人的头像转换成卡通化的形象

罗切斯特大学和字节跳动的研究人员推出TextToon，它能够在实时环境中将真人的头像转换成卡通化的形象。就像魔法一样，这项技术可以把你从视频中的头像变成你想要的任何卡通风格，比如美国漫画风格、皮克斯动...

新技术 # TextToon # 字节跳动

1年前

05850

英伟达推出LATTE3D：快速生成3D模型

英伟达推出新型大规模文本到3D合成系统LATTE3D，LATTE3D的关键在于构建可扩展的架构，并利用3D数据在优化过程中引入3D感知扩散先验、形状正则化和模型初始化，以确保对不同和复杂的训练提示具有...

新技术 # 3D模型 # LATTE3D

2年前

05850

OPPO推出多步潜在一致性模型MLCM：用于加速生成图像

OPPO推出多步潜在一致性模型MLCM，它用于加速生成图像的潜在扩散模型（LDMs）。简而言之，MLCM能够快速生成高质量的图像，同时保持较低的计算成本。MLCM仅需2-8步采样即可生成高质量、令人愉...

新技术 # MLCM # OPPO # 多步潜在一致性模型

2年前

05840

新型视频扩散模型StreamV2V：实现实时的视频到视频转换

德克萨斯大学奥斯汀分校和加州大学伯克利分校的研究人员推出新型视频扩散模型StreamV2V，它能够实现实时的视频到视频（Video-to-Video，简称V2V）翻译。这项技术允许用户通过提示（pro...

新技术 # StreamV2V # 视频扩散模型

2年前

05840

多模态问答系统Lumos：结合场景文本识别和多模态大语言模型

来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos，这是一个结合了场景文本识别（Scene Text Recognition, STR）和多模态大语言模型（Multimod...

新技术 # Lumos # 场景文本识别 # 多模态大语言模型

2年前

05840

FaceChain-SuDe：提高个性化图像生成的属性相关性

来自北京大学、阿里巴巴、清华大学和鹏程实验室的研究团队推出FaceChain-SuDe，这是一种用于个性化文本到图像生成的方法，旨在提高个性化图像生成（subject-driven generatio...

新技术 # FaceChain-SuDe # 个性化图像生成

2年前

05830

个性化图像生成RealCustom：理解你的描述，并生成符合你要求的个性化图像

来自中科大、字节跳动的研究人员推出新型文本到图像定制方法RealCustom。这种方法的目标是为给定的主题生成受文本驱动的图像，这在内容创作领域具有革命性的意义。项目主页论文地址想象一下，你想要...

新技术 # RealCustom # 个性化图像生成

2年前

05830

加载更多

FlexiDreamer：从单张图片生成三维（3D）模型

图像复制检测模型ICDiff：解决扩散模型生成图像的版权和原创性问题

统一Transformer模型Show-o：同时处理多模态理解（如图像和文本）和生成任务

苹果推出新型图像生成模型Kaleido Diffusion：通过整合自回归的潜在先验来增强采样的图像多样性

Media2Face：集成多种媒体输入（音频、图像和文本）生成同步的面部动画和头部姿势

字节推出TextToon：在实时环境中将真人的头像转换成卡通化的形象

英伟达推出LATTE3D：快速生成3D模型

OPPO推出多步潜在一致性模型MLCM：用于加速生成图像

新型视频扩散模型StreamV2V：实现实时的视频到视频转换

多模态问答系统Lumos：结合场景文本识别和多模态大语言模型

FaceChain-SuDe：提高个性化图像生成的属性相关性

个性化图像生成RealCustom：理解你的描述，并生成符合你要求的个性化图像

S.H.I.T

新悟空

ArkClaw

Joker of Academics（小丑学术期刊）

QClaw

新360 安全龙虾

新技术

网址

S.H.I.T

新悟空

ArkClaw

Joker of Academics（小丑学术期刊 ）

QClaw

新360 安全龙虾

Joker of Academics（小丑学术期刊）