百科 | 第167页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

个性化图像生成新方法InstantFamily：在零样本的情况下，根据多个身份标识（Multi-ID）生成个性化的图像

韩国SK电信推出个性化图像生成新方法InstantFamily，它能够在零样本（zero-shot）的情况下，根据多个身份标识（Multi-ID）生成个性化的图像。这项技术特别适用于创建包含多个人物的...

新技术 # InstantFamily # 个性化图像生成

2年前

06000

图像编辑技术Paint by Inpaint：根据文本指令在图像中添加对象，而无需用户提供输入遮罩

来自魏茨曼科学研究所和以色列理工学院的研究人员推出一种新颖的图像编辑技术Paint by Inpaint，它能够根据文本指令在图像中添加对象，而无需用户提供输入遮罩（mask）。这项技术的核心在于利用...

新技术 # Paint by Inpaint # 图像编辑

2年前

07510

新型3D重建模型GS-LRM：能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

Adobe和康奈尔大学的研究人员推出新型3D重建模型GS-LRM（Gaussian Splatting Large Reconstruction Model），这个模型能够从少数几张2D图像中快速...

新技术 # 3D重建模型 # GS-LRM

2年前

06030

3D图像渲染技术SAGS：改进现有的3D图像渲染方法，以实现更高质量的图像渲染，同时减少所需的计算资源和存储空间

来自伦敦帝国理工学院和华为诺亚方舟实验室的研究人员推出新的3D图像渲染技术SAGS（Structure-Aware 3D Gaussian Splatting），这项技术旨在改进现有的3D图像渲染方法...

新技术 # 3D图像渲染 # SAGS

2年前

08870

英伟达推出VFC：用于生成高保真、详细图像和3D对象标题的强大工具

英伟达推出VFC（Visual Fact Checker），它是一个用于生成高保真、详细图像和3D对象标题的强大工具。简单来说，VFC就像一个能够精确描述图片内容的智能助手，无论是2D的平面图像还是3...

新技术 # VFC

2年前

05580

新型3D生成算法MicroDreamer：能够在大约20秒内生成高质量的3D模型，而无需任何3D数据

来自中国人民大学、清华大学和快手的研究人员推出新型3D生成算法MicroDreamer，它能够在大约20秒内生成高质量的3D模型，而无需任何3D数据。这项技术基于一种称为“基于分数的迭代重建”（Sco...

新技术 # 3D生成算法 # MicroDreamer

2年前

07780

3D场景生成技术Invisible Stitch：生成平滑且连贯的3D场景，通过深度修复来改善场景的几何一致性

牛津大学的研究人员推出一种新的3D场景生成技术Invisible Stitch，这项技术的目标是生成平滑且连贯的3D场景，特别是通过深度修复（depth inpainting）来改善场景的几何一致性...

新技术 # 3D场景生成 # Invisible Stitch

2年前

05160

运动潜在一致性模型MotionLCM：能够实时控制人体动作的生成

来自清华大学和上海人工智能实验室的研究人员推出运动潜在一致性模型MotionLCM，它能够实时控制人体动作的生成。这个框架通过一种称为“潜在一致性模型”（Motion Latent Consisten...

新技术 # MotionLCM # 运动潜在一致性模型

2年前

06130

新型框架Lightplane：用于处理3D神经场的高度可扩展的组件

密歇根大学和Meta的研究人员推出新型框架Lightplane，它包含两个高度可扩展的组件：Lightplane Renderer和Lightplane Splatter。这两个组件专门用于处理3D神...

新技术 # 3D场景模型 # Lightplane # Lightplane Renderer

2年前

06590

MaPa：根据文本描述为3D模型生成逼真的材质

来自浙江大学、蚂蚁集团和深圳大学的研究人员推出MaPa，它能够根据文本描述为3D模型生成逼真的材质。与传统的纹理贴图不同，MaPa通过生成程序化的材质图（material graphs）来表示3D模型...

新技术 # 3D模型 # MaPa

2年前

08530

视觉模型PLLaVA：能够理解视频中的内容，包括动作、场景、人物穿着等，并能够生成详细描述这些内容的字幕

来自新加坡国立大学、纽约大学和字节跳动的研究人员推出用于视频密集字幕生成的先进模型PLLaVA（Pooling LLaVA），此模型的主要功能是能够理解视频中的内容，包括动作、场景、人物穿着等，并能够...

新技术 # PLLaVA # 视觉模型

2年前

05000

通用反馈学习架构ID-Aligner：用于提升文本到图像生成任务中的身份保持性能

来自中山大学和字节跳动的研究人员推出通用反馈学习架构ID-Aligner，它用于提升文本到图像生成（Text-to-Image Generation）任务中的身份保持（Identity-Preserv...

新技术 # ID-Aligner # 人物特征 # 文生图

2年前

07830

加载更多

百科