新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

3D感知图像对齐技术3D Congealing：用于处理捕捉语义相似对象的2D图像集合

来自斯坦福大学、谷歌研究、图宾根大学和Stability AI的研究人员推出3D Congealing，这是一种新颖的3D感知图像对齐技术，用于处理捕捉语义相似对象的2D图像集合。项目主页论文简...

新技术 # 3D Congealing

2年前

04570

条件感知神经网络CAN：用于在图像生成模型中添加控制

来自麻省理工学院、清华大学和英伟达的研究人员推出一种条件感知神经网络（CAN），用于在图像生成模型中添加控制，它通过动态调整神经网络的权重来实现对生成图像的控制。论文 GitHub 与之前的条件控制...

新技术 # CAN # 条件感知神经网络

2年前

07030

FlexiDreamer：从单张图片生成三维（3D）模型

来自中国科学院大学、清华大学、西安电子科技大学和生数科技的研究人员推出FlexiDreamer，它能够从单张图片生成三维（3D）模型。项目主页 GitHub 例如，你有一张你喜欢的动漫角色的照片，F...

新技术 # 3D生成模型 # FlexiDreamer

2年前

05890

SPRIGHT T2I：改进文生图模型在生成图像时保持空间一致性的能力

来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I，探讨如何改进文生图（Text-to-Image，简称T2I）模型在生成图像时保持空间一致性...

新技术 # SPRIGHT T2I # 文生图模型

2年前

09230

新型视图合成技术InstantSplat：在极短的时间内（大约40秒）从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

来自德克萨斯大学奥斯汀分校、英伟达、厦门大学、佐治亚理工学院、斯坦福大学和南加州大学推出新型视图合成技术InstantSplat，它能够在极短的时间内（大约40秒）从稀疏的、没有相机姿态信息的图像中重...

新技术 # 3D场景 # InstantSplat

2年前

01,1020

基于身份条件的人脸基础模型Arc2Face：能够根据一个人的面部特征生成高质量的、逼真的图像

来自英国伦敦帝国理工学院的研究人员推出基于身份条件的人脸基础模型Arc2Face，能够根据一个人的面部特征生成高质量的、逼真的图像。项目主页 GitHub Demo 模型想象一下，如果你有一张朋友...

新技术 # Arc2Face

2年前

06640

视频编辑框架VideoSwap：让用户自定义视频中的主要对象（例如人物、动物或物体），同时保持背景不变

来自新加坡国立大学和Meta推出视频编辑框架VideoSwap，它能够让用户自定义视频中的主要对象（例如人物、动物或物体），同时保持背景不变。你还可以通过交互式操作（如添加、删除等）进一步细化交换结果...

新技术 # VideoSwap # 视频编辑框架

2年前

08800

TextCraftor：通过微调文本编码器来提高文本到图像生成模型的性能，使得生成的图像更加精确地反映文本描述的内容

来自Snap和美国东北大学的研究人员推出文本编码器TextCraftor，它通过微调文本编码器来提高文本到图像生成模型的性能，使得生成的图像更加精确地反映文本描述的内容。这种方法减少了对大量数据集的依...

新技术 # TextCraftor # 文本编码器

2年前

05830

新型3D生成模型GaussianCube：通过结构化表示和优化传输方法解决了传统3D高斯溅射的问题

来自中国科学技术大学、清华大学和微软亚洲研究院的研究人员推出新型3D生成模型GaussianCube，它通过结构化表示和优化传输方法解决了传统3D高斯溅射的挑战，为3D内容的生成和编辑提供了一种高效且...

新技术 # 3D生成模型 # GaussianCube

2年前

05620

多模态大语言模型LITA：专门设计来处理视频中的时间定位问题

英伟达推出多模态大语言模型LITA（Language Instructed Temporal-Localization Assistant），它专门设计来处理视频中的时间定位问题。 GitHub 论文...

新技术 # LITA # 多模态大语言模型

2年前

08300

创新框架FeatUp：提高深度学习模型中图像特征的空间分辨率，而不会损失原有的语义信息

来自麻省理工、微软、Adobe和谷歌的研究团队推出创新框架FeatUp，它能够提高深度学习模型中图像特征的空间分辨率，而不会损失原有的语义信息。在计算机视觉领域，深度学习模型通常会从图像中提取特征，这...

新技术 # FeatUp # 深度模型

2年前

05410

图像转换方法img2img-turbo：在单个步骤中完成复杂的图像转换任务，同时不需要成对的训练数据，适用于多种应用场景

来自卡内基梅隆大学和Adobe的研究人员推出新的图像转换方法img2img-turbo，它能够在单个步骤中将图像从源域转换到目标域，例如从白天的场景转换到夜晚，或者添加和移除天气效果如雾、雪和雨。这种...

新技术 # img2img-turbo # 图像转换

2年前

01,0220

加载更多