新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

虚拟服装试穿工具OOTDiffusion：革新你的虚拟试衣体验

OOTDiffusion是一款开源虚拟服装试穿工具，它利用潜在扩散模型（latent diffusion models）的强大能力实现了前所未有的高精度和可控性试穿体验。 GitHub：https...

新技术 # OOTDiffusion # 虚拟服装

2年前

08080

多概念定制技术MultiBooth：根据用户的文本描述生成包含多个特定元素的图像

清华大学和Meta的研究人员推出新颖且高效的多概念定制技术MultiBooth，此技术用于从文本生成图像时实现多概念定制。简单来说，MultiBooth能够根据用户的文本描述生成包含多个特定元素的图像...

新技术 # MultiBooth # 多概念定制技术

2年前

08040

图像和视频生成框架StoryDiffusion：能够生成一系列内容一致的图像和视频

来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion，这项技术的核心在于它能够生成一系列内容一致的图像和视频，这对于讲述一个故事或者展示一个连贯的场景来说非常重要...

新技术 # StoryDiffusion # 图像生成 # 视频生成

2年前

08030

用于视频合成的交互式工具Image Conductor：让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

北京大学、腾讯PCG ARC实验室、南洋理工大学、清华大学、澳门大学和深圳先进技术研究院的研究人员推出Image Conductor，它是一种用于视频合成的交互式工具，能够让用户对视频内容中的相机运...

新技术 # Image Conductor # 视频合成

2年前

08020

ToDo：为了提高高分辨率图像生成的效率而设计

来自Leonardo AI的研究人员推出ToDo（Token Downsampling），它是为了提高高分辨率图像生成的效率而设计的。这种方法主要是为了解决图像扩散模型在处理大图像时面临的时间和内存限...

新技术 # ToDo # 扩散模型

2年前

08010

弱监督方法CatLIP：用于在互联网规模的图像-文本数据上预训练视觉模型

苹果推出新颖的弱监督方法CatLIP（Categorical Loss for Image-text Pre-training），旨在提高图像和文本数据集上的视觉模型预训练效率，同时保持与现有的对比学...

新技术 # CatLIP # CLIP # 弱监督

2年前

07980

Meta发布世界模型早期版本V-JEPA：无需人工标注或指导，自主学习视频中的视觉信息

Meta今日推出V-JEPA（Video Joint-Embedding Predictive Architecture）模型，一种通过观看视频来教机器理解和模拟物理世界的方法，以迈向利用对世界的学习...

新技术 # Meta # V-JEPA # 世界模型

2年前

07970

深度模型DepthFM：从单张图像中快速估算深度信息

来自慕尼黑大学的研究团队推出深度模型DepthFM，它是一个用于从单目（单个摄像头）图像中快速估算深度信息的系统。简单来说，DepthFM能够通过一张照片，推断出物体与摄像头之间的距离，这对于三维场景...

新技术 # DepthFM # 深度模型

2年前

07960

基于IMUs的面部捕捉系统IMUSIC：适用于多种场景，尤其是在视觉捕捉受限的情况下

来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC，它基于惯性测量单元（IMUs）来捕捉面部表情，而不是依赖于传统的视觉输入。IMUSIC的设计旨在...

新技术 # IMUSIC # 影眸科技 # 灵秘科技

2年前

07960

图像编辑框架FlexEdit：用于灵活且可控地编辑图像中的物体

来自VinAI Research和越南科技大学的研究人员推出图像编辑框架FlexEdit，它是一个基于扩散模型（Stable Diffusion）的图像编辑框架，专门设计用于灵活且可控地编辑图像中的物...

新技术 # FlexEdit # 图像编辑框架

2年前

07920

视频增强技术Noise Calibration（噪声校准）：使用预训练的视频扩散模型来改善视频质量，同时确保原始视频的内容保持不变

大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration（噪声校准）”，它使用预训练的视频扩散模型来改善视频质量，同时确保原始视频的内容保持不变。该技术通过少量迭代步...

新技术 # Noise Calibration # 噪声校准 # 视频增强技术

2年前

07910

视频合成模型后续调优方法ExVideo：提升模型生成视频的长度和质量

华东师范大学和阿里巴巴的研究人员推出新型视频合成模型扩展方法ExVideo，这种方法旨在通过参数高效的方式对现有的视频合成模型（Stable Video Diffusion）进行后期调整（post-t...

新技术 # ExVideo # SVD模型

2年前