百科 | 第12页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

新型视频编辑技术ReVideo：在视频中对特定区域进行精确的内容和运动控制编辑

北京大学深圳研究生院、ARC实验室，腾讯 PCG和东京大学的研究人员推出新型视频编辑技术ReVideo，ReVideo的核心能力是在视频中对特定区域进行精确的内容和运动控制编辑。这意味着用户可以随心...

新技术 # ReVideo # 视频编辑

2年前

08770

通用反馈学习架构ID-Aligner：用于提升文本到图像生成任务中的身份保持性能

来自中山大学和字节跳动的研究人员推出通用反馈学习架构ID-Aligner，它用于提升文本到图像生成（Text-to-Image Generation）任务中的身份保持（Identity-Preserv...

新技术 # ID-Aligner # 人物特征 # 文生图

2年前

08760

基于SAM的新型视觉模型Open-Vocabulary SAM：交互式的图像分割和识别

来自南洋理工大学、上海AI实验室的研究人员推出了一款基于SAM的新型视觉模型Open-Vocabulary SAM，它结合了Segment Anything Model（SAM）和CLIP模型的优势...

新技术 # Open-Vocabulary SAM # SAM # 图像分割

2年前

08760

新型视频生成模型FancyVideo：根据文本提示生成动态丰富且时间上连贯的视频

360 AI研究中心和中山大学的研究人员推出新型视频生成模型FancyVideo，它能够根据文本提示生成动态丰富且时间上连贯的视频。FancyVideo通过精心设计的跨帧文本引导模块（CTGM）改进了...

新技术 # FancyVideo

2年前

08720

韩国团队提出文生图大模型KOALA：可在低端GPU电脑上运行

韩国研究人员提出了一种高效的潜在扩散模型KOALA，该模型可以用于文本到图像的生成，研究人员构建了T2I模型KOALA-1B和KOALA-700M，减小了模型大小，降低了模型对硬件的需求，提高了模型运...

新技术 # KOALA # 文生图大模型 # 韩国

2年前

08690

什么是模型上下文协议（MCP）？与传统API相比，它如何简化AI集成

Model Context Protocol (MCP) 是一种新的开放协议，旨在标准化应用程序如何为大语言模型 (LLMs) 提供上下文。它由 Anthropic 于 2024 年 11 月推出，现...

科普 # AI集成 # API # MCP

1年前

08680

虚拟试衣系统IMAGDressing-v1：帮助用户在线上购物时，更真实地预览服装在不同人身上的效果

南京理工大学、华为、腾讯人工智能实验室和南京大学的研究人员推出可定制的虚拟试衣系统IMAGDressing-v1，这个系统可以帮助用户在线上购物时，更真实地预览服装在不同人身上的效果。IMAGDre...

新技术 # IMAGDressing-v1 # 虚拟穿搭 # 虚拟试衣

2年前

08680

MaPa：根据文本描述为3D模型生成逼真的材质

来自浙江大学、蚂蚁集团和深圳大学的研究人员推出MaPa，它能够根据文本描述为3D模型生成逼真的材质。与传统的纹理贴图不同，MaPa通过生成程序化的材质图（material graphs）来表示3D模型...

新技术 # 3D模型 # MaPa

2年前

08670

Follow-Your系列新框架Follow-Your-Pose v2：用于于角色图像动画的框架，可以根据一系列的动作信号（比如视频、深度图或姿势序列）生成动画视频

来自腾讯混元团队、中山大学、香港科技大学的研究人员推出Follow-Your系列新框架Follow-Your-Pose v2，这是去年发布的Follow-Your-Pose升级版，这是一个用于于角色图...

新技术 # Follow-Your-Pose v2 # 动画视频

2年前

08660

Follow-Your系列新框架Follow-Your-Emoji：基于扩散模型的肖像动画框架，生成富有表现力的表情动画

来自香港科技大学、腾讯混元团队和清华大学的研究团队推出Follow-Your系列新框架Follow-Your-Emoji，这是一种基于扩散模型的肖像动画框架。简单来说，它可以根据一系列目标表情和动作标...

新技术 # Follow-Your-Emoji # 肖像动画框架

2年前

08640

文生图模型偏好优化方法MaPO（边界感知偏好优化）：让计算机在学习生成图像时，能够更好地符合人类的偏好

韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散模型的偏好优化方法，这种方法被称为“边界感知偏好优化”（Margin-aware Preference Opti...

新技术 # MaPO # 文生图模型 # 边界感知偏好优化

2年前

08620

高质量人类动作视频生成框架MimicMotion：依据任意运动指令生成高质感、任意长度的视频内容

腾讯和上海交通大学的研究人员推出高质量人类动作视频生成框架MimicMotion，依据任意运动指令生成高质感、任意长度的视频内容。简单来说，MimicMotion是一个可以制作出逼真人类动作视频的智能...

新技术 # MimicMotion # 视频生成

2年前

08610

加载更多

百科