新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

EdgeFusion：能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像

来自韩国Nota AI和三星电子的研究人员推出EdgeFusion，它能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像。这项技术的核心是优化了文生图模型Stable Diffusion...

2年前

06960

无需训练的组合式文本到图像生成方法CompAgent

来自清华大学、华为诺亚方舟实验室、香港大学的研究人员提出了一种无需训练的组合式文本到图像生成方法CompAgent，该方法利用大语言模型(LLM)智能体进行复杂文本提示的分析与规划，将文本分解为单个对...

新技术 # CompAgent # 华为诺亚方舟 # 文生图

2年前

06940

苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite：提高模型的参数效率和生成性能

苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite，旨在提高模型的参数效率和生成性能。其论文主要研究了扩散模型（Diffusion Models）在文本到图像生成任务中的架构设计、文...

新技术 # DiT-Air # DiT-Air-Lite # 文生图模型

1年前

06930

R-Zero：首个完全自进化的推理增强框架，无需数据即可提升大模型能力

由腾讯 AI 西雅图实验室、圣路易斯华盛顿大学、马里兰大学帕克分校与德克萨斯大学达拉斯分校联合提出的新框架 R-Zero，正在挑战当前大语言模型训练范式的边界。项目主页：https://chengs...

新技术 # R-Zero # 推理增强框架

7个月前

06890

无需训练的图像编辑技术DiffUHaul：专门用于在图像中无缝移动物体

英伟达研究中心、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出一种无需训练的图像编辑技术DiffUHaul，专门用于在图像中无缝移动物体。例如，你有一张图片，里面有一只猫和一块岩石，你想要...

新技术 # DiffUHaul # 图像编辑

2年前

06870

Search_T2V：改善文本到视频合成的质量和真实感

浙江大学、飞步科技、宁波港和腾讯数据平台的研究人员推出新技术Search_T2V，旨在改善文本到视频（Text-to-Video, T2V）合成的质量和真实感。该技术通过搜索现有的视频资源作为运动先验...

新技术 # Search_T2V # 文生视频模型

2年前

06870

谷歌推出新采样方法EM Distillation（EMD）：用于提高扩散模型（diffusion models）的采样效率

谷歌推出新采样方法EM Distillation（EMD），用于提高扩散模型（diffusion models）的采样效率。扩散模型是一种强大的生成模型，能够学习复杂的数据分布并生成高质量的图像、视频...

新技术 # EM Distillation # EMD # 采样方法

2年前

06870

视频对象分割技术SMITE：解决视频内对象的分割问题，特别是在需要任意粒度（即对象可以被分割成不同数量的片段）的情况下

视频对象分割是一项具有挑战性的任务，每个像素必须被准确标记，并且这些标签必须在帧之间保持一致。当分割具有任意粒度时，难度会进一步增加，这意味着段的数量可以任意变化，并且掩模仅基于一个或几个样本图像定义...

新技术 # SMITE # 视频对象分割

1年前

06840

AI视频生成新模型CONSISTI2V：通过增强视觉一致性来改善视频生成的质量

来自滑铁卢大学、Vector Institute、Harmony.AI、多模式艺术投影研究社区的研究人员提出了一种基于扩散的图像到视频生成新方法CONSISTI2V，它旨在通过增强视觉一致性来改善视频...

新技术 # AI视频生成 # CONSISTI2V

2年前

06840

字节跳动推出数据集COCONut，专门针对图像分割任务

字节跳动推出数据集COCONut，它是对现有的COCO数据集的现代化升级，专门针对图像分割任务。图像分割是计算机视觉中的一个核心问题，它的目标是将图像中的每个像素正确地分类到不同的实例或类别中，此数据...

新技术 # COCONut # 图像分割 # 字节跳动

2年前

06830

快速视频生成方法AnimateLCM：只需四步推理就可以生成视频

来自香港中文大学、Avolution AI、上海人工智能实验室、商汤科技研究院的研究人员推出快速视频生成方法AnimateLCM，该方法利用一致性学习策略，将图像生成先验和运动生成先验进行解耦，从而提...

新技术 # AI视频生成 # AnimateLCM

2年前

06790

文本到3D生成模型VP3D：通过利用2D视觉提示来增强3D模型的视觉真实感

来自HiDream.ai和复旦大学的研究人员推出新型文本到3D生成模型VP3D，它通过利用2D视觉提示来增强3D模型的视觉真实感。在以往的研究中，虽然已经有了一些能够从文本生成3D模型的技术，但这些技...

新技术 # 3D生成模型 # VP3D

2年前

06780

加载更多

EdgeFusion：能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像

无需训练的组合式文本到图像生成方法CompAgent

苹果提出了新的文生图模型架构DiT-Air和DiT-Air-Lite：提高模型的参数效率和生成性能

R-Zero：首个完全自进化的推理增强框架，无需数据即可提升大模型能力

无需训练的图像编辑技术DiffUHaul：专门用于在图像中无缝移动物体

Search_T2V：改善文本到视频合成的质量和真实感

谷歌推出新采样方法EM Distillation（EMD）：用于提高扩散模型（diffusion models）的采样效率

视频对象分割技术SMITE：解决视频内对象的分割问题，特别是在需要任意粒度（即对象可以被分割成不同数量的片段）的情况下

AI视频生成新模型CONSISTI2V：通过增强视觉一致性来改善视频生成的质量

字节跳动推出数据集COCONut，专门针对图像分割任务

快速视频生成方法AnimateLCM：只需四步推理就可以生成视频

文本到3D生成模型VP3D：通过利用2D视觉提示来增强3D模型的视觉真实感

S.H.I.T

ITELLOU

新360 安全龙虾

Joker of Academics（小丑学术期刊）

waoo

Meshy

新技术

网址

S.H.I.T

ITELLOU

新360 安全龙虾

Joker of Academics（小丑学术期刊 ）

waoo

Meshy

Joker of Academics（小丑学术期刊）