新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

零样本视频定制框架DreamVideo-2：根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频

复旦大学、阿里巴巴、南洋理工大学和密歇根州立大学的研究人员推出一个零样本视频定制框架DreamVideo-2，能够根据单一图像和一系列界定框（bounding box）序列生成具有特定主题和运动轨迹的...

新技术 # DreamVideo-2 # 视频定制

1年前

06690

阿里巴巴Wanx 团队推出新型多模态生成模型ACE：可以根据文本指令来执行复杂的图像编辑和生成任务

阿里巴巴Wanx 团队推出新型多模态生成模型ACE，这个模型的核心功能是处理和生成图像，但它与传统的图像处理工具不同，因为它可以根据文本指令来执行复杂的图像编辑和生成任务。例如，你是一名摄影师，你拍摄...

新技术 # ACE # 阿里巴巴

1年前

06690

ProCreate：改善基于扩散的图像生成模型的样本多样性和创造性，并防止对训练数据的直接复制

纽约大学的研究人员推出创新方法ProCreate，旨在改善基于扩散的图像生成模型的样本多样性和创造性，并防止对训练数据的直接复制。简而言之，ProCreate能够在生成图像的过程中，确保新生成的图像既...

新技术 # ProCreate

2年前

06690

SpaTracker：通过在三维空间中跟踪像素点，能够在各种复杂场景中实现精确的运动估计

来自浙江大学、加州大学伯克利分校和蚂蚁集团的研究人员推出SpatialTracker，这是一种能够在三维空间中跟踪任意二维像素点的方法。它使用单目深度估计器将2D像素提升到3D，使用三平面表示法有效表...

新技术 # SpaTracker # 三维空间

2年前

06690

Adobe推出Toffee：用于主题驱动的文本到图像生成的高效数据集构建方法

Adobe Research和加州大学圣克鲁斯分校的研究人员推出Toffee系统，它是一个用于主题驱动的文本到图像生成的高效数据集构建方法。简单来说，Toffee能够创建大量的图像和文本对，这些图像能...

新技术 # Adobe Research # Toffee # 数据集

2年前

06680

图生图新技术pOps：将图像和文本转换为可以相互理解的格式，更好的生成图像

特拉维夫大学和西蒙菲莎大学的研究人员推出图生图新技术pOps（Photo-Inspired Diffusion Operators），它是一种用于生成视觉内容的先进方法。例如，你想要生成一张“在海滩上...

新技术 # pOps # 图生图

2年前

06680

谷歌推出基于问答的自动评估指标Gecko，用于评估文生图模型的性能

谷歌推出基于问答的自动评估指标Gecko2K，用于评估文生图模型的性能。文生图模型生成的图像并不总是能够完全符合文本中的所有细节。因此，评估这些模型生成的图像与文本描述的匹配程度是一个重要的研究问题...

新技术 # Gecko # Gecko2K # 自动评估

2年前

06680

自回归技术StreamingT2V：能够创建具有丰富运动动力学的长视频，不会出现停滞现象

来自Picsart AI研究部门、得克萨斯大学奥斯汀分校、佐治亚理工学院和伊利诺伊大学厄巴纳-香槟分校的研究团队推出先进的自回归技术StreamingT2V，能够创建具有丰富运动动力学的长视频，不会出...

新技术 # StreamingT2V # 自回归技术

2年前

06680

3D到3D生成方法ThemeStation：根据少量的示例生成具有一致主题的3D资源

来自香港城市大学、上海AI实验室、南洋理工大学的研究团队推出3D到3D生成方法ThemeStation，它是一个能够根据少量的示例（exemplars）生成具有一致主题的3D资源的创新方法。其追求两个...

新技术 # 3D模型 # ThemeStation

2年前

06670

新型单视图3D重建方法FDGaussian：能够从2D输入中提取出3D几何特征，从而生成一致的多视图图像

来自复旦大学的研究团队推出新型单视图3D重建方法FDGaussian，它采用正交平面分解机制，能够从2D输入中提取出3D几何特征，从而生成一致的多视图图像。项目主页论文地址想象一下，你只有一张物...

新技术 # 3D重建 # FDGaussian

2年前

06660

DragAnything：视频生成中任意对象的运动控制

来自快手、浙江大学和新加坡国立大学的研究团队推出DragAnything，它是一种用于视频生成和控制的方法，它利用实体表示法来实现对视频生成中任意对象的运动控制。项目主页 GitHub 论文例如...

新技术 # DragAnything # 视频生成 # 运动控制

2年前

06650

无需训练的新策略FasterCache：加速高质量视频生成的视频生成模型的推理

视频生成是当前 AI 领域的一个热点研究方向，特别是基于扩散模型的方法。然而，这些模型的推理速度通常较慢，限制了它们在实际应用中的效率。香港大学、南洋理工大学 S-Lab 和上海人工智能实验室的研究人...

新技术 # FasterCache # 视频生成

1年前

06640

加载更多

零样本视频定制框架DreamVideo-2：根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频

阿里巴巴Wanx 团队推出新型多模态生成模型ACE：可以根据文本指令来执行复杂的图像编辑和生成任务

ProCreate：改善基于扩散的图像生成模型的样本多样性和创造性，并防止对训练数据的直接复制

SpaTracker：通过在三维空间中跟踪像素点，能够在各种复杂场景中实现精确的运动估计

Adobe推出Toffee：用于主题驱动的文本到图像生成的高效数据集构建方法

图生图新技术pOps：将图像和文本转换为可以相互理解的格式，更好的生成图像

谷歌推出基于问答的自动评估指标Gecko，用于评估文生图模型的性能

自回归技术StreamingT2V：能够创建具有丰富运动动力学的长视频，不会出现停滞现象

3D到3D生成方法ThemeStation：根据少量的示例生成具有一致主题的3D资源

新型单视图3D重建方法FDGaussian：能够从2D输入中提取出3D几何特征，从而生成一致的多视图图像

DragAnything：视频生成中任意对象的运动控制

无需训练的新策略FasterCache：加速高质量视频生成的视频生成模型的推理

S.H.I.T

ITELLOU

ArkClaw

新360 安全龙虾

waoo

Joker of Academics（小丑学术期刊）

新技术

网址

S.H.I.T

ITELLOU

ArkClaw

新360 安全龙虾

waoo

Joker of Academics（小丑学术期刊 ）

Joker of Academics（小丑学术期刊）