用于生成长视频的模型FreeLong:在不增加额外训练成本的情况下,让现有的短视频生成模型处理更长的视频内容悉尼科技大学和浙江大学的研究人员推出一种用于生成长视频的模型FreeLong,它可以在不增加额外训练成本的情况下,让现有的短视频生成模型处理更长的视频内容,同时保持或提升视频的质量。FreeLong是...新技术# FreeLong# 视频生成模型1年前01,0830
Windows 11 新增命令行文本编辑器:Microsoft Edit 使用指南微软为 Windows 命令提示符和 PowerShell 用户带来了一款全新的 CLI(命令行界面)文本编辑器——Microsoft Edit。这是一个轻量、开源、功能齐全的命令行文本编辑工具,适用...教程# Microsoft Edit# Windows 11# 命令行文本编辑器7个月前01,0730
attribute-control:对文生图模型生成的图像中的特定属性进行精细控制来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t...新技术# attribute-control# 文生图模型# 精细控制2年前01,0530
新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务华中科技大学和vivo AI 实验室的研究人员推出新型图像分割模型EVF-SAM,EVF-SAM的核心特点是它能够理解文本提示,并根据这些提示对图像中的对象进行精确分割。这项技术对于那些需要根据用户描...新技术# EVF-SAM# 图像分割模型1年前01,0420
新型图像到3D框架Unique3D:从单视图图像高效生成高质量的3D网格模型清华大学和AVAR的研究人员推出新型图像到3D框架Unique3D,它能够从单视图图像高效生成高质量的3D网格模型。Unique3D的核心优势在于它能够在短时间内生成高保真度、细节丰富且具有强泛化能力...新技术# 3D网格模型# Unique3D1年前01,0360
ConsistentID:生成个性化人像图像时保持高度的面部身份(ID)一致性来自 中山大学深圳校区、中山大学珠海校区、联想研究院和阿联酋起源人工智能研究院推出ConsistentID,它能够在生成个性化人像图像时保持高度的面部身份(ID)一致性。ConsistentID的核心...新技术# ConsistentID# 个性化人像2年前01,0290
视频编辑方法I2VEdit:利用了图生视频模型,通过用户编辑视频的第一帧来引导整个视频的生成南洋理工大学、商汤科技和上海人工智能实验室的研究人员推出视频编辑方法I2VEdit,它利用了图像到视频的扩散模型,通过用户编辑视频的第一帧来引导整个视频的生成。这种方法的创新之处在于,它能够根据用户对...百科# I2VEdit# 视频编辑2年前01,0250
基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模态大语言模型SEED-Story,它能够根据用户提供的文本和图片生成长篇的多模态故事。这些故事不仅包含丰富的叙事文本,还包括...新技术# SEED-Story# 图文故事# 多模态大语言模型1年前01,0230
影眸科技推出新型大型3D生成模型CLAY:帮助人们将脑海中的创意轻松转化为精细的三维数字结构上海科技大学、影眸科技和华中科技大学的研究人员推出新型大型3D生成模型CLAY,它的主要任务是帮助人们将脑海中的创意轻松转化为精细的三维数字结构。就像孩子们用黏土塑造出各种形状的物体一样,CLAY能够...新技术# 3D生成模型# CLAY# 影眸科技1年前01,0210
英伟达GeForce RTX 4070 Ti SUPER近期,英伟达推出了GeForce RTX 40 SUPER系列第二款显卡,此款显卡对于AI用户来说是个不错的选择,原因就是它拥有与RTX 4080更为接近的规格配置,显存容量和带宽比起原来的RTX 4...硬件# RTX 4070 Ti SUPER# 英伟达2年前01,0090
多模态框架MotionLLM:理解和解释人类行为,特别是通过分析人体动作和视频清华大学、香港中文大学(深圳)、国际数字经济学院和香港科技大学的研究人员推出人工智能系统MotionLLM,它的主要任务是理解和解释人类行为,特别是通过分析人体动作和视频。例如,你有一台智能相机,它不...新技术# MotionLLM# 多模态框架2年前01,0070
实时渲染技术Octree-GS:用于实时渲染三维场景,特别适用于处理大型和复杂场景来自上海人工智能实验室、同济大学、中国科学技术大学和香港中文大学的研究团队推出Octree-GS(八叉树-高斯球体),这是一种用于实时渲染三维场景的方法,特别适用于处理大型和复杂场景。 项目主页 Gi...新技术# Octree-GS# 三维场景# 实时渲染2年前01,0030