零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...新技术# DiffIR2VR-Zero# 视频恢复2年前09440
新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务华中科技大学和vivo AI 实验室的研究人员推出新型图像分割模型EVF-SAM,EVF-SAM的核心特点是它能够理解文本提示,并根据这些提示对图像中的对象进行精确分割。这项技术对于那些需要根据用户描...新技术# EVF-SAM# 图像分割模型2年前01,1110
用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制北京大学、腾讯PCG ARC实验室、南洋理工大学、 清华大学、澳门大学和深圳先进技术研究院的研究人员推出Image Conductor,它是一种用于视频合成的交互式工具,能够让用户对视频内容中的相机运...新技术# Image Conductor# 视频合成2年前07760
新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制南洋理工大学、 香港科技大学和腾讯人工智能实验室的研究人员推出新型框架FreeTraj,它用于在视频扩散模型中实现无需调整参数的轨迹控制。简而言之,FreeTraj允许用户在生成视频时精确控制视频中对...新技术# FreeTraj# 轨迹控制2年前04830
创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频北京大学、南洋理工大学、上海人工智能实验室、浙江大学和上海交通大学的研究人员推出创新框架MotionBooth,它专门用于生成具有定制主体和可控主体及摄像机运动的动画视频。简单来说,MotionBoo...新技术# MotionBooth2年前08630
人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好俄罗斯国家研究型高等经济大学的研究人员推出新方法NCPPO,它用于改善文本到图像的扩散模型(Diffusion Models),使其生成的图像更加符合人类的偏好。扩散模型是一种生成模型,它们通过逐步去...新技术# NCPPO# 人类偏好# 文生图模型2年前05660
小冰推出Portrait4D-v2:创建出逼真的4D头部头像小冰推出Portrait4D-v2,它能够创建出逼真的4D头部头像。4D头像不仅具有三维的立体形状,还能随着时间变化而展示出不同的面部表情和头部动作,就像活生生的人一样。这项技术的应用前景非常广泛,比...新技术# 4D头部头像# Portrait4D-v22年前08490
新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像来自萨特希尔风险投资公司的研究人员推出新型多模态图像生成系统MUMU,MUMU的核心能力是从文本和图像混合提示(multimodal prompts)生成图像。简单来说,用户可以提供一些文本描述和参考...新技术# MUMU# 多模态图像生成2年前05150
Stability AI获得新的投资,并任命Prem Akkaraju为新CEOStability AI已经正式公布了来自一组新投资者的重大资金投入。该公司已任命Prem Akkaraju为首席执行官,并由Sean Parker出任执行主席。这一举措旨在加速Stability A...早报# Prem Akkaraju# Stability AI2年前09970
分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容新加坡国立大学的研究人员推出Video-Infinity系统,它是一个分布式的长视频生成框架。简单来说,Video-Infinity能够利用多个GPU(显卡)并行工作,快速生成长时间的视频内容。这对于...新技术# Video-Infinity# 长视频生成框架2年前05450
图像生成评估基准DREAMBENCH++:与人类偏好对齐的自动化评估系统,专门用于个性化图像生成清华大学、西安交通大学、伊利诺伊大学香槟分校、中国科学院大学和旷视科技的研究人员推出图像生成评估基准DREAMBENCH++,它是一个与人类偏好对齐的自动化评估系统,专门用于个性化图像生成。简单来说...新技术# DREAMBENCH++# 图像生成评估基准2年前05210
大型文本到图像提示数据集StyleBreeder:包含680万张图片及180万个提示词弗吉尼亚理工大学、苏黎世联邦理工学院、慕尼黑工业大学、谷歌和Artbreeder的研究人员推出大型文本到图像提示数据集StyleBreeder,它通过使用文本到图像的生成模型,探索和推广了艺术风格的多...新技术# StyleBreeder# 文生图提示数据集2年前05370