文生视频模型VSTAR:解决现有开源T2V模型难以生成内容动态变化和较长视频的问题来自博世人工智能中心、曼海姆大学、马克斯·普朗克信息学研究所和图宾根大学的研究团队推出VSTAR,这是一种用于生成动态视频的文本到视频(T2V)合成技术。VSTAR的目标是解决现有开源T2V模型难以生...新技术# VSTAR# 文生视频模型2年前07740
图像高清修复技术SUPIR:将低质量图像提升到高质量水平来自中国科学院深圳先进技术学院、上海AI实验室、悉尼大学、香港理工大学、,腾讯PCG ARC实验室、香港中文大学的研究人员推出图像高清修复技术SUPIR(Scaling-UP Image Restor...新技术# SUPIR# 高清修复2年前07740
适配器样式Stylus:自动选择和组合适配器(adapters),以提高生成图像的质量来自加州大学伯克利分校、卡内基梅隆大学和Google Deepmind的研究人员推出新的适配器样式Stylus,它能够自动选择和组合适配器(adapters),以提高生成图像的质量。适配器是一种在特定...百科# Stylus# 适配器样式2年前07730
IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5:推动开放集对象检测技术的边界IDEA研究院(粤港澳大湾区数字经济研究院)推出先进模型系列Grounding DINO 1.5,旨在推动开放集对象检测技术的边界。开放集对象检测是一种计算机视觉任务,它要求模型能够识别图像中的对象...新技术# Grounding DINO 1.5# 开集目标检测模型2年前07700
新型实时一步潜在扩散模型SDXS:在图像生成任务中显著提高效率,同时保持图像质量小米推出新型实时一步潜在扩散模型SDXS,它能够在图像生成任务中显著提高效率,同时保持图像质量。SDXS模型通过模型小型化和减少采样步骤的双重方法,显著降低了模型的延迟,使其能够在低功耗设备上实时生成...新技术# SDXS# 一步潜在扩散模型1年前07700
视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声校准)”,它使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变。该技术通过少量迭代步...新技术# Noise Calibration# 噪声校准# 视频增强技术2年前07670
合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示卡内基·梅隆大学的研究人员推出合成语言-视觉数据集StableSemantics,它专注于自然图像中的语义表示。简单来说,这个数据集旨在帮助计算机视觉系统更好地理解图像中的场景和对象的语义含义。它涵盖...新技术# StableSemantics# 合成语言-视觉数据集2年前07670
Adobe推出图像生成模型Firefly Image 3:逼真度、造型能力、细节和精确度方面均取得了显著进步Adobe在昨天的Adobe Max大会上正式发布了图像生成模型Firefly Image 3。这款模型在逼真度、造型能力、细节和精确度方面均取得了显著进步,同时提供了更加丰富的多样性,为创意人士带来...早报# Adobe# Firefly Image 32年前07660
文生图风格化工具Artist:无需训练即可实现美学控制的文本驱动风格化香港理工大学的研究人员推出一种无需训练即可实现美学控制的文本驱动风格化方法Artist。简而言之,Artist能够根据文本描述,将一张静态图片转换成具有特定艺术风格的图像,同时保持图片内容的完整性和细...新技术# Artist# 风格化2年前07640
Controlnet作者lllyasviel新开源项目Omost:将大语言模型的编程能力转化为图像合成能力Controlnet作者lllyasviel的新开源项目Omost,这是一个将大语言模型的编程能力转化为图像合成能力的项目。项目名称“Omost”(发音类似于“almost”,意为“几乎”)蕴含双重意...新技术# controlnet# lllyasviel# Omost2年前07620
谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(亚秒级)生成高质量的图片。该模型在架构和采样技术方面进行广泛优化,在iPhone 15 Pro上,Mobile...新技术# MobileDiffusion# 安卓# 扩散模型2年前07620
BroadWay:提升文生视频模型的质量,而且不需要额外的训练上海交通大学、中国科学技术大学、香港中文大学和上海人工智能实验室的研究人员推出为BroadWay,它能够提升文生视频模型的质量,而且不需要额外的训练。这就像是给视频生成模型安装了一个“涡轮增压器”,让...新技术# BroadWay# 文生视频模型1年前07600