文生图模型偏好优化方法MaPO(边界感知偏好优化):让计算机在学习生成图像时,能够更好地符合人类的偏好韩国科学技术研究院、Huggingface和高丽大学的研究人员推出一种新的文本到图像扩散模型的偏好优化方法,这种方法被称为“边界感知偏好优化”(Margin-aware Preference Opti...新技术# MaPO# 文生图模型# 边界感知偏好优化2年前08390
视觉布局CGB-DM:基于Transformer的扩散模型的内容与图形平衡布局生成方法清华大学的研究人员推出基于Transformer的扩散模型的内容与图形平衡布局生成方法CGB-DM,简单来说,CGB-DM是一个智能设计系统,它可以根据文本描述生成既美观又和谐的视觉布局。这就像是给一...新技术# CGB-DM# 视觉布局2年前08380
Python安装教程在《必备软件》已经跟大家说了,目前多数AI应用都是使用Python编写,Python版本众多,大家要根据所安装程序所需版本来进行安装。 Python官网:https://www.python.org...教程# Python# 安装教程2年前08360
基于SAM的新型视觉模型Open-Vocabulary SAM:交互式的图像分割和识别来自南洋理工大学、上海AI实验室的研究人员推出了一款基于SAM的新型视觉模型Open-Vocabulary SAM,它结合了Segment Anything Model(SAM)和CLIP模型的优势...新技术# Open-Vocabulary SAM# SAM# 图像分割2年前08350
先进的视频深度估计方法ChronoDepth:通过结合视频生成模型的先验知识,有效地提高了深度估计的准确性和时间一致性浙江大学、博洛尼亚大学、蚂蚁集团和Rock Universe的研究人员推出一种先进的视频深度估计方法ChronoDepth,它通过结合视频生成模型的先验知识,有效地提高了深度估计的准确性和时间一致性...新技术# ChronoDepth# 视频深度2年前08340
谷歌Gemini推出“引导学习(Guided Learning)”功能,正面回应 AI 教育争议周三,谷歌宣布在 Gemini 中上线一项名为 “引导学习”(Guided Learning)的新功能。它不像传统聊天机器人那样直接给出答案,而是以“AI 导师”的角色,帮助用户逐步理解复杂概念,构建...早报# Gemini# 引导学习# 谷歌6个月前08290
新型视频生成模型FancyVideo:根据文本提示生成动态丰富且时间上连贯的视频360 AI研究中心和中山大学的研究人员推出新型视频生成模型FancyVideo,它能够根据文本提示生成动态丰富且时间上连贯的视频。FancyVideo通过精心设计的跨帧文本引导模块(CTGM)改进了...新技术# FancyVideo1年前08260
虚拟服装试穿技术IDM-VTON:根据一个人的图片和一件衣服的图片,生成这个人穿上这件衣服的图像来自韩国科学技术院和OMNIOUS.AI的研究人员推出虚拟服装试穿技术IDM-VTON,该技术能够根据分别描绘人物和服装的图像对,渲染出人物穿着精选服装的视觉效果。虚拟试穿是一种计算机视觉技术,它可以...新技术# IDM-VTON# 虚拟服装试穿# 虚拟试穿2年前08260
新型图像抠图技术Matting by Generation:能够生成更高分辨率和细节丰富的抠像结果东京大学、合肥大学、Snap Research、阳明大学、香港中文大学、台湾大学和日本国立信息研究所的研究人员推出新型图像抠图技术Matting by Generation,图像抠图是指从一幅图片中精...新技术# Matting by Generation# 抠图2年前08250
在文生图模型中应用Guidance技术的方法来自阿尔托大学和英伟达的研究人员发布论文探讨了在文生图模型中应用指导(Guidance)技术的方法,作者通过实验表明,限制指导区间的方法在ImageNet-512数据集上将FID(一种衡量图像质量的指...科普# CFG Scale# Guidance2年前08250
英伟达推出Autoguidance:改进图像生成扩散模型的性能英伟达和阿尔托大学的研究人员推出Autoguidance,改进图像生成扩散模型的性能,特别是通过一种新颖的方法来控制图像质量、结果的变化性以及与给定条件(如类别标签或文本提示)的一致性。扩散模型是一种...新技术# Autoguidance# 英伟达2年前08230
新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架构,旨在生成具有无限制分辨率和长宽比的图像。 GitHub 论文 模型 传统的图像生...新技术# FiT# Transformer# 图像生成模型2年前08230