Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息Meta今日推出V-JEPA(Video Joint-Embedding Predictive Architecture)模型,一种通过观看视频来教机器理解和模拟物理世界的方法,以迈向利用对世界的学习...新技术# Meta# V-JEPA# 世界模型2年前07860
多模态大语言模型LITA:专门设计来处理视频中的时间定位问题英伟达推出多模态大语言模型LITA(Language Instructed Temporal-Localization Assistant),它专门设计来处理视频中的时间定位问题。 GitHub 论文...新技术# LITA# 多模态大语言模型2年前07840
虚拟脱衣TryOffAnyone:从穿着服装的人身上生成高保真平铺服装图像多伦多大学和帕特雷大学的研究人员推出TryOffAnyone,这是一个从穿着服装的人身上生成高保真平铺服装图像的技术。这项技术对于时尚行业来说非常重要,因为它可以增强在线购物体验,提供个性化推荐、服装...新技术# TryOffAnyone# 虚拟脱衣11个月前07810
新型图像生成蒸馏模型LinFusion:利用文本提示生成高分辨率的图像新加坡国立大学学习与视觉实验室的研究人员推出新型图像生成模型LinFusion,它能够利用文本提示生成高分辨率的图像。LinFusion的核心在于它采用了一种新颖的线性注意力机制,这使得它在处理大量像...新技术# LinFusion# 蒸馏模型1年前07800
Stable Diffusion绘画中常用的LoRA模型是什么?在使用Stable Diffusion进行AI绘画的时候,最常用的除了大模型应该就是LoRA模型,你知道LoRA是是什么吗?你知道LoRA技术其实最初是由微软技术人员为了解决大语言模型微调而开发的吗...科普# Civitai# LiblibAI# Lora2年前07790
视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型上海人工智能实验室、马克斯普朗克信息研究所和南洋理工大学的研究人员推出视频流翻译方法Live2Diff(LIVE2DIFF),它利用了单向注意力机制在视频扩散模型中,专门为直播视频流设计。这种方法的核...新技术# Live2Diff# 直播1年前07780
图像编辑技术ObjectDrop:专注于实现照片级别的物体移除和插入来自谷歌和耶路撒冷希伯来大学的研究团队推出图像编辑技术ObjectDrop,专注于实现照片级别的物体移除和插入。这项技术的目标是在不违反物理规律(例如遮挡、阴影和反射)的前提下,对图像进行编辑,使得编...百科# ObjectDrop# 图像编辑2年前07770
EmoKnob:允许在语音合成中对任意情感进行细粒度控制的框架哥伦比亚大学的研究人员推出一个允许在语音合成中对任意情感进行细粒度控制的框架EmoKnob,它用于提升语音克隆技术,只需少量示 范样本,允许用户在语音合成中精细控制情感及其强度。简单来说,EmoKno...新技术# EmoKnob# 语音克隆1年前07760
Anaconda安装教程Anaconda是一个跨平台的集成开发环境,可在Windows、Linux和macOS等操作系统上运行。Anaconda提供了一个强大的包管理器,称为conda。conda可以轻松地安装、更新和管理各...教程# Anaconda# Python# 虚拟环境2年前07760
清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频清华大学和新畅元科技推出新技术Human4DiT,它是一种用于生成高质量、时空一致的人类视频的4D扩散变换器(4D Diffusion Transformer)。这项技术可以从单张图片生成逼真的人类动...新技术# Human4DiT# 新畅元科技# 清华大学2年前07740
新型自编码器LiteVAE:用于提高图像生成模型中的效率和性能来自苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出新型自编码器LiteVAE,它被设计用于提高图像生成模型中的效率和性能。自编码器是一类神经网络,它们通过学习数据的压缩表示来重构数据。在图像处理中...新技术# LiteVAE# 自编码器2年前07700
新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据来自中国人民大学、清华大学和快手的研究人员推出新型3D生成算法MicroDreamer,它能够在大约20秒内生成高质量的3D模型,而无需任何3D数据。这项技术基于一种称为“基于分数的迭代重建”(Sco...新技术# 3D生成算法# MicroDreamer2年前07690