基于扩散模型的无需反转的人像风格化框架ZePo:在无需任何模型微调的情况下,快速生成具有特定艺术风格的肖像图像上海科技大学信息科学技术学院和中国科学院自动化研究所的研究人员推出了一种基于扩散模型的无需反转的人像风格化框架ZePo,它能够在无需任何模型微调的情况下,仅需四个采样步骤就能实现内容和风格特征的融合...新技术# ZePo# 人像风格化2年前05580
肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频蚂蚁集团支付宝终端技术部推出肖像动画新技术EchoMimic,它可以将静态的肖像照片转化为逼真的动态视频。EchoMimic创新性地结合音频与面部标志点进行联合训练,并通过一项新颖的训练策略,使其不仅...新技术# EchoMimic# 肖像动画2年前05570
文生视频新技术FIFO-Diffusion:无需训练即可从文本生成无限长度的视频首尔国立大学推出文生视频新技术FIFO-Diffusion,它基于预训练的扩散模型,用于文本条件视频生成。简单来说,FIFO-Diffusion能够根据文本描述生成无限长度的视频,而且不需要额外的训练...新技术# FIFO-Diffusion# 文生视频2年前05570
Meta推出新型视频生成模型Movie Gen:不仅能制作高清视频,还能为视频配上声音Meta宣布推出一款新AI视频生成器Movie Gen,这款工具不仅能制作高清视频,还能为视频配上声音。据Meta介绍,Movie Gen可通过简单的文字输入,自动生成全新的视频内容。此外,它还能编辑...新技术# Meta# Movie Gen# 视频生成模型2年前05560
FlashTex:使用LightControlNet实现快速可重新照明的网格纹理生成来自Roblox、卡内基梅隆大学、斯坦福大学的研究人员推出FlashTex技术,它能够快速地为3D模型生成可重新照明(relittable)的纹理。这项技术的核心在于,它可以根据用户提供的文字提示,自...新技术# 3D模型# FlashTex2年前05560
Cursor Agent接入Linear:从问题跟踪到代码提交,无需切换工具即可完成开发闭环Cursor正式推出与Linear的集成功能——现在,开发者可直接在Linear(项目管理工具)中触发Cursor后台代理,自动处理错误修复、功能构建、用户反馈响应等开发任务,无需在“问题跟踪”与“编...早报# Cursor Agent# Linear8个月前05540
智谱AI海外版 Z.ai 上线 GLM-Experimental 模型,免费开放 AI Slides 功能智谱AI旗下面向海外用户的平台 Z.ai近日上线了最新研发的 GLM-Experimental 模型,并同步推出了全新的 AI Slides(AI 幻灯片)功能,向所有用户免费开放使用,且无使用限制...早报# AI Slides# GLM-Experimental# Z.ai9个月前05540
视频运动迁移模型MotionMaster:在不需要训练的情况下,实现视频中相机运动的转移来自上海交通大学、腾讯优图实验室和哈尔滨工业大学的研究人员推出一个无需训练的视频运动迁移模型MotionMaster,它能够在不需要训练的情况下,实现视频中相机运动的转移。这意味着你可以将一个视频中的...新技术# MotionMaster# 视频运动迁移模型2年前05540
文本嵌入模型nomic-embed-text-v1:完全开源可复现Nomic AI发布文本嵌入模型nomic-embed-text-v1,这是一个开源的、可复现的、拥有8192个上下文长度的英文文本嵌入模型。这个模型在处理短文本和长文本任务上的表现超过了OpenAI...新技术# nomic-embed-text-v1# 文本嵌入模型2年前05530
Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage游戏的未来不再依赖专业设计师逐帧构建,而是由每一位玩家通过想象、生成与体验来共同塑造。 今天,Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容(UGC...新技术# Dynamics Lab# Mirage9个月前05520
用于加速DiT模型的训练和推理过程的方法HarmoniCa商汤科技研究院、北京航空航天大学、莫纳什大学和香港科技大学推出一种用于加速DiT模型的训练和推理过程的方法HarmoniCa,通过基于Step-Wise去噪训练(SDT)和图像错误代理引导目标(IEP...新技术# DiT模型# HarmoniCa2年前05490
新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成来自马克斯·普朗克智能系统研究所、Adobe和加州大学圣地亚哥分校的研究团队推出新型视频生成方法Time Reversal Fusion(时间反转融合,简称TRF),它能够控制视频内容在给定的起始...新技术# TRF# 视频生成2年前05490