新型视频生成框架MovieDreamer:专门用于制作长篇视频内容,比如电影浙江大学和阿里巴巴的研究人员推出新型视频生成框架MovieDreamer,专门用于制作长篇视频内容,比如电影。与传统的短时视频生成技术不同,MovieDreamer能够处理复杂的叙事结构和情节发展,同...新技术# MovieDreamer# 视频生成框架2年前09060
卡通视频插帧的生成性插值技术ToonCrafter:自动为卡通生成中间帧和根据参考图像进行上色香港中文大学、香港城市大学和腾讯人工智能实验室的研究人员推出ToonCrafter,它是一种用于卡通视频插帧的生成性插值技术。插帧技术,就是在两个已有的视频帧之间生成新的帧,让视频看起来更流畅。简单来...百科# ToonCrafter# 插帧技术2年前09020
Genspark 推出 AI Slides功能:AI 自动生成 PPT,彻底颠覆幻灯片创作方式创建富有影响力的幻灯片一直是一项耗时且富有挑战性的任务。Genspark 宣布推出其最新创新功能——AI Slides,旨在彻底改变幻灯片的创作体验。 地址:https://www.genspark...早报# AI Slides# Genspark9个月前09010
新型图像编辑框架Differential Diffusion:精确地控制图像的编辑过程来自特拉维夫大学、赖希曼大学的研究人员推出新型图像编辑框架Differential Diffusion,此框架的核心特点是能够让用户对图像的每个像素或区域进行不同程度的编辑,这在以往的图像编辑技术中是...新技术# Differential Diffusion# 图像编辑2年前09000
采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量英伟达、多伦多大学和矢量研究所的研究人员推出新的采样调节器AlignYouSteps(调整步伐),用于优化采样步骤,从而提高生成图像的细节和质量。这是一种通用且原则性的方法,用于优化扩散模型的采样计划...新技术# AlignYouSteps# 英伟达# 采样调节器2年前08940
创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频北京大学、南洋理工大学、上海人工智能实验室、浙江大学和上海交通大学的研究人员推出创新框架MotionBooth,它专门用于生成具有定制主体和可控主体及摄像机运动的动画视频。简单来说,MotionBoo...新技术# MotionBooth2年前08910
视觉-语言适配器PaLM2-VAdapter:将传统的视觉编码器和大语言模型结合起来PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们之间的协同工作效果。 论文 它能够有效地将传统的视觉编码器(vision encoders)和大语言模型(LL...新技术# PaLM2-VAdapter# 大语言模型# 视觉编码器2年前08890
xAI 即将推出 Grok 系列重大更新:Grok 3.5、语音视觉功能与更多新特性埃隆·马斯克旗下的 xAI 正在为其 Grok 系列产品准备一系列令人期待的更新,涵盖模型性能提升、新功能开发以及用户体验优化。这些更新不仅展示了 xAI 在人工智能领域的持续投入,也进一步缩小了 G...早报# Grok# Grok 3.5# xAI10个月前08880
ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...新技术# controlnet# 可控性# 文生图模型2年前08870
负面提示词在Stable Diffusion中的作用及书写技巧在Stable Diffusion中,负面提示(Negative Prompts)作为一种图像生成的引导机制发挥着重要作用。它们使用户能够定义希望从生成的图像中排除的内容,这在避免产生模糊、失真或包含...科普# negative prompts# Stable Diffusion# 负面提示2年前08870
新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR(Distortion-reduced Multi-Resolution Diffusion Model),此模...新技术# DiMR# 图像生成2年前08850
AI视频编辑工具LAVE:利用大语言模型(LLMs)来辅助用户进行视频编辑来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE(LLM-Powered Agent Assistance and Language Augmentation for Vide...新技术# AI视频编辑# LAVE2年前08840