AI视频生成新模型CONSISTI2V:通过增强视觉一致性来改善视频生成的质量来自滑铁卢大学、Vector Institute、Harmony.AI、多模式艺术投影研究社区的研究人员提出了一种基于扩散的图像到视频生成新方法CONSISTI2V,它旨在通过增强视觉一致性来改善视频...新技术# AI视频生成# CONSISTI2V2年前06600
英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法来自特拉维夫大学和英伟达的研究人员提出了一种创新方法ConsiStory,它允许用户通过自然语言描述生成一系列图像,这些图像不仅能够保持一致的主题,而且能够遵循文本提示。ConsiStory的核心目标...新技术# ConsiStory# 英伟达1年前06120
Stable Diffusion绘画中常用的LoRA模型是什么?在使用Stable Diffusion进行AI绘画的时候,最常用的除了大模型应该就是LoRA模型,你知道LoRA是是什么吗?你知道LoRA技术其实最初是由微软技术人员为了解决大语言模型微调而开发的吗...科普# Civitai# LiblibAI# Lora2年前07840
LoRA:为解决大语言模型微调而开发微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models,大语言模型的低阶适应),这是为解决大语言模型微调而开发的一项技术,用于...新技术# Lora# 大语言模型# 微软2年前05900
Stable Diffusion中的embedding是什么?什么是文本嵌入?在使用Stable Diffusion进行生图的时候,我们常常会用到embedding模型,这个embedding模型是什么呢?在中文中通常被翻译为“文本嵌入”,其实也就是我们之前介绍的Textual...科普# embedding# Stable Diffusion# 文本嵌入模型2年前01,2560
文本反转Textual Inversion:通过少量的图像和自然语言描述来创建新的“伪词”来指导图像生成使用文本到图像生成模型(Text-to-Image Models)来个性化地创造图像,这些模型能够根据自然语言描述生成图像,但通常难以精确地表达特定的独特概念。 项目主页 GitHub 来自特拉维夫大...新技术# Textual Inversion# 文本反转# 英伟达2年前06190
Stable Diffusion提示词简介、语法规则、常用提示词与浏览器插件推荐在使用 Stable Diffusion模型进行绘画的时候,最令人头疼的可能就是提示词该怎么写,无论是Stable Diffusion Web UI还是ComfyUI都有插件可以解决这个问题,不过大家...科普# ComfyUI# negative prompts# positive prompts2年前01,2200
语音驱动人脸说话生成框架AVCT来自网易伏羲AI实验室、悉尼科技大学的研究人员推出了从单人音频生成单人说话脸部的框架Audio-Visual Correlation Transformer (AVCT),它能够从单个说话者的音频-视...新技术# AVCT2年前08220
字节跳动推出新颖视频合成方法Boximator:可控制画面范围及运动方向字节跳动发布了一种新颖视频合成方法Boximator,主要用于生成具有丰富和精细运动控制的高质量视频。Boximator引入了两种约束类型:硬边框(hard box)和软边框(soft box),允许...新技术# Boximator# 字节跳动# 视频合成2年前06020
文本嵌入模型nomic-embed-text-v1:完全开源可复现Nomic AI发布文本嵌入模型nomic-embed-text-v1,这是一个开源的、可复现的、拥有8192个上下文长度的英文文本嵌入模型。这个模型在处理短文本和长文本任务上的表现超过了OpenAI...新技术# nomic-embed-text-v1# 文本嵌入模型2年前05430
动态视频模型DynamiCrafter:为静态图片添加动画效果来自香港中文大学、腾讯人工智能实验室、北京大学的研究人员推出动态视频模型DynamiCrafter,它是一个利用视频扩散模型(Video Diffusion Models)来为静态图片添加动画效果的工...新技术# DynamiCrafter# 视频模型2年前05720
3D内容生成框架DreamGaussian:提高基于图像和文本生成3D模型的效率和质量来自南洋理工大学、百度和北京大学的研究人员推出3D内容生成框架DreamGaussian,专门设计用于提高基于优化方法创建三维(3D)模型的效率和质量。该框架旨在解决当前从图像或文本快速生成高质量3D...新技术# 3D内容生成框架# DreamGaussian2年前05690