百科 | 第20页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

谷歌推出新型图像编辑工具Magic Insert：将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然

谷歌推出新型图像编辑工具Magic Insert，可以让我们像变魔术一样，将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然，就像它本...

2年前

07430

一致性模型的强化学习RLCM：提升图像生成的速度和质量

来自康奈尔大学的研究团队推出RLCM（Reinforcement Learning for Consistency Models, 一致性模型的强化学习），RLCM提供了一种有效的方法来提升图像生成的...

新技术 # RLCM # 一致性模型

2年前

07430

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT，它特别擅长理解中文和英文的文本提示，并据此生成图像，Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话，生成并优化图像...

新技术 # Hunyuan-DiT # 提示词 # 文生图模型

2年前

07420

Garment3DGen：根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

Meta推出Garment3DGen，它是一种自动化的方法，能够将基础的服装网格模型转换成可以直接用于模拟的资产，无论是通过图像还是文本提示。这个方法使得快速生成资产变得简单快捷，大大降低了原本需要专...

新技术 # 3D服装模型 # Garment3DGen

2年前

07420

全新文生图框架RealCompo：结合SD1.5模型与GLIGEN模型的优势来提高生成图像的质量

RealCompo是一个全新的文生图框架，它旨在解决当前文生图模型在处理多对象组合生成时遇到的困难，通过动态平衡真实性和组合性来提高生成图像的质量。 GitHub 论文 RealCompo利用了文本到...

新技术 # GLIGEN模型 # RealCompo # 文生图框架

2年前

07420

交互式帧插值工具Framer：根据用户的创造力生成两个图像之间平滑过渡的帧

帧插值是生成两个图像之间平滑过渡帧的技术，广泛应用于视频处理、动画制作和内容创作等领域。传统的帧插值方法通常依赖于固定的算法，难以实现对局部运动的精细控制。浙江大学和蚂蚁集团的研究人员提出了Frame...

新技术 # Framer # 帧插值

1年前

07410

【AI周报】openAI取消GPT 4使用时3 小时 40条的限制

1、openAI取消GPT 4使用时3 小时 40条的限制 GPT 4取消了3 小时 40条的限制，可以无限量使用，这是因为竞争加剧还是因为GPT 5要来了呢？ 2、OpenAI首推语音引擎用15秒...

早报 # DBRX # Jamba # OpenAI

2年前

07410

去噪方法GeneOH Diffusion：解决手-物体交互（HOI）去噪的问题

来自清华大学、上海人工智能实验室、上海启智研究院的研究人员推出GeneOH Diffusion，它旨在解决手-物体交互（HOI）去噪的问题。在手-物体交互中，我们经常需要准确地追踪手部动作，尤其是在游...

新技术 # GeneOH Diffusion

2年前

07400

谷歌推出CamViG：控制视频生成过程中的相机视角，从而生成具有精确相机运动的视频

Google Research推出CamViG（Camera Aware Image-to-Video Generation），它能够根据单一图像和三维相机运动信号生成视频。这项技术的核心在于，它能够...

新技术 # CamViG # 相机运动 # 谷歌

2年前

07390

LayerDiffusion：可生成高质量的透明图像和图层

Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新的项目LayerDiffusion，它允许大规模预训练的潜在扩散模型（如...

新技术 # LayerDiffusion # 图层 # 透明图像

2年前

07390

阿里推出AI视频生成模型I2VGen-XL

阿里旗下达摩院推出AI视频生成模型I2VGen-XL，可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频，生成的视频具高清 (1280 * 720)、宽屏 (16:9)、时序连贯、质感好等特...

新技术 # AI视频 # I2VGen-XL # 阿里

2年前

07330

文生视频新技术T2V-Turbo：快速生成高质量的视频，并且能够根据文本描述来创建视频内容

来自加州大学圣巴巴拉分校、谷歌和滑铁卢大学的研究人员推出文生视频新技术T2V-Turbo，它可以快速生成高质量的视频，并且能够根据文本描述来创建视频内容。它将来自混合的不同可微奖励模型的反馈整合到预训...

新技术 # T2V-Turbo # 文生视频

2年前

07320

加载更多

百科

谷歌推出新型图像编辑工具Magic Insert：将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然

一致性模型的强化学习RLCM：提升图像生成的速度和质量

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

Garment3DGen：根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

全新文生图框架RealCompo：结合SD1.5模型与GLIGEN模型的优势来提高生成图像的质量

交互式帧插值工具Framer：根据用户的创造力生成两个图像之间平滑过渡的帧

【AI周报】openAI取消GPT 4使用时3 小时 40条的限制

去噪方法GeneOH Diffusion：解决手-物体交互（HOI）去噪的问题

谷歌推出CamViG：控制视频生成过程中的相机视角，从而生成具有精确相机运动的视频

LayerDiffusion：可生成高质量的透明图像和图层

阿里推出AI视频生成模型I2VGen-XL

文生视频新技术T2V-Turbo：快速生成高质量的视频，并且能够根据文本描述来创建视频内容

S.H.I.T

新Flova

Manus

Tripo

Meshy

抓虾吧

百科

网址

S.H.I.T

新Flova

Manus

Tripo

Meshy

抓虾吧