百科 | 第24页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

连续3D词（Continuous 3D Words）：通过文本提示来精细控制图像生成过程中的多个属性

来自牛津大学、Adobe Research的研究人员提出了一种“连续3D词（Continuous 3D Words）”的新方法，使得用户能够通过文本提示来精细控制图像生成过程中的多个属性，比如照明方向...

2年前

07030

模型量化技术BitsFusion：减少SD模型参数大小，同时还能让这个模型生成的图片质量更好

Snap和罗格斯大学的研究人员推出新型图像生成模型的权重量化技术BitsFusion。简单来说，就是研究者们开发了一种方法，可以把一个用来生成图片的复杂模型（叫做扩散模型）的参数量大大减少，同时还能让...

新技术 # BitsFusion # 模型参数 # 模型量化

2年前

07020

基于Transformer架构的新型图像生成模型DART：根据文本描述生成高质量的图像

苹果和香港中文大学的研究人员推出新型图像生成模型DART，这个模型的目标是让计算机能够根据文本描述生成高质量的图像。DART是一个基于Transformer架构的模型，它在非马尔可夫框架内统一了自回归...

新技术 # DART # Transformer架构 # 图像生成模型

2年前

07010

腾讯优图推出RealTalk：用于生成逼真、实时的音频驱动人脸视频的框架

腾讯优图实验室和南京大学的研究人员推出新技术RealTalk，它是一个用于生成逼真、实时的音频驱动人脸视频的框架。简单来说，RealTalk可以根据一个人的语音生成一个看起来非常真实的3D人脸动画，而...

新技术 # RealTalk # 南京大学 # 腾讯优图

2年前

06990

Adobe推出新版Photoshop：引入全新 Firefly Image 3模型，“调整刷”与“字体浏览器”带来新体验

在昨天的Adobe Max大会上，Adobe带来了重磅更新：Photoshop迎来全新升级，并集成了图像生成模型Firefly Image 3。这一组合不仅为设计师和创意工作者带来了前所未有的AI图像...

早报 # Adobe # Firefly Image 3 # Photoshop

2年前

06990

LM Studio 0.3.17 版本正式引入MCP支持

LM Studio 0.3.17 版本正式引入了模型上下文协议（Model Context Protocol, MCP）的支持，允许用户将本地或远程的 MCP 服务器连接到应用中，从而为大型语言模...

早报 # LM Studio # MCP

9个月前

06970

无需训练的组合式文本到图像生成方法CompAgent

来自清华大学、华为诺亚方舟实验室、香港大学的研究人员提出了一种无需训练的组合式文本到图像生成方法CompAgent，该方法利用大语言模型(LLM)智能体进行复杂文本提示的分析与规划，将文本分解为单个对...

新技术 # CompAgent # 华为诺亚方舟 # 文生图

2年前

06970

无需训练的图像编辑技术DiffUHaul：专门用于在图像中无缝移动物体

英伟达研究中心、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出一种无需训练的图像编辑技术DiffUHaul，专门用于在图像中无缝移动物体。例如，你有一张图片，里面有一只猫和一块岩石，你想要...

新技术 # DiffUHaul # 图像编辑

2年前

06960

视频对象分割技术SMITE：解决视频内对象的分割问题，特别是在需要任意粒度（即对象可以被分割成不同数量的片段）的情况下

视频对象分割是一项具有挑战性的任务，每个像素必须被准确标记，并且这些标签必须在帧之间保持一致。当分割具有任意粒度时，难度会进一步增加，这意味着段的数量可以任意变化，并且掩模仅基于一个或几个样本图像定义...

新技术 # SMITE # 视频对象分割

1年前

06940

谷歌推出新采样方法EM Distillation（EMD）：用于提高扩散模型（diffusion models）的采样效率

谷歌推出新采样方法EM Distillation（EMD），用于提高扩散模型（diffusion models）的采样效率。扩散模型是一种强大的生成模型，能够学习复杂的数据分布并生成高质量的图像、视频...

新技术 # EM Distillation # EMD # 采样方法

2年前

06940

OpenAI旗下模型选型指南：全面解析 GPT 系列与 o 系列，助你精准选择适合的 AI 模型

OpenAI于近期接连发布了多个新的模型，但命名上的混乱让许多用户难以区分这些模型之间的区别。例如，GPT 4o、GPT-4o mini、o3、o4-mini、GPT-4.1、GPT 4.5，这些模型...

科普 # AI 模型 # ChatGPT # OpenAI

12个月前

06910

图像分割技术OpenTrans：提高开放词汇表分割（OVS）的效率

来自北京交通大学和西蒙菲莎大学的研究人员推出OpenTrans，它旨在提高开放词汇表分割（Open-Vocabulary Segmentation, OVS）的效率。OVS是一种图像分割技术，能够识别...

新技术 # OpenTrans # 图像分割技术

2年前