新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

SPRIGHT T2I：改进文生图模型在生成图像时保持空间一致性的能力

来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I，探讨如何改进文生图（Text-to-Image，简称T2I）模型在生成图像时保持空间一致性...

2年前

09230

通义千问视觉理解模型 Qwen-VL升级版：Qwen-VL-Plus、Qwen-VL-Max

阿里云宣布通义千问视觉理解模型 Qwen-VL 再次升级，继 Plus 版本之后推出 Max 版本，升级版模型拥有更强的视觉推理能力和中文理解能力，能够根据图片识人、答题、创作、写代码，并在多个权威测...

新技术 # Qwen-VL-Max # Qwen-VL-Plus # 视觉理解模型

2年前

09230

Controlnet作者新项目IC-Light：根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目，这是一款控制图像照明效果的模型，简单来说其主...

新技术 # controlnet # IC-Light # 打光

2年前

09210

双语文本到图像生成模型Taiyi-Diffusion-XL，支持中文提示词

IDEA 研究院是由沈向洋创立，他们在2021年11月22日宣布启动“封神榜”大模型开源体系。“封神榜”是由 IDEA-CCNL 的工程师、研究人员、实习生团队共同维护的一项长期开源计划。项目基于Ap...

新技术 # SDXL # Taiyi-Diffusion-XL # 中文提示词

2年前

09170

采样调节器AlignYouSteps：优化采样步骤，从而提高生成图像的细节和质量

英伟达、多伦多大学和矢量研究所的研究人员推出新的采样调节器AlignYouSteps（调整步伐），用于优化采样步骤，从而提高生成图像的细节和质量。这是一种通用且原则性的方法，用于优化扩散模型的采样计划...

新技术 # AlignYouSteps # 英伟达 # 采样调节器

2年前

09110

ControlNet++：通过显式优化生成图像与条件控制之间的像素级循环一致性，来改进可控生成过程

中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++，这是一种新方法，通过显式优化生成图像与条件控制之间的像素级循环一致性，来改进可控生成过程。具体来说，对于给定的条件控制...

新技术 # controlnet # 可控性 # 文生图模型

2年前

09070

新型图像编辑框架Differential Diffusion：精确地控制图像的编辑过程

来自特拉维夫大学、赖希曼大学的研究人员推出新型图像编辑框架Differential Diffusion，此框架的核心特点是能够让用户对图像的每个像素或区域进行不同程度的编辑，这在以往的图像编辑技术中是...

新技术 # Differential Diffusion # 图像编辑

2年前

09060

新型图像生成模型DiMR：通过多分辨率处理和时间依赖的层归一化技术，有效地提高了图像的质量和真实感，减少了失真

字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR（Distortion-reduced Multi-Resolution Diffusion Model），此模...

新技术 # DiMR # 图像生成

2年前

09050

视觉-语言适配器PaLM2-VAdapter：将传统的视觉编码器和大语言模型结合起来

PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型，以提高它们之间的协同工作效果。论文它能够有效地将传统的视觉编码器（vision encoders）和大语言模型（LL...

新技术 # PaLM2-VAdapter # 大语言模型 # 视觉编码器

2年前

08950

AI视频编辑工具LAVE：利用大语言模型（LLMs）来辅助用户进行视频编辑

来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE（LLM-Powered Agent Assistance and Language Augmentation for Vide...

新技术 # AI视频编辑 # LAVE

2年前

08920

小冰推出Portrait4D-v2：创建出逼真的4D头部头像

小冰推出Portrait4D-v2，它能够创建出逼真的4D头部头像。4D头像不仅具有三维的立体形状，还能随着时间变化而展示出不同的面部表情和头部动作，就像活生生的人一样。这项技术的应用前景非常广泛，比...

新技术 # 4D头部头像 # Portrait4D-v2

2年前

08900

新型视频超分辨率（VSR）技术EvTexture：通过挖掘事件数据中的高频细节，从而提高视频的分辨率和质量

中国科学技术大学和合肥国家科学中心人工智能研究院的研究人员推出新型视频超分辨率（VSR）技术EvTexture，这项技术的核心在于利用事件驱动的信号来增强视频中的纹理细节，从而提高视频的分辨率和质量...

新技术 # EvTexture # VSR # 视频超分辨率

2年前

08840

加载更多