百科 | 第166页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5：推动开放集对象检测技术的边界

IDEA研究院（粤港澳大湾区数字经济研究院）推出先进模型系列Grounding DINO 1.5，旨在推动开放集对象检测技术的边界。开放集对象检测是一种计算机视觉任务，它要求模型能够识别图像中的对象...

2年前

07510

Meta推出多模态基础模型家族Chameleon：专为理解和生成图像与文本而设计

Meta推出多模态基础模型家族Chameleon，它们是专为理解和生成图像与文本而设计，多模态意味着这些模型能够同时处理多种类型的数据，比如图片和文字。例如，你给Chameleon一个描述或者一张图片...

新技术 # Chameleon # Meta # 多模态基础模型

2年前

08040

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT：能够根据上下文与用户进行多轮多模态对话，生成并优化图像

腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT，它特别擅长理解中文和英文的文本提示，并据此生成图像，Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话，生成并优化图像...

新技术 # Hunyuan-DiT # 提示词 # 文生图模型

2年前

07270

Controlnet作者新项目IC-Light：根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目，这是一款控制图像照明效果的模型，简单来说其主...

新技术 # controlnet # IC-Light # 打光

2年前

09110

新型图像上采样模型Inf-DiT：高效地对任何分辨率的图像进行上采样，即提高图像的分辨率而不失细节

清华大学与智谱AI的研究人员推出新型图像上采样模型Inf-DiT，它能够高效地对任何分辨率的图像进行上采样，即提高图像的分辨率而不失细节。在图像处理领域，上采样是一个重要的技术，它可以用于放大图像而不...

新技术 # Inf-DiT # 图像上采样模型

2年前

01,1940

谷歌推出新框架ImageInWords（IIW）：创建准确且细节丰富的图像描述，以提高视觉-语言模型的训练效果

Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords（IIW），此框架旨在创建准确且细节丰富的图像描述，以提高视觉-语言模型（VLMs...

新技术 # IIW # ImageInWords # 数据集

2年前

06950

新型视觉模型EfficientViT：专门用于高分辨率的密集预测任务

来自MIT、浙江大学、清华大学、MIT-IBM Watson AI实验室的研究人员推出新型视觉模型EfficientViT，它专门用于高分辨率的密集预测任务。这类任务在计算机视觉领域非常重要，应用范围...

新技术 # EfficientViT # 视觉模型

2年前

06470

如何从HuggingFace导入新模型到Ollama

在《如何在本地安装及使用Ollama，轻松玩转本地大语言模型》这篇文章里，已经详细向大家介绍了Ollama这款软件如何安装及使用，虽然官方的模型库已经提供了大量可用模型，但与Hugging Face上...

教程 # HuggingFace # Ollama

2年前

01,4910

图像和视频生成框架StoryDiffusion：能够生成一系列内容一致的图像和视频

来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion，这项技术的核心在于它能够生成一系列内容一致的图像和视频，这对于讲述一个故事或者展示一个连贯的场景来说非常重要...

新技术 # StoryDiffusion # 图像生成 # 视频生成

2年前

07960

文生图定制模型Pair Customization：从单一图像对中学习风格差异，并随后将习得的风格应用于生成过程中

来自卡内基梅隆大学和东北大学的研究人员推出新定制方法Pair Customization，该方法从单一图像对中学习风格差异，并随后将习得的风格应用于生成过程中。这是一款使用一对图像（一个原始图像和一个...

新技术 # Pair Customization # 文生图定制模型

2年前

05830

3D服装生成框架DressCode：根据文本指导生成具有缝纫图案和基于物理渲染（PBR）纹理的服装

上海科技大学、宾夕法尼亚大学、影眸科技和赜深科技推出3D服装生成框架DressCode，它能够根据文本指导生成具有缝纫图案和基于物理渲染（PBR）纹理的服装。这项技术对于数字化人类创建、时尚设计、虚拟...

新技术 # 3D服装生成 # DressCode

2年前

09090

适配器样式Stylus：自动选择和组合适配器（adapters），以提高生成图像的质量

来自加州大学伯克利分校、卡内基梅隆大学和Google Deepmind的研究人员推出新的适配器样式Stylus，它能够自动选择和组合适配器（adapters），以提高生成图像的质量。适配器是一种在特定...

百科 # Stylus # 适配器样式

2年前

07680

加载更多

百科