模型 | 第85页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

StabilityAI推出全新视频生成模型Stable Video 4D（SV4D）：可将单个视频转化为 8 个不同角度/视图的新视图视频

StabilityAI在今天推出一个新的视频生成模型Stable Video 4D（SV4D），只需 40 秒就可将单个视频转化为 8 个不同角度/视图的新视图视频（5 帧/个视角），整个 4D 优化...

11个月前

01,0510

以Stable Cascade为基础！新型超高分辨率图像生成方法UltraPixel：生成从1K至6K多种分辨率的高品质图像

香港科技大学（广州）、华为诺亚方舟实验室、马克斯普朗克信息研究所和香港科技大学的研究人员推出一种新型超高分辨率图像生成方法UltraPixel，此方法是以Stability AI的模型Stable...

图像模型 # Stable Cascade # UltraPixel # 超高分辨率图像生成

11个月前

07150

Fal.ai平台推出新DiT模型AuraFlow：支持文字，百分百开源

Stability AI因为Stable Diffusion 3 Medium模型的许可证问题备受诟病，虽然后来更改了许可证，但此模型在人物尤其是躺倒后人物的糟糕表现还是不受开源社区待见。不少人开始转...

图像模型 # AuraFlow # DiT模型 # Fal.ai

11个月前

06400

多语言文本编码器Glyph-ByT5-v2：提高在图形设计图像中渲染多种语言文本的准确性和美观度

来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2，这是之前介绍的Glyph-ByT5升级版，此技术的目标是提高在图形设计图像中渲染多...

大语言模型 # Glyph-ByT5-v2 # Glyph-SDXL-v2 # 文本编码器

11个月前

01,0350

单目深度估算模型Depth Anything V2：通过分析单张图片来预测物体距离

来自香港大学和TikTok的研究人员推出单目深度估算模型Depth Anything的升级版Depth Anything V2，让计算机通过分析单张图片来预测物体距离的技术，这在自动驾驶、3D建模和虚...

图像模型 # Depth Anything V2 # 单目深度估算模型

11个月前

01,1930

Stability AI释出Stable Diffusion 3 Medium模型，8G显存显卡即可使用

Stability AI终于在6月12日释出了万众期待的Stable Diffusion 3模型，不过此次释出的仅是 20 亿个参数的Stable Diffusion 3 Medium 模型，该型号尺...

图像模型 # SD3模型 # Stability AI # Stable Diffusion 3 Medium

11个月前

05,0400

设计灵感来源于PaLI-3！谷歌推出开源视觉语言模型PaliGemma

PaliGemma 是谷歌推出的新一代视觉语言模型家族，其设计灵感来源于PaLI-3，能够接收图像与文本输入并生成文本输出。PaliGemma建立在包括SigLIP视觉模型和Gemma语言模型在内的开...

多模态模型 # PaliGemma # 谷歌

11个月前

06530

Jasper推出新型蒸馏方法Flash Diffusion：高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型图像生成

Jasper推出了一种高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型生成的蒸馏方法Flash Diffusion，该方法在COCO 2014和COCO 2017数据集上，针对少量步骤的图像...

图像模型 # Flash Diffusion # Jasper # 蒸馏模型

11个月前

08450

SDXL系列新模型SDXL Flash：高速且保证质量的SDXL模型

Stable Diffusion Community是一个非官方、非盈利性质的组织，它们主要目标是尽可能改进 SD 模型并让每个人都可以使用它们，近期它们推出了新的SDXL系列模型SDXL Flash...

图像模型 # SDXL Flash # sdxl-flash-mini # 高速模型

11个月前

01,0240

全新开源背景移除模型ormbg：专门针对含有人物的图像进行了优化

ormbg是一个基于基于高度准确的二分类图像分割（DIS）的全新开源背景移除模型，它专门针对含有人物的图像进行了优化，此模型类似于 RMBG-1.4，但提供了开放的训练数据和流程，且商业使用免费。它提...

图像模型 # DIS # ormbg # 背景移除模型

11个月前

01,1630

字节跳动推出新型蒸馏模型Hyper-SD：基于SD1.5和SDXL1.0基础模型提炼

字节跳动在推出文生图模型SDXL-Lightning后，又推出了新的蒸馏模型Hyper-SD，它有效地结合了ODE轨迹保留和重构的优点，同时在步骤压缩过程中保持了接近无损的性能。与SDXL-Light...

图像模型 # Hyper-SD # 字节跳动 # 蒸馏模型

11个月前

01,1830

文生图模型新架构MoA：根据用户的个性化需求生成包含特定人物的图像，同时保持原有模型的风格和多样性

Snap推出新架构注意力混合（Mixture-of-Attention，简称MoA），即在个性化图像生成中实现主体与上下文解耦的注意力混合模型（MoA），用于个性化文本到图像的扩散模型。简单来说，Mo...

图像模型 # MoA # 文生图模型

11个月前

09870

加载更多

模型

StabilityAI推出全新视频生成模型Stable Video 4D（SV4D）：可将单个视频转化为 8 个不同角度/视图的新视图视频

以Stable Cascade为基础！新型超高分辨率图像生成方法UltraPixel：生成从1K至6K多种分辨率的高品质图像

Fal.ai平台推出新DiT模型AuraFlow：支持文字，百分百开源

多语言文本编码器Glyph-ByT5-v2：提高在图形设计图像中渲染多种语言文本的准确性和美观度

单目深度估算模型Depth Anything V2：通过分析单张图片来预测物体距离

Stability AI释出Stable Diffusion 3 Medium模型，8G显存显卡即可使用

设计灵感来源于PaLI-3！谷歌推出开源视觉语言模型PaliGemma

Jasper推出新型蒸馏方法Flash Diffusion：高效、快速、多用途且与LoRA兼容，旨在加速预训练扩散模型图像生成

SDXL系列新模型SDXL Flash：高速且保证质量的SDXL模型

全新开源背景移除模型ormbg：专门针对含有人物的图像进行了优化

字节跳动推出新型蒸馏模型Hyper-SD：基于SD1.5和SDXL1.0基础模型提炼

文生图模型新架构MoA：根据用户的个性化需求生成包含特定人物的图像，同时保持原有模型的风格和多样性

NotebookLM

oLLM

OpenAI Codex CLI

CachyOS

Meshy

Genspark

模型

网址

NotebookLM

oLLM

OpenAI Codex CLI

CachyOS

Meshy

Genspark