模型 | 第6页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

新型视频生成模型T2V-Turbo-v2：基于VideoCrafter2模型提炼，提升视频生成的质量和效率

加州大学圣巴巴拉分校、加州大学洛杉矶分校、亚马逊 AGI和滑铁卢大学的研究人员推出新型视频生成模型T2V-Turbo-v2，它旨在提升基于扩散的文本到视频（T2V）生成的质量和效率。简单来说，这项技术...

视频模型 # T2V-Turbo-v2 # 视频生成模型

1年前

07830

VectorJourney| Pretend to Travel：卡通插画与真实结合的FLUX LoRA模型

VectorJourney| Pretend to Travel是由Muertu基于FLUX.1-dev上训练的LoRA模型，巧妙融合现实与插画元素。前景角色以插画风格呈现，而背景则为逼真的写实风格...

Flux衍生 # FLUX # LoRA模型 # VectorJourney

1年前

07820

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后，阿里通义千问团队近日推出一款更轻量但性能强劲的新版本： Qwen3-Coder-30B-A3B-Instruct 这...

大语言模型 # Qwen3-Coder-30B-A3B-Instruct # 代码大模型

8个月前

07730

Shuttle 3 Diffusion：基于 Flux.1 Schnell 构建的一款微调模型，能够以简化的四步流程生成高质量的图像

Shuttle 3 Diffusion 是由 ShuttleAI 基于 Flux.1 Schnell 构建的一款微调模型，能够以简化的四步流程生成高质量的图像，其表现与 Flux Dev 或 Pro ...

Flux衍生 # FLUX.1 [schnell]# Shuttle 3 Diffusion

1年前

07680

Stable Diffusion XL(SDXL)

Stability AI于北京时间2023年 7 月 27 日正式发布 Stable Diffusion XL 首个正式版 1.0，SDXL 1.0 能生成更加鲜明准确的色彩，在对比度、光线和阴影方面...

图像模型 # AI绘画 # SDXL # Stable Diffusion XL

1年前

07650

Sand AI推出新型视频生成模型MAGI-1：通过自回归预测视频块序列来生成视频

MAGI-1是由Sand AI研究团队开发的一种新型视频生成模型。该模型通过自回归预测视频块序列来生成视频，每个视频块由固定长度的连续帧组成。MAGI-1的核心目标是实现高保真、实时、因果一致的视频生...

视频模型 # MAGI-1 # Sand AI # 自回归

11个月前

07600

统一框架UniFL：通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能

来自字节跳动和中山大学的研究人员推出利用反馈学习机制来全面增强扩散模型的统一框架UniFL，它通过统一的反馈学习来提升稳定扩散模型（Stable Diffusion）的性能。UniFL作为一种通用、高...

图像模型 # Stable Diffusion # UniFL

1年前

07600

Nexa AI 推出迷你视觉语言模型 OmniVision-968M

Nexa AI 最新发布了 OmniVision-968M，这是一款专为边缘设备设计的视觉语言模型，它通过技术创新，将图像标记数量大幅减少，显著降低了延迟和计算负担，还提升了处理速度，为边缘计算领域带...

多模态模型 # Nexa AI # OmniVision-968M # 视觉语言模型

1年前

07490

腾讯混元发布 HunyuanImage-3.0：800亿参数开源原生多模态模型，实现“语义理解-图像生成”的深度融合

腾讯混元项目组正式发布并开源HunyuanImage-3.0——当前开源社区规模最大、性能最强的文生图模型。该模型总参数量突破800亿，推理时每token仅激活130亿参数（兼顾性能与效率），基于原生...

图像模型 # HunyuanImage-3.0 # 腾讯混元

6个月前

07470

Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版AuraSR-v2

Fal.ai平台推出了新一代GAN 图像放大工具AuraSR的第二版，上个月它们推出了AuraSR 第一版后，得到了开源社区积极回应，让他们立刻着手开发新版。AuraSR 以 Adobe 的 Giga...

图像模型 # AuraSR # AuraSR-v2 # Fal.ai

1年前

07420

多语言、多任务 ASR 模型Dolphin：支持东亚、南亚、东南亚和中东地区的 40 种东方语言，同时也支持 22 种中国方言

近年来，自动语音识别（ASR）技术取得了显著进展，这主要得益于模型架构的改进和大规模数据集的可用性。然而，现有的多语言 ASR 模型（如 Whisper）在处理东方语言时表现不佳，且存在可重复性问题 ...

语音模型 # ASR 模型 # Dolphin # 语音识别

12个月前

07410

日本团队推出浮世绘风格专用生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie

日本AI团队Sakana AI发布了专门用于生成浮世绘风格的生成模型Evo-Ukiyoe和浮世绘上色模型Evo-Nishikie，此模型是是以转为日语打造的图像生成模型Evo-SDXL-JP为基础，通...

图像模型 # Evo-Nishikie # Evo-Ukiyoe # 浮世绘

1年前