SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1055 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    新型视频生成模型T2V-Turbo-v2:基于VideoCrafter2模型提炼,提升视频生成的质量和效率

    新型视频生成模型T2V-Turbo-v2:基于VideoCrafter2模型提炼,提升视频生成的质量和效率

    加州大学圣巴巴拉分校、加州大学洛杉矶分校、亚马逊 AGI和滑铁卢大学的研究人员推出新型视频生成模型T2V-Turbo-v2,它旨在提升基于扩散的文本到视频(T2V)生成的质量和效率。简单来说,这项技术...
    视频模型# T2V-Turbo-v2# 视频生成模型
    11个月前
    07600
    Rev推出开源自动语音识别模型Reverb和话者分离模型

    Rev推出开源自动语音识别模型Reverb和话者分离模型

    Rev 最近宣布开源其尖端的 Reverb 自动语音识别 (ASR) 和话者分离模型。经过 200,000 小时高质量人工转录的英语语音训练,Reverb 在长篇语音识别领域中表现出色,超越了所有现有...
    语音模型# Reverb# 话者分离模型# 语音识别模型
    11个月前
    07500
    图像恢复算法PMRF:改善从损坏的图像中恢复出高质量、逼真图像

    图像恢复算法PMRF:改善从损坏的图像中恢复出高质量、逼真图像

    以色列理工学院的研究人员推出图像恢复算法PMRF(Posterior-Mean Rectified Flow,后验均值校正流),这个算法的目标是改善从损坏的图像中恢复出高质量、逼真图像的方法。具体来说...
    图像模型# PMRF# 图像恢复算法
    11个月前
    06440
    Momo XL:基于SDXL的动漫风格模型

    Momo XL:基于SDXL的动漫风格模型

    Momo XL 是一个基于 Stable Diffusion XL (SDXL) 的动漫风格模型,经过微调后,能够生成具有详细和生动美学的优质动漫风格图像。这款模型专为艺术家和动漫爱好者设计,提供了多...
    图像模型# Momo XL# SDXL# 动漫风格
    11个月前
    04980
    高级插图模型Illustrious:专门针对插画和动画任务进行了优化,主要用于生成动漫风格的图像

    高级插图模型Illustrious:专门针对插画和动画任务进行了优化,主要用于生成动漫风格的图像

    OnomaAI 研究小组推出一个高级插图模型Illustrious,它主要用于生成动漫风格的图像。Illustrious XL是一个基于SDXL的模型,专门针对插画和动画任务进行了优化。它是基于 Ko...
    图像模型# Illustrious# Illustrious XL# 插图模型
    11个月前
    01,2140
    大型多模态模型LLaVA-Video:专门设计来处理视频指令并进行视频内容理解

    大型多模态模型LLaVA-Video:专门设计来处理视频指令并进行视频内容理解

    字节跳动、南洋理工大学S-Lab和北京邮电大学的研究人员推出大型多模态模型LLaVA-Video,专门设计来处理视频指令并进行视频内容理解。这个模型特别擅长于解析和生成与视频内容相关的语言描述,比如详...
    多模态模型# LLaVA-Video# 多模态模型
    11个月前
    05590
    新型开源大型多模态模型LLaVA-Critic:用于评估各种多模态任务的性能

    新型开源大型多模态模型LLaVA-Critic:用于评估各种多模态任务的性能

    字节跳动和马里兰大学帕克分校的研究人员推出新型开源大型多模态模型LLaVA-Critic,它被设计成一个全能的评估者,用于评估各种多模态任务的性能。多模态任务通常涉及理解和生成与图像、视频和文本相关的...
    多模态模型# LLaVA-Critic# 多模态模型
    11个月前
    04420
    新型CLIP专家混合模型CLIP-MoE:可以无缝替换CLIP,以即插即用的方式,而无需在下游框架中进一步适应

    新型CLIP专家混合模型CLIP-MoE:可以无缝替换CLIP,以即插即用的方式,而无需在下游框架中进一步适应

    香港中文大学、上海人工智能实验室和舒尔茨大学的研究人员推出新型CLIP模型CLIP-MoE,它是为了增强现有的多模态智能模型CLIP而设计的。CLIP-MoE可以无缝替换CLIP,以即插即用的方式,而...
    多模态模型# CLIP-MoE# 多模态智能模型
    11个月前
    05860
    蓝莓真身!Black Forest Labs推出FLUX1.1 [pro]和BFL API,生成质量更高速度更快

    蓝莓真身!Black Forest Labs推出FLUX1.1 [pro]和BFL API,生成质量更高速度更快

    由Stable Diffusion 原班人马组成的新公司Black Forest Labs于8月份推出全新文生图模型Flux.1系列后,就迅速取代Stability AI成为AI绘画领域最出色的开源公...
    Flux衍生# Black Forest Labs# FLUX1.1 [pro]
    11个月前
    06260
    OpenAI 推出更快的语音转录模型Whisper large-v3-turbo,不牺牲质量、速度提升8 倍

    OpenAI 推出更快的语音转录模型Whisper large-v3-turbo,不牺牲质量、速度提升8 倍

    在10月1日的DevDay活动中,OpenAI宣布了一项重大更新:推出了Whisper large-v3-turbo语音转录模型。这款新模型在保持质量几乎不变的前提下,处理速度比之前的large-v3...
    语音模型# OpenAI# Whisper large-v3-turbo# 语音转录模型
    11个月前
    06790
    Golden Haggadah:基于FLUX.1-dev的金色哈加达风格LoRA

    Golden Haggadah:基于FLUX.1-dev的金色哈加达风格LoRA

    Golden Haggadah是一款基于FLUX.1-dev,以 14 世纪加西班牙泰罗尼亚金色哈加达风格为基础训练的LoRA模型,适用于生成圣经故事图片。 模型:https://civitai.co...
    Flux衍生# FLUX.1-dev# Golden Haggadah# Lora
    11个月前
    04730
    Photorealistic Portrait Prompt Dataset:专为FLUX.1设计的写实肖像提示数据集

    Photorealistic Portrait Prompt Dataset:专为FLUX.1设计的写实肖像提示数据集

    Photorealistic Portrait Prompt Dataset是专为FLUX.1设计的写实肖像提示数据集,包含精心策划的提示集合。FLUX.1作为先进的文本到图像合成模型,利用复杂提示技...
    Flux衍生# 写实肖像提示数据集
    11个月前
    04450
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Zoom Earth

    Zoom Earth

    ZoomEarth是交互式世界天气图。通过雨量,风力,温度,压力等的交互式地图探索当前天气并查看您所在位置的天气预报。通过ZoomEarth,您可以跟踪台风和风暴的发展、监测野火和烟雾,并通过查看近乎实时更新的卫星图像来了解最新情况。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单