SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1055 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    端到端唇音同步框架LatentSync:可以分析新的音频信号,并生成与音频同步的口型

    端到端唇音同步框架LatentSync:可以分析新的音频信号,并生成与音频同步的口型

    字节跳动与北京交通大学的研究团队共同提出了一种名为LatentSync的新方法,旨在解决唇音同步的问题。这一框架利用了Stable Diffusion的强大能力,通过一个端到端的流程直接建模复杂的音视...
    语音模型# LatentSync# 唇音同步
    11个月前
    03860
    文本到音频生成模型TANGOFLUX:从文本描述中快速、忠实地生成高质量的音频内容

    文本到音频生成模型TANGOFLUX:从文本描述中快速、忠实地生成高质量的音频内容

    随着人工智能技术的发展,文本到音频(TTA)生成模型正在逐渐改变我们与数字内容互动的方式。然而,创建高质量且自然的音频输出仍然是一个复杂的技术挑战,尤其是在对齐模型以产生符合人类期望的音频方面。新加坡...
    语音模型# TANGOFLUX# 文本到音频生成模型
    5个月前
    03450
    用文生图的新型规模感知变换器SWITTI:基于现有的下一代规模预测自回归(AR)模型

    用文生图的新型规模感知变换器SWITTI:基于现有的下一代规模预测自回归(AR)模型

    Yandex Research、俄罗斯国立研究型大学高等经济学院、莫斯科物理技术学院和Skoltech科大的研究人员推出新型规模感知变换器SWITTI,它用于文本到图像的合成。SWITTI基于现有的下...
    图像模型# AR模型# SWITTI
    11个月前
    03680
    Snow Ball:雪花球主题的Flux Lora,允许在雪花球内展示各种场景

    Snow Ball:雪花球主题的Flux Lora,允许在雪花球内展示各种场景

    Snow Globe - Snow Ball是一款雪花球主题的Flux Lora,允许在雪球内展示各种场景,非常适合与其他类型Lora搭配使用。 地址:https://tensor.art/model...
    Flux衍生# Flux LoRa# Snow Ball# 雪花球
    11个月前
    03470
    Seiwert Industrial:抽象工业现代主义风格Flux Lora

    Seiwert Industrial:抽象工业现代主义风格Flux Lora

    Seiwert Industrial是一款受弗朗茨·威廉·塞维特(Franz Wilhelm Seiwert,1894–1933)启发的抽象工业现代主义风格Flux Lora,弗朗茨·威廉·塞维特是集...
    Flux衍生# Seiwert Industrial# 工业现代主义
    11个月前
    03110
    Gesture Draw:草图风格Flux Lora,非常适合捕捉动态和能量,是绘制粗略、手势草图的完美选择

    Gesture Draw:草图风格Flux Lora,非常适合捕捉动态和能量,是绘制粗略、手势草图的完美选择

    Gesture Draw是一个草图风格Flux Lora,非常适合捕捉动态和能量,是绘制粗略、手势草图的完美选择。无论是快速练习还是动态姿势,这个LoRA都能保持草图的生动感和生命力。跳过过度修饰的外...
    Flux衍生# Flux LoRa# Gesture Draw# 草图
    11个月前
    03030
    RisographPrint:Risograph印刷风格Flux Lora,适合用于小册子、海报以及具有纹理和手工艺感的醒目平面设计

    RisographPrint:Risograph印刷风格Flux Lora,适合用于小册子、海报以及具有纹理和手工艺感的醒目平面设计

    RisographPrint是一款Risograph印刷风格Flux Lora,以其鲜艳的分层色彩、半透明的大豆油墨以及轻微的瑕疵(如错位和半色调渐变)而闻名。这种风格将复古美学与现代多功能性相结合...
    Flux衍生# Flux LoRa# RisographPrint
    11个月前
    03290
    Ligne Claire:法国漫画家尚·吉罗开创的“Ligne Claire”艺术风格Flux Lora

    Ligne Claire:法国漫画家尚·吉罗开创的“Ligne Claire”艺术风格Flux Lora

    Ligne Claire是一款旨在生成类似于由法国漫画家Jean Giraud(尚·吉罗)开创的“Ligne Claire”艺术风格图像的Flux Lora。 模型地址:https://civitai...
    Flux衍生# Flux LoRa# Ligne Claire# 尚·吉罗
    11个月前
    03250
    Everly Heights Character Sheets:专为故事创作者、动画师和游戏开发者设计的Flux Lora

    Everly Heights Character Sheets:专为故事创作者、动画师和游戏开发者设计的Flux Lora

    Everly Heights Character Sheets是一款专为故事创作者、动画师和游戏开发者设计的Flux Lora,这款LoRA模型以精准和风格创建专业级角色设定表。无论你是为动画、漫画还...
    Flux衍生# Everly Heights Character Sheets
    11个月前
    03210
    CELEBRIT:重现MTV昔日热门节目《名人死亡赛》中黏土动画风格的Flux Lora

    CELEBRIT:重现MTV昔日热门节目《名人死亡赛》中黏土动画风格的Flux Lora

    CELEBRIT是一款旨在重现MTV昔日热门节目《名人死亡赛》中黏土动画风格的Flux Lora,开发者推出了两款模型(经典版和多功能版),无需触发关键词即可使用。 模型地址:https://civi...
    Flux衍生# Flux LoRa# 名人死亡赛# 黏土动画
    11个月前
    02670
    CogAgent-9B-20241220:基于视觉语言模型的开源 GUI agent 模型

    CogAgent-9B-20241220:基于视觉语言模型的开源 GUI agent 模型

    图形用户界面(GUI)是用户与软件交互的核心。然而,构建能够有效导航GUI的智能代理一直是一个持续的挑战。传统方法在适应性方面存在不足,尤其是在处理复杂布局或GUI频繁变化时,这些问题限制了自动化GU...
    多模态模型# CogAgent-9B-20241220
    11个月前
    02720
    腾讯发布一种在 MM-DiT 架构下无需额外训练的多提示长视频生成方法DiTCtrl

    腾讯发布一种在 MM-DiT 架构下无需额外训练的多提示长视频生成方法DiTCtrl

    随着视频生成模型的发展,基于DiT架构如 Sora 和 MM-DiT 在单提示视频生成任务中取得了显著进展。然而,这些模型在处理多个顺序提示时面临诸多挑战,难以生成连贯且自然过渡的场景。具体来说: 严...
    视频模型# DiTCtrl
    11个月前
    03160
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    MiroFish

    MiroFish

    MiroFish 是一款基于多智能体技术的新一代 AI 预测引擎。通过提取现实世界的种子信息(如突发新闻、政策草案、金融信号),自动构建出高保真的平行数字世界。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单