SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1055 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    Playful Metropolis:融合了都市环境与卡通元素的插画风格Flux Lora

    Playful Metropolis:融合了都市环境与卡通元素的插画风格Flux Lora

    Playful Metropolis是一款充满活力与创意的插画风格Flux Lora,融合了都市环境与充满想象力的卡通元素。这种风格通过将日常城市景观与夸张、有趣的角色和场景相结合,创造出一种超现实又...
    Flux衍生# Playful Metropolis
    11个月前
    02790
    Propaganda Games:20 世纪中叶宣传海报风格Lora

    Propaganda Games:20 世纪中叶宣传海报风格Lora

    Propaganda Games是一款受英国标志性平面设计师阿布拉姆·盖姆斯 (1914-1996) 标志性风格启发的Flux Lora,此 LoRA 捕捉了 20 世纪中叶宣传海报的鲜明、震撼的美学...
    Flux衍生# Propaganda Games
    11个月前
    02960
    肖像图像动画Hallo系列再次更新!Hallo3框架引入Cogvidex模型,生成的肖像动画动作更自然、画面更逼真

    肖像图像动画Hallo系列再次更新!Hallo3框架引入Cogvidex模型,生成的肖像动画动作更自然、画面更逼真

    复旦大学、百度的研究人员对再次对Hallo 进行了更新,提出了 Hallo3框架,在通过预训练的基于变换器的视频生成模型(Cogvidex),解决现有肖像图像动画技术在处理非正面视角、渲染肖像周围动态...
    视频模型# Cogvidex模型# Hallo3
    11个月前
    02880
    Stability AI推出图生3D框架SPAR3D:从单张图片生成可编辑的 3D 模型

    Stability AI推出图生3D框架SPAR3D:从单张图片生成可编辑的 3D 模型

    Stability AI和伊利诺伊大学厄巴纳-香槟分校的研究人员推出一个用于从单视图图像重建高质量3D对象的先进框架SPAR3D,SPAR3D通过结合回归模型和生成模型的优势,实现了高效的3D重建,同...
    3D模型# 3D模型# SPAR3D# Stability AI
    11个月前
    02970
    Adobe推出TransPixar:通过文本和图像生成透明背景的视频

    Adobe推出TransPixar:通过文本和图像生成透明背景的视频

    香港科技大学(广州)和 Adob​​e 研究的研究人员推出一种先进的文本到视频生成方法 TransPixar,特别专注于生成包含透明度通道(Alpha Channel)的RGBA视频,也就是能够通过文...
    视频模型# TransPixar
    11个月前
    02790
    新型多模态大语言模型Sa2VA:将 SAM2 与 LLaVA相结合,实现对图像和视频的深入理解

    新型多模态大语言模型Sa2VA:将 SAM2 与 LLaVA相结合,实现对图像和视频的深入理解

    加州大学默塞德分校、字节跳动、武汉大学和北京大学的研究人员推出新型多模态大语言模型Sa2VA,它将SAM-2视频分割模型与LLaVA视觉-语言模型相结合,实现了对图像和视频的密集、基于语义的理解。Sa...
    多模态模型# Sa2VA# 多模态大语言模型
    11个月前
    02720
    微软正式开源了Phi-4:拥有140亿参数的小型语言模型

    微软正式开源了Phi-4:拥有140亿参数的小型语言模型

    去年12月,微软推出了其Phi系列的最新成员——Phi-4,该模型在解决数学问题等方面展现了显著的进步。这些进步主要得益于训练数据质量的提升,特别是采用了高质量的合成数据集和人类生成的内容数据集。然而...
    大语言模型# Phi-4# 微软
    11个月前
    02980
    高效大型多模态模型LLaVA-Mini:通过最小化视觉令牌(vision tokens)的数量来提高模型的计算效率和响应速度

    高效大型多模态模型LLaVA-Mini:通过最小化视觉令牌(vision tokens)的数量来提高模型的计算效率和响应速度

    中国科学院计算技术研究所智能信息处理重点实验室(ICT/CAS)、中国科学院人工智能安全重点实验室和中国科学院大学的研究人员推出高效大型多模态模型LLaVA-Mini,旨在通过最小化视觉令牌(visi...
    多模态模型# LLaVA-Mini# 多模态模型
    11个月前
    02840
    开源多模态视频语音大模型VITA-1.5: 基于Qwen2.5模型,实现接近实时的视觉和语音交互能力

    开源多模态视频语音大模型VITA-1.5: 基于Qwen2.5模型,实现接近实时的视觉和语音交互能力

    随着多模态大语言模型(MLLMs)的发展,如何有效地整合视觉、语言和语音成为了人工智能领域面临的一个重要挑战。VITA-1.5 是由南京大学(NJU)、腾讯优图实验室(Tencent Youtu La...
    语音模型# Qwen2.5模型# VITA-1.5
    11个月前
    03350
    英伟达推出世界基础模型平台NVIDIA Cosmos :帮助物理 AI 开发人员更好、更快地构建物理 AI 系统

    英伟达推出世界基础模型平台NVIDIA Cosmos :帮助物理 AI 开发人员更好、更快地构建物理 AI 系统

    英伟达在CES2025上宣布推出 NVIDIA Cosmos 平台,该平台包含先进的世界基础生成模型、高级分词器、防护栏和加速视频处理管道,旨在推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展...
    多模态模型# NVIDIA Cosmos# 世界模型# 英伟达
    11个月前
    03530
    Anaglyph3D:生成3D图像的Flux Lora,不过需要你戴上红蓝 3D 眼镜观看

    Anaglyph3D:生成3D图像的Flux Lora,不过需要你戴上红蓝 3D 眼镜观看

    Anaglyph3D是一款能够让你生成3D图像的Flux Lora,不过需要你戴上红蓝 3D 眼镜观看,才能看到图像展现出的效果,红蓝3D眼睛很便宜,只需要几块钱就可以在网上买到。 模型地址:http...
    Flux衍生# Anaglyph3D# Flux LoRa
    11个月前
    04710
    Etch A Sketcher:重现 Etch A Sketch 玩具的外观及其独特的线描风格的Flux Lora

    Etch A Sketcher:重现 Etch A Sketch 玩具的外观及其独特的线描风格的Flux Lora

    Etch A Sketcher是一款国外经典艺术玩具Etch A Sketcher(蚀刻素描)的Flux Lora,旨在重现 Etch A Sketch 玩具的外观及其独特的线描风格。 地址:http...
    Flux衍生# Etch A Sketcher# 蚀刻素描
    11个月前
    03330
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    MiroFish

    MiroFish

    MiroFish 是一款基于多智能体技术的新一代 AI 预测引擎。通过提取现实世界的种子信息(如突发新闻、政策草案、金融信号),自动构建出高保真的平行数字世界。
    互联网大厂模拟器

    互联网大厂模拟器

    《互联网大厂模拟器》或许不会改变现实,但它提供了一个出口:在虚拟世界里,我们可以安全地体验“另一种职场人生”,然后笑着关掉页面,继续面对明天的站会。
    Moonvalley

    Moonvalley

    洛杉矶初创公司 Moonvalley 发布了一款名为“Marey”的 AI 视频生成模型。Marey 使用“自有或完全许可”的源数据进行训练,并提供精细的相机和运动控制等定制选项。
    查看完整榜单