SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1188 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    EmoNet:迈向真正“有情感”的AI,LAION开源新一代情感智能模型

    EmoNet:迈向真正“有情感”的AI,LAION开源新一代情感智能模型

    人工智能的发展正进入一个全新的阶段:从理解语言到理解情绪。尽管AI在语言处理、推理能力等方面取得了显著进展,但在情感智能(Affective Intelligence)这一维度上,仍然存在巨大空白。 ...
    多模态模型# EmoNet# LAION AI# 情感智能模型
    9个月前
    03130
    EdgeTAM:Meta 与南洋理工等联合推出可在手机运行的视频分割模型,比 SAM 2 快 22 倍

    EdgeTAM:Meta 与南洋理工等联合推出可在手机运行的视频分割模型,比 SAM 2 快 22 倍

    由 Meta Reality 实验室、南洋理工大学 和 上海人工智能实验室 联合提出的新模型 EdgeTAM 引起了广泛关注。该模型是对 Segment Anything Model 2(SAM 2...
    视频模型# EdgeTAM# SAM 2# 视频分割模型
    9个月前
    02770
    Midjourney 正式发布 V1 视频模型:从文本到视频,AI创作迈入新阶段

    Midjourney 正式发布 V1 视频模型:从文本到视频,AI创作迈入新阶段

    6月18日,Midjourney 宣布正式推出其首款视频生成模型 V1,标志着这家以图像生成闻名的 AI 公司,正式进军视频内容创作领域。 这一更新不仅打通了原有的图文生成生态,还实现了从文本直接生成...
    视频模型# Midjourney
    9个月前
    01170
    Jan-Nano:40亿参数的紧凑型研究专用语言模型正式上线

    Jan-Nano:40亿参数的紧凑型研究专用语言模型正式上线

    Menlo发布一款专为深度研究任务设计的小型语言模型 Jan-Nano 。该模型拥有 40亿参数规模,在保证轻量级部署的同时展现出强大的推理能力。此模型基于 Qwen3-4B 构建,并经过 DAPO ...
    大语言模型# Jan-Nano# 小型语言模型
    9个月前
    03310
    Multiverse:全球首个开源的非自回归并行推理框架,推理速度提升2倍

    Multiverse:全球首个开源的非自回归并行推理框架,推理速度提升2倍

    卡内基梅隆大学与英伟达联合推出了一项具有突破性的生成模型框架——Multiverse。这是全球首个开源的非自回归(Non-Autoregressive)并行推理框架,在保持与主流自回归模型(AR-LL...
    大语言模型# Multiverse# 推理框架
    9个月前
    02000
    MiniMax正式发布Hailuo 02:全球首个能生成高复杂度体操动作的视频模型

    MiniMax正式发布Hailuo 02:全球首个能生成高复杂度体操动作的视频模型

    MiniMax宣布推出全新视频生成模型——Hailuo 02,这是目前全球唯一一个能够高质量生成如“体操运动”这类高复杂度场景的AI视频模型。 地址:https://hailuoai.com/crea...
    视频模型# Hailuo 02# MiniMax
    9个月前
    02930
    中科院团队推出多模态新模型 Stream-Omni,语音+视觉交互更高效

    中科院团队推出多模态新模型 Stream-Omni,语音+视觉交互更高效

    由中国科学院计算技术研究所智能信息处理重点实验室、中国科学院人工智能安全重点实验室以及中国科学院大学联合提出,Stream-Omni 是一种新型的语言-视觉-语音多模态模型。该模型通过高效的模态对齐机...
    语音模型# Stream-Omni# 语言-视觉-语音多模态模型
    9个月前
    03000
    MiniMax发布全球首款开源大规模混合注意力推理模型MiniMax-M1

    MiniMax发布全球首款开源大规模混合注意力推理模型MiniMax-M1

    近日,MiniMax 宣布推出全新大语言模型 MiniMax-M1,这是全球首款开源的大规模混合注意力推理模型,专为复杂任务和长上下文场景设计。 GitHub:https://github.com/M...
    大语言模型# MiniMax# MiniMax-M1
    9个月前
    02660
    月之暗面推出Kimi-Dev-72B:为软件工程任务打造的新一代开源编码大模型

    月之暗面推出Kimi-Dev-72B:为软件工程任务打造的新一代开源编码大模型

    月之暗面推出一款全新的开源编码大语言模型 Kimi-Dev-72B,专为软件工程任务设计。该模型基于 Qwen2.5-72B 微调而来,在 SWE-bench Verified 测试中取得了 60.4...
    大语言模型# Kimi-Dev-72B# 月之暗面
    9个月前
    03570
    清华、腾讯等联合推出基于语言模型的高质量歌曲生成框架 LeVo

    清华、腾讯等联合推出基于语言模型的高质量歌曲生成框架 LeVo

    随着大语言模型(LLMs)和音频语言模型的快速发展,AI 在音乐生成领域的能力显著提升,特别是在 歌词到歌曲生成 的方向上取得了突破性进展。 然而,现有方法仍面临两大核心挑战: 歌曲结构复杂,难以同时...
    语音模型# LeVo# SongGeneration# 音乐生成
    9个月前
    02600
    Nanonets 推出 Nanonets-OCR-s:首个面向 LLM 的结构化 OCR 模型

    Nanonets 推出 Nanonets-OCR-s:首个面向 LLM 的结构化 OCR 模型

    近日,Nanonets 宣布推出一款全新的 OCR 模型 Nanonets-OCR-s ——这是一款专为大语言模型(LLMs)设计的图像转 Markdown 工具,具备强大的文档理解与结构化输出能力...
    多模态模型# Nanonets-OCR-s# OCR 模型
    9个月前
    03010
    微软与 OpenAI 支持,哈佛法学院发起:首个大规模公共 AI 图书数据集正式开源

    微软与 OpenAI 支持,哈佛法学院发起:首个大规模公共 AI 图书数据集正式开源

    上周,由微软与 OpenAI 联合资助、起源于哈佛大学法学院图书馆研究计划的 机构资料计划(Institutional Data Initiative,简称 IDI)宣布开源其首个大型 AI 数据集...
    大语言模型# OpenAI# 哈佛法学院# 微软
    9个月前
    02670
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    悟空

    悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    查看完整榜单