SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    美团 LongCat 团队发布 LongCat-Video:高效长视频生成的开源新标杆

    美团 LongCat 团队发布 LongCat-Video:高效长视频生成的开源新标杆

    美团LongCat团队推出 LongCat-Video,这是一个基础视频生成模型,拥有 13.6B 参数,在文本到视频、图像到视频以及视频续接生成任务中表现出色。它特别擅长高效且高质量的长视频生成,标...
    视频模型# LongCat# LongCat-Video# 美团
    1个月前
    0170
    蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族

    蚂蚁集团发布 Ling 2.0:基于“推理优先”原则的稀疏大模型家族

    蚂蚁集团 百灵大模型团队近日发布 Ling 2.0 —— 一个系统性构建的 稀疏混合专家(MoE)语言模型系列,核心理念是:模型容量可无限扩展,但每个 token 的计算成本应保持恒定。该系列通过统一...
    大语言模型# Ling 2.0# 蚂蚁集团
    1个月前
    0310
    MiniMax 发布 MiniMax M2:面向编码与代理的高性能开源 MoE 模型

    MiniMax 发布 MiniMax M2:面向编码与代理的高性能开源 MoE 模型

    MiniMax 团队正式发布 MiniMax M2 —— 一款专为代码生成与 AI 代理工作流优化的混合专家(Mixture-of-Experts, MoE)模型。该模型以 MIT 开源许可 在 Hu...
    大语言模型# MiniMax M2
    1个月前
    0170
    美团发布LongCat-Flash-Omni:开源全模态大模型的实时交互新标杆

    美团发布LongCat-Flash-Omni:开源全模态大模型的实时交互新标杆

    美团 LongCat 团队近日开源了 LongCat-Flash-Omni —— 一款参数总量达 5600 亿、每 token 动态激活 270 亿参数 的 全模态大模型(Full-Modal LLM...
    多模态模型# LongCat-Flash-Omni# 美团
    1个月前
    0110
    百度飞桨发布 PaddleOCR-VL(0.9B):轻量级端到端多语言文档解析模型

    百度飞桨发布 PaddleOCR-VL(0.9B):轻量级端到端多语言文档解析模型

    百度飞桨团队近日开源 PaddleOCR-VL(0.9B)——一款专为复杂版式文档智能解析设计的视觉语言模型(VLM)。该模型以仅 9亿参数的轻量级架构,实现了对文本、表格、数学公式、图表及手写体的高...
    多模态模型# PaddleOCR-VL# 文档解析模型
    1个月前
    0160
    谷歌在 Mixboard 测试标注与背景移除功能,强化视觉工作流

    谷歌在 Mixboard 测试标注与背景移除功能,强化视觉工作流

    谷歌正在为其 AI 视觉实验平台 Mixboard 测试一系列新功能,包括图像背景移除与高级标注工具,进一步拓展其在教育、演示和产品设计场景中的应用潜力。 Mixboard 是一款基于结构化画布的 A...
    早报# Mixboard# 谷歌
    1个月前
    0140
    谷歌正为 Stitch 推出图像代理与智能导出功能,强化设计-开发协同

    谷歌正为 Stitch 推出图像代理与智能导出功能,强化设计-开发协同

    谷歌正在为 AI 设计工具 Stitch 推出一系列关键升级,深化其在 UI/UX 设计与工程开发工作流中的整合能力。本次更新聚焦于两大核心功能:图像代理模式与项目文档自动生成,并扩展导出生态,标志着...
    早报# Stitch# 谷歌
    1个月前
    0250
    谷歌将 Gemini Deep Research 与 Workspace 数据深度集成

    谷歌将 Gemini Deep Research 与 Workspace 数据深度集成

    谷歌近日正式推出 Gemini Deep Research 的重大升级:支持直接调用用户在 Google Workspace 中的私有数据,包括 Gmail 邮件、Drive 文档(含 PDF、电子表...
    早报# Gemini Deep Research# 谷歌
    1个月前
    0120
    Perplexity 开始测试 Comet Android 浏览器

    Perplexity 开始测试 Comet Android 浏览器

    Perplexity 正在对其全新移动浏览器 Comet for Android 进行有限的 beta 测试,目前仅向部分选定用户推送邀请。此次测试标志着其 AI 驱动浏览体验正式从桌面端延伸至移动端...
    早报# Comet# Perplexity
    1个月前
    0150
    OpenAI 或将推出 GPT-5.1 Thinking 模型,直面 Gemini 3 Pro 竞争

    OpenAI 或将推出 GPT-5.1 Thinking 模型,直面 Gemini 3 Pro 竞争

    近期,有迹象表明 OpenAI 正在为 GPT-5.1 系列模型的发布做最后准备,其中首个亮相的变体 GPT-5.1 Thinking 已在 ChatGPT 网站的前端或后端组件中被识别。该模型被明确...
    早报# Gemini 3 Pro# GPT-5.1 Thinking# OpenAI
    1个月前
    0700
    谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

    谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

    2025 年 11 月 6 日,谷歌云正式推出其第七代张量处理单元(TPU),并同步发布基于 Arm 架构的Axion 虚拟机与裸金属实例。这两项新产品面向 AI 实验室、SaaS 平台以及正从模型训...
    硬件# TPU# 谷歌云
    1个月前
    0220
    谷歌无代码AI迷你应用创建工具Opal启动全球推广

    谷歌无代码AI迷你应用创建工具Opal启动全球推广

    谷歌实验室推出的无代码AI迷你应用构建器Opal,已从16个国家扩展至160多个国家。该工具仍被谷歌标记为"实验性产品",因此功能可能存在不完善之处。 Opal于7月24日率先在美国上线,10月7日拓...
    早报# Opal# 谷歌
    1个月前
    0170
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    云文档查找工具

    云文档查找工具

    云文档分享站支持一键搜索飞书、Notion、语雀、FlowUS等平台云文档,目前已收录优质文档666个
    Poe API

    Poe API

    Quora 旗下的 AI 聚合平台 Poe 正式推出 开发者 API,允许开发者通过统一接口,调用平台上超过 100 款文本、图像、语音和视频生成模型。
    OpenSkills

    OpenSkills

    OpenSkills 是 Anthropic的 Claude Skills 系统的开源实现。它让 Cursor、Windsurf、Aider 等主流 AI 编码代理也能使用与 Claude Code 完全兼容的技能系统——相同的提示格式、相同的文件结构、相同的渐进式披露机制,只是调用方式从内置工具变为 CLI 命令。
    必应图像创建器

    必应图像创建器

    微软必应旗下的图像创建器(Bing Image Creator)是基于基于OpenAI 的 DALL-E 图片生成技术,可以让用户通过输入一些自然语言的指令(咒语),生成各种有趣和创意的图片。此工具以后也将会是必应搜索的一部分,用户可以在网页上直接使用,也可以通过Bing Chat来使用。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单