博客 | 第16页 | SD百科导航

美团 LongCat 团队发布 LongCat-Video：高效长视频生成的开源新标杆

美团LongCat团队推出 LongCat-Video，这是一个基础视频生成模型，拥有 13.6B 参数，在文本到视频、图像到视频以及视频续接生成任务中表现出色。它特别擅长高效且高质量的长视频生成，标...

1个月前

0170

蚂蚁集团发布 Ling 2.0：基于“推理优先”原则的稀疏大模型家族

蚂蚁集团百灵大模型团队近日发布 Ling 2.0 —— 一个系统性构建的稀疏混合专家（MoE）语言模型系列，核心理念是：模型容量可无限扩展，但每个 token 的计算成本应保持恒定。该系列通过统一...

大语言模型 # Ling 2.0 # 蚂蚁集团

1个月前

0310

MiniMax 发布 MiniMax M2：面向编码与代理的高性能开源 MoE 模型

MiniMax 团队正式发布 MiniMax M2 —— 一款专为代码生成与 AI 代理工作流优化的混合专家（Mixture-of-Experts, MoE）模型。该模型以 MIT 开源许可在 Hu...

大语言模型 # MiniMax M2

1个月前

0170

美团发布LongCat-Flash-Omni：开源全模态大模型的实时交互新标杆

美团 LongCat 团队近日开源了 LongCat-Flash-Omni —— 一款参数总量达 5600 亿、每 token 动态激活 270 亿参数的全模态大模型（Full-Modal LLM...

多模态模型 # LongCat-Flash-Omni # 美团

1个月前

0110

百度飞桨发布 PaddleOCR-VL（0.9B）：轻量级端到端多语言文档解析模型

百度飞桨团队近日开源 PaddleOCR-VL（0.9B）——一款专为复杂版式文档智能解析设计的视觉语言模型（VLM）。该模型以仅 9亿参数的轻量级架构，实现了对文本、表格、数学公式、图表及手写体的高...

多模态模型 # PaddleOCR-VL # 文档解析模型

1个月前

0160

谷歌在 Mixboard 测试标注与背景移除功能，强化视觉工作流

谷歌正在为其 AI 视觉实验平台 Mixboard 测试一系列新功能，包括图像背景移除与高级标注工具，进一步拓展其在教育、演示和产品设计场景中的应用潜力。 Mixboard 是一款基于结构化画布的 A...

早报 # Mixboard # 谷歌

1个月前

0140

谷歌正为 Stitch 推出图像代理与智能导出功能，强化设计-开发协同

谷歌正在为 AI 设计工具 Stitch 推出一系列关键升级，深化其在 UI/UX 设计与工程开发工作流中的整合能力。本次更新聚焦于两大核心功能：图像代理模式与项目文档自动生成，并扩展导出生态，标志着...

早报 # Stitch # 谷歌

1个月前

0250

谷歌将 Gemini Deep Research 与 Workspace 数据深度集成

谷歌近日正式推出 Gemini Deep Research 的重大升级：支持直接调用用户在 Google Workspace 中的私有数据，包括 Gmail 邮件、Drive 文档（含 PDF、电子表...

早报 # Gemini Deep Research # 谷歌

1个月前

0120

Perplexity 开始测试 Comet Android 浏览器

Perplexity 正在对其全新移动浏览器 Comet for Android 进行有限的 beta 测试，目前仅向部分选定用户推送邀请。此次测试标志着其 AI 驱动浏览体验正式从桌面端延伸至移动端...

早报 # Comet # Perplexity

1个月前

0150

OpenAI 或将推出 GPT-5.1 Thinking 模型，直面 Gemini 3 Pro 竞争

近期，有迹象表明 OpenAI 正在为 GPT-5.1 系列模型的发布做最后准备，其中首个亮相的变体 GPT-5.1 Thinking 已在 ChatGPT 网站的前端或后端组件中被识别。该模型被明确...

早报 # Gemini 3 Pro # GPT-5.1 Thinking # OpenAI

1个月前

0700

谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

2025 年 11 月 6 日，谷歌云正式推出其第七代张量处理单元（TPU），并同步发布基于 Arm 架构的Axion 虚拟机与裸金属实例。这两项新产品面向 AI 实验室、SaaS 平台以及正从模型训...

硬件 # TPU # 谷歌云

1个月前

0220

谷歌无代码AI迷你应用创建工具Opal启动全球推广

谷歌实验室推出的无代码AI迷你应用构建器Opal，已从16个国家扩展至160多个国家。该工具仍被谷歌标记为"实验性产品"，因此功能可能存在不完善之处。 Opal于7月24日率先在美国上线，10月7日拓...

早报 # Opal # 谷歌

1个月前

0170

加载更多

美团 LongCat 团队发布 LongCat-Video：高效长视频生成的开源新标杆

蚂蚁集团发布 Ling 2.0：基于“推理优先”原则的稀疏大模型家族

MiniMax 发布 MiniMax M2：面向编码与代理的高性能开源 MoE 模型

美团发布LongCat-Flash-Omni：开源全模态大模型的实时交互新标杆

百度飞桨发布 PaddleOCR-VL（0.9B）：轻量级端到端多语言文档解析模型

谷歌在 Mixboard 测试标注与背景移除功能，强化视觉工作流

谷歌正为 Stitch 推出图像代理与智能导出功能，强化设计-开发协同

谷歌将 Gemini Deep Research 与 Workspace 数据深度集成

Perplexity 开始测试 Comet Android 浏览器

OpenAI 或将推出 GPT-5.1 Thinking 模型，直面 Gemini 3 Pro 竞争

谷歌云发布第七代 TPU Ironwood 与新型 Axion Arm 实例

谷歌无代码AI迷你应用创建工具Opal启动全球推广

Fogsight (雾象)

云文档查找工具

Poe API

OpenSkills

必应图像创建器

Google AI Studio

网址

Fogsight (雾象)

云文档查找工具

Poe API

OpenSkills

必应图像创建器

Google AI Studio