谷歌发布 WeatherNext 2:AI 天气预报模型速度提升 8 倍,精准到小时级谷歌DeepMind与Google Research联合发布全新AI天气预报模型WeatherNext 2,定位为“迄今最先进、最高效的全球天气预报解决方案”。该模型以“速度提升8倍、分辨率达小时级...多模态模型# WeatherNext 2# 天气预报# 谷歌3周前0190
推理能力再飞跃!Gemini 3正式发布:多模态拉满+代理编码,6.5亿用户可直接使用谷歌今天正式发布新一代旗舰大模型 Gemini 3,这是其继 Gemini 2.5 发布七个月后推出的重磅升级版本,也是迄今最强大的大语言模型。此次发布距离 OpenAI GPT-5.1、Anthro...大语言模型早报# Gemini 3# 谷歌3周前0520
IBM 发布 Granite 4.0 Nano:350M-1.5B 参数边缘模型,混合SSM架构+Apache 2.0开源,性能超越同尺寸竞品在边缘计算与设备端AI需求日益增长的今天,“小模型能否实现强能力”成为行业核心诉求。近日,IBM 正式推出 Granite 4.0 Nano 系列模型——作为 Granite 4.0 家族的全新成员...大语言模型# Granite 4.0 Nano# IBM3周前040
OpenAI 开源安全推理模型gpt-oss-safeguard:自定义策略+可解释推理,多策略准确率超越 GPT-5-thinking在AI内容安全领域,传统分类器“依赖标注样本、策略更新繁琐”的痛点长期困扰开发者。OpenAI 正式发布 gpt-oss-safeguard 研究预览版——一款开源权重的安全推理模型,以“自定义策略...大语言模型# gpt-oss-safeguard# OpenAI3周前040
谷歌 DeepMind 发布 SIMA 2:AI智能体首次在虚拟世界中“自我改进”谷歌DeepMind发布通用AI智能体下一代产品SIMA 2的研究预览,通过深度整合大语言模型Gemini的语言与推理能力,实现从“单纯遵循指令”到“理解环境并互动”的核心突破。这款由Gemini 2...多模态模型# SIMA 2# 谷歌 DeepMind3周前0130
OpenAI 发布 GPT-5.1:8 种个性语调可选,Instant 更温暖、Thinking 更智能继8月GPT-5发布引发争议后,OpenAI今日正式推出旗舰模型更新版——GPT-5.1,通过双模型优化、8种个性语调预设、自适应推理等核心升级,旨在解决前代模型“体验平平”“缺乏个性化”的问题,让C...大语言模型# GPT-5.1# OpenAI3周前0110
百度开源ERNIE-4.5-VL-28B-A3B-Thinking:3B活跃参数实现大型模型级多模态推理百度正式开源 ERNIE-4.5-VL-28B-A3B-Thinking,一款专注于文档、图表与视频理解的多模态推理模型。尽管模型总参数达 约 30B,但通过稀疏激活机制,每次推理仅激活 3B 参数...多模态模型# ERNIE-4.5-VL-28B-A3B-Thinking# 多模态推理# 百度3周前0120
Maya1:开源 3B 语音模型,支持自然语言控制与情感标签的文本到语音生成Maya Research 近期发布了一款突破性的开源文本到语音(TTS)模型——Maya1。这款仅3B参数的模型,不仅能将文本与自然语言描述转化为富有情感的24kHz高质量语音,还支持单GPU实时运...语音模型# Maya1# 语音模型3周前0370
Meta 开源 Omnilingual ASR:支持 1600+ 语言的语音识别系统Meta AI 近日发布了 Omnilingual ASR——一套开源、可扩展的多语言自动语音识别(ASR)系统,支持 1600 多种语言,并能通过零样本上下文学习泛化到 超过 5400 种语言,包括...语音模型# Meta# Omnilingual ASR# 语音识别3周前0380
商汤开源SenseNova-SI:面向空间智能的多模态模型当前主流多模态基础模型在文本、图像理解、推理和生成任务上已取得显著进展,但在空间智能(Spatial Intelligence)方面仍存在系统性短板。具体表现为: 对物体尺度、距离、比例的估计不准确 ...多模态模型# SenseNova-SI# 商汤# 空间智能4周前0880
阿里巴巴推出 SmartResume:一个能“读懂”复杂简历版式的智能解析系统在企业招聘中,自动化处理海量简历是刚需,但简历格式千奇百怪——多栏排版、图文混排、表格嵌套,传统文本提取工具常会打乱语义顺序,导致关键信息错位。 针对这一难题,阿里巴巴企业智能团队发布了 SmartR...多模态模型# SmartResume# 智能简历解析# 阿里巴巴4周前0900
阶跃星辰开源 Step-Audio-EditX:首个基于 LLM 的迭代式音频编辑模型阶跃星辰(Step AI)正式发布 Step-Audio-EditX —— 一款革命性的基于大语言模型(LLM)的音频编辑系统,首次实现对语音情感、说话风格与副语言特征的高精度、迭代式、零样本控制,并...语音模型# Step-Audio-EditX# 阶跃星辰# 音频编辑模型4周前01070