斯坦福AI专家预测2026年将发生什么经过多年的快速扩张和数十亿美元的投资,2026年可能标志着人工智能直面其实际效用的时刻。斯坦福大学计算机科学、医学、法学和经济学领域的多位教授在预测未来一年时,都指向了一个引人注目的主题:AI布道时代...科普# 斯坦福4个月前0660
智能体设计模式:连接 AI 演示与企业价值的缺失环节企业 AI 市场目前正承受着严重的"宿醉"。过去两年,决策者们被各种演示轰炸——看到自主智能体如何预订航班、编写代码和分析数据。然而,现实情况截然不同。尽管实验热情空前高涨,但在生产环境中部署可靠、自...科普# 智能体设计4个月前0900
AI 智能体正开始蚕食 SaaS我们花了十五年时间看着软件吞噬世界。整个行业被软件吞噬——零售、媒体、金融——你能想到的,过去几十年都经历了令人难以置信的颠覆,伴随着 SaaS 工具的激增。这导致了大量 SaaS 公司的出现——其总...科普# AI 智能体# SaaS4个月前0520
32GB 显存 Arc 显卡曝光!英特尔 AI 工具暗示它存在,专业级或先上,消费级待定英特尔在 12 月发布的 AI Playground v3.0.0 Alpha 版中,疑似通过用户指南的演示案例,意外泄露了一款配备 32GB 显存的 Arc显卡,该显卡被业内普遍指向传闻已久的“Bi...硬件# AI Playground# 英特尔4个月前0460
OpenAI 正式开放 ChatGPT 第三方应用提交,应用目录上线OpenAI 已于 2025 年 12 月 17 日 正式开放 ChatGPT 第三方应用提交通道,并同步推出 ChatGPT 应用目录(App Directory)。用户可通过 ChatGPT 侧边...早报# ChatGPT# OpenAI4个月前0710
谷歌发布 Gemini 3 Flash:面向实时高吞吐场景,成本较 Pro 版降 85%,支持多模态输入继上月发布旗舰模型 Gemini 3 Pro 后,谷歌于 12 月 17 日正式推出轻量级版本 Gemini 3 Flash,专为成本与延迟敏感的实时、高吞吐量 AI 应用打造,在保留 Pro 版核心...早报# Gemini 3 Flash# 谷歌4个月前0410
NotebookLM 新增“数据表格”功能:一键将非结构化信息转为可导出表格谷歌近期为 AI 笔记工具 NotebookLM 推出一项名为 “数据表格”(Data Tables) 的新功能,旨在帮助用户将散落在文档、笔记或网页中的非结构化信息,自动整理为结构清晰、格式统一的表...早报# NotebookLM# 数据表格# 谷歌4个月前0440
谷歌Gemini上线AI视频核验功能,但仅支持自家模型生成内容随着AI生成视频的逼真度不断提升,辨别一段画面是真实拍摄还是由模型合成,正变得愈发困难。为此,谷歌近期在 Gemini 应用中扩展了其内容透明度工具,新增对AI生成视频的核验能力。 不过,这项功能有一...早报# AI视频# Gemini# 谷歌4个月前0320
GPT-Image-1.5重磅上线:ChatGPT图像功能大升级,4倍提速+精准编辑对标竞品2025年12月17日,OpenAI正式推出图像生成新模型GPT-Image-1.5。这款提前上线的模型不仅将图像生成速度提升4倍,还强化了指令理解与编辑一致性,搭配创意工作室式的新界面,成为Open...早报# ChatGPT# GPT-Image-1.5# OpenAI4个月前0460
谷歌翻译上线实时语音翻译:基于 Gemini 2.5 Flash Audio,支持 70 种语言谷歌为其 Gemini 音频模型 推出重大更新,并率先集成到 谷歌翻译应用 中,带来一项真正实用的实时语音到语音翻译能力。这项功能专为耳机场景设计,目标很简单:让你在现实世界中“听见”翻译后的声音。 ...早报# 实时语音翻译# 谷歌翻译4个月前0330
谷歌Gemini深度研究智能体升级:Gemini 3 Pro加持,开放API赋能开发者谷歌近日对Gemini Deep Research(深度研究智能体)完成重大升级,不仅将模型底座更换为更强大的Gemini 3 Pro,还首次开放交互API供开发者调用。此次升级重点解决了AI研究中的...早报# Gemini# Gemini 3 Pro# 深度研究智能体4个月前0650
阿里通义联合多所高校推出 Wan-Move:无需额外模块,实现高精度动作控制的视频生成框架在视频生成领域,动作控制是连接静态图像与动态叙事的关键环节。然而,现有方法普遍存在两个瓶颈:一是控制粒度粗糙(如仅用边界框控制整体移动),二是依赖额外模型(如光流估计器),导致推理复杂、误差累积、难以...百科# Wan-Move# 动作控制# 视频生成4个月前0770