新AnyTalker:用单人数据生成自然互动的多人对话视频
多人对话视频的自动生成,长期以来受限于两个关键难题:一是高质量多人视频数据极难获取,二是多个角色之间的互动行为难以建模。为解决这些问题,来自香港科技大学、Video Rebirth、浙江大学和北京交通...
新谷歌将 Google Chat 迁移至新域名以提升访问速度
谷歌宣布,将为 Google Chat 用户推送一项虽小但实用的更新,以改善其体验并提高服务可靠性。该公司正在将 Google Chat 迁移至一个新域名,提供比以往更快的访问体验。 Google 表...
新你现在可以在 ChatGPT 内部使用 Photoshop 编辑照片
早在十月,OpenAI 就宣布了新一代应用程序,用户可以直接在 ChatGPT 体验中与之互动。Booking.com、Canva、Coursera、Figma、Expedia、Spotify 和 Z...
新OpenAI 与迪士尼达成合作!Sora 用户很快可以创作漫威和星球大战短片
早在九月,OpenAI 就发布了 Sora 2,这是其迄今为止最先进的视频生成模型。Sora 2 能够从自然语言或图像生成具有丰富细节和动态的视频片段与音频。它还对 3D 空间、运动和场景连续性有深入...
新OpenAI正式发布GPT-5.2 :GDPval 超人类专家,编码/长上下文/视觉能力全面跃升
OpenAI 再度刷新大模型天花板——GPT-5.2 正式发布。这款专为专业知识工作和长期运行智能体打造的前沿模型,在编码、长上下文推理、视觉理解、工具调用等核心能力上实现跨越式提升,甚至在覆盖 44...
新省下订阅费!学生专属 AI 工具福利:从生产力到设计开发,覆盖学习全场景
对学生来说,合理规划零花钱和生活费早已是必修课——尤其是现在,除了吃饭、买日用品这些常规开销,AI工具订阅费正悄悄成为一笔不小的支出。毕竟不管是写论文、做PPT、搞设计还是敲代码,AI工具都成了学习和...
新对标谷歌 Nano Banana 2!OpenAI Image-2 系列模型 LM Arena 测试细节全解析
OpenAI 正加速布局多模态赛道!继传闻中的 GPT-5.2 即将发布后,其新一代图像生成模型 Image-2 系列 也在 LM Arena、Design Arena 等评估平台曝光实测。两款内部代...
智谱AI语音识别模型GLM-ASR双版本登场:云端版精准识别多场景,Nano版开源免费,笔记本/手机均可部署
智谱AI全新发布 GLM-ASR 系列语音识别模型,包含云端部署的 GLM-ASR-2512 与端侧轻量化的 GLM-ASR-Nano-2512 两个版本。其中 Nano 版以 1.5B 紧凑参数规模...
智谱AI开源GLM-4.6V:128K上下文视觉语言模型,原生工具调用打通感知与执行链路
智谱AI正式推出并开源 GLM-4.6V 系列多模态大语言模型,包含面向云端与高性能集群的 GLM-4.6V (106B) 基础模型,以及针对本地部署和低延迟场景优化的 GLM-4.6V-Flash ...
Mistral AI 发布 Devstral 2 编程模型+Vibe CLI:1230亿参数适配智能体开发,终端原生编程更高效
Mistral AI 推出两大核心产品——新一代软件工程智能体编程模型家族 Devstral 2,以及开源命令行编程助手 Mistral Vibe CLI。前者以高参数、长上下文和高性价比成为开源编程...















