Anthropic 计划在印度设办公室,寻求与信实工业合作Anthropic 正式启动其在印度的本地化布局。据 TechCrunch 报道,公司联合创始人兼 CEO Dario Amodei 本周访问印度,计划于班加罗尔设立首个南亚办公室,并探索与印度最大企...早报# Anthropic# Claude# 信实工业2个月前0580
StreamDiffusionV2:支持多显卡的实时视频生成系统由加州大学伯克利分校、麻省理工学院、斯坦福大学、德克萨斯大学奥斯汀分校与 First Intelligence 联合研发的 StreamDiffusionV2 正式开源。这是一个面向交互式直播场景的实...视频模型# StreamDiffusionV22个月前01330
谷歌将 AI Plus 套餐与搜索 AI 模式扩展至数十个新国家继上月在印度尼西亚推出平价 AI 订阅服务后,谷歌正式宣布将 AI Plus 套餐 推广至 36 个新增国家和地区。此次扩展后,该服务已在 全球 77 个国家 上线。 与此同时,谷歌还宣布其基于 Ge...早报# Google AI Plus2个月前0590
使用 Nano Banana 的 4 个技巧:精准编辑、一致生成与应用构建自 2025 年 8 月底发布以来,Google DeepMind 推出的新型图像生成与编辑模型 Nano Banana 已在 Gemini 应用中支持超过 50 亿次图像创作。它并非简单的文生图工具...提示词# nano-banana# 谷歌2个月前01290
对话 Google 技术专家:什么是“氛围编程”?AI 正在改变我们构建数字产品的方式。如今,即使没有编程背景,你也可以通过自然语言描述一个想法,快速生成网页原型或小型应用。这种新兴实践被称为 “氛围编程”(Vibe Coding)。 为了更深入理解...科普# Vibe Coding# 氛围编程2个月前0650
谷歌将 AI 编程工具 Opal 扩展至 15 个新国家谷歌正式将其 AI 驱动的无代码应用构建工具 Opal 推向全球更多地区。继今年 7 月在美国首发后,这款由 Google Labs 开发的实验性工具现已在 加拿大、印度、日本、韩国、越南、印度尼西亚...早报# Opal# 谷歌2个月前0920
谷歌推出新型 AI 模型Gemini 2.5 Computer Use,可操作浏览器完成网页任务谷歌发布一款名为 Gemini 2.5 Computer Use 的新型 AI 模型,能够通过浏览器窗口执行点击、滚动、输入文本等交互操作,帮助用户在那些没有开放 API 的网站上自动完成任务。 这项...多模态模型# Gemini 2.5 Computer Use# 谷歌2个月前01130
Apriel-1.5-15B-Thinker:用中期训练提升多模态推理效率在大模型竞赛普遍追求参数规模和算力投入的背景下,一个名为 Apriel-1.5-15B-Thinker 的新开源模型带来了不同的思路:它不依赖强化学习或偏好优化,也不从零训练,而是通过精心设计的中期训...大语言模型# Apriel-1.5-15B-Thinker2个月前0920
微软测试 Edge 与 Copilot 深度集成:AI 将能使用你的浏览器个人资料微软正在为 Windows 11 上的 Microsoft Edge 测试一项重要的新功能:让 Copilot(现称 Copilot in Windows) 更深入地接入用户的浏览器环境。 最新发现显...早报# Copilot# Edge# 微软2个月前0590
ComfyUI-FSampler :通过 Epsilon 外推实现高效采样加速开发者obisin打造的 FSampler 的新插件已上线,为 ComfyUI 用户提供了一种无需训练、不依赖特定模型的扩散模型采样加速方案。它通过预测每一步的噪声(epsilon),减少对主模型的调...插件# ComfyUI-FSampler# 采样加速2个月前01400
Self-Forcing++:一种无需长视频训练即可生成高质量长视频的新方法近年来,扩散模型在图像和短片视频生成方面取得了突破性进展。然而,当扩展到长视频生成(如数十秒甚至数分钟)时,现有方法普遍面临一个核心问题:质量随长度增加而显著下降。 这主要源于两个限制: 计算成本高...新技术# Self Forcing# 字节跳动2个月前01500
小红书开源 FireRedChat:一个完整、可控的全双工语音交互系统在智能助手和客户服务场景中,用户希望与AI的对话像人与人交流一样自然——可以随时插话、打断、继续,而系统能即时响应。要实现这种体验,需要真正的全双工语音交互能力。 然而,现有方案存在明显短板: 端到端...语音模型# FireRedChat# 小红书2个月前01920