VibeVoice-1.5B:微软开源TTS框架,可生成4人60分钟长对话音频微软近期开源了一款全新文本到语音(TTS)框架——VibeVoice-1.5B,其核心突破在于打破传统TTS系统的局限:能同时生成包含4个不同说话者、最长60分钟的连贯对话音频,且在长序列处理效率、说...语音模型# TTS# VibeVoice-1.5B# 微软3个月前03840
Excel 新函数 COPILOT 上线:用自然语言驱动你的表格微软正式推出一项新功能——COPILOT函数,现已面向 Windows 和 Mac 版 Microsoft Excel 用户上线。它将大语言模型的能力直接集成到 Excel 的公式系统中,让你在不离开...早报# Copilot# Excel# 微软4个月前01810
微软测试 Copilot Creator Gallery:一个 Sora 风格的 AI 内容发现与再创作平台据 TestingCatalog 最新发现,微软正在内部测试一项名为 Copilot Creator Gallery 的新功能。这是一项专为创作者设计的内容浏览与再创作平台,采用类似 OpenAI S...早报# Copilot Creator Gallery# 微软4个月前01910
微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”在 AI 智能体(Agent)技术快速发展的当下,开发者已经可以通过 LangChain、AutoGen、OpenAI Agent SDK 等框架,快速构建具备工具调用、多轮对话和任务编排能力的智能系...新技术# Agent Lightning# 微软# 智能体4个月前01330
微软将 Xbox Copilot 引入 Windows 游戏栏:AI 开始参与你的游戏过程微软正在把 AI 更深地融入游戏体验。 继今年早些时候在 iOS 和 Android 上测试 Xbox Copilot 后,微软现已开始向 Windows 11 游戏栏(Xbox Game Bar)推...早报# Windows 游戏栏# Xbox Copilot# 微软4个月前01310
一个 URL 就能读取 AI 密钥?微软AI网络协议NLWeb漏洞暴露基础安全短板几个月前,在 Build 大会上,微软隆重推出了一项名为 NLWeb 的新协议。它被描述为“代理网络的 HTML”,目标是让任何网站或应用都能集成类似 ChatGPT 的自然语言搜索功能——用户只需提...早报# NLWeb# 微软4个月前01570
微软推出 Edge Copilot 模式,重新定义网页浏览几十年来,我们的浏览器使用方式几乎未曾改变:打开标签、搜索信息、跳转页面、不断切换——循环往复。尽管标签越开越多,效率却未随之提升。 现在,这一模式正在被打破。 微软正式推出 Edge Copilot...早报# Edge Copilot# 微软4个月前01740
微软推出Phi-Ground:提高计算机界面(GUI)定位(grounding)的准确性微软推出一个名为 Phi-Ground 的模型家族,旨在提高计算机界面(GUI)定位(grounding)的准确性。GUI 定位是计算机使用代理(CUAs)执行实际操作的核心组件,类似于机器人中的机械...大语言模型# Phi-Ground# 微软4个月前01570
Brave 浏览器正式屏蔽微软Recall功能,从 1.81 版本起默认禁用从 Brave 1.81 版本开始,所有使用 Windows 11 及以上系统的用户将获得一项新的隐私保护功能: Brave 将默认阻止 Microsoft Recall 捕获你在浏览器中的任何活动...早报# Brave 浏览器# Recall# 微软5个月前01420
微软推出 Copilot 3D 实验功能,瞄准创意与设计领域微软正在不断拓展其 AI 助手 Copilot 的能力边界,最新动向显示,他们正开发一项名为 Copilot 3D 的实验性功能,旨在帮助用户基于图片生成 3D 模型。这一进展表明,微软正将 Copi...早报# Copilot 3D# 微软5个月前02250
OpenAI 30亿美元收购落空,Windsurf核心团队转投谷歌DeepMindOpenAI试图以30亿美元收购AI编码初创公司 Windsurf 的计划最终宣告失败。该交易已于周五正式终止。 更具戏剧性的是,就在交易告吹的同一天,谷歌 DeepMind 宣布已聘请 Windsu...早报# OpenAI# Windsurf# 微软5个月前01660
微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计,为边缘设备、移动应用等资源受限环境提供高效的推理能...大语言模型# Phi-4-mini-flash-reasoning# 微软5个月前0960