微软提出 GUI-Actor:基于视觉语言模型的无坐标 GUI 定位新范式在构建基于视觉语言模型(VLM)的 GUI 代理系统中,一个关键挑战是如何准确理解屏幕上的视觉内容并定位应执行操作的区域。传统方法通常将此问题建模为“文本到坐标的生成”任务,即通过语言描述预测具体像素...多模态模型# GUI-Actor# 微软6个月前02730
来了!微软发布可在 Teams 中控制一切的开发 AI 代理Athena在最近的 Microsoft BUILD 大会上,微软推出了一项面向软件开发者的重磅工具 —— Athena。它不是一个简单的 AI 助手,而是一个深度集成于 Microsoft Teams 的智能代...早报# Athena# Microsoft Teams# 微软6个月前01770
微软测试Copilot新功能Live Portraits,或支持自定义3D头像微软正在测试一项名为 Live Portraits 的新功能,或将为 Copilot 带来更具视觉表现力和个性化的新体验。 目前,这一功能仍处于实验阶段,尚未对外公开。在最新一轮网页界面更新中,用户可...早报# Copilot# Live Portraits# 微软6个月前02040
微软上线 Bing 视频生成工具:支持文本生成短视频,Sora 技术加持,免费可用!微软正在将 必应图像创建器 升级为更强大的 AI 创作平台 —— 这一次,它带来了 AI 生成视频功能。 据 Windows Latest 独家报道,微软正在测试名为 “Bing 视频创建工具”(Bi...早报# Bing 视频生成# Sora# 微软7个月前02190
微软记事本也能用 AI 写文章了?Windows 11 新增 AI 写作功能你以为记事本只是个简单的文本编辑器?微软正在让它变得更聪明。 在最新发布的 Windows 11 Canary 和 Dev 预览版中,微软开始测试一项全新的 AI 功能:Write with AI,它...早报# AI# 微软# 记事本7个月前02010
英伟达与微软携手,加速 RTX AI PC 的发展在当今快速发展的技术领域,生成式 AI 正在重塑我们的工作和娱乐方式。英伟达和微软的合作,通过推出 RTX AI PC,正在将这一变革推向新的高度。本文将详细介绍英伟达和微软如何通过一系列创新技术和工...早报# RTX AI PC# 微软# 英伟达7个月前02010
微软加入Anthropic的MCP指导委员会,Windows 11 引入原生MCP支持在2025年微软Build大会上,微软宣布正式加入 Anthropic 的模型上下文协议(MCP)指导委员会。这一消息标志着MCP在人工智能行业中的重要性日益提升。今年早些时候,OpenAI和谷歌均表...早报# MCP# Windows 11# 微软7个月前03470
微软推出NLWeb:让每个网站都能拥有AI驱动的自然语言界面在2025年Build大会上,微软宣布推出一个名为 NLWeb 的开放项目,旨在简化为网页创建自然语言界面的过程。这一技术使任何网站都能轻松转变为人工智能驱动的应用程序,用户可以通过简单的对话界面(即...早报# NLWeb# 微软7个月前02820
微软宣布推出 Microsoft Discovery 平台,利用AI加速科学发展在2025年5月20日的Build大会上,微软宣布推出 Microsoft Discovery 平台。这一平台利用AI智能代理技术,“转变科学发现过程”,加速从假设制定到实验模拟和分析的端到端科学任务...早报# Microsoft Discovery# 微软7个月前01890
微软推出新的命令行文本编辑器Edit微软今天正式推出了Windows版的命令行文本编辑器“Edit on Windows”,用户可以通过在命令提示符中输入“edit”来访问它,从而在命令行中直接编辑文件。这是微软在2025年Build大...早报# Edit# 命令行文本编辑器# 微软7个月前02500
微软Edge新增AI API,助力开发者轻松集成智能功能在2025年Build大会上,微软宣布为Edge浏览器推出一系列全新的AI API,允许开发者直接利用内置在Edge中的AI模型,为网络应用赋予智能化能力。这一举措被认为是要与谷歌Chrome的“内置...早报# Edge# 微软7个月前02070
微软推出Windows AI Foundry,助力开发者轻松构建AI驱动应用在2025年5月20日的Build大会上,微软宣布了一项重大更新:推出 Windows AI Foundry,这是对去年发布的 Windows Copilot Runtime 服务的重新命名和扩展。微...早报# Windows AI Foundry# 微软7个月前01660