在最新发布的 Microsoft Edge 141.0.3537.13(Beta 版) 中,微软引入了一项实验性功能:对网页视频进行实时 AI 音频翻译。该功能允许用户将正在播放的视频原声自动翻译成目标语言,并以合成语音同步输出,提升跨语言内容理解能力。
目前该功能仍处于预览阶段,尚未向所有 Beta 用户开放,但在更新至 Canary 版本后,部分用户已可在设置中看到相关选项。
功能位置与启用方式
该功能在 Edge 设置中的路径为:
设置 → 辅助功能 → 实时翻译
标题显示:“为支持的网站上的视频提供翻译建议”(Offer to translate videos on supported sites)
启用后,当访问支持的视频页面时,Edge 会自动弹出一个浮动控制栏,提示是否开始翻译音频。

技术机制:本地 AI 模型驱动
与传统的字幕翻译不同,这一功能并非仅转换文字,而是通过本地运行的 AI 模型,将原始语音识别为文本、翻译后再合成为目标语言的语音输出。
这意味着:
- 翻译过程更贴近实时
- 数据处理主要在设备端完成,保护隐私
- 对硬件资源要求较高
系统要求:高内存门槛
要使用此功能,设备必须满足以下最低配置:
- 至少 12 GB 内存
- 4 核 CPU 或更高
实际测试表明,在配备 16GB 内存的笔记本电脑上,系统空闲状态下已占用约 4GB(即近 25%),因此可用内存需稳定在 12GB 左右才能顺利启用功能。

⚠️ 注意:一旦启动翻译,Edge 会持续占用大量内存资源,可能影响其他应用运行。若不主动关闭翻译任务,资源不会自动释放。
实测体验:YouTube 可用,语言有限
目前该功能仅在 YouTube 上可稳定触发,尚不支持 Netflix、Bilibili 等主流平台。
输入语言方面,当前仅支持三种:
- 英语
- 西班牙语
- 韩语
测试人员使用一段西班牙语游戏实况视频进行测试,Edge 在下载对应 AI 模型后自动静音原音频,并开始播放翻译语音。整体延迟较低,基本实现同步输出。
但存在一个问题:系统尝试使用双人声轨(男声与女声)来模拟说话者语气变化。由于原视频仅为单人解说,这种切换导致听感割裂,反而降低了沉浸感。
准确性方面,初步判断翻译结果较为通顺,但由于源语言非母语,无法完全验证细节准确率。
PDF 引擎变更:Adobe 将成默认引擎
自 2025 年 10 月起,微软将为企业用户提供新的默认 PDF 渲染方案 —— 由 Adobe 提供技术支持的 PDF 引擎。

主要变化包括:
- 更流畅的文档加载与注释体验
- 支持高级编辑功能(需订阅 Adobe 计划)
- 界面中新增 Adobe 品牌标识及“在 Adobe 中编辑”按钮
此举标志着 Edge 正逐步淘汰旧版基于 Chromium 的轻量级 PDF 模块,转向更专业的第三方集成方案。
已弃用功能(Edge Beta 142 起)
随着技术演进,微软正清理遗留组件。从 Beta 142 版本开始,以下基于 EdgeHTML 的功能将被移除:
| 功能名称 | 说明 |
|---|---|
| Legacy Web View | 旧版嵌入式 Web 控件 |
| Windows 8/8.1/UWP HTML 应用 | 包括 Hosted Web Apps 和 Windows Web Apps |
| Legacy PWA | 早期渐进式 Web 应用支持 |
| Legacy Edge DevTools | EdgeHTML 版本的开发者工具 |
这些调整意味着微软全面转向现代 Chromium 架构,不再维护旧技术栈。
安全增强:限制网站访问本地网络
即将上线的新策略将允许用户或管理员阻止网站请求访问本地网络资源(如局域网设备、打印机等),防止恶意站点探测内网结构,提升安全性。
企业策略更新(Beta 142)
面向企业管理员,本次更新还带来两项新控制策略:
- 标签页预览控制:管理员可启用或禁用鼠标悬停时显示的标签页缩略图及其页面详情。
- Microsoft 365 Copilot Chat 图标可见性管理:可统一隐藏或显示浏览器侧边栏中的 Copilot 入口,便于组织合规与使用规范管理。















