微软Edge浏览器新增实时 AI 音频翻译：本地运行，但需 12GB 内存

392 0

在最新发布的 Microsoft Edge 141.0.3537.13（Beta 版） 中，微软引入了一项实验性功能：对网页视频进行实时 AI 音频翻译。该功能允许用户将正在播放的视频原声自动翻译成目标语言，并以合成语音同步输出，提升跨语言内容理解能力。

目前该功能仍处于预览阶段，尚未向所有 Beta 用户开放，但在更新至 Canary 版本后，部分用户已可在设置中看到相关选项。

功能位置与启用方式

该功能在 Edge 设置中的路径为：

设置 → 辅助功能 → 实时翻译
标题显示：“为支持的网站上的视频提供翻译建议”（Offer to translate videos on supported sites）

启用后，当访问支持的视频页面时，Edge 会自动弹出一个浮动控制栏，提示是否开始翻译音频。

技术机制：本地 AI 模型驱动

与传统的字幕翻译不同，这一功能并非仅转换文字，而是通过本地运行的 AI 模型，将原始语音识别为文本、翻译后再合成为目标语言的语音输出。

这意味着：

翻译过程更贴近实时
数据处理主要在设备端完成，保护隐私
对硬件资源要求较高

系统要求：高内存门槛

要使用此功能，设备必须满足以下最低配置：

至少 12 GB 内存
4 核 CPU 或更高

实际测试表明，在配备 16GB 内存的笔记本电脑上，系统空闲状态下已占用约 4GB（即近 25%），因此可用内存需稳定在 12GB 左右才能顺利启用功能。

⚠️ 注意：一旦启动翻译，Edge 会持续占用大量内存资源，可能影响其他应用运行。若不主动关闭翻译任务，资源不会自动释放。

实测体验：YouTube 可用，语言有限

目前该功能仅在 YouTube 上可稳定触发，尚不支持 Netflix、Bilibili 等主流平台。

输入语言方面，当前仅支持三种：

英语
西班牙语
韩语

测试人员使用一段西班牙语游戏实况视频进行测试，Edge 在下载对应 AI 模型后自动静音原音频，并开始播放翻译语音。整体延迟较低，基本实现同步输出。

但存在一个问题：系统尝试使用双人声轨（男声与女声）来模拟说话者语气变化。由于原视频仅为单人解说，这种切换导致听感割裂，反而降低了沉浸感。

准确性方面，初步判断翻译结果较为通顺，但由于源语言非母语，无法完全验证细节准确率。

PDF 引擎变更：Adobe 将成默认引擎

自 2025 年 10 月起，微软将为企业用户提供新的默认 PDF 渲染方案 —— 由 Adobe 提供技术支持的 PDF 引擎。

主要变化包括：

更流畅的文档加载与注释体验
支持高级编辑功能（需订阅 Adobe 计划）
界面中新增 Adobe 品牌标识及“在 Adobe 中编辑”按钮

此举标志着 Edge 正逐步淘汰旧版基于 Chromium 的轻量级 PDF 模块，转向更专业的第三方集成方案。

已弃用功能（Edge Beta 142 起）

随着技术演进，微软正清理遗留组件。从 Beta 142 版本开始，以下基于 EdgeHTML 的功能将被移除：

功能名称	说明
Legacy Web View	旧版嵌入式 Web 控件
Windows 8/8.1/UWP HTML 应用	包括 Hosted Web Apps 和 Windows Web Apps
Legacy PWA	早期渐进式 Web 应用支持
Legacy Edge DevTools	EdgeHTML 版本的开发者工具

这些调整意味着微软全面转向现代 Chromium 架构，不再维护旧技术栈。

安全增强：限制网站访问本地网络

即将上线的新策略将允许用户或管理员阻止网站请求访问本地网络资源（如局域网设备、打印机等），防止恶意站点探测内网结构，提升安全性。

企业策略更新（Beta 142）

面向企业管理员，本次更新还带来两项新控制策略：

标签页预览控制：管理员可启用或禁用鼠标悬停时显示的标签页缩略图及其页面详情。
Microsoft 365 Copilot Chat 图标可见性管理：可统一隐藏或显示浏览器侧边栏中的 Copilot 入口，便于组织合规与使用规范管理。

早报 # Edge浏览器 # 实时 AI 音频翻译

文章版权归作者所有，未经允许请勿转载。

ElevenLabs 发布 Conversational AI 2.0：支持 RAG、自动多语言与批量呼叫

早报 # Conversational AI 2.0 # ElevenLabs

10个月前

02500

微软将集成 Anthropic AI 技术，多元化 Office 365 智能能力

早报 # Anthropic # 微软

6个月前

01100

腾讯元宝上线自研推理模型Thinker（T1），支持联网搜索

早报 # DeepSeek-R1 # Thinker（T1）# 元宝

1年前

02880

OpenAI Sora 推出“客串角色”功能，支持宠物和物品生成 AI 视频

早报 # OpenAI # Sora

5个月前

01470

暂无评论

暂无评论...

微软Edge浏览器新增实时 AI 音频翻译：本地运行，但需 12GB 内存

功能位置与启用方式

技术机制：本地 AI 模型驱动

系统要求：高内存门槛

实测体验：YouTube 可用，语言有限

PDF 引擎变更：Adobe 将成默认引擎

已弃用功能（Edge Beta 142 起）

安全增强：限制网站访问本地网络

企业策略更新（Beta 142）

OpenAI 与微软达成新协议，向营利转型迈出关键一步

恶意日历邀请可诱导 ChatGPT 泄露 Gmail 内容

相关文章

ElevenLabs 发布 Conversational AI 2.0：支持 RAG、自动多语言与批量呼叫

微软将集成 Anthropic AI 技术，多元化 Office 365 智能能力

腾讯元宝上线自研推理模型Thinker（T1），支持联网搜索

OpenAI Sora 推出“客串角色”功能，支持宠物和物品生成 AI 视频

暂无评论

文章

新限时免费体验一周！小米凌晨官宣三款大模型：MiMo-V2 系列正式亮相，1M 上下文比肩 Opus 4.6

DiT架构的文生视频模型xGen-VideoSyn-1：根据文本描述生成逼真的视频场景

用“Megakernel”打破LLM推理瓶颈：斯坦福Hazy Research实现Llama-1B史上最低延迟

Vivaldi CEO 强硬表态：坚决禁止浏览器集成生成式 AI，网页该由人类主导

针对姿势引导的人像图像动画技术TCAN：让图片中的人物根据某个动作序列（比如一个视频）来做出相应的动作

自适应投影引导APG：不牺牲图像质量的前提下，使用更高的指导尺度，从而生成更丰富、更真实的图像

新悟空

Meshy

OpenMAIC

S.H.I.T

Sub2API

ArkClaw

微软Edge浏览器新增实时 AI 音频翻译：本地运行，但需 12GB 内存

功能位置与启用方式

技术机制：本地 AI 模型驱动

系统要求：高内存门槛

实测体验：YouTube 可用，语言有限

PDF 引擎变更：Adobe 将成默认引擎

已弃用功能（Edge Beta 142 起）

安全增强：限制网站访问本地网络

企业策略更新（Beta 142）

OpenAI 与微软达成新协议，向营利转型迈出关键一步

恶意日历邀请可诱导 ChatGPT 泄露 Gmail 内容

相关文章

文章

标签云

网址

新悟空

Meshy

OpenMAIC

S.H.I.T

Sub2API

ArkClaw