ComfyUI VibeVoice ASR:高质量长时语音识别自定义节点,支持说话人分离与SRT导出ComfyUI VibeVoice ASR是一款专为ComfyUI打造的自定义节点,核心价值在于将Microsoft VibeVoice ASR强大的语音识别能力集成到ComfyUI工作流中,让用户无...插件# ComfyUI VibeVoice ASR# VibeVoice-ASR2周前0120
微软开源 VibeVoice-ASR:支持60分钟长音频的端到端语音转写模型微软正式开源 VibeVoice-ASR——一款面向真实场景的统一语音识别模型。它能单次处理长达60分钟的连续音频,并输出包含说话人身份、精确时间戳与文本内容的结构化转录结果,同时支持用户注入自定义热...语音模型# VibeVoice-ASR# 微软3周前0160