microsoft/VibeVoice
VibeVoice是微软开源的前沿语音AI框架,包含ASR和TTS模块。支持60分钟长音频单次处理,生成带说话人、时间戳的结构化转录,覆盖50+语言。提供实时语音合成、多语言语音库及vLLM加速推理,适用于智能助手、会议记录等场景。
语言:Python · 总 Stars:34,381 · 今日新增:+1,704
基于 2026-04-01 榜单,共收录 1 个与 LLM Inference 相关的热门仓库。
大模型推理、服务化部署与模型应用。
VibeVoice是微软开源的前沿语音AI框架,包含ASR和TTS模块。支持60分钟长音频单次处理,生成带说话人、时间戳的结构化转录,覆盖50+语言。提供实时语音合成、多语言语音库及vLLM加速推理,适用于智能助手、会议记录等场景。
语言:Python · 总 Stars:34,381 · 今日新增:+1,704