Whisper-large-v3-turbo

Whisper-large-v3-turbo：语音识别

Whisper-large-v3-turbo 是 OpenAI Whisper 系列中性能最强的语音识别模型版本之一，融合了大规模模型的高准确率与优化后的推理速度。该模型基于 Whisper-large-v3 进行改进，旨在提供更快的响应时间和更低的计算资源消耗，同时保持卓越的多语言识别能力和鲁棒性。Whisper-large-v3-turbo 支持复杂环境中的语音转文本、实时字幕、语音翻译等任务，适合部署在高性能服务器及云端平台，为高端应用场景提供稳定高效的语音处理能力。

源模型工程请访问：Whisper-large-v3-turbo

性能参考

设备

语种

数据精度

音频长度

实时率(RTF)

模型大小

支持的语种

支持的语种
中文
英文
日语
韩语
法语
泰语

注意：在右侧性能参考板块中，展示了当前音频输入长度下对应语种的 RTF 值。由于模型输入尺寸固化（非动态输入），低于该音频长度的 RTF 值会略微增高。

使用AidASR推理

待发布

许可证

源模型许可证：MIT

可部署模型许可证：APLUX-MODEL-FARM-LICENSE