Whisper-large-v3-turbo
语音识别
W8A16
FP16

Whisper-large-v3-turbo:语音识别
Whisper-large-v3-turbo 是 OpenAI Whisper 系列中性能最强的语音识别模型版本之一,融合了大规模模型的高准确率与优化后的推理速度。该模型基于 Whisper-large-v3 进行改进,旨在提供更快的响应时间和更低的计算资源消耗,同时保持卓越的多语言识别能力和鲁棒性。Whisper-large-v3-turbo 支持复杂环境中的语音转文本、实时字幕、语音翻译等任务,适合部署在高性能服务器及云端平台,为高端应用场景提供稳定高效的语音处理能力。
源模型工程请访问:Whisper-large-v3-turbo
性能参考
设备
语种
数据精度
音频长度
实时率(RTF)
模型大小
支持的语种
支持的语种 |
---|
中文 |
英文 |
日语 |
韩语 |
法语 |
泰语 |
注意:在右侧性能参考板块中,展示了当前音频输入长度下对应语种的 RTF 值。由于模型输入尺寸固化(非动态输入),低于该音频长度的 RTF 值会略微增高。
使用AidASR推理
待发布
性能参考
设备
语种
数据精度
音频长度
实时率(RTF)
模型大小