Whisper-base
语音识别
W8A16
FP16

Whisper-base: 语音识别
Whisper-base 是 OpenAI Whisper 系列中的基础版本,在保持模型轻量化的同时,相较于 tiny 模型提供了更高的语音识别精度和更强的多语言能力。该模型支持语音识别、语音转文本和语音翻译等任务,具备较快的推理速度与良好的性能平衡。Whisper-base 适合部署在对准确率有一定要求、同时需要高效率处理的移动设备或边缘终端中,广泛应用于实时语音转写、语音搜索和语音驱动应用场景。
源模型工程请访问:Whisper-base
性能参考
设备
语种
数据精度
音频长度
实时率(RTF)
模型大小
支持的语种
支持的语种 |
---|
中文 |
英文 |
日语 |
韩语 |
法语 |
泰语 |
注意:在右侧性能参考板块中,展示了当前音频输入长度下对应语种的 RTF 值。由于模型输入尺寸固化(非动态输入),低于该音频长度的 RTF 值会略微增高。
使用AidASR推理
待发布
性能参考
设备
语种
数据精度
音频长度
实时率(RTF)
模型大小