Whisper-base

Whisper-base: 语音识别

Whisper-base 是 OpenAI Whisper 系列中的基础版本，在保持模型轻量化的同时，相较于 tiny 模型提供了更高的语音识别精度和更强的多语言能力。该模型支持语音识别、语音转文本和语音翻译等任务，具备较快的推理速度与良好的性能平衡。Whisper-base 适合部署在对准确率有一定要求、同时需要高效率处理的移动设备或边缘终端中，广泛应用于实时语音转写、语音搜索和语音驱动应用场景。

源模型工程请访问：Whisper-base

性能参考

设备

语种

数据精度

音频长度

实时率(RTF)

模型大小

支持的语种

支持的语种
中文
英文
日语
韩语
法语
泰语

注意：在右侧性能参考板块中，展示了当前音频输入长度下对应语种的 RTF 值。由于模型输入尺寸固化（非动态输入），低于该音频长度的 RTF 值会略微增高。

使用AidASR推理

待发布

许可证

源模型许可证：MIT

可部署模型许可证：APLUX-MODEL-FARM-LICENSE