Whisper-tiny.en

Whisper-tiny.en：语音识别

Whisper-tiny.en 是 OpenAI Whisper 系列中最轻量化的英文语音识别模型，专为在资源受限设备和低功耗场景下实现高效语音转文本而设计。该模型仅支持英语输入，采用 Transformer 编码解码架构，在保持端到端识别优势的同时，显著减少了参数规模和计算开销。

由于模型体积极小（约 39M 参数），Whisper-tiny.en 能够在移动设备、嵌入式系统和边缘计算平台上快速运行，延迟低、响应快，非常适合实时语音转录和语音交互任务。虽然精度不及中大型模型，但在日常对话、语音助手、字幕生成等场景中，依然具备良好的可用性和稳定性。

此外，该模型支持主流推理框架部署，能够与流式语音接口结合，便于集成到应用和产品中，是对速度和轻量化要求较高场景的理想选择。

源模型工程请访问：Whisper-tiny.en

性能参考

设备

语种

数据精度

音频长度

实时率(RTF)

模型大小

模型资源获取

Model Farm 提供预编译好的模型资源以及推理代码，支持以下两种方式获取：

# 模型查询
mms list [model name]

# 模型资源获取
mms get -m [model name] -p [precision] -c [soc] -b [backend] -d [file path]

MMS 具体使用请参考：MMS 使用 & 提前获取预览版块模型

支持的语种

支持的语种
英文

注意：在右侧性能参考板块中，展示了当前音频输入长度下对应语种的 RTF 值。由于模型输入尺寸固化（非动态输入），低于该音频长度的 RTF 值会略微增高。

使用AidVoice推理

许可证

源模型许可证：MIT

可部署模型许可证：APLUX-MODEL-FARM-LICENSE