WeTTS-FP32
语音合成
FP32
post
WeTTS:文字转语音

WETTS(WeNet End-to-End Text-to-Speech)是一个基于WeNet的端到端文本到语音(TTS)开源项目。该项目旨在提供一个高效、灵活且易于使用的TTS系统,支持多种语言和声音风格。WETTS利用先进的深度学习技术,如Transformer和WaveRNN,以实现高质量的语音合成。

源模型

  • 输入尺寸: 动态输入
  • 参数量: --,--
  • 模型大小: 410M,65.9M
  • 输出尺寸:动态输出

源模型仓库:wetts

性能参考

设备

AI框架
数据精度
推理耗时
精确度损失
模型大小
模型转换

AIMO暂时还不支持该模型的自动转换

模型推理

SDK安装

pip install onnxruntime

推理示例代码

  • 点击模型 & 代码下载模型文件和推理代码包,文件结构如下
/model_farm_{model_name}_aidlite
    
    |__ models # folder where model files are stored

    |__ python # model inference example

    |__ cpp # model inference example

    |__ README.md
许可证
源模型许可证:APACHE-2.0
可部署模型许可证:APLUX-MODEL-FARM-LICENSE
性能参考

设备

AI框架
数据精度
推理耗时
精确度损失
模型大小