MeloTTS-Chinese-FP16
语音合成
FP16
post
MeloTTS-Chinese:语音合成

MeloTTS-Chinese 是由 MIT 和 MyShell.ai 联合开发的高质量多语言文本转语音(TTS)模型,支持多种英语口音,包括美式、英式、印度式、澳大利亚式和默认口音。该模型采用先进的 Transformer 架构,融合了 VITS、VITS2 和 Bert-VITS2 等技术,旨在提供自然、流畅的语音合成体验。

源模型

源模型仓库:MeloTTS-Chinese

核心特性

  • 多口音支持:包括美式、英式、印度式、澳大利亚式和默认口音。
  • 实时推理:优化为支持 CPU 上的实时推理,无需 GPU 加速。
  • 高质量语音输出:生成自然、清晰的语音,适用于多种应用场景。
  • 易于集成:提供 Python API,方便开发者集成到各种应用中。
  • 开源许可:采用 MIT 许可证,支持商业和非商业用途。

技术架构

MeloTTS-Chinese 基于 Transformer 架构,结合了 VITS、VITS2 和 Bert-VITS2 等先进技术,能够生成高质量的语音输出。

性能参考

设备

AI框架
数据精度
推理耗时
精确度损失
模型大小
模型转换

待发布

模型推理

待发布

许可证
源模型许可证:MIT
可部署模型许可证:APLUX-MODEL-FARM-LICENSE
性能参考

设备

AI框架
数据精度
推理耗时
精确度损失
模型大小