MeloTTS-Chinese-FP16
语音合成
FP16

MeloTTS-Chinese:语音合成
MeloTTS-Chinese 是由 MIT 和 MyShell.ai 联合开发的高质量多语言文本转语音(TTS)模型,支持多种英语口音,包括美式、英式、印度式、澳大利亚式和默认口音。该模型采用先进的 Transformer 架构,融合了 VITS、VITS2 和 Bert-VITS2 等技术,旨在提供自然、流畅的语音合成体验。
源模型
源模型仓库:MeloTTS-Chinese
核心特性
- 多口音支持:包括美式、英式、印度式、澳大利亚式和默认口音。
- 实时推理:优化为支持 CPU 上的实时推理,无需 GPU 加速。
- 高质量语音输出:生成自然、清晰的语音,适用于多种应用场景。
- 易于集成:提供 Python API,方便开发者集成到各种应用中。
- 开源许可:采用 MIT 许可证,支持商业和非商业用途。
技术架构
MeloTTS-Chinese 基于 Transformer 架构,结合了 VITS、VITS2 和 Bert-VITS2 等先进技术,能够生成高质量的语音输出。
性能参考
设备
AI框架
数据精度
推理耗时
精确度损失
模型大小
模型转换
待发布
模型推理
待发布
性能参考
设备
AI框架
数据精度
推理耗时
精确度损失
模型大小