域名频道资讯站
我们一直在努力制造惊吓

阿里公布新语音合成技术 录音10分钟定制AI语音

阿里公布新语音合成技术 录音10分钟定制AI语音

KAN-TTS的基本框图

阿里公布新语音合成技术 录音10分钟定制AI语音

构建多发音人语音合成系统的方式

阿里公布新语音合成技术 录音10分钟定制AI语音

多发音人模型实际训练过程

阿里公布新语音合成技术 录音10分钟定制AI语音

阿里公布新语音合成技术 录音10分钟定制AI语音

阿里公布新语音合成技术 录音10分钟定制AI语音

据悉,KAN-TTS由达摩院机器智能实验室自主研发,深度融合了目前主流的端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。

阿里利用Multi-Speaker Model与Speaker-aware Advanced Transfer Learning相结合的方法,将语音合成定制成本降低10倍以上,周期压缩3倍以上。也就是说,用1小时有效录音数据和不到两个月制作周期,就能完成一次标准TTS定制。

此外,这使得普通用户定制“AI声音”的门槛更低。只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。

本文素材来自互联网

赞(0)
分享到: 更多 (0)

中国专业的网站域名及网站空间提供商

买域名买空间