阿里公布新语音合成技术“KAN-TTS”

来源：新浪科技

2019/7/10 18:00:23

近日，阿里发布新一代语音合成技术KAN-TTS。

本文关键字：互联网

7月10日下午消息，阿里巴巴发布新一代语音合成技术KAN-TTS，称可大幅提高合成语音与真人发声的相似度，并将语音合成定制成本降低10倍以上。该技术由达摩院机器智能实验室自主研发。

阿里方面称，当前业界商用系统的合成语音与原始音频录音的接近程度通常在85%到90%之间，而基于KAN-TTS技术的合成语音可将该数据提高到97%以上。

据悉，KAN-TTS由达摩院机器智能实验室自主研发，深度融合了目前主流的端到端TTS技术和传统TTS技术，从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注，对录音人和录音环境要求很高。从启动定制到最终交付，项目周期长成本高。

阿里利用Multi-Speaker Model与Speaker-aware Advanced Transfer Learning相结合的方法，周期压缩3倍以上。也就是说，用1小时有效录音数据和不到两个月制作周期，就能完成一次标准TTS定制，可大幅提高合成语音与真人发声的相似度，并将语音合成定制成本降低10倍以上。

责编：畅享精灵

微信扫一扫实时了解行业动态

微信扫一扫分享本文给好友

客服电话
400-698-9918

阿里公布新语音合成技术“KAN-TTS”

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。