不得不说,在科技飞速发展的今天,智能语音无处不在,他们或温柔、或磁性、或俏皮,用富含各种情感色彩的语音服务着我们的生活。
语音合成技术为机器人装上了嘴巴,而音色合成则丰富了机器的情感表达。那么,在时间就是成本的情况下,如何简单、快速、低成本打造适合自己业务的专属音色?
思必驰推出发音人音色定制平台,助力用户能够快速、高效自主完成语音合成音色模型定制,降低语音合成定制门槛。用户只需要根据自身场景需要,上传一定量符合规定标准的有效音频,即可一站式完成自动标注、模型定制、质量评测等流程,高度模拟发音人的音色、韵律和停顿习惯,获得所需音色。
(音色合成平台示意图)
1音色,让人机沟通更有温度
智能语音作为人类与机器沟通的途径之一,广泛应用于生活和工作场景。而不同情感的音色,为人机交互赋予了情感温度。
思必驰发音人音色定制平台支持定制中英文、成人男女、儿童以及幽默、严肃、甜美、中性等各种情感风格的音色,可满足客户在消费电子产品、明星动漫热门IP、数字人客服、有声读物、新闻播报等多个领域的应用需求。
2低门槛,大制作,快速获得音色
用户使用思必驰发音人音色定制平台,最快数小时即可获得专属音色,那么,思必驰是如何做到这一点的呢?
在数据采集方面,用户可按照思必驰录音规范进行数据采集,保证数据质量;在数据标注方面,可选择思必驰“自动标注”技术,一小时音频标注时间可压缩至数分钟,且不会对合成效果产生明显影响,自然度MOS损失在0~0.2内;在模型训练方面,思必驰构建了快速高质量的模型自训练流程,可自动进行数据特征提取和模型训练,结合大数据预训练和迁移学习技术,最快数小时即可完成一个音色的模型训练流程。
丰富而具有差异化的平台服务,让思必驰发音人音色定制平台具有以下优势:
简单快捷
将之前繁琐的流程通过平台化的方式实现,仅需要进行基础的配置,其它标注、训练等流程即可自动化完成,效率大大提高。
交付能力强
不再受限于研发人力,没有技术背景的用户也可快速使用平台,仅需数小时即可完成音色定制。
数据门槛低
只需要少量的音频即可训练出自然、情感丰富、还原度高的音色。
定制成本低
减少了标注、工程化等成本,定制成本大大降低。
思必驰支持公有云、混合云、私有化、终端离线等多种部署方式,让用户的数据更安全。
此外,思必驰DUI开放平台音色库还拥有男声、女声、童声、等百余种音色,可以直接满足客户在智能车载、智能家居、智能客服等多个领域的应用需求,已服务于央视网、腾讯、美的、海尔等多家客户。
3技术沉淀,铸就AI实力
作为国内专业的对话式人工智能平台公司,思必驰曾先后参与国家标准《中文语音合成互联网服务接口规范》与行业标准《中文语音合成服务系统评估规范》的制定,并成为全国首批通过评估测评的公司之一。
思必驰的语音合成技术涵盖了大数据语音定制、小数据快速定制、歌声合成、小语种合成、方言合成、情感合成。语音合成技术得到业内肯定,思必驰智能中文语音合成系统通过了AIIA组织的中文语音合成水平测试。
近年,基于深度神经网络为基础的语音合成成为主流,语音合成质量有了巨大提升。路漫漫其修远兮,思必驰将持续加大技术研究,为大家带来更自然、更真实、更个性、更低成本的语音合成服务。