像百度地图这种导航软件里的明星语音包,都是靠明星去录制大量的音频吗?需要说多少字?

还有红绿灯位置

不需要明星录制大量音频。

语音包都是靠软件合成的,明星只需要录制一些包含特征词的句子,例如“直行”、“左转、右转”、“前方有红绿灯”、“前方有测速拍照”等等。

而比较长的句子则要用到TTS(Text To Speech)技术了,也就是文本转语音技术,包括Siri、谷歌翻译用的就是这一技术。通过计算机语音合成,可以将任意文本转换成具有高自然度的语音。

原理上,只要让明星把汉语中的21个声母、37个韵母、5个声调组合的不超过3000个语音全部录一次,播放时,再把每个字的语音串起来就可以了。

这就好比活字印刷术,明星每个字的发音都是一个单字,TTS会把这些单字重新排列组合成导航里的长句子。

虽然组字成句听起来略显生硬,但随着TTS语音技术的发展,自然度已经越来越高了。

扩展资料

TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。

它是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。

TTS语音合成技术即将覆盖国标一、二级汉字,具有英文接口,自动识别中、英文,支持中英文混读。所有声音采用真人普通话为标准发音,实现了120-150个汉字/分钟的快速语音合成,朗读速度达3-4个汉字/秒,使用户可以听到清晰悦耳的音质和连贯流畅的语调。现在有少部分MP3随身听具有了TTS功能。

TTS是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。TTS不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文档的可读性。现在的TTS应用包括语音驱动的邮件以及声音敏感系统,并常与声音识别程序一起使用。

参考资料:百度百科-TTS

温馨提示:答案为网友推荐,仅供参考
第1个回答  2018-06-05
不是的,这些语音包是用技术合成的。请明星或者声优录制了几千句(录制越多,后期合成越像),收集到这些相关语音特征值,然后做成相关参数定制出来的。像“左转”,“直行”这类固定的导航提示音是可以录制的,但类似“骡马市”,“爱华路”之类成千上万的地名,只能通过合成的方式来完成。标贝科技就给百度地图做了很多明星语音包,杨洋的就是他们做的,用户反馈也不错。本回答被提问者采纳
第2个回答  2019-01-06
不是的,这些语音包是用技术合成的。请明星或者声优录制了几千句(录制越多,后期合成越像),收集到这些相关语音特征值,然后做成相关参数定制出来的。像“左转”,“直行”这类固定的导航提示音是可以录制的,但类似“骡马市”,“爱华路”之类成千上万的地名,只能通过合成的方式来完成。标贝科技就给百度地图做了很多明星语音包,杨洋的就是他们做的,用户反馈也不错。
第3个回答  2018-06-05
说不了多少个字吧,我之前在百度还是高德(有点忘了)可以设置自己的声音作为提示音,记得好像说不了多少个字,你可以试试本回答被网友采纳
第4个回答  2020-05-13
回答者肯定没有用过才这么说,本人技术开发,原来也以为是tts技术嘛,录入特有字词再拼起来,但是中国的地名那么多都要录入吗?其实他只要你读20句话,然后分析出你的音色音频。最后就可以任意说了,太厉害啦👍
相似回答