谷歌DeepMind发布重磅技术WaveNet:机器人的面孔,天使的声音
近日,谷歌旗下人工智能公司DeepMind公布了其在计算机语音合成领域的最新研究突破——WaveNet。WaveNet是一种利用神经网络系统对原始音频波形(Raw SoundWave)建模的技术,生成的音频质量优于目前所有的文本转语音(Text-to-Speech,TTS)系统,将计算机输出音频与人类自然语音差距缩小50%,号称世界最佳!
DeepMind在twitter发文称:“让人类和机器对话是人机交互领域长久以来的梦想!”
通常我们听到的计算机或手机输出的文本转语音(TTS)音频都会觉得别扭、生硬,甚至诡异。此次DeepMind推出的这款新型语音合成系统WaveNet将大大改善这种情况,让机器输出音频更自然、更像人类发声。
当然,让计算机发出声音,这并不是什么新鲜事儿。
最常用的TTS方法可能是拼接式语音合成(Concatenative Synthesis):先录制单一说话者的大量语音片段,建立一个大型语料库,然后简单地从中进行选择并合成完整的大段音频、词语和句子。这种“机械式”方法使得计算机输出音频经常产生语音毛刺、语调的诡异变化、甚至结巴,并且无法调整语音的强调性音节或情绪。
另外一种方法是所谓的参数化方法,利用数学模型对已知的声音进行排列、组装成词语或句子来重新创造音频。这种技术倒是不易产生声音毛刺,所以确实让机器输出的音频听起来不那么机器化。
然而,这两种技术的共同点是:简单、机械地将语音片段拼接起来,而不是从零开始创造出整个音频波形。
音频跳转
WaveNet正是一种从零开始创造整个音频波形输出的技术。
WaveNet利用真实的人类声音剪辑和相应的语言、语音特征来训练其卷积神经网络(convolutional neural networks),让其能够辨别这两方面(语言和语音)的音频模式。使用中,对WaveNet系统输入新的文本信息,也即相对应的新的语音特征,WaveNet系统会重新生成整个原始音频波形来描述这个新的文本信息。
WaveNet组织结构
WaveNet是逐步进行操作的:首先,生成一个音频波形样本;接着再处理、生成一个音频波形样本,逐步进行。其中非常重要的是,新的样本生成都会受到此前样本结果的影响,也即每一步的样本结果都将影响下一步的样本预测,并帮助生成下一步的样本。
最终的音频结果确实表现惊人(试听参照DeepMind网站:https://deepmind.com/blog/wavenet-generative-model-raw-audio/)。相比于连续合成和参数化合成技术,WaveNet输出音频明显更接近自然人声。
DeepMind的WaveNet技术无疑是计算机语音合成领域的一大突破。然而,由于WaveNet是计算整个原始音频波形,每输出一秒音频神经网络必须处理16000个样本,所以WaveNet技术需要强大的运算能力来合成语音。
据DeepMind透露给《金融时报》(Financial Times)的内部消息称,这意味着目前还不能应用于谷歌或其他的任何一项产品中。
然而,这并不是计算机面临的唯一语言问题。翻译自然语言和手写文字也是人工智能系统的一大难题。
起码以现在这速度,在计算机形成真正的智能思考能力之前,它们应该早就能够用花哨的语言和人类交流了。
好的文章,需要您的鼓励
17
- 最新资讯
- 最新问答
-
2025两会热议:工业机器人“黄金五年”已来?
关键字: 工业机器人 2025-03-12 -
AI赋能工业机器人,制造业革命,已悄然来临!
关键字: 工业机器人 2025-01-16 -
巅峰对决完美收官!2024年中关村仿生机器人大赛各项冠军出炉!
关键字: 仿生机器人 2024-11-29 -
出海+ | 极智嘉10月全球新动态
关键字: 极智嘉 2024-10-24 -
会议邀请 | 昇视唯盛邀请您参加第8届国际机器人焊接、智能化与自动化会议暨第15届中国机器人焊接会议
关键字: 昇视唯盛 机器人焊接 会议 2024-10-17
-
智能焊接机器人的优势有哪些?
标签: 焊接机器人,工业机器人,配天机器人 提问:小王 2025-06-04 14:03:04 -
自动装卸货机器人的组成部分有哪些?
标签: 赛那德机器人,装卸货机器人,赛那德 提问:李子 2025-05-28 11:03:03 -
激光焊接机器人的特点有哪些?
标签: 激光焊接机器人,焊接机器人,工业机器人 提问:小T 2025-04-15 11:02:00 -
工业机器人码垛原理是什么?
标签: 码垛机器人,工业机器人 提问:晓明 2025-03-24 12:00:00 -
什么是自动焊接和半自动焊接?
标签: 焊接,焊接机器人 提问:小君 2025-03-18 09:00:00
- 2021-05-14 13:36:48
- 2019-09-27 11:29:38
- 2022-06-27 10:05:41
- 2020-08-17 15:11:43
- 2019-01-25 11:08:57
- 2020-10-16 13:27:55
- 2022-08-24 12:09:31
- 2018-07-18 16:14:08
- 2022-08-30 15:17:40
- 2022-08-24 14:16:37
- 2022-09-13 12:17:35
- 2023-09-01 10:16:04
- 2025-03-12
- 2025-01-16
- 2024-11-29
- 2024-10-24
- 2024-10-17
- 2024-10-16
- 2024-10-16
- 2024-10-16
- 2024-10-15
- 2024-10-15