首页历史沉浮 > —正文
谷歌正在使用机器学习技术来提高二重奏通话的质量。
2020-04-05 20:16:25

据外国媒体报道,为了确保连接不稳定的二人通话服务的音频质量,谷歌推出了一项名为Waveeneteq的声音质量改善计划。据报道,该项目基于谷歌的DeepMind相关技术,旨在使用人工噪声来抑制音频抖动。这种噪音听起来像人说话,但实际上是由机器学习技术产生的。

如果你曾经打过一个网络电话,你一定经历过或多或少的由不稳定连接引起的音频抖动。

这可能发生在呼叫过程中的一些音频数据包丢失、延迟过高或顺序不正确时。

谷歌表示,99%的双打电话出现分组丢失,其中20%的通话丢失超过3%,另有10%的通话丢失超过8%。

每个通信应用程序都采取了一些方法来处理丢包问题,但谷歌表示,传统的数据包丢失掩盖了(Plc)过程,或者导致了高达60ms的漏洞。

相反,基于DeepMind神经网络技术的Waveeneteq解决方案已经以48种不同的语言对100多个扬声器数据进行了培训。

为了更有说服力,谷歌还发布了一些比较音频,从Waveeneteq到普通plc技术。当然,新技术能转换多少音频也有一些限制。

谷歌表示,Waveeneteq的设计是为了取代短音频间隔,而不是在直播过程中错过的全部音频间隔。因此,在120ms后,系统就会消失,产生静音。

通过评估,google已经确保Waveeneteq不会带来任何新操作的压力,并且所有的处理都可以在用户的设备端完成,毕竟googleduo默认打开端到端加密。

一旦网络连接变得顺畅,实时音频就会立即恢复,波形将无缝地消失。目前,这项技术已经在像素4智能手机上进行了测试,随后该公司将把它推广到更多的设备上。