您正在使用IE低版浏览器,为了您的FUTUREAI账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
FUTUREAI 业界
发私信给FUTUREAI
发送

谷歌齐新离线语音辨认模子更小,功耗更低!

本文作者:FUTUREAI 2019-03-19 16:00
导语:导读: 语音辨认是Siri、Alexa战Google等智妙手机的主要构成部门,但那些语音辨认体系有一个很年夜的缺陷,那便是会有响应的提早,用户必需 等候Siri或其他实拟助脚去呼应查询,并且

导读: 语音辨认是Siri、Alexa战Google等智妙手机的主要构成部门,但那些语音辨认体系有一个很年夜的缺陷,那便是会有响应的提早,用户必需 等候Siri或其他实拟助脚去呼应查询,并且假如语速过快便有极年夜能够形成曲解。


语音辨认是Siri、Alexa战Google等智妙手机的主要构成部门,但那些语音辨认体系有一个很年夜的缺陷,那便是会有响应的提早,用户必需 等候Siri或其他实拟助脚去呼应查询,并且假如语速过快便有极年夜能够形成曲解。

有提早呈现是果为用户的语音和从中获得的数据必需 从要脚机传输到办事器,正在那边停止阐发后再发还。那能够需求从几毫秒到几秒的工夫,假如数据包正在历程中没有当心得,则需求更少工夫。

谷歌全新离线语音识别模型更小,功耗更低!

为何不克不及间接正在装备长进止语音辨认呢?果为将语音转换成毫秒级的文本需求相称年夜的计较才能,那不由 是听一段声音战写一个单词,而是逐字逐句天文解一小我私家正在道甚么和触及到企图战全部语境。

固然,脚机实在是能够做到那一面的,但那其实不 会比把脚机上的内容收收到云端快几,并且会年夜量耗电。但跟着该范畴的稳步开展,那一烦闷 沉迷标仿佛已成为能够,谷歌便使得那一功用正在Pixel上获得真现�˹����ܼ����������。

为真现那一改变,Google团队花了五年工夫研讨成绩并简化用于语音辨认的AI体系。比方,旧版Gboard的听写硬件由三个自力的组件去模仿音频波形,将声音取音素婚配,然后将那些音素组分解笔墨输出,更新后的版本将一切那些事情汇合到一个步调中。

新模子借减少了体系中被称为“解码器图形”的部门,那个组件的功用相似于书中的索引,将音频波形取书里笔墨相婚配。正在Gboard的听写模子的旧版本中,那个解码器图形巨细为2GB,关于装备上处置去道太年夜了。比拟之下,新版本仅为80兆字节,减少了25倍。

谷歌全新离线语音识别模型更小,功耗更低!

您只需求道出您的查询,它会立即被转录下去,并间接显现。它听到了您的声音后会立即呼应,而不消 比及您完成全部句子再来测度您的意义。

但烦闷 沉迷前它只正在谷歌键盘使用法式Gboard中事情,只正在Pixel上事情,并且它只合用于好式英语。

“思索到止业趋向,跟着专业硬件战算法改良的交融,我们期望那里引见的手艺能够很快用于更多言语战更普遍的使用范畴。”谷歌写讲。


本文由进驻维科号的做者撰写,不雅面仅代表做者自己,没有代表景智AI坐场。若有侵权或其他成绩,请联络告发。

声明:景智AI网尊重行业规范,任何转载稿件皆标注作者和来源;景智AI网的原创文章,请转载时务必注明文章作者和"来源:景智AI网", 不尊重原创的行为将受到景智AI网的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至:mailto:813501038@qq.com

分享:
相关文章
最新文章