Google AI 技巧全公开!不只开源语音数据资料库,连模

收藏:615

Google AI 技巧全公开!不只开源语音数据资料库,连模

Google 的工程师们经常被问到这幺个问题:

怎幺上手用深度学习做语音识别或其它音频识别,比如关键词或指令?

虽然,现在出现了些很优秀的开源语音识别系统,比如  Kaldi,就能把神经网络作为其中的一个模块。但其高度複杂性,让它们并不适合作为解决简单任务的指南。更重要的是,对于新手而言,免费、可公开获取的数据集并不多,经过预处理的、或适合于简单的关键词检测的也很少。

为解决这些问题, Google 的  TensorFlow 和AIY 团队创建了  Speech Commands Dataset,即「语音命令数据集」,并基于它向  TensorFlow 添加训练和推理的示例代码。

雷锋网 (公众号:雷锋网 )消息,Google 在今日宣布开源该数据集。

对30 个命令短语,该数据集有65000 次的长约一秒钟的发音。这来自数千个不同的人向  AIY 网站提交的贡献。它以Creative Commons BY 4.0 许可发布,随着新贡献的添加,该数据集在未来会不断扩大。

建立这个数据集的目的,是帮助大家为应用创建基础但有用的语音交互 ,比如「 Yes」、「No」、数字、方向等词语。Google 也已经将开发这一数据集的基础设施 开源 ,并 希望看到更多人借此创建更多版本的数据集,尤其是针对冷门语言和应用。

下载预建的  TensorFlow 安卓演示APP,打开  「TF Speech」,就能体验 Google 基于该数据集开发的识别模型。另外,你可以通过  TensorFlow.org 的  音频识别  tutorial  学习怎幺开发你自己的模型。

_______________________________________________________

► 你是否常在各类丰富的科技趋势里流连忘返?
► 你是否常被创业故事弄得热血沸腾无法成眠?
► 你是否喜欢很有挑战性、尝试新事物的工作?
我想你大概就是得了  TO  病,不加入不行了。
準备好你的履历自传,寄至  [email protected]
记得标注你要「应徵  TO  社群编辑」,才不会跑错棚哦!
>> 
详细职缺讯息

______________________________________________________

延伸阅读

让 Google 一年损失 30 亿台币的神秘按钮!搜寻首页那个「好手气」按钮到底是啥 OREO 挂名赞助?Google 推出最新 Android 系统 Oreo,解决版本碎片化就靠它
Google、Facebook 和亚马逊如何运用用户数据资料?
Google 发表自动去图片浮水印演算法,目的却是为了保护版权?