Deep Speech

生活百科 2023-01-26 10:45生活百科www.aizhengw.cn

Deep Speech

Deep Speech,百度研发的语音识别系统。

百度在美国康奈尔大学图书馆的网站上发表论文称,Deep Speech準确率超过了苹果、谷歌的产品。

研发历程

语音收集

百度团队收集了9600人的7000个小时的语音,但多数是在安静环境下。为了提升噪音环境下的语音识别能力,百度向语音样本中添加了大约15种类型的噪音,比如酒店、汽车和捷运内的环境噪音,从而将语音样本中的数据扩充到10万个小时。然后,百度让系统在噪音环境下学习识别语音。

产品公布

百度近日在美国康奈尔大学图书馆的网站上发表论文称,已开发出了一种新的语音识别系统Deep Speech,準确率超过了苹果、谷歌的产品。
百度近日在美国康奈尔大学图书馆的arXiv.org网站上发表论文称,已开发出了一种新的语音识别系统Deep Speech,準确率超过了苹果、谷歌的产品。

产品特点

百度首席科学家吴恩达以及由Awni Hannun领导的10人研究团队在美国康奈尔大学图书馆网站上称,他们已经开发出了一种新的,更为準确的语音识别系统Deep Speech,该系统使用了端对端的深度学习技术。语音识别是一项越来越重要的技术,已经被用于苹果语音助手Siri、语音输入功能Dictation以及谷歌语音搜寻中。
吴恩达称,按照衡量语音识别系统出错率的标準基準,Deep Speech的準确性已经超越了苹果、谷歌的语音识别系统。特别是在汽车或人群等噪音环境下,Deep Speech的表现更为出色。
吴恩达称,测试显示,在噪音环境下,Deep Speech语音识别出错率比谷歌语音识别引擎(Google Speech API)、语音识别公司wit.ai、微软必应语音搜寻、苹果Dictation的语音系统低10%以上。

Copyright@2015-2025 www.aizhengw.cn 癌症网版板所有