
去年10月,微软透露了语音识别技术,可以将电话呼叫的单词以及培训的人的经销商转录。专业人士达到5.9%的错误率,匹配Microsoft系统的结果。
在星期日发布的博客帖子,微软研究的首席演讲科学家Xuedong Huang宣布该公司现已超越该纪录。
微软的语音识别系统“达到了新的行业里程碑”并缺口了5.1%的错误率,击败了专业人体转录的水平。
结果是一个主要的AI里程碑,使微软更接近开发人工智能,这将理解单词背后的含义,而不是简单地认识它们。
黄州“从认识到言语致力于言论是语音技术的下一个主要前沿”。
成就比微软预期的成就迅速到达,如2015年黄通知媒体,发展一个可以超过人类转录的系统是“四到五年”。
结果只花了两年了。
微软指出将会有挑战,特别是因为它侧重于改善语音识别技术,以适应嘈杂的环境或高度重视的演讲。
(来源:微软 - Xuedong Huang [离开]和他的团队)