您的位置首页  网络技术

网络技术基础论文谷歌等语音识别技术水平或超人类 暂未投入使用

技术突破

与数字语音助手聊天产生的乐趣大概就像你努力与一个的孩子讲道理一样。如果你曾经对着你的Xbox大吼,或者Siri,那说明你可能已经对语音识别失望了。

“一年前,我们做了一次基准测试,得出的结论是难以实现这一功能。但是现在,一切都已经发生了改变。我们公司对语音识别进行了加倍投资,主要得益于我们所看到的这些技术进步,”图特勒表示,“你将发现,那些在准确率上与人相当、或比人更高的语音识别系统实现商业化。”

沙尔克维克正在谷歌从事一项野心勃勃的研究项目,开发能够整合公司海量数据的语音系统。他表示,目前正在实验室测试的一个项目能够使计算机听懂并在本质上“思考”人们向谷歌设备输入的语音。

语音和机器学习领域近期的创新应该会大幅提升语音识别的能力,缓解人们的不满情绪。Siri开发团队中有人表示,工程师们都在狂热地开发语音识别技术,令其足够智能,以实现设备与用户真正地对话。“语音识别技术对所有地区口语的理解能力已取得长足的进步,”Siri底层础技术的开发公司SRI International(后被苹果收购)副总裁威廉·马克(William Mark)称,“这种对话式互动现在成为了一种前沿技术。”

但是研究人员称,人类近期在语音识别和人工智能领域取得的突破将很快会大幅提升设备的理解能力。谷歌著名工程师约翰·沙尔克维克(Johan Schalkwyk)表示,只需一到两年,这种性能强大的新型设备就会问世。它不仅能够听懂人们说话的意思,还明白上下文的关联与细微差别。

蒂姆·图特勒(Tim Tuttle)对语音识别技术的飞跃等待已久。他在1997年取得了麻省理工学院的博士学位,并在该校人工智能实验室任职。过去10年,他先后在多家硅谷公司工作,并最终在2010年创建了自己的公司Expect Labs。图特勒的公司去年开始从事一个系统研发,将复杂的语音指令加入到移动应用中。这款应用能够允许用户进入一家商店后向手机询问要买的扫帚在哪一条货架走道。

彭博社发表分析文章称,现在的语音识别技术还不够成熟,较为机械,一些模糊不清的词汇难以辨别,也不能通过语境理解用户的真正意图。但是,近期语音识别和人工智能领域取得的突破让一项数十年前就已问世的数字神经网络技术获得。谷歌正在此神经网络技术的基础上开发可以整合其海量数据的语音系统,其能够让语音识别更为智能,大幅改善了识别质量。未来,市场上或将出现准确率与人类相当或水平更高的语音识别系统。

以下是文章全文:

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐