您的位置首页  网络杂谈  建站经验

刘聪:科大讯飞直播场景下识别准确率已达85%

站长之家(ChinaZ.com)10月23日 消息:今天下午,科大讯飞AI研究院常务副院长刘聪发表了关于“构筑AI科技树,焕新美好新生活”的主题演讲。在演讲中,刘聪提到了如何保持AI技术不断突破以及如何实现应用落地的问题。

刘聪认为,在人工智能的应用场景中,最重要的一个就是语音交互。他称语音识别是讯飞的传统强项。近年来,科大讯飞陆续推出了方言识别、远场交互、多麦克风阵列等相关的功能,将语音听写从简单场景的可用做到了通用。

下一步,科大讯飞将持续深耕语音识别,去挑战更加复杂的场景,去实现从语音到声音,从单纯的文字内容的识别,到音频的全场景解析。例如直播场景这样有游戏、音乐以及笑声、掌声等各种音效嘈杂的背景下,如何有针对性地提取想要的声音。

面对这种复杂的环境,科大讯飞已经有一套全场景音频解析的整体方案。目前,可达讯飞在直播场景下的识别准确率已经从从60%提到了85%。未来,这些相关技术会在科大讯飞的开放平台、讯飞听见等上线。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:薛璐压缩包版本237m
  • 编辑:唐志钢
  • 相关文章