您的位置  网络资讯  动态

创新100 | 科大讯飞陈志刚:数据和算法仍是语音瓶颈,医疗教育等将爆发增长

编者按:在二十一世纪新十年开启之际,正式推出《中国创新公司100》系列榜单及报道,围绕5G、AI、芯片、制造、零售、出行、社交、企业服务等领域内的技术创新和商业模式创新,对相关行业和优质创新公司进行深度价值挖掘。

近日,在主办的《中国创新公司100》沙龙第二期中,清华大学人工智能研究院听觉智能研究中心主任郑方教授、声智科技联合创始人&首席知识官常乐、科大讯飞AI研究院副院长陈志刚,探讨了智能语音技术和商业化的发展。本文为陈志刚院长在沙龙上分享的精彩观点。

作者 | 梁昌均

编辑 | 杨锦

人工智能的发展离不开数据、算力、算法等三大要素。在本期沙龙上,科大讯飞AI研究院副院长陈志刚认为,目前智能语音技术在算法和数据上还存在许多问题需要解决。

具体来看,在算法方面,语音技术还有一些难啃的骨头没有解决,比如前端的声学降噪算法、前端声学信号处理算法、麦克风阵列算法等,这些算法的突破都是解决当前比较困难的语音问题的必由之路。此外,数据采集也存在一定困难,比如特殊场景下数据使用频度不高,专业场景下数据比较稀缺等。

对于语音技术未来发展的趋势,陈志刚同样认为,单一技术很难给企业带来市场当中的领先优势,但语音和其他技术的融合不应是简单的技术组合,而是需要去了解每个技术水平,同时选择有融合价值的应用场景,通过联合建模的方式可能会形成最好的场景解决方案。

在应用方面,陈志刚表示,智能语音在C端的落地,一定要和海量用户的常态性需求紧密关联起来,不断提升产品在实际应用过程当中的易用性,才能够打造出来一些真正有开创性的新的硬件品类。

科大讯飞AI研究院副院长陈志刚通过线上参与沙龙

另一方面,包括智能语音等在内的人工智能技术在To B领域的规模化应用还仅仅集中在少数领域,多数行业仍处于尝试或初期阶段。陈志刚分析称,这可能与行业的数据积累、行业基础,包括信息化水平等有关。同时,目前技术还没有达到非常好用的状态,其存在迭代优化的过程,这个过程根据每个行业的特点,可能会持续几个月到几年。

他表示,智能语音在医疗、教育、政务等这些领域下场景的应用能够帮助从业者以及老百姓们提升使用体验,用户反馈会逐步得到提升,未来会有很多领域迎来爆发式增长。

陈志刚还给出了互联网科技巨头竞争之下企业的发展策略,要么选择加入巨头生态,要么是利用核心技术做自己的产品创新,但这种创新相对来说有一定的难度,要有一定的颠覆性和开创性,同时要有一定的技术壁垒。

但无论选择哪种路径,智能语音企业在发展过程中都需要打造自身的核心竞争力。陈志刚认为,这需要企业做到两点:选择合适的赛道,形成自身的差异化趋势;同时要基于对核心技术的理解,形成全新的产品创新思维模式。

以下为陈志刚院长分享实录(经删减整理)

人工智能发展有三要素,算法、算力、数据,目前智能语音在哪一块还需突破?

陈志刚:语音技术大部分的场景和应用,在这三个方面都有较好的基础。从还需要突破的角度来看,还是两个方面。第一是算法,目前语音技术还有一些难啃的骨头没有解决,比如前端的声学降噪算法,前端声学信号处理算法,麦克风阵列算法,角色分离,包括后续理解上面的算法,这些算法的突破都是解决当前比较困难的语音问题的必由之路。其次是数据,很多场景下面数据采集可能是困难的,如在一些特殊场景下面,数据有各种各样的使用限制条件,使用过程当中可能频度不是那么高。在一些专业性领域比较强的场景下面,数据本身就非常稀缺。

智能语音等多模态技术融合对壁垒的构建能够起到什么样的作用,有没有比较好的方式来做?

陈志刚:单一技术的确很难带来市场当中的领先优势,在语音基础上面,可以融入自然语言理解、视觉、知识构建、推理技术等,但不是一昧简单的技术组合,一定要清楚地了解每个技术的水平,再去考虑多个技术之间有没有共通融合或者统一建模的方式能够互相扬长避短,同时要选择合适的应用场景,看到哪些技术有融合的价值,那么联合建模可能会形成最好的场景解决方案。

怎么看待智能语音企业去做AI芯片、操作系统等?这会是未来趋势吗?

陈志刚:目前很多人工智能企业有转型,是一定程度上必然的趋势。AI技术要落地一定会涉及到平台,也就是说用什么样的载体,AI落地的过程需要各个环节的密切配合,才可以把它的价值最大程度挖掘出来。人工智能企业研发一些智能硬件,或操作系统,会促进产业之间加速发展,特别在当前国际形势下面,加大自主研发的投入,可以避免被国外卡脖子。无论对人工智能企业本身的发展还是从国家战略角度来看,都是非常好的趋势,比较值得鼓励。

智能语音在C端落地上应该怎么做?目前面临的困境是什么?

陈志刚:智能语音只是一种技术,To C领域一定要和海量用户的常态性需求紧密关联起来,把核心技术应用到用户的需求当中去,并不断提升产品在实际应用过程当中的易用性,才能够打造出来一些真正有开创性的新的硬件品类,发挥它真正的价值。

目前各种各样的互联网服务,包括音视频服务、信息流服务,包括很多智能家居市场,基本被很多巨头垄断。其它硬件厂商想要活下来,我觉得就两种可能的模式,一种是选择加入巨头的生态,通过打磨自身产品,真正挖掘用户刚需的需求,取得一些先发优势,积累大量用户。第二种是利用核心技术做产品的创新,这种创新相对来说有一定的难度,要有一定的颠覆性和开创性,同时要有一定的技术壁垒。

To B领域是包括智能语音在内的人工智能技术应用的主要方向,但目前其实也是仅仅在少数几个领域有规模应用,如何看待技术发展和应用程度上的差异?

陈志刚:在To B领域,目前语音有很多应用的场景,比如客服、金融、电信领域,还有很多领域还正在积极尝试当中。这也许与行业当前的数据积累、行业基础,包括信息化水平等都有一定的关系,同时,现在技术也许还没有达到非常好用的状态,但这不是技术的缺陷问题。人工智能落地应用需要有一个迭代优化的过程,这个过程根据每个行业的应用特点,可能会持续几个月到几年。

虽然可以用技术来吸引眼球,但是技术本身是会逐步被用户遗忘。在To B领域更重要的是挖掘用户流程过程当中,特别是行业真实用户应用过程当中的一系列真实刚需需求,把这些需求作为重点去打磨的场景,思考在这个场景下语音技术到底能发挥哪些价值,这样才能够挖掘出更多领域更多场景。未来,智能语音将赋能医疗、教育、政务等这些领域下的场景,还有很多领域值得期待,都有爆发式增长的空间。

如何看待目前智能语音行业的竞争情况?企业如何在这种情况下形成自身的核心竞争力?

陈志刚:语音作为智能时代的重要入口,每个科技巨头都应该把握,但各家赛道其实还是有较大的差别。语音本身是赋能型的技术,赋能自己根据地的业务,提升用户的满意度、活跃度,包括用户的黏性,从而对业务产生较大的帮助。随着各家业务的延伸和发展,产生一些重合是正常的,从而产生竞争,是科技进步的表现,只要是良性的,都应该鼓励。

对于企业来说,怎么能够在这种情况下保证自己的核心竞争力?要选择合适的赛道,要看是不是已经有了巨头,如果已有那就需要考虑如何做出差异化。另一方面,要从核心技术的产品创新思维模式上面来考虑,前提是要充分理解核心技术怎么样才能发挥价值。传统产品经理的思维模式没办法站在一个相对比较高颠覆式、开创式的创新高度去思考一个全新的行业产品的模式,这方面要建立全新的思维模式,保持对新技术敏锐的嗅觉,用对新技术的理解赋能产品。

实况2013 http://www.xinzhiliao.com/zx/jianshen/2192.html
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:望月直播app官方免费下载,武豫鲁,600495资金流向,
  • 编辑:唐志钢
  • 相关文章