中国智能语音行业的历史沿革、现状与发展动态分析(下)
- 来源:客户世界 smarty:if $article.tag?>
- 关键字:智能,语音,行业 smarty:/if?>
- 发布时间:2021-11-01 14:11
在上篇中,作者解读了中国智能语音行业的历史沿革和应用现状。在本篇中,将为您解读中国智能语音行业的保障、行业的制约因素和未来展望。
一、中国智能语音行业的保障
根据上文对我国智能语音行业的分析,可以发现我国智能语音行业市场发展速度快、潜力大,目前已存在以科大讯飞为代表的智能语音上市公司,并且智能语音技术在教育、医疗、公检等领域已经得到应用。智能语音的良好发展不仅得益于我国人口红利形成的巨大需求和市场,还得益于我国以科技企业代表对人工智能和智能语音行业的持续投入和深耕,也与我国政策、方针等的大力支持是密不可分的,这些因素是我国智能语音行业发展的重要基石和保障。
1.中国智能语音行业的政策支持力度大
我国高度重视智能语音技术进步与行业发展,智能语音已上升为国家战略。为了在新一轮国际科技竞争中掌握主导权,我国加快人工智能和智能语音行业的布局与规划。2017年,工业和信息化部出台的《促进新一代人工智能产业发展三年行动计划(2018-2020 年)》;2018年,国务院办公厅出台的《关于促进“互联网+ 医疗健康”发展的意见》;2019年,最高人民法院出台的《最高人民法院关于深化人民法院司法体制综合配套改革的意见》;2020年,教育部、国家发展改革委、财政部联合出台的《关于"双一流"建设高校促进学科融合,加快人工智能领域研究生培养的若干意见》等重要文件中都明确提出了加快智能语音技术在医疗、公检等领域的应用以及智能语音的学科建设和人才培养,进一步促进我国人工智能和智能语音行业发展。此外,中国已有逾 20个省市出台了人工智能产业鼓励政策,其中江苏、上海、广东、北京、浙江是国家大力发展人工智能的热点区域。在国家政策以及地方配套政策的推动下,人工智能、智能语音等领域产业链初具规模,与产业下游应用领域的结合不断深入,推动经济社会各领域从数字化、网络化向智能化加速提升。
2.中国智能语音技术的支撑
我国语音识别研究一直紧跟国际水平,国家层面也十分重视。国内中科院的自动化所、声学所以及清华大学等科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别技术研究专门立项,并取得了高水平的科研成果。我国中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其准确率和系统响应率均可达90%以上。
3.中国智能语音行业的市场需求大
随着我国经济的高质量增长以及基于我国巨大的人口红利,我国智能语音行业市场需求大、增长快。2014年我国智能语音行业市场规模仅有28.7亿元,到2018年,智能语音市场规模增长至157.9亿元,年复合增长率为53.2%,并根据历史数据预测,到2023年,智能语音行业市场规模将达到655.1亿元,2018 -2023年的年复合增长率为32.9%。
二、中国智能语音行业的制约因素
1.行业基础层技术存在短板
目前,中国智能语音行业基础层的核心关键技术积累较薄弱,算法、芯片及基础元器件的原创科技实力与国外企业相差较大。智能语音行业基础层核心技术实力欠缺,如芯片,传感器等核心元器件,不仅影响行业原创科技成果的输出,并且核心技术或生产环节长期依赖国外,不利于中国智能语音企业建立国际竞争优势。智能语音芯片等核心基础元器件从投入到规模化生产的周期较长,在产品研发至生产期间所需资金投入较大且回报周期长,致力于基础层核心)元器件研发的企业需面临较大的资金压力。近年来,智能语音行业较好的发展前景吸引资本涌入,中国国内资本持续加码智能语音领域,但资本多集中在智能语音行业的应用层,在回报周期较长的基础层领域缺乏布局。智能语音基础层核心元器件的技术瓶颈导致企业的国际竞争力不足。中国近90%的芯片需依靠进口,行业对于进口芯片等基础元器件的进口依赖,消耗了大量的外汇储备,导致智能语音产品的生产成本居高不下,压缩行业的获利空间,制约智能语音行业的发展。
2.语音识别技术“鲁棒性” 问题凸显
语音识别技术在智能语音下游的应用逐渐广泛,由于语音信号的频谱受到复杂的环境因素干扰,如信道差异、测试环境差异等,语音识别系统的“鲁棒性”受影响,智能语音硬件对于用户需求识别的准确度降低,影响消费者体验。语音识别的完整过程包含语音信号识别、静音切除、声学特征提取等多个环节。基于语音信号的多样性和复杂性,语音识别系统在保证环境安静、语料的清晰、标准的情况下才能实现用户需求的准确识别。在智能语音硬件的真实使用场景中,方言、噪音、远场、断句等情况不可避免。语音采集地点变更导致的环境及背景噪音差异、语音信号传输载体方式多样导致的传输信道差异,都将造成语音信号的频谱畸变,导致智能语音系统对于用户需求的准确识别产生偏差。语音识别技术的成熟度将影响各应用领域智能生态的构建及发展,语音识别技术的“鲁棒性”问题亟待解决。
3.自然语言处理技术尚不成熟
目前,自然语言处理(NLP)技术在人机交互领域仅停留在浅度处理层面,智能语音设备无法保障智能语音系统对于用户需求识别的准确率。自然语言处理(NLP)技术主要包含三个层面,分别为词法分析、句法分析、语义分析。在语义分析层面,机器对句子的理解只能做到语义角色标注层面,即标出句中的句子成分和主被动关系等,词义消歧是制约自然语言处理(NLP)技术的最大阻碍。语音识别系统在完成切词、标注词性以及词语识别后,需要对每个词语进行理解。但由于一词多义的情况无法避免,机器无法比拟人力基于语言环境和知识储备消除各种歧义的能力,因此基于自然语言处理技术的语音识别系统在实际操作情况并不理想。
三、中国智能语音行业的未来展望
1.行业将大力发展深度集成语音Al芯
基于语音交互为用户带来的便利性,智能语音技术在各行业应用程度日益加深,各领域智能终端产品逐渐普及。在传统智能语音解决方案中,语音识别技术需在云端进行计算,庞大的数据和运算量导致设备运行成本和功耗居高不下,且易出现语音交互“时延”的问题,影响用户的消费体验。Al芯片的算力决定了智能语音处理的速度以及语音交互的便利性,因此行业将大力发展深度集成语音Al芯片。深度集成语音Al芯片利用主要算法和芯片架构深度集成,将芯片和语音识别算法技术组合成语音模块,放置在设备中。用户只需向设备发送指令,设备中的语音模块通过麦克风将语音导入设备变成电信号,语音模块再将电信号提取出来进行运算,从而实现“人机交互”。深度集成语音Al芯片拥有较大的数据存储空间,无需将语音语料上传至云端进行计算,保护信息安全性。深度集成语音Al芯片降低了设备的数据运算量及功耗,在节约设备运行成本的同时,提高智能语音处理速度,提升消费者的用户体验。
2. 行业将构建智能语音专利池
目前,中国智能语音行业进入快速成长期,语音技术在各下游场景的商业化应用日益广泛,推动智能语音产业分工的细化以及科学技术的密集化。落地的智能语音产品会涉及众多专利技术,且分属于不同所有者,众多的专利请求、复杂的专利授权、以及高额的专利侵权赔偿等问题将阻碍智能语音新技术的实践运用。因此,中国智能语音行业有望建立智能语音专利池,引导和促进智能语音技术跨行业的实施和应用,推动语音相关产业的发展,智能语音专利池的建立可以有效降低交易成本,消除专利实施中的授权障碍,减少企业间的专利纠纷、有利于专利技术的推广应用。专利权人可以向智能语音专利池贡献自己的核心专利,同时享有免费使用其他专利人专利的权利,免去了专利权相互交叉许可的交易成本。专利的有效管理消除了专利实施中重复授权的障碍,有效降低了专利许可中的交易成本,满足行业需求的同时,提高社会经济效益。构建智能语音专利池可以促进专利权人的相互合作,形成专利权人的利益联盟,使其共同开发研究智能语音产业的新型技术,保持智能语音专利池的先进性,实现利益最大化。此外,智能语音专利池的建立将提高我国智能语音企业的国际竞争力,实现优势互补。
3. 人工智能融入企业战略
在《MIT斯隆管理评论》(MIT Sloan Management Review)和波士顿咨询公司(BCG)联合开展的2019年人工智能全球企业高管调研与研究的主要发现中,90%的受访者认为人工智能可以为他们的企业带来商机。此外,越来越多的领导者认为,人工智能不仅是机遇,也是战略风险。因此,让人工智能融入战略,充分利用人工智能赋能战略,也是管理者需要考虑的问题。如果人工智能计划不是企业商业战略的核心,它们就不太可能创造出重要的价值和规模。如果企业当前的商业战略忽视了人工智能的风险或机遇,那么很可能需要对战略进行重新审视。
参考文献:
[1]朱家泉,付晶晶.智能语音助运营商智慧家庭业务落地[J].中国电信业,2021(05):78-80.
[2]李国光.智能语音在数字出版领域的应用探析[J].科技传播,2021,13(08):31-33.
[3]刘丽.基于智能语音的人机交互在智慧交通服务中的应用[J].中国交通信息化,2021(04):129-131.
[4]罗建勋.智能语音转写平台的应用[J].现代电视技术,2021(04):143-146.
[5]孙楚音,黄孟祺,唐德鹏,魏书杰.中国智能语音产业的发展潜力研究[J].科技经济导刊,2020,28(02):185+184.
[6]任智.浅析中国智能语音产业的发展潜力[J].广西质量监督导报,2019(08):93-94.
