语音识别是AI重要一环,智能语音引发巨头混战
- 来源:读者新周刊 smarty:if $article.tag?>
- 关键字: smarty:/if?>
- 发布时间:2016-12-21 14:05
语音技术作为人机交互方式的入口,是人工智能重要的一环。不只是BAT(百度、阿里巴巴、腾讯),搜狗、科大讯飞等也在加速智能语音的布局,不少围绕AI的创业团队如云知声也都将语音作为探索人工智能的方向。
要想顺利进入这一领域,需要的是多年的技术与经验积累。
百度语音首席科学家吴恩达表示,语音识别技术非常复杂,最难的是核心技术的提升,例如识别率的提升,几年前语音识别率还只有80%多,当时用起来还是相当困难;还有大数据语音合成等,现在的目标是如何才能远远超过人类的识别能力。此外,百度语音识别97%的准确率是在比较安静的环境下达到的目标,在噪音干扰的情况下如何提升识别率,百度还有工作要做。
除了百度之外,可以看到的是,今年9月,腾讯云技术团队和微信AI团队开放微信语音处理技术,推出了智能语音服务。在语音识别、语音合成、声纹识别等功能上提供了垂直领域定制化的语音产品。阿里的人工智能系统,已具备智能语音交互、图像识别、交通预测、情感分析等功能。
在语音识别领域,搜狗CEO王小川在不久前的世界互联网大会上透露,搜狗输入法一天处理的语音输入请求达到1.9亿次,产生超过16万小时的语音数据。在庞大的用户基础和数据积累后,可以把语音输入做到更极致的状态,如语音合成、声纹识别等。
公开资料显示,在技术指标方面,百度语音识别、搜狗输入法语音识别、讯飞输入法语音识别准确率达到97%,腾讯云智能语音识别技术在通用领域中准确率达95%。
在投资人士看来,智能语音仍是一个好的投资机会。此前,峰瑞资本早期项目负责人朱祎舟提到,尽管各家根据实验数据得出的语音识别准确率达到95%甚至更高,但在实际使用时并没有那么高,前端的语音/声学交互的很多问题如果得不到解决,整体的体验始终不够好;而包括家居、车载、可穿戴设备、机器人等大量智能终端的爆发,智能语音将变得更加友好和重。
在IBM前全球副总裁、赛伯乐投资集团总裁王阳看来,未来人工智能在医疗、无人驾驶、金融、零售、安防、个人助理等七个领域有强大的应用空间。他提到,人工智能个人助理目前普遍应用于智能手机上的语音助理,语音输入、家庭管家等,最终是在收集消费者的消费习惯,从而提供各类服务。
ResearchandMarkets研究报告显示,预计2016年全球智能语音产业规模可达82.3亿美元以上,到2020年,全球语音市场规模预计将达到191.7亿美元。(本文节选自中国智能制造网)
