本
文
摘
要
编者按:在二十一世纪新十年开启之际,搜狐科技正式推出《中国创新公司100》系列榜单及报道,围绕5G、AI,以及芯片、制造、零售、出行、社交、企业服务等领域内的技术创新和商业模式创新,对优质创新公司及相关行业进行深度价值挖掘。
目前,处于第三波浪潮的AI正在迎来加速发展,AI技术不断突破,进入应用规模爆发的临界点。2020年,AI还跻身“新基建”七大领域,成为各行各业数字化、智能化升级的重要基础设施,大量布局AI的科技巨头和创业公司逐渐开始涌上潮头。
在AI掀起的第四次工业革命中,谁能脱颖而出?继芯片系列榜单后,搜狐科技《中国创新公司100》正式推出AI领域榜单,首期聚焦智能语音领域及代表公司。未来的一段时间内,我们还将围绕计算机视觉、机器人等细分领域进行系列策划报道,并举办主题沙龙活动,敬请期待。
出品 | 搜狐科技
作者 | 梁昌均
编辑 | 杨锦
6月17日,搜狐科技《中国创新公司100》正式发布中国智能语音企业榜单。根据技术水平、经营状况、融资进展等核心指标,并结合业内专家审定,评选出国内智能语音行业20家代表企业。国内智能语音行业市场格局如何,这些上榜企业在技术布局和应用落地方面有何进展?榜单深度解读揭晓答案。
要点提炼:
1、全球智能语音市场呈现明显集中趋势,国内市场相对分散,且由本土企业主导;
2、榜单中初创企业达到14家,合计披露融资额近120亿元,头部企业获资本追捧;
3、技术融合发展是行业趋势,机器学习/深度学习、知识图谱、AI芯片等是榜单企业在智能语音之外普遍布局的技术;
4、智能语音应用在消费级市场以语音助手为代表,企业级市场以智能客服为代表,电信、金融、电商、教育、医疗、汽车是竞争相对激烈的领域。
本文共计5000余字,阅读大约需要10分钟。
国内市场本土企业“唱主角”
语言是人与外界沟通最重要的纽带,被称为人工智能皇冠上的明珠。智能语音的核心是处理自然语言,即以口头语言(语音)和书面语言(文字)为研究对象,对其进行识别、理解及生成,从而使机器具备能听会说、能理解会思考的能力。
智能语音涉及多类型学科,主要包括声学信号(如声源定位、语音增强、回声抵消等)、模式识别(如声纹识别、语音识别、语种识别等)、自然语言处理(自然语言理解、自然语言生成等),以及语音合成等细分技术,囊括感知智能和认知智能两大层面,其中语音识别和自然语言处理位居人工智能七大关键技术,也是人机语音交互变革的核心支撑性技术。
智能语音主要技术方向 资料来源:华西证券
人类对智能语音的探索始于上世纪50年代,迄今已逾70年。语音识别是最早进行研究的技术,2016年语音识别准确率在深度神经网络的帮助下达到95%,被视为首次基本达到人类水平,智能语音也加速进入技术迭代、产品升级、商业化落地的爆发期。
人工智能之父艾伦·图灵提出的“图灵测试” 一般被认为是自然语言处理思想的开端。自然语言处理,是指用计算机对自然语言(如汉语、英语)的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工,马斯克等联合创建的OpenAI发布超大的自然语言处理模型GPT-3是该领域的代表成果。
目前,全球智能语音语义市场已相对集中,龙头占据主要份额。据中商产业研究院、广证恒生等机构数据,在全球智能语音语义市场中,Nuance、谷歌、苹果、微软、科大讯飞等头部企业占有80%以上市场份额。不久前,微软斥资160亿美元(约 1022亿元人民币)收购 Nuance的交易已获美国反垄断批准,完成后市场规模将进一步集中。
据Frost & Sullivan预测,去年我国智能语音行业市场规模约为254亿元,预计2024年将达到490亿元。但相对全球,我国智能语音语义市场格局比较分散。IDC在去年12月发布的《中国人工智能软件及应用(2020上半年)跟踪》报告显示,在智能语音语义应用市场,科大讯飞、百度、阿里市场份额靠前,思必驰、智臻智能等明星创企也占有一定市场份额。但前述企业合计占据份额仅有40%左右,市场竞争仍比较激烈。
我国智能语音行业市场规模增长情况(亿元) 资料来源:Frost & Sullivan
同时,受限于中英文语义理解差异(叠加方言影响),以及中文语音语料资源匮乏等因素,海外智能语音巨头,比如Nuance、微软、苹果等市场规模较小,本土企业占据主导地位。IDC预计,随着应用场景在AI产业规模化中的重要性不断提升,未来BATH类公司将占据更高市场份额。
TOP20中14家为初创企业
从此次上榜的20家智能语音企业来看,国内智能语音企业主要分为三类:以百度、阿里为代表的互联网科技巨头;以科大讯飞为代表的技术服务商;以思必驰、云知声等为代表的深耕于垂直领域和细分场景的初创企业,这类企业最多,达到14家。
据艾媒咨询统计,截止2019年底,我国人工智能创业项目中处于语音识别和语义分析赛道的企业超过250家,占比达10%,但其中仅有30多企业已完成B轮后融资,也就是说有87%的企业尚处于发展前期。此次上榜的14家初创企业,均完成B+轮后融资。
榜单的14家初创企业融资情况 资料来源:天眼查
具体来看,有8家企业处于D轮后融资,包括思必驰、云知声、出门问问、智臻智能、捷通华声、中译语通、乐言科技、普强信息;其中思必驰在去年8元完成Pre-IPO融资,云知声去年11月冲刺科创板,但今年2月主动撤回申请,上市终止。捷通华声、智臻智能都曾是新三板挂牌企业,目前均已摘牌,不排除未来登陆A股的可能性。
从融资额度来看,这14家企业披露的融资金额合计超过117亿元,其中云知声、出门问问、思必驰融资金额最多,分别达到20亿元、17亿元、13亿元,合计占到总额的比重接近43%,显示资本对头部企业的追捧明显。不少企业还获得巨头青睐,如思必驰、智臻智能、乐言科技获得阿里投资,京东持有云知声近4%的股份,捷通华声也获得百度加持。
应用多面开花,巨头抢占智能音箱入口
榜单第一梯队企业中,成立于1999年、脱胎于中科大实验室的科大讯飞,是我国智能语音产业的领头羊,尤其在语音识别领域占据绝对地位。2017年科大讯飞作为智能语音行业代表,成为首批国家新一代人工智能开放创新平台。
在技术研发上,科大讯飞强调源头创新、自主研发,目前形成以感知智能+认知智能两大研发方向,在语音合成、语音识别、语音评测、图文识别、医学影像、机器翻译、自然语言理解等多个核心技术方面均有突破。近年来,科大讯飞的技术团队规模稳定占比在60%以上,研发投入也持续增长,去年占营收比已接近17%。
科大讯飞最近五年营收和研发投入情况 资料来源:公司财报
在应用落地上,科大讯飞也逐渐摆脱外界质疑,形成2B+2C双轮驱动、软硬件齐头并进的业务模式,覆盖智能硬件、开放平台、教育、城市、医疗、汽车、金融、运营商、工业等领域。2019年科大讯飞营收首破百亿,去年进一步增长至130亿元;净利润近14亿元,同比增长66%。
搜狗也是AI领域的创新者,其在2016年提出了“自然交互+知识计算”的长期核心战略,持续推进语音听写、语音翻译、语音交互等技术研发。目前,搜狗主要布局AI硬件和AI交互录音,推出录音笔、手表等产品,并具备搜狗分身、搜狗同传、搜狗知音等技术和平台。
近年来,搜狗在以语音为主导的人机交互领域,推出了多款“数字人”产品。从全球AI合成主播,到全球首个3D AI合成主播,再到全球首个手语AI合成主播,是搜狗在语音交互和分身技术上的不断突破。
此外,互联网科技巨头也是智能语音领域不可或缺的角色,此次入榜的阿里、百度和小米便是其中的代表,主要业务分别体现在天猫精灵、小度和小爱同学上。天猫精灵是阿里云智能事业群于2017年发布的AI智能终端品牌,去年1月升级为独立事业部,成为阿里巴巴布局AIoT及内容生态领域的核心平台。
阿里、百度、小米智能语音业务平台情况 资料来源:官网
小度是百度旗下人工智能助手,并开发了语音操作系统DuerOS。今年3月,小度智能助手月语音交互总次数达66亿次。去年9月底,百度将小度拆分独立融资,百度资本及CPE战略领投,IDG资本跟投,融资后估值200亿元。
小爱同学是小米旗下的人工智能语音交互引擎,搭载在小米手机、小米AI音箱、小米电视等众多小米生态链设备中,月活跃用户突破7000万(截止去年3月)。去年11月,小爱同学5.0正式发布,从语音助手升级为智能生活助手。
智能音箱是这三大企业争相布局的焦点,而依靠补贴攻城、低价策略的互联网玩法,国内智能音箱市场格局集中。据IDC数据,去年中国智能音箱市场销量3676万,维持三强争霸局面,阿里、百度、小米合计市场份额超95%,其中阿里天猫精灵位居第一(约35%),百度紧随其后(约33%)。但在带屏智能音箱市场上,百度以超63%的市场份额遥遥领先,阿里和小米合计为36%。
资料来源:IDC
在语音为主导的人机交互发展趋势下,智能音箱实际上已经成为巨头布局智能家居的入口,这也是以智能音箱为代表的智能家居在近些年开始走向大众的原因。据eMarketer统计,中国智能音箱普及率仅有10%,相比美国26%的普及率,仍有广阔很大市场空间,中国市场潜在用户群体高达2.24亿。
IDC预计称,中国智能家居设备市场到2024年出货量将达到5.3亿台,相较2019年将增长155%。作为智能家居入口的智能音箱,仍大有可为。但如何通过打通语音交互、物联网、感应等技术,真正把握用户需求痛点,仍是不小挑战。
主流语音识别准确率达97%,智能助手和客服应用广泛
从发展程度上来看,语音识别是最为成熟、最先得到大规模应用的的AI技术。中国语音识别技术发展水平已与国外同步,如百度、科大讯飞、搜狗等主流平台识别准确率目前均达到97%以上。阿里巴巴的语音技术还超越谷歌,被MIT评选为2019年全球十大突破性技术。
自然语言处理则在2016年进入期望膨胀期,但由于进展未实现预期,自2019年后转入幻灭期,预期成熟时间仍有5-10年,其典型应用如数据解读、文本生成等,目前仍处于初步采用阶段。在这个领域,中国与美国则存在一定差距。
从此次榜单上的企业来看,语音识别和自然语言处理几乎是所有企业都有布局的技术。但语音识别等相对容易的单点技术的突破,已经难以支撑企业在竞争的红海中取胜。位居头部的5家企业除了语音识别、自然语言处理,还布局了其它多个AI技术,并致力于融合发展,多模态交互被业内认为是未来趋势。
另外14家初创企业还热衷于布局机器学习/深度学习(算法)、知识图谱(大规模语义网络)等技术,包括思必驰、出门问问、智臻智能、中译语通、竹间智能、追一科技、乐言科技、智齿科技、达观数据等。通过布局这些技术,可以进一步推动语音识别或自然语言处理的技术突破,如语音识别准确率的不断提升及其应用就离不开深度学习的贡献。
此外,作为算力设施的AI芯片也有多家企业进行投入。阿里、百度、小米均有在布局,如百度的智能语音芯片“鸿鹄”已在智能家居产品上量产出货;思必驰和云知声也有在研发AI芯片,作为其语音解方案重要的底层硬件设施,成为其发展战略的组成部分。
从总体应用来看,智能语音市场规模进展较快。清华大学数据显示,语音识别和自然语言处理是中国市场规模最大的两大AI技术应用方向,占比分别约为25%和21%,合计达到46%,超过计算机视觉市场规模(35%)。
从具体落地来看,消费级市场(2C)和企业级市场(2B)是两大主要模式。2C应用主要包括智慧生活、智能家居、智慧办公等场景,通过智能语音技术赋能各类终端,比如手机语音助手,阿里、百度、小米的音箱产品,科大讯飞、搜狗的录音笔产品等。有数据显示,2018年有近一半智能手机配有智能语音助手,Strategy Analytics预计,到2023年前将达到90%。
智能语音两大应用场景 资料来源:华西证券
相较而言,2B应用具有更高的垂直属性和壁垒,其中智能客服说是最为普遍的应用场景之一。榜单多数企业均通过提供相关解决方案或打造虚拟的在线机器人,为电信、金融、电商、政务等行业提供咨询接待、问题处理、智能推荐等业务。智臻智能是最早将AI赋能客服领域的企业,其推出的小i机器人深耕智能客服市场十余年,终端客户逾8亿。
捷通华声则是在国内率先推出智能语音助手、电话客服机器人、智能语音外呼机器人、实体智能语音机器人、实时智能语音分析系统的企业。乐言科技推出的乐语助人是一款面向天猫、淘宝等平台的新一代AI智能客服机器人,问题识别率达99%,咨询转化率提升15%。智齿科技则构建了包括呼叫中心、在线机器人和在线客服等产品,贯穿售前+售中+售后全流程,提供覆盖服务+营销+管理全场景的营销与服务解决方案。
教育、医疗和汽车也是较为普遍的应用领域。科大讯飞的第一大业务即为教育,在医疗领域也在持续布局,在车载语音领域拥有半壁江山;思必驰、云知声、出门问问、智臻智能、捷通华声、来也科技、竹间智能、追一科技、普强信息、智齿科技等企业都有布局这三个行业,智慧课堂、电子语音病例、车载语音等是核心应用场景。
总体来看,在智能语音技术不断突破的情况下,应用落地也在持续推进。但在已有应用场景的情况下,如何提升用户体验,推动交互变革,如何推动企业转型,实现降本增效,挖掘更多的应用场景,并能够规模应用,仍是行业内企业面临的共同挑战。