本
文
摘
要
2亿人,是什么概念?它可以是全中国总人数的七分之一,也可以是过去十年新增人口数的3倍。但同时,它也可以是一款智能英语学习产品的注册人数总和。
从2012年成立至今,来自175个国家,384个城市的2亿用户选择流利说进行英语学习。也是这2亿人,完成了逾39亿分钟对话和532亿句录音的数据积累,让流利说拥有了国内最大的"中国人英语语音数据库"。
作为一家人工智能驱动在线教育产品孵化及创新的企业,流利说从成立之初,就把大数据作为公司发展的核心,以其核心的自适应学习,满足了大数据时代下不断多元化发展的语言学习需求。
值得注意的是,从成立到赴美上市,经过多年的发展探索和行业沉浮,今年第一季度流利说迎来上市后首盈利,公司实现营收1.99亿元,净利润1220万元,毛利率稳步增长至77.6%。这是流利说上市以来的不断探索长续发展战略的阶段性成果,更凸显了流利说的产品价值主张。
在此契机下,我们有幸与负责课程研发与AI算法的流利说联合创始人兼首席科学家林晖博士进行了深入对话,就流利说的产品脉络、核心壁垒,以及对用户的需求认知、AI技术的延伸方向以及未来智能教育的技术趋势等进行了交流与探讨。
1
移动互联网风口
催生出的智能学习产品
在线教育的行业萌芽始于2011-2012年,与互联网爆发的时间点契合度较高,随着移动互联网技术推进,在线教育行业,尤其是移动端在线教育领域加速增长,呈现井喷式发展。仅在2012年当年,百度来自教育关键词投放的收入超过40亿元。
移动设备的普及和互联网技术的成熟加速了在线教育的发展,高速带宽与4G移动时代亦极大程度地提高了直播课程和碎片化时间学习的可能性。
曾就职于Google的林晖博士,在过往的工作中积累了大量的语音识别、产品研究和业务产出方面的经验,而初期的行业调研结合创始团队海外留学时期对英语学习的需求,让林晖博士及创始团队试图解决“哑巴英语”式的教学缺陷,如此,便有了流利说最初的产品雏形。
格隆汇:作为最早的智能教育倡行者,您和创始团队当时为什么会选择做这样一款概念超前的英语学习产品?
林晖:首先是因为我们看到了移动互联网的大趋势。2012年的时候智能手机已经开始普及,其背后带来本质的计算与人机交互的变化。移动是载体,可以更好地承载随时随地的智能计算,同时,智能手机的摄像头和麦克风也为更便捷的人机交互提供了基础。摄像头可以提供视觉理解交互通道,麦克风则是让更加自然、便捷的人机语音交互有了可能。移动计算具备在一些场景里改变原有生活方式和商业模式的潜力,我们就想把握住这个风口在移动互联网上做一些有意思的事情。
当时团队观察了金融、医疗、教育等几个大行业,最后我们觉得教育是一个很好的切入点。这跟创始团队自身的经历也有关系,从国内求学再到海外留学、工作,再到回国创业,我们一方面是教育的受益者,另一方面也看到了教育行业某些低效率的存在,比如非常多的时间被花费在学习英语上,但我们自身、以及周围同学、同事的普遍感受是学习时间很长,但开口能力却很差,背后影射的其实是语言教育的缺陷。
2013年初,流利说就上线了第一版的英语智能学习产品,搭载了智能化技术,比如用户可以录一段英文,算法可以对这段语音进行打分,流利说可以根据打分情况安排后续的学习。这在当时是一个比较新潮的产品功能,推出之后我们的用户增长非常显著。
当时有一个重要的技术创新在于,我们需要把原来PC系统上的成熟算法做小,让它在手机端可以运行起来。把PC端几百兆的系统做到手机里只需要几兆的内存容量,这对第一版流利说app来说是非常重要的技术创新与突破,核心算法能够无需互联网就在手机上运行,这使得随时随地的即时反馈成为可能,游戏化的核心玩法也成为可能,同时避开了当时移动网络不稳定、资费贵的问题。
移动互联网端对如何将算法与产品结合,其实是提出了更高的技术要求,所以对我们来说,率先将其产品化落地意义非常重大,后续技术层面的诸多优化、迭代都是在此基础上进行的。
格隆汇:流利说运营初期缺乏用户数据,但算法又需要数据反哺,如何启动?
林晖:流利说从一开始就在做AI算法落地,在过去多年的研发过程中形成了很多关于AI产品化的方法论。比如在产品冷启动阶段,我们可以运用相关领域大量公开的数据构建模型,然后再迁移到具体的口语打分等领域,形成MVP可用的版本。在这个基础上实现产品落地,通过产品的创新设计保障用户基本体验。随后具体场景下的数据会随流量的增加而累积,用于算法优化,打造更好的产品体验,实现“产品形成-数据累积-算法优化-产品升级”的正向循环。
格隆汇:流利说可以为用户提供“个性化、自适应”的学习课程,我们应该如何理解“自适应”?
林晖:自适应学习的概念在教育行业提的比较多,其实本质就是个性化的学习体验,以学习者为中心,自动为学习者适应性的调整学习体验。
但对于AI技术,用户可感知的大多在交互层面,隐藏在后台的推荐逻辑是不易被感知的。所以『个性化、自适应』的概念虽然提的人很多,但很难去验证一款学习产品是不是真的具备自适应的功能,而且关心自适应是否真的给用户带来价值的企业就更少了。流利说很早就不仅仅停留在讲概念的阶段,现在已经进入了自适应学习探索的深水区,也是行业里真正推进个性化、自适应产品和技术的少数者。
我们在目前的商业链条上开展了非常多的基于强化学习的自适应算法A/B实验,比较不同模型和算法对比用户留存、复购是否提升。通过算法迭代和数据积累,在核心的学习产品上,我们把复购率提升了30%,这是个性化学习实效的用户价值和商业价值非常直观的体现。
2
海量数据推动
算法优化及多元化业务发展
不断积累的海量数据持续赋能着算法模型的优化,完善了流利说的学习操作系统,赋能C端覆盖全球的在线语言学习产品的升级、B端企业服务的加码以及语言类学术研究等领域的拓展,逐步释放出更大的价值潜力。隐藏在后台的算法实际上最核心的任务就是了解用户,佐以成熟的数据分析技术,“知己知彼”后,发现、挖掘甚至是创造新需求是水到渠成的事。
流利说通过多年的技术及行业沉淀,逐渐形成了由“测评类+内容类+推荐类+交互类”组成的四大引擎,赋能更加多样化、定制化的需求服务。
格隆汇:基础技术的成熟会不会对流利说产生威胁,流利说的竞争壁垒何在?
林晖:我个人认为,单点技术不会构成技术壁垒,真正的壁垒在于智能技术与实际场景的结合,强调的是AI产品化的能力。
能形成竞争壁垒的无外乎四类,先进的技术、网络效应、规模经济、以及品牌。
单点技术形成竞争壁垒我认为需要至少两个条件,技术性能比别人好至少10倍,并且有如专利等保护措施。这类技术研发的投入往往也是巨大的,需要有大的技术突破,比如5G 技术。另一种先进技术的实现路径是组合式的技术创新,比如 iPhone 当时就并不是某个单项技术的突破,而是多项技术的组合式创新做出了改变时代的产品。
在智能教育领域,我认为单点技术不会成为壁垒,我们更看重智能技术与场景的结合,强调的是AI产品化的组合式创新能力。人工智能技术需要深入场景进行打磨,场景离不开产品和业务。在实际场景运用中,与用户体验相关的技术要求很高,而且需要多种技术达到一定效果后才能组合出好的用户体验的产品。我们推出的AI外教就是一款这样的产品,如果只用市面上其他的语音或者图像识别技术提供方,就很难攒出达到同等的产品要求及用户体验标准。
网络效应一旦形成是很好的竞争壁垒,尤其是超线性、指数级增长的网络效应。在线教育的网络效应是比较弱的,但我们也在过去的实践中落地了一些具有网络效应的链路,每增加一个用户都会增加产品给其他用户的价值,形成正反馈的循环。
规模经济方面,目前在线教育行业面临着可以上规模但不经济的挑战。我们去年开始加强了在规模经济上探索,通过精细化运营目前取得了一点小成绩,今年第一季度实现了上市后的首次盈利。同时,流利说过去在智能化个性化学习产品研发的规模投入,沉淀成了包含四大引擎的学习操作系统。基于这样的操作系统,我们可以在更多的学习领域更经济的生产的智能化学习产品,实现更大的价值释放。
所有的一切,最后都会归结到品牌。在机会成本和时间成本都比较高的教育行业,品牌是很重要的。流利说近两亿的注册用户,在英语学习领域是有品牌效应的。
不过总的来说,我认为在复杂的商业环境下,一款产品、一个组织的竞争优势很多时候是综合能力的体现。
格隆汇:独有的数据库能否输出新价值,赋能流利说的未来业务?
林晖:数据的价值是巨大的。前两年,我们出版了一本偏学术的书,把全国各地不同方言区学英语的语音进行了分析,对于语言学的研究、大学的英语教育,都起到了比较积极的促进作用。
学术价值只是冰山一角,海量的数据也帮助我们开发出更智能化的产品。跟读场景下积累的数据可以训练出最能听懂中国人说英语的语音识别引擎,成为流利说AI老师的基础能力之一,我们最新推出的Alix人工智能老师也在用户端得到了非常高的评价。
此外,流利说的多模态数据中储备了大量的用户学习行为数据,也在我们的AI系统里得到不断的处理、使用,使我们对用户学习行为和习惯的了解不断深入。从产品化角度来看,这些数据帮助我们构建起学习操作系统,可以作为独立产品用于企业培训和SaaS平台,未来我们将为更广泛的用户提供个性化学习体验。
格隆汇:未来流利说的产品会延伸到英语学习产品之外吗?
林晖:这是必然的。流利说积累的AI产品化认知,通过对智能化、个性化学习进行解构,沉淀出了AI四大引擎,可以支撑和赋能多样化的智能学习产品。
测评类引擎支持形成性和总结性评估,其对学生对象的刻画和细粒度的评价支持,是任何学习产品和学习场景无法略过的环节;内容类引擎在对教学和练习内容等进行更底层的如知识点、技能点的自动、半自动化的结构抽取,同时也通过系统和人工智能生成算法提高优质内容的生产效率;推荐类引擎则是在前两项的支撑下,做到个性化的推荐;交互引擎主要围绕学习体验进行,引导用户实现心流体验。这四类引擎通过若干 SaaS 化或者 PaaS 化的产品实现,综合成我们的学习操作系统,使得研发人员不用了解底层的智能技术就能够生产具备智能属性的学习产品。
目前,我们正基于四大引擎的学习操作系统在英语学习之外的领域和合作伙伴共同构建产品,为比如企业端客户提供定制化的需求服务。
3
打破冰冷感
凸显人工智能在线教育产品的价值主张
智能教育大势所趋,顶层设计的完善和不断涌现的行业新技术,将打破行业发展瓶颈,推动智能教育行业在不同场景下的价值实现。
在专访之前,笔者对人工智能也有普遍的刻板印象,认为AI是冰冷的,没有交互的。未来算法要如何摆脱冰冷的触感,怎么让在线语言学习产品更有温度,更贴近市场、贴近用户,实现真正的个性化学习,或许是未来行业探索的方向之一。针对这个问题,善谈的林晖博士也分享了自己的看法。
从流利说角度出发,未来人工智能的“温度”将更多体现在通过对全球不断增长的在线语言学习需求的深刻了解和持续探索,提供更加个性化、便利化且兼具实用性的自适应学习产品及配套服务。未来,智能教育在学校、家庭及移动场景中的应用本质上是进一步提高了用户的个性化需求,促进交互,这种交互并不是简单的数据对接,或者需求对接,而是在凸显产品价值主张的同时,也在通过人工智能技术,拉近了人与人、人与产品、人与场景的距离。
格隆汇:AI的系统是固化的,但用户端的需求是动态变化的,流利说如何去满足变化的需求?
林晖:首先我不认为需求是一直变化的,人类最底层的需求其实是不变的。只是在需求不那么强的时候,会给外界一种变化的表象,需要我们去进行一些情景和情绪的激发。
我负责的上海市人工智能与认知学习重点实验在人脑认知方面做了些研究,其实人的各种行为包括学习的行为都是可以有较科学的解释的。大家都说学习反人性,但其实是没找到顺应人性的学习方式。学习是可以自驱的,自我探索式的学习、有人人互动的学习等等都可以是快乐的,也是我们在努力探索的方向。
这里很重要的第一步就是对学习者认知状况的深度洞察和识别,本质是用户个性化学习需求的表达,也正是流利说的测评引擎和交互引擎去做的事情。系统会不断评估用户的学习过程,在察觉用户学习状态和学习效果不好时,针对情绪变化,调动更具吸引力的内容来提升学生的学习兴趣。而且,要做到规模的个性化,肯定离不开机器和系统。为每个人配一个真人老师随时随地对学习者的情况进行深度理解是不现实的,必须要通过系统和智能算法的帮助才能实现。
另外,AI系统也不是固化的,系统可以根据用户反馈、数据反馈等闭环进行迭代,现在的技术也能做到一定程度的根据数据进行自我更新和迭代,实现『进化』。我们最近发布的AIix老师就是一个进化的系统,有意思的是虽然TA只是个AI,『我喜欢这个老师』是用户喜欢我们这个产品排名前三的理由。其实不管是AI系统还是产品,投射给用户的是背后研发人员的温度,每一行代码,每一句文字,都可以通过『活』的产品去给用户传递用心的的温度。
格隆汇:未来智能教育会向什么方向发展?
林晖:长远来看,我相信教育的数字化、智能化的趋势是不可逆的。具体的发展方向,需要根据不同的年龄段、地域、学习内容、场景等划分来看。简单讲下学校场景、家庭场景、以及随时随地的自学场景一些可能的发展。
在学校场景中,未来3-5年的变化会非常大。数字化感知技术、硬件基础都已经成熟,国家对减轻学生作业和校外培训负担的决心很大,同时将加大对数字化教育转型的投入,接下来就看如何实实在在地改变老师教学、学生学习的方式,从而减轻学生的负担。可以预见的是,智能技术将校内场景进一步发挥价值。
在家庭场景中,政策限制了更低年龄层的校外培训,但家长的焦虑、孩子更好成长的需求仍会真实存在。可能这部分的教育需求会转化到家庭场景中,智能教辅会为家长提供一些教学工具、输出教学理念,协助家长教育孩子,促进亲子关系,引导孩子更好地学习和发展。
在自主学习场景中,类似流利说的AI智能老师将在移动以及新的AR、VR平台迎来更大发展空间。某些细分领域可能出现超级AI老师,它会非常了解用户,并储备了该领域非常完整的知识体系,在此基础上将为用户提供个性化的心流学习体验。
浪潮之下固然不乏“裸泳者”,但更多的“良币”将迎来高速发展契机,大量的智能教育技术、产品思考和理想有望在这一阶段成为现实。
最后,林晖博士向格隆汇表示,一款成功的智能学习产品,除了对技术的充分理解和前瞻性判断,以及凝聚一个优秀的团队之外,更需要的,是对用户需求的感知、理解和把控。他认为,“这种共情能力是很重要的,只有明白用户要什么才可能做出有需求的产品”。
俄国作家陀思妥耶夫斯基曾说过,世界上有多种多样的力量,特别是意志和愿望的力量,它有沸腾的开水般的和烧红的铁般的温度。或许,流利说也正因为有了这种贴近用户的共情能力,加上旨在以人工智能驱动助推实现教育公平的初心,使得在线语言学习产品真正摆脱冰冷感,也有着“沸腾的开水般的和烧红的铁般的温度”,赋能每一个人实现最大潜力。