本
文
摘
要
AI和认知智能- 从儿歌说起
有人说得好,“懒,是推动科技进步的原动力”。所以,人类一直梦想机器替自己干活,在美丽梦想的引导下人工智能经历了多次”泡沫-幻灭-重生”的螺旋式发展,大致可以分为三个阶段:
一是计算智能,即快速计算和记忆存储能力。比如下棋,本质上利用计算能力和穷举法加一定优化,比人多想n步就能有优势。以深蓝计算机战胜了当时的国际象棋冠军为标志,此后人类在这样的强运算型的比赛方面就不能战胜机器了。
二是感知智能,即视觉、听觉、触觉等感知能力。语音识别、图像识别等,机器在感知智能方面已越来越接近于人类,甚至某些方面超过人类。
三是认知智能,通俗讲是“能理解会思考”。人类有语言,才有概念,才有推理,所以概念、意识、观念等都是人类认知智能的表现。认知智能是模拟人类理解思考的过程。每个人都有自己的知识面或者说知识结构、知识体系,然后基于这些知识进行推理和思考。理解认知智能及其构建过程,我们可以分析一下人类幼崽的学习过程。
“这是一个苹果,苹果可以吃”
“这是爸爸、这是妈妈”
“爸爸的爸爸叫什么?爸爸的爸爸叫爷爷”
焦虑的家长们总希望自己的幼儿能够快速学得人类的知识,方便自己能够有时间自由的出去浪。这些牙牙学语的日常,就是一个人类知识体系。分解开,包含了:
概念(”这是一个苹果“)属性(”苹果可以吃“)关系(”爸爸的爸爸“)更细的分解,“爸爸的爸爸叫什么?爸爸的爸爸叫爷爷”,这句儿歌歌词描述了两条关系规则:一个男性类别实体可以是另一男性类别实体的父亲;一个男性类别实体可以是另一人类类别实体的祖父,一条关系规则是由两个实体和实体之间的关系构成。
人类幼儿一天睡眠10个小时以上,这么一颗初级的大脑已经具备很强的分类和推导能力。“爸爸的爸爸叫什么”,聪明的幼儿会根据两层父子关系推断和归类,这个白胡子爷爷应该亲近,虽然他/她暂时还不知道该叫什么;“爸爸的爸爸是爷爷”就完成了一次知识推断之后的关系补全。
还比如“苹果可以吃”,“苹果可以分享给亲近的人吃”,这里幼儿需要分类和推理。如果隔壁王叔叔能吃到你儿子手里的苹果而你吃不着...
AI知识图谱的定义
知识和知识体系,这是一些生活化的表达。学术化的表达,以前叫“知识语义网络”,后面google弄了一个概念叫“知识图谱”。名词转换的核心,就是能够把科学分解、模式化符号化的表达。我们要让机器具备认知智能,就是要让计算机真正成为“电脑”,能够模拟和接近“人脑”。每个人都有自己的知识面、知识体系,本质就是是不同“人脑”的知识图谱;要让机器具备认知智能,就需要将知识表达、知识推理这些进行符号化、数字化,让“电脑”形成认知能力,能够去理解这个世界。
严肃的定义,知识图谱是什么?
定义1: 知识图谱是描述真实世界存在的概念或实体以及它们之间的关系。
定义2: 知识图谱是描述客观世界存在的概念或实体以及它们之间的关系。
前者定义的最先提出者(或者翻译者)应该是华东理工大学的王昊奋教授。鉴于数字世界、虚拟世界乃至元宇宙都出来了,有必要把“真实世界”延伸一下,拓展到“客观世界”。一个游戏里的人物、关系、任务这些也都是客观存在的,我们也可以去定义和使用相应的知识图谱。
如此,知识图谱就能将若干个“实体、关系、实体”的知识内容变成一个“顶点+边”的图网络,使用图计算进行一些推导和推理。知识图谱中每个结点都有若干个属性及其属性值,实体与实体之间的边表示结点之间的关系,边的指向表示关系的方向,边上的标记表示关系的类型。这样,一个文科生的“知识”和“推导”这些模糊混沌感性的名称,变成了理工生的“符号表达、图计算、规则推理”。
知识图谱还有一些基础概念:
1、本体
具有同种特性的实体构成的 *** ,如人、猫、狗、书等。在面向对象编程语言里就是:类(class)。
2、实体
具有可区别性且独立存在的某种具体的事物,如具体的名叫 张三 的那个人、张三养的那条狗等。在面向对象编程语言里就是某个类的一个实例:对象(object)。
3、属性
比如:张三这个人 有「性别」这个属性,「性别」这个属性的属性值是:「男」。对应面向对象编程语言是:成员变量(field)。
知识图谱能干啥
知识图谱于2012年5月17日Google正式提出,其初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验,如今知识图谱是google搜索引擎PageRank(网页排名)的关键技术。随着人工智能的技术发展和应用,知识图谱作为关键技术之一,已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。自互联网、社交网络开始的知识图谱应用已经比较成熟了,而且确实能很好提升用户体验(以及更好的割韭菜),比如你百度“李亚鹏”,然后提示你也可以搜索一下内容
(我以为第一条应该是王菲,没想到是许晴,八卦迭代快啊!)
我们关注的更多是如何与传统产业融合。要想为这个行业提供更好的服务,就需要对这个行业进行定制化,要有行业知识,把行业老专家、老师傅的知识体系和手册、文档、日志这些变成持续更新的领域知识图谱,进而帮助这个行业提升生产力,帮助这些行业、产业升级。
比如:工业领域的设备故障诊断、辅助检修。畅想一下,构建维护汽车维修知识图谱,结合类似汽车总线远程诊断和备件物流配送体系,就能够让边远某村某镇的路边摊修理店具备与一线修理厂的维修水平,终端客户也可以根据知识图谱了解汽车的维修知识,甚至汽车出了问题,这个问题的答案就明明白白躺在知识图谱里供终端客户了解学习,这样就再也不担心被修理店坑钱了。
辅助修理
知识图谱关键流程
1)知识建模 (设计)
又叫schema设计,或者本体构建,或者实体类别、关系类别、属性类别的定义。可以理解为知识建模是进行了一个行业图数据库的结构设计(拗口一点:知识语义网络图的结构设计)。
2)知识抽取 (实例化)
如关系数据库一样,建模之后就是数据实例化,往这个知识语义图结构里面灌实例数据(各个知识点,也就是图的顶点和边,也就是各个实体/关系/属性的数据记录)。
3)知识推理 (应用)
有了知识图谱结构和数据,有了人工智能的基础,但是缺少“推理逻辑举一反三”的能力,推理规则就是面向领域应用制定推理逻辑。
通用人工智能目前还是神话,弱人工智能阶段就是利用图计算、神经网络一些定理性规则来推导其它(比如,利用最短路径判断顶点之间关系可以有很多场景),弱人工智能很多逻辑规则需要面向领域来设计制定。
九识 - 领域知识图谱构建管理平台
花卉知识图谱
最后来介绍一下我们的知识图谱产品,我们的知识图谱产品叫“九识”,是一个知识图谱的构建和管理工具,可以帮助企业快速构建和管理领域知识图谱,实现从知识建模、知识抽取、知识推理到图谱分析的全流程工具化支持,助力企业领域知识沉淀,实现以知智能为基础的企业智能知识库、智能客服、智能运维等,一句话,有了知识图谱,知识就将在企业里流动,不管是助力新人培训还是提高企业生产和管理效率,都是益处多多。