本文隶属于专栏《人工智能》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见人工智能
1972 年在讨论了如何为课程构建模块化教学系统之后,知识图谱这个术语就被创造出来了。
20 世纪 80 年代末,University of Groningen 和 University of Twente 联合启动了一个名为知识图谱的项目,专注于设计边缘仅限于一组有限关系的语义网络,以促进图上的代数计算。
在随后的几十年里,语义网络和知识图谱之间的区别变得模糊了。
一些早期的知识图谱是针对特定主题的。
1985年,Wordnet 成立,捕捉单词和意义之间的语义关系——将这一想法应用于语言本身。
2005年,Marc Wirk 创立了 Geonames,以捕捉不同地名、地点和相关实体之间的关系。
1998 年,英国金融科学有限公司的 Andrew Edmonds 创建了一个名为 ThinkBase 的系统,在图形上下文中提供基于模糊逻辑的推理。
2007 年,DBpedia 和 Freebase 都作为通用知识的基于图谱的知识存储库成立。
DBpedia 专注于从维基百科提取的数据,而 Freebase 还包括一系列公共数据集。没有将自己描述为“知识图谱”,而是开发和描述了相关概念。
2012 年,谷歌推出了他们的知识图谱,基于 DBpedia 和 Freebase 等来源。
他们后来纳入了从索引网页中提取的 RDFa、Microdata、JSON-LD 内容,包括中央情报局世界概况、维基数据和维基百科。
使用 schema.org 词汇表中的术语进一步组织了与该知识图谱相关的实体和关系类型。
Google Knowledge Graph 成为 Google 内部基于字符串的搜索的成功补充,其在线流行使该术语更常用。
从那时起,几家大型跨国公司宣传了他们的知识图谱使用,进一步普及了这个词。
这些包括 Facebook、LinkedIn、Airbnb、微软、亚马逊、优步和 eBay。
2019 年,IEEE 将其关于 Big Knowledge 和 Data Mining and Intelligent Computing 的年度国际会议合并为 Knowledge Graph 国际会议。
知识图谱(Knowledge graph)没有一个普遍接受的定义。
大多数定义都是通过语义网络的视角来观察主题,包含以下功能:
一个知识图谱
(i)定义了模式中实体的抽象类和关系
(ii)主要描述现实世界实体及其相互关系,以图表组织
(iii)允许任意实体可能相互关联
(iv)涵盖各种主题领域。
实体、其语义类型、属性和关系的网络。
知识图谱获取信息并将其集成到本体中,并应用推理器来获得新知识。
然而,有许多知识图谱表示与其中一些特征无关。
对于这些知识图谱,这个更简单的定义可能更有用:
将知识表示为概念及其之间关系的数字结构(事实上的)。
知识图谱可以包括一个本体,允许人类和机器理解和推理其内容。
知识图谱结合了几种数据管理范式的特点:
RDF 中表示的知识图谱为数据集成、统一、链接和重用提供了最佳框架,因为它们结合了:
资源描述框架(Resource Description Framework,RDF)是一个使用 XML 语法来表示的资料模型(Datamodel),用来描述 Web 资源的特性,及资源与资源之间的关系。
普通的图 vs 知识图谱 vs 带接口的知识图谱 (以鞋子为例子)
毫不奇怪,现代文本分析技术大量利用了知识图谱:
许多特定的用途和应用依赖于知识图谱。
主要包括数据和信息密集型服务,如