SLINT:基于模式独立的关联数据的互联系统

摘要:关联数据互连是所有实例的发现,关联数据互连表示现实世界中相同的对象和定位于不同的数据源。由于不同的数据开发者频繁的使用不同的模式来存储资源,因此我们的目标是开发一个模式独立的互连系统。我们的系统自动选择重要的谓词和有效的谓词(比)对作为块和实例匹配的关键。我们系统的主要区别是使用加权同现和自适应过滤实现模块和实例的匹配。实验结果表明,该系统有效的提高了精度和最近一些的召回。同时也对系统的性能和主要步骤的效率进行了讨论。

关键字:关联数据,模式独立,块,互连.

1.引言

       多年致力于关联数据的研究已经为LOD带来了大量的数据。然而,在语义网中最大化的发展关联数据的效率仍然面临许多困难。语义Web仍面临许多困难。当前的挑战之一是整合各个实例数据源构建一个共同的知识体系。当不同的数据源可能含有异构实例的情况下,这些实例是和现实世界中相同的对象相关的,数据集成过程需要检测这样的对象以确保数据的完整性和一致性。检测数据源之间的所有特性是数据互连的任务。数据互连包含两个主要的步骤,blocking和实例匹配。blocking的目的是修剪比较的数量,实例匹配用来确定两个感兴趣实例的匹配状态。

       当前互连方法可以分成两个步骤:依赖于模式[2,7,10]和模式独立[1,3,4,9]。前者要求关于RDF谓词意义的知识(如谓词#preLabel声明对象的标签)和谓词校准(如谓词#preLabel与谓词#name的匹配)。相比之下,后者不需要这些信息,因此它不依赖于人类知识的模式。因为一个关联数据实例是一组RDF三元组(主体,谓词,客体:数据源对象),一个数据源的模式指的是所有使用的谓词的列表,这些谓词同词汇和本

你可能感兴趣的:(本体学习,数据关联,互联,本体,系统)