0


SchemEX - 链接开放数据的Web规模索引模式提取

SchemEX -- Web-Scale Indexed Schema Extraction of Linked Open Data
课程网址: http://videolectures.net/iswc2011_scherp_data/  
主讲教师: Ansgar Scherp
开课单位: 科布伦茨 - 兰道大学
开课时间: 2011-11-25
课程语种: 英语
中文简介:
我们提出SchemEX,一种方法和工具,用于在线性运行时复杂度的链接开放数据(LOD)的Web规模,实时索引和模式提取。由于我们不能假设在本地机器上完全检索LOD云是可行的,因此我们遵循基于流的方法,该方法不假设如何通过数据抓取器从Web检索RDF三元组。我们通过将SchemEX应用于2011年的Bill Triple Challenge数据集以及具有11M三元组的较小数据集来展示我们的方法的适用性。
课程简介: We present SchemEX, an approach and tool for web-scale, real-time indexing and schema extraction of Linked Open Data (LOD) at linear runtime complexity. As we cannot assume that a complete retrieval of the LOD cloud on a local machine is feasible, we follow a stream-based approach that makes no assumption about how the RDF triples are retrieved from the web by a data crawler. We show the applicability of our approach by applying SchemEX to the Billion Triple Challenge Dataset 2011 and a smaller dataset with 11M triples.
关 键 词: 线性运行; 开放数据; Web检索
课程来源: 视频讲座网
最后编审: 2019-05-05:lxf
阅读次数: 57