
Indexing of large n-gram collection
课程网址: http://videolectures.net/sikdd2015_zajec_ngram_collection/  
主讲教师: Patrik Zajec
开课单位: 约瑟夫·斯特凡研究所
开课时间: 2015-10-15
课程语种: 英语

本文提出了一种高效的索引技术,适用于索引大型 n gram 集合,重点是完整的通配符查询支持和速度效率。此外,我们在 Google 的 Web 1T 5 gram 集合之上使用这种技术构建了 n gram 搜索引擎,其优点是交互式查询和快速结果检索,但需要在更高的内存消耗上进行权衡。

课程简介: This paper presents an efficient indexing technique suitable for indexing large n-gram collections with an emphasis on full wildcard query support and speed efficiency. Further we used this technique in building the n-gram search engine, on top of Google’s Web 1T 5-gram collection, whose advantages are interactive querying and fast result retrieval with tradeoff on higher memory consumption.
关 键 词: 高效索引技术; 快速结果检索; 交互式查询
课程来源: 视频讲座网
数据采集: 2021-06-16:zyk
最后编审: 2024-01-16:liyy
阅读次数: 41