0


频繁的常规项集挖掘

Frequent Regular Itemset Mining
课程网址: http://videolectures.net/kdd2010_ruggieri_fri/  
主讲教师: Salvatore Ruggieri
开课单位: 比萨大学
开课时间: 2010-10-01
课程语种: 英语
中文简介:
频繁项目集的简明表示牺牲了数据分析员提取的简洁模式的可读性和直接可解释性。 在本文中,我们引入了一个名为regular的项集的扩展,具有直接的语义和可解释性,以及与闭项集相当的简洁性。 常规项目集允许指定项目可能存在或不存在; 可能存在项集的任何子集; 并且可以存在项集的任何非空子集。 我们设计了一个名为RegularMine的过程,用于挖掘一组常规项集,它是频繁项集的简明表示。 该过程根据常规项目集计算封闭的等价类中的频繁项集的覆盖。 我们报告了几个标准密集和稀疏数据集的实验结果,验证了所提出的方法。
课程简介: Concise representations of frequent itemsets sacrifice readability and direct interpretability by a data analyst of the concise patterns extracted. In this paper, we introduce an extension of itemsets, called regular, with an immediate semantics and interpretability, and a conciseness comparable to closed itemsets. Regular itemsets allow for specifying that an item may or may not be present; that any subset of an itemset may be present; and that any non-empty subset of an itemset may be present. We devise a procedure, called RegularMine, for mining a set of regular itemsets that is a concise representation of frequent itemsets. The procedure computes a covering, in terms of regular itemsets, of the frequent itemsets in the class of equivalence of a closed one. We report experimental results on several standard dense and sparse datasets that validate the proposed approach.
关 键 词: 频繁项目集; 直接可解释性; 常规项目集; 稀疏数据集
课程来源: 视频讲座网
最后编审: 2019-05-11:cjy
阅读次数: 58