对比例容错频繁项集高效挖掘Towards Efficient Mining of Proportional Fault-Tolerant Frequent Itemsets |
|
课程网址: | http://videolectures.net/kdd09_gopalkrishnan_temop/ |
主讲教师: | Vivekanand Gopalkrishnan |
开课单位: | 南洋理工大学 |
开课时间: | 2009-09-14 |
课程语种: | 英语 |
中文简介: | 容错频繁项集 (ftfi) 是表示和发现广义知识的频繁项集的变体。然而, 尽管人们对这一领域的兴趣越来越大, 但以前的做法都没有在其确切支持下按其比例开采 ffti (ft支持)。 这个问题之所以困难, 有两个原因: (a) 在松弛是成比例的情况下, ft 支持的非反单调特性, 以及 (b) ft-支持计算中的困难。以前在这个问题上的努力要么通过添加约束来简化一般问题, 要么提供没有任何错误保证的近似解决方案。 在本文中, 我们讨论了这些问题在一般的 ftfi 挖掘问题。我们通过为 ft 支持提供明显正确的反单调边界来限制搜索空间, 并开发出切实可行的实现方法。此外, 我们还提供了一个有效和准确的 ft 支持计数程序。 使用真实数据集进行的大量实验验证了我们的解决方案对于完全挖掘 ftfi 是相当有效的。 |
课程简介: | Fault-tolerant frequent itemsets (FTFI) are variants of frequent itemsets for representing and discovering generalized knowledge. However, despite growing interest in this field, no previous approach mines proportional FTFIs with their exact support (FT-support). This problem is difficult because of two concerns: (a) non anti-monotonic property of FT-support when relaxation is proportional, and (b) difficulty in computing FT-support. Previous efforts on this problem either simplify the general problem by adding constraints, or provide approximate solutions without any error guarantees. In this paper, we address these concerns in the general FTFI mining problem. We limit the search space by providing provably correct anti monotone bounds for FT-support and develop practically efficient means of achieving them. Besides, we also provide an efficient and exact FT-support counting procedure. Extensive experiments using real datasets validate that our solution is reasonably efficient for completely mining FTFIs. |
关 键 词: | 计算机科学; 数据挖掘; 频繁模式 |
课程来源: | 视频讲座网 |
最后编审: | 2021-12-23:liyy |
阅读次数: | 63 |