0


属性和关系数据的联合聚类分析没有群集数的先验的规范

Joint Cluster Analysis of Attribute and Relationship Data Without Priori Specification of the Number of Clusters
课程网址: http://videolectures.net/kdd07_moser_jca/  
主讲教师: Flavia Moser
开课单位: 西蒙弗雷泽大学
开课时间: 2007-09-15
课程语种: 英语
中文简介:
在许多应用中,属性和关系的数据是可用的,携带的互补信息的真实世界的实体。在这种情况下,一个联合分析两种类型的数据可以得到比经典的聚类算法,要么只使用属性数据或关系数据更准确的结果(图)。连通k-中心(CKC)已被提议作为发现K集群,有凝聚力的属性和关系数据首次联合聚类分析模型。然而,这是众所周知的,在群集数的先验知识往往是不可用的应用,如社区认同及热点分析。在本文中,我们介绍和描述发现先验数目不详的集群的属性和关系数据的联合聚类分析问题的背景下,被称为连接x团簇(CXC)问题。假定真正的簇中的属性数据和内部连接的关系数据可从其相邻集群紧凑和独特的。不同于传统的基于属性的聚类方法,附近的集群中没有的属性数据,但在关系数据定义。为了有效地解决CXC问题,我们提出jointclust,算法采用动态两阶段法。在第一阶段中,我们发现所谓的集群原子。我们提供了这个阶段的概率分析,这给了我们一个概率保证,每一个真正的集群,通过在初始聚类原子的至少一个代表。在第二阶段,这些群集原子合并在一个自底向上的方式,在一个树状图。最后的聚类是由我们的目标函数的确定。我们几个真实数据集上的实验评估表明,JointClust确实发现有意义的,准确而不需要用户指定的数字集群,聚类。
课程简介: 在许多应用中,属性和关系的数据是可用的,携带的互补信息的真实世界的实体。在这种情况下,一个联合分析两种类型的数据可以得到比经典的聚类算法,要么只使用属性数据或关系数据更准确的结果(图)。连通k-中心(CKC)已被提议作为发现K集群,有凝聚力的属性和关系数据首次联合聚类分析模型。然而,这是众所周知的,在群集数的先验知识往往是不可用的应用,如社区认同及热点分析。在本文中,我们介绍和描述发现先验数目不详的集群的属性和关系数据的联合聚类分析问题的背景下,被称为连接x团簇(CXC)问题。假定真正的簇中的属性数据和内部连接的关系数据可从其相邻集群紧凑和独特的。不同于传统的基于属性的聚类方法,附近的集群中没有的属性数据,但在关系数据定义。为了有效地解决CXC问题,我们提出jointclust,算法采用动态两阶段法。在第一阶段中,我们发现所谓的集群原子。我们提供了这个阶段的概率分析,这给了我们一个概率保证,每一个真正的集群,通过在初始聚类原子的至少一个代表。在第二阶段,这些群集原子合并在一个自底向上的方式,在一个树状图。最后的聚类是由我们的目标函数的确定。我们几个真实数据集上的实验评估表明,JointClust确实发现有意义的,准确而不需要用户指定的数字集群,聚类。
关 键 词: 聚类算法; K集群; CXC
课程来源: 视频讲座网
最后编审: 2020-06-25:zyk
阅读次数: 56