图簇是否有最佳质量?Is there a best quality metric for graph clusters? |
|
课程网址: | http://videolectures.net/ecmlpkdd2011_almeida_best/ |
主讲教师: | Hélio Almeida |
开课单位: | 米纳斯吉拉斯联邦大学 |
开课时间: | 2011-10-03 |
课程语种: | 英语 |
中文简介: | 图形聚类是在图形中发现相似顶点组的过程,是一个非常有趣的研究领域,在许多不同的场景中都有应用。图聚类的一个最重要的方面是对聚类质量的评估,这不仅对于测量聚类算法的有效性很重要,而且对于给定网络中关系动态的深入了解也很重要。文献中已经提出了许多用于图聚类的质量评估指标,但是他们没有就如何图聚类是图中发现相似顶点组的过程,是一个非常有趣的研究领域,在许多不同的场景中都有应用。图聚类最重要的一个方面是聚类质量的评价,它不仅对度量聚类算法的有效性很重要,而且对了解给定网络中的动态关系也很重要。文献中已经提出了许多图聚类的质量评价指标,但是对于它们之间如何比较以及在不同类型的图上表现如何,还没有达成共识。在这项工作中,我们研究了五种主要的图聚类质量度量方法,根据它们的形式偏差和它们在应用于集群时的行为,这些方法是通过四种经典的图聚类算法在五种大型真实世界图上的实现发现的。我们的结果表明,那些流行的质量指标对某些类型的集群错误地给出好分数有很强的偏见,尤其是在较大的网络中。它们还表明,当集群结构与更传统的、类似于团的集群结构不同时,当前使用的集群算法和质量指标的行为并不像预期的那样。相互比较以及它们在不同类型的图表上的表现进行比较达成共识。在这项工作中,我们研究了五个主要的图聚类质量度量,根据它们的形式偏差以及它们在应用于四个经典图形聚类算法的实现时在五个大的真实世界图上发现的行为。我们的结果表明,那些流行的质量指标对于错误地将某些类型的群集的好分数授予错误具有强烈的偏见,尤其是在较大的网络中。它们还表明,当集群结构与更传统的集团结构不同时,当前使用的集群算法和质量指标的行为并不像预期的那样。 |
课程简介: | Graph clustering, the process of discovering groups of similar vertices in a graph, is a very interesting area of study, with applications in many different scenarios. One of the most important aspects of graph clustering is the evaluation of cluster quality, which is important not only to measure the effectiveness of clustering algorithms, but also to give insights on the dynamics of relationships in a given network. Many quality evaluation metrics for graph clustering have been proposed in the literature, but there is no consensus on how do they compare to each other and how well they perform on different kinds of graphs. In this work we study five major graph clustering quality metrics in terms of their formal biases and their behavior when applied to clusters found by four implementations of classic graph clustering algorithms on five large, real world graphs. Our results show that those popular quality metrics have strong biases toward incorrectly awarding good scores to some kinds of clusters, especially seen in larger networks. They also indicate that currently used clustering algorithms and quality metrics do not behave as expected when cluster structures are different from the more traditional, clique-like ones. |
关 键 词: | 图形聚类; 测量聚类算法; 评估指标 |
课程来源: | 视频讲座网 |
最后编审: | 2019-10-17:cwx |
阅读次数: | 34 |