阿尔法集α-Clusterable Sets |
|
课程网址: | http://videolectures.net/ecmlpkdd2011_antzoulatos_sets/ |
主讲教师: | Gerasimos S. Antzoulatos |
开课单位: | 帕特拉斯大学 |
开课时间: | 2011-10-03 |
课程语种: | 英语 |
中文简介: | 尽管在过去几十年中对聚类研究越来越感兴趣,但迄今为止还没有制定出独立于特定算法或基础数据结构甚至目标函数的统一聚类理论。在本文中,我们通过提出基于特定区域内数据密度的数据集“可聚合性”的新概念,迈出了聚类理论基础的第一步尽管近几十年来人们对聚类研究的兴趣日益浓厚,但目前还没有形成一种独立于特定算法的统一聚类理论,或者是作为数据结构乃至目标函数基础的统一聚类理论。在本文中,我们通过提出一个基于特定区域内数据密度的数据集“可聚性”的新概念,向聚类的理论基础迈出了第一步。具体来说,我们给一个正式的定义我们称之为“α-clusterable”设置,我们利用这一概念证明的原则提出了集群的不可能性定理jonkleinberg[25],是一致的。我们进一步提出一个基于无监督聚类算法的概念α-clusterable集。该算法利用的能力广为人知并被广泛使用粒子群优化[31]最近提议窗口最大化密度函数[38]。所得到的聚类质量与其他各种著名聚类算法的相应聚类质量进行了比较。。具体来说,我们给出了我们称之为“α可群集”集合的正式定义,并利用这一概念来证明Kleinberg在聚类[25]中不可能性定理中提出的原则是一致的。我们进一步提出了一种基于α可聚集的概念的无监督聚类算法。所提出的算法充分利用了众所周知且广泛使用的粒子群优化[31]的能力,以最大化最近提出的窗口密度函数[38]。将所获得的聚类质量有利地与各种其他已知聚类算法的相应聚类质量进行比较。 |
课程简介: | In spite of the increasing interest into clustering research within the last decades, a unified clustering theory that is independent of a particular algorithm, or underlying the data structure and even the objective function has not be formulated so far. In the paper at hand, we take the first steps towards a theoretical foundation of clustering, by proposing a new notion of "clusterability" of data sets based on the density of the data within a specific region. Specifically, we give a formal definition of what we call "α-clusterable" set and we utilize this notion to prove that the principles proposed in Kleinberg’s impossibility theorem for clustering [25], are consistent. We further propose an unsupervised clustering algorithm which is based on the notion of α-clusterable set. The proposed algorithm exploits the ability of the well known and widely used particle swarm optimization [31] to maximize the recently proposed window density function [38]. The obtained clustering quality is compared favorably to the corresponding clustering quality of various other well-known clustering algorithms. |
关 键 词: | 聚类理论; 数据密度; 数据集; 可聚合性; α可聚集 |
课程来源: | 视频讲座网 |
最后编审: | 2019-10-17:cwx |
阅读次数: | 113 |