首页数学
   首页代数学
   首页计算机应用
0


矩阵的分解

Factorizing Gigantic Matrices
课程网址: http://videolectures.net/ecmlpkdd2011_bauckhage_kersting_matrices...  
主讲教师: Kristian Kersting, Christian Bauckhage
开课单位: 数据和网络挖掘实验室
开课时间: 2011-11-29
课程语种: 英语
中文简介:
数据矩阵的低秩近似已成为机器学习和数据挖掘中的重要工具。它们允许在较低维空间中嵌入高维数据,因此可以减轻由噪声引数据矩阵的低秩近似已成为机器学习和数据挖掘的重要工具。它们允许在较低的维度空间中嵌入高维数据,因此可以减轻由于噪声造成的影响,揭示潜在的关系,或促进进一步的处理。这些特性已在生物信息学、计算机视觉、文本处理、推荐系统、社会网络分析等诸多领域得到了成功的应用。当今技术的特点是数据量呈指数级增长。传感器技术、Internet应用程序和通信网络的最新进展需要扩展到非常大的和/或不断增长的数据矩阵的方法。在本教程中,我们将讨论矩阵分解的基本特性,并介绍几种用于现代大规模数据分析问题的最新方法。本教程的目标读者广泛,因为它回顾了机器学习和数据挖掘技术。它是为博士生,实践者,和研究人员谁对大规模机器学习和数据分析感兴趣。本教程分为三个部分:*第一部分:矩阵分解——传统的优化方法和统计基础:在本节中,我们将讨论基础和传统方法的多线性扩展,如SVD、PCA、K-Means和向量量化。矩阵分解的许多实际应用都对分解问题施加了约束。例如,矩阵因子需要是非负的、现有数据的凸组合或紧凑的二进制代码。其中,我们讨论了光谱哈希、NMF、原型分析、CNMF和CH-NMF等技术。*第三部分:数据驱动矩阵分解技术:本教程的第一部分和第二部分考虑范数最小化问题,以获得合适的矩阵因子。最近将矩阵因子分解扩展到大规模数据的方法采用了不同的观点:它们试图最大化给定数据矩阵的行和列的选择量。在本教程的最后一部分中,我们将介绍并回顾FastMap、CUR、CMD和SiVM等方法。在每个部分中,我们将展示来自图像处理、计算机视觉、机器人、web挖掘和社交媒体分析等领域的实际应用。起的影响,发现潜在关系或促进进一步处理。这些特性已经在许多应用领域中被证明是成功的,例如生物信息学,计算机视觉,文本处理,推荐系统,社交网络分析等。当今技术的特征在于数据量呈指数级增长。传感器技术,互联网应用和通信网络的最新进展需要扩展到非常大和/或不断增长的数据矩阵的方法。在本教程中,我们将讨论矩阵分解的基本特征,并介绍几种可扩展到现代海量数据分析问题的最新方法。本教程旨在回顾广泛的受众,同时回顾机器学习和数据挖掘技术。它适用于对大规模机器学习和数据分析感兴趣的博士生,从业者和研究人员。本教程分为三个部分:*第一部分:矩阵分解 - 传统优化方法和统计基础:在这个区块中,我们将讨论传统方法的基础和多线性扩展,如SVD,PCA,K均值和矢量量化。 *第二部分:约束矩阵分解许多矩阵分解的现实应用对分解问题施加了约束。例如,矩阵因子需要是非负的,现有数据的凸组合或紧凑的二进制代码。其中,我们讨论了诸如光谱哈希,NMF,原型分析,CNMF和CH NMF等技术。 *第三部分:数据驱动的矩阵分解技术:本教程的第一部分和第二部分考虑规范最小化问题,以获得合适的矩阵因子。最近将矩阵分解扩展到海量数据的方法假设了不同的观点:它们试图最大化给定数据矩阵的行和列的选择的量。在本教程的最后一部分中,我们介绍和回顾了FastMap,CUR,CMD和SiVM等方法。在每个部分中,我们提供了图像处理,计算机视觉,机器人,Web挖掘等领域的实际应用。社交媒体分析。
课程简介: Low-rank approximations of data matrices have become an important tool in machine learning and data mining. They allow for embedding high dimensional data in lower dimensional spaces and can therefore mitigate effects due to noise, uncover latent relations, or facilitate further processing. These properties have been proven successful in many applications areas such as bio-informatics, computer vision, text process ing, recommender systems, social network analysis, among others. Present day technologies are characterized by exponentially growing amounts of data. Recent advances in sensor technology, Internet applications, and communication networks call for methods that scale to very large and/or growing data matrices. In this tutorial, we discuss basic characteristics of matrix factorization and introduce several recent approaches that scale to modern massive data analysis problems. The tutorial aims at a wide audience as it reviews both machine learning and data mining techniques. It is intended for PhD students, practitioners, and researchers who are interested in large scale machine learning and data analysis. The tutorial is divided into three parts: * Part I: Matrix Factorization — Traditional Optimization Approaches and Statistical Foundations: In this block, we will discuss foundations and multi-linear extensions of traditional methods such as SVD, PCA, K-Means, and Vector Quantization. * Part II: Constraint Matrix Factorization Many real-world applications of matrix factorization impose constraints on the factorization problem. For instance, matrix factors need to be non-negative, convex combinations of existing data, or compact binary codes. Among others, we discuss techniques such as Spectral Hashing, NMF, Archetypal Analysis, CNMF, and CH-NMF. * Part III: Data-driven Matrix Factorization Techniques: The first and second part of the tutorial consider norm minimization problems to obtain suitable matrix factors. Recent approaches that extend matrix factorization towards massive data assume a different point of view: they attempt to maximize the volume of a selection of rows and columns of a given data matrix. In this final part of the tutorial, we present and review approaches such as FastMap, CUR, CMD, and SiVM. In each of the parts, we present practical applications from fields such as image processing, computer vision, robotics, web mining, and social media analysis.
关 键 词: 数据矩阵; 低秩近似; 数据挖掘; 低维空间; 高维数据; 指数级增长变化; 图像处理; 计算机视觉
课程来源: 视频讲座网
最后编审: 2019-08-25:chenxin
阅读次数: 115