0


XGBoost:一个可扩展的树提升系统

XGBoost: A Scalable Tree Boosting System
课程网址: http://videolectures.net/kdd2016_chen_boosting_system/  
主讲教师: Tianqi Chen
开课单位: 华盛顿大学
开课时间: 2016-09-27
课程语种: 英语
中文简介:
树提升是一种高效且广泛使用的机器学习方法。在本文中,我们描述了一种称为XGBoost的可扩展端到端树提升系统,该系统被数据科学家广泛使用,以在许多机器学习挑战中取得最先进的结果。我们提出了一种新的稀疏数据稀疏性感知算法和近似树学习的加权分位数草图。更重要的是,我们提供了关于缓存访问模式、数据压缩和分片的见解,以构建一个可扩展的树增强系统。通过结合这些见解,XGBoost使用比现有系统少得多的资源扩展到数十亿个示例之外。
课程简介: Tree boosting is a highly effective and widely used machine learning method. In this paper, we describe a scalable end-to-end tree boosting system called XGBoost, which is used widely by data scientists to achieve state-of-the-art results on many machine learning challenges. We propose a novel sparsity-aware algorithm for sparse data and weighted quantile sketch for approximate tree learning. More importantly, we provide insights on cache access patterns, data compression and sharding to build a scalable tree boosting system. By combining these insights, XGBoost scales beyond billions of examples using far fewer resources than existing systems.
关 键 词: 提升系统; 机器学习; 数据科学
课程来源: 视频讲座网
数据采集: 2023-06-11:chenxin01
最后编审: 2023-06-11:chenxin01
阅读次数: 24