境外开放课程——按学科专业列表
开放课程人文社会科学统计学::

121
Negative Correlations in Collaboration:Concepts and Algorithms[合作中的负相关:概念和算法]
  Qian Liu(南洋理工大学) 本文研究了协作中的负相关的有效挖掘。协作负相关是两组变量之间的负相关,而不是传统上在一对变量之间。它表示一组中所有变量的同步值上升或下降,只要另一组中...
热度:81

122
Consensus Group Stable Feature Selection[一致群稳定特征选择]
  Steven Loscalzo(纽约州立大学 ) 在高维和小样本数据的特征选择中,稳定性是一个重要但尚未解决的问题。在本文中,我们表明特征选择的稳定性强烈依赖于样本大小。我们提出了一种新的稳定特征选择...
热度:51

123
Tell Me Something I Don't Know: Randomization Strategies for Iterative Data Mining[告诉我一些我不知道的事情:迭代数据挖掘的随机化策略 ]
  Sami Hanhijärvi(阿尔托大学) 存在各种各样的数据挖掘方法,并且在探索性数据分析中通常可用于对同一数据集使用许多不同的方法。然而,这导致了一种方法所发现的结果是否反映了另一种方法的结...
热度:50

124
Mining Uncertain and Probabilistic Data: problems, Challenges, Methods, and Applications[挖掘不确定和概率数据:问题、挑战、方法和应用]
  Jian Pei, Ming Hua(西蒙弗雷泽大学 ) 不确定的数据是一些重要应用所固有的,例如环境监测,市场分析和定量经济学研究。这些应用中的不确定数据通常是由数据随机性和不完整性,测量设备的限制,数据更...
热度:37

125
Statistical Change Detection for Multi-Dimensional Data [多维数据的统计变化检测]
  Xiuyao Song(佛罗里达大学) 本文研究检测多维数据集中的分布变化。对于给定的基线数据集和一组新观察到的数据点,我们定义了一个称为密​​度测试的统计测试,用于确定观察到的数据点是否来...
热度:126

126
Event Summarization for System Management[系统管理事件汇总]
  Wei Peng(佛罗里达大学) 在系统管理应用程序中,以时间事件的形式生成和收集大量数据。虽然挖掘时间事件数据以发现有趣和频繁的模式已经获得了快速增长的研究工作,但是应用程序的用户被...
热度:25

127
Practical Guide to Controlled Experiments on the Web: Listen to Your Customers not to the HiPPO [网上受控实验实用指南:倾听客户的意见,而不是HiPPO]
  Ron Kohavi(微软公司) 网络为使用对照实验快速评估想法提供了前所未有的机会,也称为随机实验(单因素或因子设计),A / B测试(及其推广),分裂测试,控制/治疗测试和平行飞行。受控...
热度:55

128
Detecting Changes in Large Data Sets of Payments Cards Data: A Case Study[检测支付卡大数据集数据的变化:一个案例研究]
  Robert Grossman(无) 数据挖掘中的一个重要问题是检测大的变化数据集。虽然有各种变化检测算法已经开发出来的,在实践中它可能是一个问题由于这些算法的异质性,将这些算法扩展到大数...
热度:74

129
Relational Data Pre-Processing Techniques for Improved Securities Fraud Detection[用于改进证券欺诈检测的关系数据预处理技术 ]
  Andrew Fast(马萨诸塞大学) 商业数据集通常是大型的,关系型的和动态的。它们包含许多人,地点,事物,事件及其相互作用的记录。这些数据集很少适合于知识发现,并且它们通常包含其含义在数...
热度:61

130
From Trees to Forests and Rule Sets - A Unified Overview of Ensemble Methods[从树到森林和规则集-集成方法的统一概述]
  John Elder, Giovanni Seni(圣克拉拉大学) 在过去十年中,集合方法是机器学习中最有影响力的发展之一。它们在各种问题域中表现极佳,具有理想的统计特性,并且在计算上具有良好的扩展性。通过将竞争模型组...
热度:70

131
Detecting Anomalous Records in Categorical Datasets [分类数据集中异常记录的检测]
  Kaustav Das(卡内基梅隆大学 ) 我们考虑在高度分类数据集中检测异常的问题。在大多数应用程序中,异常被定义为“异常”的数据点。我们经常访问主要由正常记录组成的数据,以及一小部分未标记的...
热度:79

132
Temporal Causal Modeling with Graphical Granger Methods [用图形格兰杰方法建立时间因果模型 ]
  Andrew Arnold(卡内基梅隆大学) 对现实世界问题的挖掘因果关系的需求已被广泛认可,而不仅仅是统计相关性。这些应用中的许多自然涉及时间数据,这提出了如何最好地利用时间信息进行因果建模的挑...
热度:97

133
Moddeling and analysis of user behavior in online communities[在线社区中用户行为的建模和分析]
  Matthew Rowe(兰开斯特大学) 了解和预测在线社区的健康状况对其拥有长寿和成功的既得利益者的所有者和管理者具有重要价值。然而,社区进化与其成员的行为模式和趋势之间的关联尚不清楚,这阻...
热度:83

134
Connecting the dots: A multi-pivot approach to data exploration[连接点:数据探索的多轴方法]
  Igor Popov(因斯布鲁克大学) 数据浏览器的目的是帮助用户有效地识别和查询数据,而不会被大型复杂的数据图表所淹没。在基于图形的数据集中识别和查询数据的建议解决方案是透视(或设置导向浏...
热度:53

135
Wheat or chaff - Practically feasible inferactive ontology revision[小麦或箔条——实用可行的交互式本体修改]
  Nadeschda Nikitina(牛津大学) 当自动获取本体知识时,质量控制是必不可少的。我们考虑最严格的方法 - 对获得的数据进行详尽的手动检查。通过使用自动推理,我们部分地自动化过程:在每个专家...
热度:49