境外开放课程——按学科专业列表
开放课程自然科学信息科学与系统科学::

286
Evolutionary Hierarchical Dirichlet Processes for Multiple Correlated Time-varying Corpora[多相关时变语料库的进化层次Dirichlet过]
  Jianwen Zhang(清华大学) 从多个相关的时变文本语料库中挖掘聚类演化在探索性文本分析中是重要的。在本文中,我们提出了一种称为进化分层Dirichlet过程〜(EvoHDP)的方法,以从这些文本...
热度:60

287
Temporal Recommendation on Graphs via Long- and Short-term Preference Fusion[通过长期和短期偏好融合对图形的时间建议]
  Quan Yuan(IBM公司) 随着时间的推移准确捕获用户偏好是推荐系统中的一个重大实际挑战。随着时间的简单关联通常没有意义,因为用户由于不同的外部事件而改变他们的偏好。用户行为通常...
热度:125

288
Medical Coding Classification by Leveraging Inter-Code Relationships[利用码间关系进行医学编码分类]
  Yan Yan(美国东北大学) 医疗编码或分类是将患者医疗记录中包含的信息转换为标准预定义医疗代码的过程。全世界有几种与诊断和医疗程序相关的医疗编码惯例;然而,在美国,ICD的第九次修订...
热度:59

289
Collusion-Resistant Privacy-Preserving Data Mining[防止串通的隐私保护数据挖掘]
  Bin Yang(东京大学) 由于数据挖掘的广泛应用以及对保护私人和个人信息的日益关注,最近对隐私保护数据挖掘(PPDM)的研究已变得越来越流行。近来,已经提出了许多保护数据挖掘的隐私...
热度:61

290
Mining Advisor-Advisee Relationships from Research Publication Networks[来自研究出版网络的采矿顾问咨询关系]
  Chi Wang(伊利诺伊大学) 信息网络包含关于人或实体之间关系的丰富知识。不幸的是,这种知识通常隐藏在不明确分类不同种类关系的网络中。例如,在研究出版物网络中,顾问建议研究人员之间...
热度:93

291
Latent Aspect Rating Analysis on Review Text Data: A Rating Regression Approach[评价文本数据的潜在面评价分析:一种评价回归方法]
  Hongning Wang(伊利诺伊大学) 在本文中,我们定义和研究一种新的固定文本数据分析问题,称为潜在方面评级分析(LARA),旨在分析在主题方面的在线评论中对实体表达的观点,以发现每个评论者的...
热度:91

292
Direct Mining of Discriminative Patterns for Classifying Uncertain Data[不确定数据分类识别模式的直接挖掘]
  Jianyong Wang(清华大学) 分类是数据挖掘中最重要的任务之一。与其他方法不同,关联分类试图找到输入分类数据中存在的所有频繁模式,其满足用户指定的最小支持和/或其他区分度量,例如最...
热度:85

293
Community-based Greedy Algorithm for Mining Top-K Influential Nodes in Mobile Social Networks[基于社区的贪婪算法在移动社交网络中挖掘影响最大的K节点]
  Yu Wang(北京大学) 随着移动设备和无线技术的普及,移动社交网络系统越来越多。移动社交网络作为信息和影响以“口口相传”的形式传播起着至关重要的作用。在移动社交网络中找到有影...
热度:74

294
Mass Estimation and Its Applications[质量估计及其应用]
  Kai Ming Ting(澳大利亚联邦大学) 本文介绍了质量估计 - 数据挖掘中的基础建模机制。它为质量提供了理论基础,也是估算质量的有效方法。我们证明它在信息检索,回归和异常检测等任务中非常有效地...
热度:62

295
Finding Effectors in Social Networks[在社交网络中寻找效应器]
  Evimaria Terzi(波士顿大学) 假设网络(V,E),其中V中的节点的子集是活动的。我们考虑在给定的信息传播模型下选择一组k个活动节点以最好地解释观察到的激活状态的问题。我们将这些节点称为...
热度:64

296
Overlapping Experiment Infrastructure: More, Better, Faster Experimentation[重叠的实验基础设施:更多、更好、更快的实验]
  Diane Tang(斯坦福大学) 在谷歌,实验几乎是一个口头禅;我们评估几乎所有可能影响用户体验的变化。这些变化不仅包括明显的用户可见变化,例如对用户界面的修改,还包括更微妙的变化,例...
热度:232

297
A Scalable Two-Stage Approach for a Class of Dimensionality Reduction Techniques[一类维数约简技术的可扩展两阶段方法]
  Liang Sun(亚利桑那州立大学) 维度降低在涉及高维数据的许多数据挖掘应用中起着重要作用。许多现有的降维技术可以被表述为广义特征值问题,其不能扩展到大尺寸问题。先前的工作将广义特征值问...
热度:33

298
Training and Testing of Recommender Systems on Data Missing Not at Random[非随机缺失数据推荐系统的培训和测试]
  Harald Steck(贝尔实验室) 用户通常只评估所有可用项目的一小部分。我们表明,缺乏评级可以提供有用的信息,以提高所有项目的最高k命中率,这是建议的自然准确度量。至于测试推荐系统,我...
热度:61

299
Discovering Precursors to Aviation Safety Incidents: from Massive Data to Actionable Information[发现航空安全事件的前兆:从海量数据到可操作信息]
  Ashok N. Srivastava(美国宇航局) 现代飞机以前所未有的速度生成数据,数百个参数以秒为单位记录。该数据可用于研究飞机硬件系统的状况,也可用于研究飞行员和飞机之间复杂的相互作用。 NASA正在...
热度:78

300
User Browsing Models: Relevance versus Examination[用户浏览模型:相关性与检验]
  Ramakrishnan Srikant(谷歌公司) 关于搜索引擎结果的用户浏览模型已经做了大量工作,包括有机和赞助。结果的点击率(CTR)是检查概率(用户将查看结果)乘以结果的感知相关性(点击给定检查的概...
热度:81