境外开放课程——按学科专业列表
开放课程人文社会科学统计学::

196
Improving Categorisation in Social Media using Hyperlinks to Structured Data Sources[使用指向结构化数据源的超链接改进社交媒体中的分类]
  Sheila Kinsella(爱尔兰国立大学) 社交媒体为主题分类提出了独特的挑战,包括帖子的简洁性,对话的非正式性以及频繁依赖外部超链接为对话提供背景。在本文中,我们调查这些外部超链接的用途,以确...
热度:50

197
Seeing Vs. Noticing: Helping users find and use information quickly[看到与注意:帮助用户快速查找和使用信息]
  Elena Simperl, Prasad Kantamneni(南安普顿大学) 通常,企业在设计产品时会平衡多个目标。在平衡这些目标的过程中,我们有时会忽视客户,牺牲创造力。在这次演讲中,Prasad Kantamneni将分享他在为每月数十亿用...
热度:33

198
Dealing with structured and unstructured data at Facebook[在Facebook处理结构化和非结构化数据]
  Lars Backstrom, Marko Grobelnik(约瑟夫·斯特凡学院) Facebook在过去五年中经历了巨大的增长。在这里,我们将首先看一下伴随这种增长的一些基本统计数据和趋势。然后我们将深入探讨两个不同的主题。首先,我们将看一...
热度:77

199
Toward Large-Scale Shallow Semantics for Higher-Quality NLP[转向高质量NLP的大尺度浅层语义]
  Eduard Hovy(南加州大学) 在过去十年统计方法工作的成功基础上,有迹象表明质量保证,摘要,信息提取,甚至机器翻译的持续质量改进需要更复杂,甚至可能(浅)的文本意义的语义表示。但是...
热度:53

200
The DANTE database: what it is, how it was created, and what it can contribute to the dictionaries and lexicons of the future[DANTE数据库:它是什么,它是如何创建的,以及它对未来词典和词典的贡献]
  Michael Rundell(词典编纂大师班) Dante是一个词汇数据库,提供基于语料库的精细英语核心词汇描述。记录在数据库中的每个事实都来自当前英语的17亿字语料库的证据,并得到其明确支持。几乎所有这...
热度:94

201
EDM and the 4th Paradigm of Scientific Discovery - Reflections on the 2010 KDD Cup Competition[EDM与科学发现的第四范式 - 对2010年KDD杯比赛的思考]
  John Stamper(卡内基梅隆大学) 技术的进步使得收集大量数据的能力比以往任何时候都更容易。这些庞大的数据集为许多领域提供了机遇和挑战,教育也不例外。了解如何在EDM领域处理极端数量的学生...
热度:60

202
Mining the Web for Meaning[挖掘网络的意义]
  Peter D. Turney(加拿大国家研究委员会) 2001年,ECML PKDD发表了我的论文“挖掘网络同义词”。 2011年,他们选择了这篇论文作为10年奖,因为“10年前在ECML PKDD会议期间发表的论文被证明在科学或其他...
热度:73

203
TRUMIT: A Tool to Support Large-Scale Mining of Text Association Rules[TRUMIT:支持大规模挖掘文本关联规则的工具]
  George Tsatsaronis(挪威科技大学) 由于文本数据的性质,关联规则挖掘在文本语料库中的应用多年来一直吸引着研究科学界的关注。在本文中,我们将展示一个可以从文本中有效挖掘关联规则的系统。系统...
热度:64

204
Introduction to causal discovery: A Bayesian Networks approach[因果发现简介:贝叶斯网络方法]
  Ioannis Tsamardinos(研究与技术基金会) 本教程介绍了使用代表条件独立模型的图表从观测数据中发现因果发现的基本假设和技术。它首先介绍了因果关系的发现,如因果马尔科夫状态,忠实的条件,和d分离标...
热度:88

205
Traffic Jams detection using flock mining[基于群采的交通堵塞检测]
  Roberto Trasarti(国家研究委员会) GPS装置在汽车上的广泛使用使得能够收集车辆的时间相关位置,并因此收集它们在道路网络上的运动。可以分析如此庞大的数据集合以查找交通流量的关键情况。对交通...
热度:69

206
Fast approximate text document clustering using Compressive Sampling[使用压缩采样后速度近似文本文档聚类 ]
  Laurence A. F. Park(墨尔本大学) 文档聚类涉及对文档集的重复扫描,因此随着集合的大小增加,聚类任务所需的时间增加并且甚至可能由于计算约束而变得不可能。压缩采样是一种特征采样技术,它允许...
热度:25

207
Multi-Subspace Representation and Discovery[多子空间表示和发现]
  Chris Ding(德克萨斯大学) 本文提出了多子空间发现问题,并提供了一种理论解决方案,可以保证同时恢复子空间的数量,每个子空间的维数以及每个子空间的数据点成员。我们进一步提出了一种数...
热度:75

208
Melodic Models for Polyphonic Music Classification[复调音乐分类的旋律模型]
  Ruben Hillewaere(布鲁塞尔大学) 复调音乐的分类仍然是当前音乐数据挖掘方法的挑战。在本文中,我们探讨了在复音分类任务中专门为旋律创建的分类器的性能。在海顿和莫扎特的弦乐四重奏运动的小数...
热度:100

209
Binary Decomposition Methods for Multipartite Ranking[多方排名的二元分解方法]
  Johannes Fuernkranz(达姆施塔特工业大学) 二分排名是指从正面和负面标记的示例的训练集中学习排名函数的问题。应用于一组未标记的实例,期望排名函数建立总顺序,其中正实例在负数之前。排名函数的性能通...
热度:76

210
Inference and Validation of Networks[网络的推理和验证]
  Ilias Flaounas(布里斯托尔大学) 我们基于统计测试和机器学习的原理,开发了一种统计方法来验证网络推理算法的结果。通过相似性度量和空模型将结果与参考网络进行比较,使我们能够测量结果的显着...
热度:86