境外开放课程——按学科专业列表
开放课程工程与技术科学计算机科学技术计算机应用::

451
Mining Social Images with Distance Metric Learning for Automated Image Tagging[使用距离度量学习挖掘社交图像以实现自动图像标记]
  Steven C. H. Hoi(南洋理工大学) 随着各种社交媒体应用的普及,如今很多社交媒体网站上都出现了大量带有高质量标签的社交图片。网络社交图像的挖掘已经成为网络搜索和数据挖掘领域一个新兴的重要...
热度:37

452
Batch Query Processing for Web Search Engines[Web搜索引擎的批量查询处理]
  Shuai Ding(纽约大学理工学院) 大型网络搜索引擎现在每天处理数十亿次查询。大多数查询本质上是交互式的,需要几分之一秒的响应。但是,也有许多重要的场景,在这些场景中,为各种不需要立即响...
热度:42

453
I Tag, You Tag: Translating Tags for Advanced User Models[我标签,您标签:翻译高级用户模型的标签]
  Robert Wetzker(柏林理工大学) 协作标记服务(folksonomies)是Web 2.0时代的明星之一。它们允许用户用自由选择的关键字(标记)标记各种资源。我们对两种真实世界的大众分类法的研究揭示,单个用...
热度:48

454
A Sketch-Based Distance Oracle for Web-Scale Graphs [基于草图的web尺度距离预测]
  Atish Das Sarma(乔治亚理工学院) 我们研究了计算大型图(例如网络图和社交网络)中的节点之间的距离的基本问题。我们的目标是能够实时回答节点对之间的距离查询。由于标准最短路径算法价格昂贵,...
热度:80

455
Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation[个性化标签推荐的成对交互张量分解]
  Steffen Rendle(谷歌公司) 标签在最近的许多网站中扮演着重要的角色。推荐者系统可以帮助向用户推荐他可能想要为某一特定项目标记的标记。基于Tucker分解(TD)模型的分解模型提供了高质量的...
热度:345

456
Precomputing Search Features for Fast and Accurate Query Classification[预计算搜索功能可实现快速准确的查询分类]
  Arnd Christian König(微软公司) 查询意图分类对于网络搜索和广告是至关重要的。众所周知,这是一项具有挑战性的工作,因为web查询平均包含的单词少于三个,因此几乎不能为基于此的分类决策提供...
热度:36

457
Boilerplate Detection Using Shallow Text Features[使用浅文本特征的样板检测]
  Christian Kohlschütter(汉诺威莱布尼兹大学) 除了实际内容之外,Web页面还包含导航元素、模板和广告。这个样板文本通常与主要内容无关,可能会降低搜索精度,因此需要正确检测。在本文中,我们分析了一组用...
热度:65

458
Tagging Human Knowledge[标记人类知识]
  Paul Heymann(斯坦福大学) 标记系统的一个基本前提是,普通用户可以使用不受控制的词汇表组织大量的集合,用于浏览和其他任务。到目前为止,这一前提仍相对未经研究。使用库数据,我们测试...
热度:32

459
On Compressing the Textual Web[ 在压缩文本Web上]
  Paolo Ferragina(比萨大学) 现在我们知道如何有效地压缩任何现代搜索引擎的最基本的组件,例如,由网络结构和/或它的使用产生的图表,发布列表,和术语字典。但据我们所知,没有任何研究深...
热度:20

460
fLDA: Matrix Factorization through Latent Dirichlet Allocation[fLDA:基于潜在狄利克雷分布的矩阵分解 ]
  Bee-Chung Chen(领英公司) 我们提出了一种新的矩阵因子分解方法fLDA,用于预测推荐系统应用中的评分。项目元数据的表示是自然的。这类场景在内容推荐、广告定位和web搜索等web应用程序中很...
热度:58

461
Measuring the Reusability of Test Collections[测试集的可重用性度量 ]
  Ben Carterette(特拉华大学) 虽然测试集合的构建是一个耗时且昂贵的过程,但是真正的成本是通过对集合进行成百上千次的重复使用而摊销的。其中一些实验可能涉及到检索初始构建阶段未判断的文...
热度:48

462
Learning Concept Importance Using a Weighted Dependence Model[利用加权依赖模型的学习概念的重要性]
  Michael Bendersky(谷歌公司) 通过术语依赖对查询概念建模已经被证明对检索性能有显著的积极影响,特别是对于诸如web搜索之类的任务,在这些任务中,高级别的相关性尤其重要。然而,以前的大...
热度:43

463
Discovering and Using Groups to Improve Personalized Search [发现和使用组来改进个性化搜索]
  Jaime Teevan; Meredith Ringel Morris;Steve Bush(微软公司) 发现和使用群组来改进个性化搜索
热度:33

464
On Stability, Clarity, and Co-occurrence of Self-Tagging[自标记的稳定性、清晰性和共现性]
  Aixin Sun; Anwitaman Datta(南洋理工大学) 大多数关于标记的研究都集中在协作标记系统上,在这个系统中,每个资源(例如文章、照片)都可以由具有多个标记的多个用户进行标记。然而,在自标记系统中,资源(...
热度:98

465
Clustering the Tagged Web [标记网络聚类]
  Christopher D. Manning; Paul Heymann; Hector Garcia-Molina;Daniel Ramage(斯坦福大学) 对标记的Web进行聚类
热度:23