0


网络数据挖掘

Web Data Mining
课程网址: http://videolectures.net/russir2010_baeza_yates_wdm/  
主讲教师: Ricardo Baeza-Yates
开课单位: 恩特公司
开课时间: 2011-03-18
课程语种: 英语
中文简介:
网络继续发展和发展得非常快, 改变了我们的日常生活。这项活动代表了数百万向网络贡献内容的机构和人员以及使用网络的10亿人的合作工作。在这个超链接数据的海洋中, 有显式和隐性的信息和知识。数据有三种主要风格: 内容 (文本、图像等)、结构 (超链接) 和用法 (导航、查询等), 暗示着不同的技术, 如文本、图形或日志挖掘。每一个案例都反映了一些人的智慧, 他们可以用来让网络变得更好。例如, 用户在 web2.0 网站中生成的标记. \ \ 本教程介绍 (a) web 挖掘背后的主要概念、web 挖掘中的不同数据以及典型的应用程序;(b) 挖掘过程: 数据回忆、数据清理、数据仓库和数据分析, 包括内容挖掘情况下的爬网, 以及使用挖掘的隐私问题;(c) 用于不同数据类型的主要技术;(d) 三种类型的用例: 内容、结构和使用挖掘, 范围从网站设计到搜索引擎。
课程简介: The Web continues to grow and evolve very fast, changing our daily lives. This activity represents the collaborative work of the millions of institutions and people that contribute content to the Web as well as the one billion people that use it. In this ocean of hyperlinked data there is explicit and implicit information and knowledge.\\ Web Mining is the task of analyzing this data and extracting information and knowledge for many different purposes. The data comes in three main flavors: content (text, images, etc.), structure (hyperlinks) and usage (navigation, queries, etc.), implying different techniques such as text, graph or log mining. Each case reflects the wisdom of some group of people that can be used to make the Web better. For example, user generated tags in Web 2.0 sites.\\ The tutorial covers (a) the main concepts behind Web mining, the different data that is found in the Web and typical applications; (b) the mining process: data recollection, data cleaning, data warehousing and data analysis, including crawling in the case of content mining, and privacy issues in the case of usage mining; (c) the main techniques used for the different data types; and (d) use cases of the three types: content, structure and usage mining, ranging from Web site design to search engines.
关 键 词: 计算机科学»网络挖掘; Web
课程来源: 视频讲座网
最后编审: 2020-06-18:dingaq
阅读次数: 41