0


新的虹膜数据:模块化数据发生器

The New Iris Data: Modular Data Generators
课程网址: http://videolectures.net/kdd2010_adae_nidmdg/  
主讲教师: Iris Adä
开课单位: 康斯坦茨大学
开课时间: 2010-10-01
课程语种: 英语
中文简介:
本文介绍了一种模块化、高度灵活、开放源码的数据生成环境。使用现有的图形数据流工具,用户可以为数字和分类数据生成器组合各种类型的模块。其他功能通过嵌入生成器模块的数据处理框架添加。生成的数据流可用于记录、部署和重用生成的数据生成器。我们描述了整个环境和各个模块,并演示了如何使用它们来生成样本、复杂的客户/产品数据库以及相应的购物篮数据,包括各种工件和异常值。
课程简介: In this paper we introduce a modular, highly flexible, open-source environment for data generation. Using an existing graphical data flow tool, the user can combine various types of modules for numeric and categorical data generators. Additional functionality is added via the data processing framework in which the generator modules are embedded. The resulting data flows can be used to document, deploy, and reuse the resulting data generators. We describe the overall environment and individual modules and demonstrate how they can be used for the generation of a sample, complex customer/product database with corresponding shopping basket data, including various artifacts and outliers.
关 键 词: 图形数据流工具; 分类数据发生器模块; 产品数据库
课程来源: 视频讲座网
最后编审: 2019-12-24:lxf
阅读次数: 52