机读格式显示(MARC)
- 010 __ |a 978-7-111-73385-0 |d CNY59.90
- 100 __ |a 20230912d2023 em y0chiy50 ea
- 200 1_ |a 数据采集与预处理技术应用 |A shu ju cai ji yu yu chu li ji shu ying yong |d = Data collection and preprocessing technology |f 安俊秀 ... [等] 编著 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2023
- 215 __ |a 196页 |c 图 |d 26cm
- 304 __ |a 题名页题其余责任者: 唐聃, 柳源, 杨林旺, 万里浪, 田茂云等
- 314 __ |a 安俊秀, 成都信息工程大学教授, 访问学者, 硕士生导师。
- 330 __ |a 本书共有九章, 从数据采集与预处理概述开始, 介绍了大数据环境的搭建, 并对数据采集与数据预处理的技术方法进行了系统介绍。数据采集的内容包括Flume日志数据采集、Kafka日志数据采集、Fluentd与Logstach等一系列数据采集技术 ; 数据预处理的内容包括网络爬虫采集Web数据、Python数据预处理技术、Kettle数据处理技术、Pig和OpenRefine这些数据预处理技术。旨在让读者了解并基本掌握当下主要的数据采集与预处理技术、工具, 以及它们的使用方法。
- 510 1_ |a Data collection and preprocessing technology |z eng
- 606 0_ |a 数据采集 |A shu ju cai ji |x 高等学校
- 606 0_ |a 数据处理 |A shu ju chu li |x 高等学校
- 701 _0 |a 安俊秀 |A an jun xiu |4 编著
- 801 _0 |a CN |b WFKJXY |c 20240901
- 905 __ |a WFKJXY |d TP274/687