机读格式显示(MARC)
- 010 __ |a 978-7-121-42011-5 |d CNY128.00
- 100 __ |a 20220329d2021 em y0chiy50 ea
- 200 1_ |a 大数据采集与处理 |A da shu ju cai ji yu chu li |f 张雪萍主编
- 210 __ |a 北京 |c 电子工业出版社 |d 2021
- 215 __ |a xiv, 477页 |c 图 |d 26cm
- 225 2_ |a 大数据及人工智能产教融合系列丛书 |A da shu ju ji ren gong zhi neng chan jiao rong he xi lie cong shu
- 314 __ |a 张雪萍, 博士, 教授, 教育部新世纪优秀人才, 河南省高校科技创新人才, 河南省教育厅学术技术带头人。
- 330 __ |a 本书首先介绍了大数据概念及特征、大数据处理关键技术、开源 Hadoop安装与使用、Hadoop生态系统及主要组件, 在此基础上重点介绍了大数据采集、大数据预处理、大数据存储与计算、大数据安全等关键技术, 并且每一部分都以案例为依托进行项目实战。大数据采集部分具体包括: 大数据采集方法、常用采集工具及平台、网络爬虫、Apache Kafka等; 大数据预处理技术包括: 清理、集成、变换、数据仓库与ETL; 大数据存储与计算部分介绍了RDB、MPP、HDFS、HBase、Alluxio、ElasticSearch等存储架构, Redis、Cassandra、ongoDB、Neo4j等常用的NoSQL, MapReduce计算框架、Hive数据仓库, Spark、Storm、Flink等流计算模式, 以及Pregel图计算; 大数据安全部分介绍了大数据安全面临的技术问题和挑战、大数据安全关键技术以及大数据安全管理及应用; 最后介绍了电商、交通、医院、电信、煤炭、教育等行业大数据采集与处理。
- 333 __ |a 本书既适合大数据、人工智能等领域的工程技术人员学习参考, 也可作为高等院校计算机学科大数据及其相关专业的本科生和研究生教材。
- 410 _0 |1 2001 |a 大数据及人工智能产教融合系列丛书
- 606 0_ |a 数据采集 |A shu ju cai ji
- 606 0_ |a 数据处理 |A shu ju chu li
- 701 _0 |a 张雪萍 |A zhang xue ping |4 主编
- 801 _0 |a CN |b 北京京城新安 |c 20220819
- 905 __ |a WFKJXY |d TP274/368