机读格式显示(MARC)

000 01200nam0 2200265 450

001 0000653784

005 20230828102600.0

010 __ |a 978-7-302-61363-3 |d CNY59.00

100 __ |a 20221227d2022 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a y z 000yy

106 __ |a r

200 1_ |a Hadoop与Spark入门 |9 Hadoop yu Spark ru men |f 覃雄派, 陈跃国编著

210 __ |a 北京 |c 清华大学出版社 |d 2022

215 __ |a 14,233页 |d 26cm

300 __ |a 数据科学与大数据技术

330 __ |a 本书包含13章:第1、2章介绍如何为深入学习Hadoop和Spark做环境准备,包括VMware虚拟机的创建和CentOS操作系统安装。第3-6章介绍Hadoop大数据平台的基本原理,包括HDFS、MapReduce计算模型、HBase数据库,以及Hive数据仓库的原理、部署方法和开发技术。第7-11章介绍Spark大数据平台的基本原理,包括弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、有向无环图表达的作业及其处理过程等,并且介绍了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和开发技术。最后两章介绍了Flume(第12章)和Kafka(第13章)两个工具。

606 0_ |a 数据处理软件

690 __ |a TP274 |v 5

701 _0 |a 覃雄派 |9 qin xiong pai |4 编著

701 _0 |a 陈跃国 |9 chen yue guo |4 编著

801 _0 |a CN |b WFKJXY |c 20230828

905 __ |a WFKJXY |d TP274/554

920 __ |a 4370400 |z 1