机读格式显示(MARC)
- 000 01200nam0 2200265 450
- 010 __ |a 978-7-302-61363-3 |d CNY59.00
- 100 __ |a 20221227d2022 em y0chiy50 ea
- 200 1_ |a Hadoop与Spark入门 |9 Hadoop yu Spark ru men |f 覃雄派, 陈跃国编著
- 210 __ |a 北京 |c 清华大学出版社 |d 2022
- 215 __ |a 14,233页 |d 26cm
- 330 __ |a 本书包含13章:第1、2章介绍如何为深入学习Hadoop和Spark做环境准备,包括VMware虚拟机的创建和CentOS操作系统安装。第3-6章介绍Hadoop大数据平台的基本原理,包括HDFS、MapReduce计算模型、HBase数据库,以及Hive数据仓库的原理、部署方法和开发技术。第7-11章介绍Spark大数据平台的基本原理,包括弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、有向无环图表达的作业及其处理过程等,并且介绍了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和开发技术。最后两章介绍了Flume(第12章)和Kafka(第13章)两个工具。
- 701 _0 |a 覃雄派 |9 qin xiong pai |4 编著
- 701 _0 |a 陈跃国 |9 chen yue guo |4 编著
- 801 _0 |a CN |b WFKJXY |c 20230828
- 905 __ |a WFKJXY |d TP274/554