MARC状态:已编 文献类型:中文图书 浏览次数:26
- 题名/责任者:
- Hadoop+Spark大数据分析实战/迟殿委编著
- 出版发行项:
- 北京:清华大学出版社,2022
- ISBN及定价:
- 978-7-302-60884-4/CNY69.00
- 载体形态项:
- 290页:图;26cm
- 丛编项:
- 大数据技术丛书
- 个人责任者:
- 迟殿委 编著
- 学科主题:
- 数据处理软件
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书是Hadoop+Spark大数据分析技术入门书, 基于Hadoop和Spark两大框架体系的3.2版本, 以通俗易懂的方式系统介绍Hadoop+Spark原生态组件的原理、集群搭建、实战操作, 以及整个Hadoop生态系统主流的大数据分析技术。本书共分14章。第1章讲解Hadoop框架及新版本特性, 并详细讲解大数据分析环境的搭建工作, 包括Linux操作系统的安装、SSH工具使用和配置等。第2章讲解了Hadoop伪分布式的安装和开发体验, 使读者熟悉Hadoop大数据开发两大核心组件, 即HDFs和MapReduce。第3-12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadcop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume, 以及Spark框架数据处理、机器学习等实战技术, 并通过实际案例加深对各个框架的理解与应用。第13-14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。
全部MARC细节信息>>
| 索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
| TP274/465 | 2099240 | 四楼公共开放书架(贴墙书架)
|
可借 | 四楼公共开放书架(贴墙书架) | |
| TP274/465 | 2099241 | 四楼公共开放书架(贴墙书架)
|
可借 | 四楼公共开放书架(贴墙书架) | |
| TP274/465 | 2099242 | 四楼公共开放书架(贴墙书架)
|
可借 | 四楼公共开放书架(贴墙书架) |
显示全部馆藏信息




四楼公共开放书架(贴墙书架)