机读格式显示(MARC)
- 000 01416oam2 2200301 450
- 010 __ |a 978-7-302-59181-8 |d CNY49.90
- 100 __ |a 20211213d2022 em y0chiy50 ea
- 200 1_ |a 大数据技术入门 |9 da shu ju ji shu ru men |e Hadoop+Spark |f 于海浩,刘志坤主编
- 210 __ |a 北京 |c 清华大学出版社 |d 2022
- 215 __ |a 194页 |c 图 |d 26cm
- 330 __ |a 本书基础理论、应用开发以及实际案例相结合,围绕Hadoop、Spark生态圈循序渐进介绍关于大数据技术领域中的基础知识、应用开发技术和基于Spark的常见机器学习算法,最后以两个实战案例全面、系统地应用了本书介绍的基础知识和应用开发方法。全书共14章,分别为大数据概述、Hadoop简介及安装部署、HDFS 分布式文件系统、MapReduce计算框架、Hive 数据仓库、HBase分布式数据库、Spark基础、Spark RDD弹性分布式数据集、Spark SQL、Spark Streaming实时计算框架、Spark Streaming与Flume、Kafka的整合、Spark MLlib 机器学习、实战案例-分布式优惠券后台应用系统、实战案例-新闻话题实时统计分析,书中的每个知识点都有相应的实现代码和实例。
- 410 _0 |1 2001 |a 大数据与人工智能技术丛书
- 701 _0 |a 于海浩 |9 yu hai hao |4 主编
- 701 _0 |a 刘志坤 |9 liu zhi kun |4 主编
- 801 _0 |a CN |b WFKJXY |c 20230827
- 905 __ |a WFKJXY |d TP274/551