机读格式显示(MARC)
- 000 01214nam0 2200253 450
- 010 __ |a 978-7-302-57508-5 |d CNY79.00
- 100 __ |a 20210226d2021 em y0chiy50 ea
- 200 1_ |a Python大数据处理库PySpark实战 |A Pythonda shu ju chu li ku PySparkshi zhan |f 汪明著
- 210 __ |a 北京 |c 清华大学出版社 |d 2021
- 215 __ |a 310页 |c 图 |d 26cm
- 330 __ |a 本书分为7章, 第1章介绍大数据的基本概念、常用的大数据分析工具; 第2章介绍Spark作为大数据处理的特点和算法; 第3章介绍Spark实战环境的搭建, 涉及Windows和Linux操作系统; 第4章介绍如何灵活应用PySpark对数据进行操作; 第5章介绍PySpark ETL处理, 涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容; 第6章介绍PySpark如何利用MLib库进行分布式机器学习 (Titanic幸存者预测); 第7章介绍一个PySpark和Kafka结合的实时项目。
- 333 __ |a 可作为广大PySpark入门读者必备的参考书, 同时能作为大中专院校师生的教学参考书, 也可作为高等院校计算机及相关专业的大数据技术教材使用
- 606 0_ |a 数据处理 |A shu ju chu li
- 701 _0 |a 汪明 |A wang ming |4 著
- 801 _0 |a CN |b 北京京城新安 |c 20220819
- 905 __ |a WFKJXY |d TP274/372