MARC状态:订购 文献类型:中文图书 浏览次数:9
- 题名/责任者:
- Python和PySpark数据分析/(加) 乔纳森·里乌著
- 出版发行项:
- :清华大学出版社,2023
- ISBN及定价:
- 9787302645368/118
- 载体形态项:
- xiii, 402页
- 丛编项:
- 数据科学与大数据技术
- 学科主题:
- 软件工具-程序设计-程序设计
- 中图法分类号:
- TP311.561
- 提要文摘附注:
- 本书是一本精心设计的教程, 可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据 (从基于Hadoop的集群到Excel工作表) 扩大多台机器的处理能力。通过阅读本书, 读者将学习如何将大型分析任务分解为可管理的块, 以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后, 您将能够编写和运行速度极快的PySpark程序, 这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码, 管理跨多台机器扩展的数据, 在P
- 使用对象附注:
- 本书适用于程序设计人员
全部MARC细节信息>>