潍坊科技学院图书馆书目检索系统

| 暂存书架(0) | 登录



MARC状态:已编 文献类型:中文图书 浏览次数:12

题名/责任者:
深入大型数据集:并行与分布化Python代码/(美) John T. Wolohan著 张若飞译
出版发行项:
北京:电子工业出版社,2021
ISBN及定价:
978-7-121-40368-2/CNY99.00
载体形态项:
300页:图;24cm
统一题名:
Mastering large datasets with Python : parallelize and distribute your Python code
其它题名:
并行与分布化Python代码
个人责任者:
沃勒翰 (Wolohan, John T.)
个人次要责任者:
张若飞
学科主题:
软件工具-程序设计
中图法分类号:
TP311.561
一般附注:
博文视点
责任者附注:
责任者规范汉译姓: 沃勒翰
提要文摘附注:
本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP311.561/304 1845364   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
TP311.561/304 1845365   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
TP311.561/304 1845366   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架