潍坊科技学院图书馆书目检索系统

| 暂存书架(0) | 登录



MARC状态:审校 文献类型:中文图书 浏览次数:5

题名/责任者:
大数据原理及实践/张晓燕 ... [等] 主编
出版发行项:
上海:上海财经大学出版社,2023
ISBN及定价:
978-7-5642-3909-1/CNY39.00
载体形态项:
203页:图;24cm
并列正题名:
Principles and practice of big data
个人责任者:
张晓燕 主编
个人责任者:
王筱莉 主编
个人责任者:
李跃文 主编
学科主题:
数据处理-高等学校
中图法分类号:
TP274
一般附注:
高等教育“十四五”经管类精品
题名责任附注:
题名页题: 张晓燕, 王筱莉, 李跃文, 谢妍曦主编
书目附注:
有书目 (第200-203页)
提要文摘附注:
本书分为八章。首章介绍Hadoop生态系统及其发展历程。大家可以通过此章内容了解到Hadoop是一个开放的生态系统, 里面有很多项目组成, 包括数据采集类的项目、数据处理类的项目和数据可视化类的项目等; 第二章介绍Hadoop的核心组件, 包括HDFS、MapReduce和Yarn, 通过此章的学习。大家可以了解到Hadoop三大核心组件的基本组成及运行原理; 第三章介绍Hadoop集群环境的搭建。第四章主要介绍Hadoop生态系统中非常常用、非常实用又简单易用的Hive组件, 介绍其原理及安装方法; 第五章主要介绍Hive的使用, 了解Hive中DDL和DML语法知识 (通过前面五章的学习。大家可以独立搭建Hadoop集群, 并上传文件到HDFS中, 并且利用MapReduce或者Hive对数据文件进行统计分析); 第六章进入Hadoop生态系统中内存计算的学习, 选用Spark组件, 着重介绍Spark的内存计算的原理及运行模式; 第七章介绍Spark的编程及SparkSQL的使用。通过这两部分的学习, 大家可以完成Spark的安装部署, 了解Spark的适用场合, 学会Spark编程和SparkSQL对数据进行分析; 第八章为SparkMLLib的内容。通过这一章的学习, 大家可以利用SparkMLLib完成较复杂的一些数据分析, 例如分类、聚类和关联分析等。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP274/677 2266018   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
TP274/677 2266019   自然科学书库-四楼西北     可借 自然科学书库-四楼西北
显示全部馆藏信息
CADAL相关电子图书
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架