MARC状态:已编 文献类型:中文图书 浏览次数:17
- 题名/责任者:
- 大数据采集与处理/张雪萍主编
- 出版发行项:
- 北京:电子工业出版社,2021
- ISBN及定价:
- 978-7-121-42011-5/CNY128.00
- 载体形态项:
- xiv, 477页:图;26cm
- 丛编项:
- 大数据及人工智能产教融合系列丛书
- 个人责任者:
- 张雪萍 主编
- 学科主题:
- 数据采集
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 责任者附注:
- 张雪萍, 博士, 教授, 教育部新世纪优秀人才, 河南省高校科技创新人才, 河南省教育厅学术技术带头人。
- 提要文摘附注:
- 本书首先介绍了大数据概念及特征、大数据处理关键技术、开源 Hadoop安装与使用、Hadoop生态系统及主要组件, 在此基础上重点介绍了大数据采集、大数据预处理、大数据存储与计算、大数据安全等关键技术, 并且每一部分都以案例为依托进行项目实战。大数据采集部分具体包括: 大数据采集方法、常用采集工具及平台、网络爬虫、Apache Kafka等; 大数据预处理技术包括: 清理、集成、变换、数据仓库与ETL; 大数据存储与计算部分介绍了RDB、MPP、HDFS、HBase、Alluxio、ElasticSearch等存储架构, Redis、Cassandra、ongoDB、Neo4j等常用的NoSQL, MapReduce计算框架、Hive数据仓库, Spark、Storm、Flink等流计算模式, 以及Pregel图计算; 大数据安全部分介绍了大数据安全面临的技术问题和挑战、大数据安全关键技术以及大数据安全管理及应用; 最后介绍了电商、交通、医院、电信、煤炭、教育等行业大数据采集与处理。
- 使用对象附注:
- 本书既适合大数据、人工智能等领域的工程技术人员学习参考, 也可作为高等院校计算机学科大数据及其相关专业的本科生和研究生教材。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/368 | 1970778 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 | |
TP274/368 | 1970779 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 | |
TP274/368 | 1970780 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息