MARC状态:已编 文献类型:中文图书 浏览次数:13
- 题名/责任者:
- Python爬虫大数据采集与挖掘:微课视频版/曾剑平编著
- 出版发行项:
- 北京:清华大学出版社,2020
- ISBN及定价:
- 978-7-302-54054-0/CNY59.80
- 载体形态项:
- xi, 296页:图;26cm
- 丛编项:
- 大数据与人工智能技术丛书
- 个人责任者:
- 曾剑平 编著
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.561
- 书目附注:
- 有书目 (第294-296页)
- 提要文摘附注:
- 本书围绕大数据采集, 对采集技术的相关基础、技术原理、Python实现技术、大数据挖掘与应用方法进行了系统介绍。书中全面、完整地覆盖了各种类型的网络爬虫及相关的信息处理挖掘技术, 并提供了27个与爬虫技术和应用相关的Python程序。全书共分为四大部分, 即概述、基础篇、技术与实现篇、大数据挖掘与应用篇。第一部分是概述, 首先指出了利用Python采集互联网大数据的重要性, 介绍了相关技术研究、技术体系、Pyt hon爬虫采集技术的合规性及应用现状等; 第二部分是基础篇, 包括 Web服务器的应用架构以及HTTP、Robots、HTML、页面编码等相关协议和规范; 第三部分是技术与实现篇, 全面介绍了普通网络爬虫技术、动态页面采集方法、主题爬虫技术、DeepWeb爬虫、微博信息采集、Web信息提取以及反爬虫技术等, 内容涵盖了各种爬虫技术实现方法及Python例子; 第四部分是大数据挖掘与应用篇, 介绍了用于爬虫应用中的典型大数据处理与挖掘技术以及Web大数据采集的常见应用模式, 并以新闻采集与分析、SQL注入在线检测为例介绍了Python爬虫应用构建方法等。
- 使用对象附注:
- 本书可以作为高等院校大数据、计算机、信息以及经管、金融等相关专业的教材, 也可以作为大数据、计算机、信息以及经管、金融等领域研究人员和专业技术人员的参考书
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/152 | 1689026 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 | |
TP311.561/152 | 1689027 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 | |
TP311.561/152 | 1689028 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息