MARC状态:已编 文献类型:中文图书 浏览次数:19
- 题名/责任者:
- 基于Python的Web大数据爬取实战指南/夏换, 杨秀璋, 于小民编著
- 出版发行项:
- 北京:科学出版社,2019
- ISBN及定价:
- 978-7-03-060637-2/CNY142.00
- 载体形态项:
- 275页:图;24cm
- 丛编项:
- 大数据科学研究丛书
- 个人责任者:
- 夏换 编著
- 个人责任者:
- 杨秀璋 编著
- 个人责任者:
- 于小民 编著
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.561
- 一般附注:
- 贵州省普通高等学校科技拔尖人才支持计划项目“定向钻机远程实时监控大数据分析评价系统”(黔教合KY字[20161068) 贵州省教育厅青年科技人才成长项目“实体和属性对齐方法的研究与实现”(黔教合KY字[20161172) 贵州省教育厅青年科技人才成长项目“无线校园网络建设中Mesh网关负载均衡问题研究”(黔教合KY字[2016178) 资助 贵州省科技计划项目——重点项目“圆形地下连续墙结构时变性仿真研究”(黔科合基础20191403号) 贵州省科技计划项目“多源地理数据融合知识图谱构建方法在舆情分析中的应用—以贵州省为例”(黔科合基础[20191041号)
- 提要文摘附注:
- 本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行,常用的传播方式包括HTML、XML、Json、Ajax和纯文本等;信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取,其中主要包括的技术包括:正则表达式、XPath技术、Selenium、BeautifulSoup等;数据存储技术主要是存储爬取的数据信息,主要包括SQL数据库、纯文本格式等。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/27 | 1656816 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息