机读格式显示(MARC)
- 010 __ |a 978-7-03-060637-2 |d CNY142.00
- 099 __ |a CAL 012019040708
- 100 __ |a 20190403d2019 em y0chiy50 ea
- 200 1_ |a 基于Python的Web大数据爬取实战指南 |A ji yu Python de Web da shu ju pa qu shi zhan zhi nan |f 夏换, 杨秀璋, 于小民编著
- 210 __ |a 北京 |c 科学出版社 |d 2019
- 215 __ |a 275页 |c 图 |d 24cm
- 225 2_ |a 大数据科学研究丛书 |A da shu ju ke xue yan jiu cong shu
- 300 __ |a 贵州省普通高等学校科技拔尖人才支持计划项目“定向钻机远程实时监控大数据分析评价系统”(黔教合KY字[20161068) 贵州省教育厅青年科技人才成长项目“实体和属性对齐方法的研究与实现”(黔教合KY字[20161172) 贵州省教育厅青年科技人才成长项目“无线校园网络建设中Mesh网关负载均衡问题研究”(黔教合KY字[2016178) 资助 贵州省科技计划项目——重点项目“圆形地下连续墙结构时变性仿真研究”(黔科合基础20191403号) 贵州省科技计划项目“多源地理数据融合知识图谱构建方法在舆情分析中的应用—以贵州省为例”(黔科合基础[20191041号)
- 330 __ |a 本书主要是基于Python的Web大数据爬取实战指南,选题内容包括基础知识和通过Python爬取Web网页数据两大部分。下图是PythonWeb数据采集的结构图,主要包括三个部分:网络传播技术、信息提取技术和数据存储技术。网络传播通常是使用HTTP进行,常用的传播方式包括HTML、XML、Json、Ajax和纯文本等;信息提取技术主要可以通过Python语言、R语言、Java语言等进行获取,其中主要包括的技术包括:正则表达式、XPath技术、Selenium、BeautifulSoup等;数据存储技术主要是存储爬取的数据信息,主要包括SQL数据库、纯文本格式等。
- 410 _0 |1 2001 |a 大数据科学研究丛书
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _0 |a 夏换 |A xia huan |4 编著
- 701 _0 |a 杨秀璋 |A yang xiu zhang |4 编著
- 701 _0 |a 于小民 |A yu xiao min |4 编著
- 801 _0 |a CN |b NMU |c 20190403
- 905 __ |a WFKJXY |d TP311.561/27