如何用python抓取文献
浅谈
Python
爬虫技术的网页数据抓取与分析
吴永聪
【期刊名称】
《计算机时代》
【年
(
卷
),
期】
2019(000)008
【摘要】
近年来
,
随着互联网的发展
,
如何有效地从互联网获取所需信息已成为众
多互联网企业竞争研究的新方向
,
而从互联网上获取数据最常用的手段是网络爬
虫
.
网络爬虫又称网络蜘蛛和网络机器人
,
它是一个程序
,
可以根据特定的规则和
给定的
URL
自动收集互联网数据和信息
.
文章讨论了网络爬虫实现过程中的主
要问题
:
如何使用
python
模拟登录、如何使用正则表达式匹配字符串获取信息、
如何使用
mysql
存储数据等
,
并利用
python
实现了一个网络爬虫程序系统
.
【总页数】
3
页
(94-96)
【关键词】
网络爬虫
;Python;MySQL;
正则表达式
【作者】
吴永聪
【作者单位】
广东省佛山市南海区卫生职业技术学校
,
广东
佛山
528211
【正文语种】
中文
【中图分类】
TP311.11
【相关文献】
1.
基于
Python
的
MYSQL
数据库访问技术
[J],
黄传禄
2.
基于
Python
爬虫技术的网页数据抓取与分析研究
[J],
熊畅
3.
基于
Python
的气象观测数据的解析与存储
[J],
师利霞
;
黄元媛
4.Python
访问
MySQL
数据库
[J],
郑岚
5.
基于
Python
的网页版物理实验快速建设技术
[J],
宫薇薇
;
祝继常
;
韩煦
如何用python抓取文献
浅谈
Python
爬虫技术的网页数据抓取与分析
吴永聪
【期刊名称】
《计算机时代》
【年
(
卷
),
期】
2019(000)008
【摘要】
近年来
,
随着互联网的发展
,
如何有效地从互联网获取所需信息已成为众
多互联网企业竞争研究的新方向
,
而从互联网上获取数据最常用的手段是网络爬
虫
.
网络爬虫又称网络蜘蛛和网络机器人
,
它是一个程序
,
可以根据特定的规则和
给定的
URL
自动收集互联网数据和信息
.
文章讨论了网络爬虫实现过程中的主
要问题
:
如何使用
python
模拟登录、如何使用正则表达式匹配字符串获取信息、
如何使用
mysql
存储数据等
,
并利用
python
实现了一个网络爬虫程序系统
.
【总页数】
3
页
(94-96)
【关键词】
网络爬虫
;Python;MySQL;
正则表达式
【作者】
吴永聪
【作者单位】
广东省佛山市南海区卫生职业技术学校
,
广东
佛山
528211
【正文语种】
中文
【中图分类】
TP311.11
【相关文献】
1.
基于
Python
的
MYSQL
数据库访问技术
[J],
黄传禄
2.
基于
Python
爬虫技术的网页数据抓取与分析研究
[J],
熊畅
3.
基于
Python
的气象观测数据的解析与存储
[J],
师利霞
;
黄元媛
4.Python
访问
MySQL
数据库
[J],
郑岚
5.
基于
Python
的网页版物理实验快速建设技术
[J],
宫薇薇
;
祝继常
;
韩煦