Python简单实现网页内容抓取功能示例_Python

Python简单实现网页内容抓取功能示例

2021-03-01 00:30偶-木 Python

这篇文章主要介绍了Python简单实现网页内容抓取功能,结合实例形式分析了Python基于urllib模块的网页请求、内容读取等相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python简单实现网页内容抓取功能。分享给大家供大家参考，具体如下：

使用模块：

1 2	`import` `urllib2` `import` `urllib`

普通抓取实例：

									#!/usr/bin/python

									# -*- coding: UTF-8 -*-

									import urllib2

									url = 'http://www.baidu.com'

									#创建request对象

									request = urllib2.Request(url)

									#发送请求，获取结果

									try:

									 response = urllib2.urlopen(request)

									except BaseException, err:

									 print err

									 exit()

									#获取状态码，如果是200表示获取成功

									code = response.getcode()

									print code

									#读取内容

									if 200 == code:

									 content = response.read() 

									 print content

Get请求抓取实例：

									#!/usr/bin/python

									# -*- coding: UTF-8 -*-

									import urllib2

									import urllib

									#urllib2使用GET方式的请求

									url = 'http://www.baidu.com/s'

									values = {'wd' : '车云'}

									# 必须编码

									data = urllib.urlencode(values) 

									url = url + '?' + data 

									print url

									#url == http://www.baidu.com/s?wd=%E8%BD%A6%E4%BA%91

									#创建request对象

									request = urllib2.Request(url)

									#发送请求，获取结果

									try:

									 response = urllib2.urlopen(request)

									except BaseException, err:

									 print err

									 exit()

									#获取状态码，如果是200表示获取成功

									code = response.getcode()

									print code

									#读取内容

									if 200 == code:

									 content = response.read() 

									 print content