刚开始学python,记录下问题。
代码如下:
1
2
3
4
5
6
7
8
9
10
|
#coding:utf-8 import re,urllib2 def getHTML(url): html = urllib2.urlopen(url) html = html.read() return html if __name__ = = '__main__' : url = 'https://www.baidu.com' #处理换行符以及空格 print getHTML(url).replace( '\n' ,' ').replace(' \t ',' ').replace(' ',' ') |
总结
以上所述是小编给大家介绍的python爬虫正则表达式之处理换行符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/u013216667/article/details/80620568