如何用python循环读取下面.txt文件中,用红括号标出来的数据呢?
首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式。
再加上,对读和写文件的操作,就行了
注:我用的是pycharm+python2.7
话不多说,直接上代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
import re f1 = file ( 'shen.txt' , 'r' ) data1 = f1.readlines() # print data1 f1.close() results = [] for line in data1: data2 = line.split() # print data2[0] m = re.findall(r "[0-9]:" , data2[ 0 ]) if m: results.append(line) # for i in data2[0]: # data3=i.split(":") # print data3 # if data3>=0 and data3<=50000: # results.append(line) # if i=='1': # results.append(line) f2 = file ( 'deal.txt' , 'w' ) f2.writelines(results) f2.close() |
前期,我遇到“1:”这样的字符串实在是没办法处理,后来查找资料,发现有正则这么爽的东西!
在上面的代码中,需要说明的是:
1
|
m = re.findall(r "[0-9]:" , data2[ 0 ]) |
该语句的意思就是,对于字符串而言,寻找到能够匹配1:,2:,9:。。。。。。的字符串
最后处理的结果是:
由于数据不是很漂亮,还需要将里面的“,”和“:”这两个符号去掉,因此,我使用了replace语句
代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
|
#coding:utf-8 #__author__ ='dell' import re f1 = file ( 'shen.txt' , 'r' ) data1 = f1.readlines() # print data1 f1.close() results = [] for line in data1: data2 = line.split() # print data2[0] m = re.findall(r "[0-9]:" , data2[ 0 ]) if m: results.append(line) # for i in data2[0]: # data3=i.split(":") # print data3 # if data3>=0 and data3<=50000: # results.append(line) # if i=='1': # results.append(line) f2 = file ( 'deal.txt' , 'w' ) f2.writelines(results) f2.close() # 替换掉所有的逗号, f4 = open ( 'deal.txt' , 'r' ) data3 = f4.read() f4 = data3.replace( ',' , ' ' ) f5 = file ( 'deal.txt' , 'w' ) f5.write(f4) f5.close() # 替换掉所有的冒号 f6 = open ( 'deal.txt' , 'r' ) data4 = f6.read() f6 = data4.replace( ':' , ' ' ) f7 = file ( 'deal.txt' , 'w' ) f7.write(f6) f7.close() |
最终,得到的数据就很漂亮了,如下所示:
以上这篇使用python读取.text文件特定行的数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/u011436427/article/details/81874646