python提取具有某种特定字符串的行数据方法_Python

python提取具有某种特定字符串的行数据方法

2021-04-28 00:14请叫我渣渣的帕楚利亚 Python

今天小编就为大家分享一篇python提取具有某种特定字符串的行数据方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

今天又帮女朋友处理了一下，她的实验数据，因为python是一年前经常用，最近找工作，用的是c，c++，python的有些东西忘记了，然后就一直催我，说我弄的慢，弄的慢，你自己弄啊，烦不烦啊，逼逼叨叨的，最后还不是我给弄好的？呵呵

好的，数据是这样的，我截个图

python提取具有某种特定字符串的行数据方法

我用红括号括起来的，就是我所要提取的数据

其中lossstotal.txt是我要提取的原始数据，考虑两种方法去提取，前期以为所要提取行的数据是有一定规律的，后来发现，并不是，所以，我考虑用正则来提取，经过思考以后，完成了数据的提取，如下午所示，数据变的非常好看

python提取具有某种特定字符串的行数据方法

代码如下：

									#coding:utf-8

									#__author__ ='dell'

									import re

									f1=file('losstotal.txt','r')

									data1=f1.readlines()

									# print data1

									f1.close()

									results = []

									f2 = open('loss2.txt', 'w')

									# # 按照特定行提取，发现后面的行并无规律

									# i = 0

									# for line in data1:

									# i+=1

									# # print line

									# if((i-1)%3==0):

									# f2.write(line)

									# print line

									# 利用正则表达式

									for line in data1:

									 data2=line.split()

									 # print data2

									 for i in data2:

									 n = re.findall(r"iteration", i)

									 # m=re.findall(r"loss", i)

									 if n:

									  # print line

									  f2.writelines(line)

									f2.close()

									f3=file('loss2.txt','r')

									data3=f3.readlines()

									# print data1

									f3.close()

									f4 = open('loss3.txt', 'w')

									for line in data3:

									 data4=line.split()

									 # print data2

									 for i in data4:

									 n = re.findall(r"loss", i)

									 # m=re.findall(r"loss", i)

									 if n:

									  print line

									  f4.writelines(line)

									f4.close()

									# 去掉逗号

									f5=open('loss3.txt','r')

									data5=f5.read()

									f5=data5.replace(',',' ')

									f6=file('lossfinal.txt','w')

									f6.write(f5)

									f6.close()

									# # 去掉等号=

									f7=open('lossfinal.txt','r')

									data7=f7.read()

									f7=data7.replace('=',' ')

									f8=file('lossfinal.txt','w')

									f8.write(f7)

									f8.close()

									  # data3=lin.split()

									  # for j in data3:

									  # m=re.findall(r"loss",i)

									  # if m:

									  # print lin

									 # # m=re.findall(r"sgd_solver.cpp",i)

									 # n=re.findall(r"iteration",i)