本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
''''' Created on Dec 21, 2012 Python 读取UTF-8文件 统计文件的行数目 @author: liury_lab ''' # -*- coding: utf-8 -*- import codecs # 对较小的文件,最简单的方法是将文件读入一个行列表中, # 然后计算列表的长度即可 count = len (codecs. open ( 'd:/FreakOut.cpp' , 'rU' , 'utf-8' ).readlines()) print (count) # 对较大的文件,可循环计数 count = - 1 for count, line in enumerate (codecs. open ( 'd:/FreakOut.cpp' , 'rU' , 'utf-8' )): pass count + = 1 print (count) # 对于像windows结束标记有'\n'的,还可以有如下办法: count = 0 the_file = codecs. open ( 'd:/FreakOut.cpp' , 'rb' , 'utf-8' ) while ( True ): buffer = the_file.read( 8192 * 1024 ) if not buffer : break count + = buffer .count( '\n' ) count + = 1 the_file.close() print (count) |
希望本文所述对大家的Python程序设计有所帮助。