在实际的算法与程序开发中,经常需要面对的场景就是对同一目录内的文件进行批量操作。
并且很多时候目录中的文件明明是有规律的,同时希望程序在进行处理时也是按照一定的顺序进行。
方法 1
1
2
3
4
5
6
7
8
|
>>> import os >>> fileList = os.listdir( 'TestDir' ) >>> fileList [ 'test1.txt' , 'test10.txt' , 'test11.txt' , 'test2.txt' , 'test23.txt' , 'test28.txt' ] >>> fileList.sort(key = lambda x: int (x[ 4 : - 4 ])) >>> fileList [ 'test1.txt' , 'test2.txt' , 'test10.txt' , 'test11.txt' , 'test23.txt' , 'test28.txt' ] >>> |
方法 2
1
2
3
4
5
6
7
8
9
|
>>> import os >>> import natsort >>> fileList = os.listdir( 'TestDir' ) >>> fileList [ 'test1.txt' , 'test10.txt' , 'test11.txt' , 'test2.txt' , 'test23.txt' , 'test28.txt' ] >>> fileList = natsort.natsorted(fileList) >>> fileList [ 'test1.txt' , 'test2.txt' , 'test10.txt' , 'test11.txt' , 'test23.txt' , 'test28.txt' ] >>> |
补充:python对目录下的文件排序问题
1.按照时间来排序
1
2
3
4
5
6
7
8
9
10
11
|
def get_file_list(file_path): dir_list = os.listdir(file_path) if not dir_list: return else : # 注意,这里使用lambda表达式,将文件按照最后修改时间顺序升序排列 # os.path.getmtime() 函数是获取文件最后修改时间 # os.path.getctime() 函数是获取文件最后创建时间 dir_list = sorted (dir_list,key = lambda x: os.path.getmtime(os.path.join(file_path, x))) # print(dir_list) return dir_list |
2.获取最后修改时间的文件路径
1
2
3
4
5
6
7
|
import os url = 'D:\PycharmProjects\Ambulance_Api\logs' lists = os.listdir(url) print (lists) lists.sort(key = lambda fn: os.path.getmtime(url + '\\' + fn)) filepath = os.path.join(url,lists[ - 1 ]) print (filepath) |
3.按照文件名字来排序
1)用库函数sorted()对字符串排序,它的对象是字符
2)用函数sort()对数字排序,它的对象是数字,如果读取文件的话,需要进行处理(把文件后缀名‘屏蔽')
1
2
3
4
5
6
7
|
import os img_path = './img/' img_list = sorted (os.listdir(img_path)) #文件名按字母排序 img_nums = len (img_list) for i in range (img_nums): img_name = img_path + img_list[i] print (img_name) |
sort函数中用到了匿名函数(key = lambda x:int(x[:-4])),其作用是将后缀名'.jpg'“屏蔽”(因为‘.jpg'是4个字符,所以[:-4]的含义是从文件名开始到倒数第四个字符为止)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/am290333566/article/details/93485128