本文实例讲述了Python实现通过文件路径获取文件hash值的方法。分享给大家供大家参考,具体如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
import hashlib import os,sys def CalcSha1(filepath): with open (filepath, 'rb' ) as f: sha1obj = hashlib.sha1() sha1obj.update(f.read()) hash = sha1obj.hexdigest() print ( hash ) return hash def CalcMD5(filepath): with open (filepath, 'rb' ) as f: md5obj = hashlib.md5() md5obj.update(f.read()) hash = md5obj.hexdigest() print ( hash ) return hash if __name__ = = "__main__" : if len (sys.argv) = = 2 : hashfile = sys.argv[ 1 ] if not os.path.exists(hashfile): hashfile = os.path.join(os.path.dirname(__file__),hashfile) if not os.path.exists(hashfile): print ( "cannot found file" ) else CalcMD5(hashfile) else : CalcMD5(hashfile) #raw_input("pause") else : print ( "no filename" ) |
使用Python进行文件Hash计算有两点必须要注意:
1、文件打开方式一定要是二进制方式,既打开文件时使用b模式,否则Hash计算是基于文本的那将得到错误的文件Hash(网上看到有人说遇到Python的Hash计算错误在大多是由于这个原因造成的)。
2、对于MD5
如果需要16位(bytes)的值那么调用对象的digest()
而hexdigest()
默认是32位(bytes),同理Sha1
的digest()
和hexdigest()
分别产生20位(bytes)和40位(bytes)的hash值
希望本文所述对大家Python程序设计有所帮助。