一、死锁
简单来说,死锁是一个资源被多次调用,而多次调用方都未能释放该资源就会造成死锁,这里结合例子说明下两种常见的死锁情况。
1、迭代死锁
该情况是一个线程“迭代”请求同一个资源,直接就会造成死锁:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
import threading import time class MyThread(threading.Thread): def run( self ): global num time.sleep( 1 ) if mutex.acquire( 1 ): num = num + 1 msg = self .name + ' set num to ' + str (num) print msg mutex.acquire() mutex.release() mutex.release() num = 0 mutex = threading.Lock() def test(): for i in range ( 5 ): t = MyThread() t.start() if __name__ = = '__main__' : test() |
上例中,在run函数的if判断中第一次请求资源,请求后还未 release ,再次acquire,最终无法释放,造成死锁。这里例子中通过将print下面的两行注释掉就可以正常执行了 ,除此之外也可以通过可重入锁解决,后面会提到。
2、互相调用死锁
上例中的死锁是在同一个def函数内多次调用造成的,另一种情况是两个函数中都会调用相同的资源,互相等待对方结束的情况。如果两个线程分别占有一部分资源并且同时等待对方的资源,就会造成死锁。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
import threading import time class MyThread(threading.Thread): def do1( self ): global resA, resB if mutexA.acquire(): msg = self .name + ' got resA' print msg if mutexB.acquire( 1 ): msg = self .name + ' got resB' print msg mutexB.release() mutexA.release() def do2( self ): global resA, resB if mutexB.acquire(): msg = self .name + ' got resB' print msg if mutexA.acquire( 1 ): msg = self .name + ' got resA' print msg mutexA.release() mutexB.release() def run( self ): self .do1() self .do2() resA = 0 resB = 0 mutexA = threading.Lock() mutexB = threading.Lock() def test(): for i in range ( 5 ): t = MyThread() t.start() if __name__ = = '__main__' : test() |
这个死锁的示例稍微有点复杂。具体可以理下。
二、可重入锁
为了支持在同一线程中多次请求同一资源,python提供了“可重入锁”:threading.RLock。RLock内部维护着一个Lock和一个counter变量,counter记录了acquire的次数,从而使得资源可以被多次require。直到一个线程所有的acquire都被release,其他的线程才能获得资源。这里以例1为例,如果使用RLock代替Lock,则不会发生死锁:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
import threading import time class MyThread(threading.Thread): def run( self ): global num time.sleep( 1 ) if mutex.acquire( 1 ): num = num + 1 msg = self .name + ' set num to ' + str (num) print msg mutex.acquire() mutex.release() mutex.release() num = 0 mutex = threading.RLock() def test(): for i in range ( 5 ): t = MyThread() t.start() if __name__ = = '__main__' : test() |
和上面那个例子的不同之处在于threading.Lock()换成了threading.RLock() 。
三、互斥锁
python threading模块有两类锁:互斥锁(threading.Lock )和可重用锁(threading.RLock)。两者的用法基本相同,具体如下:
1
2
3
4
|
lock = threading.Lock() lock.acquire() dosomething…… lock.release() |
RLock的用法是将threading.Lock()修改为threading.RLock()。便于理解,先来段代码:
1
|
[root@361way lock] # cat lock1.py |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
#!/usr/bin/env python # coding=utf-8 import threading # 导入threading模块 import time # 导入time模块 class mythread(threading.Thread): # 通过继承创建类 def __init__( self ,threadname): # 初始化方法 # 调用父类的初始化方法 threading.Thread.__init__( self ,name = threadname) def run( self ): # 重载run方法 global x # 使用global表明x为全局变量 for i in range ( 3 ): x = x + 1 time.sleep( 5 ) # 调用sleep函数,让线程休眠5秒 print x tl = [] # 定义列表 for i in range ( 10 ): t = mythread( str (i)) # 类实例化 tl.append(t) # 将类对象添加到列表中 x = 0 # 将x赋值为0 for i in tl: i.start() |
这里执行的结果和想想的不同,结果如下:
1
|
[root@361way lock] # python lock1.py |
1
2
3
4
5
6
7
8
9
10
|
30 30 30 30 30 30 30 30 30 30 |
为什么结果都是30呢?关键在于global 行和 time.sleep行。
1、由于x是一个全局变量,所以每次循环后 x 的值都是执行后的结果值;
2、由于该代码是多线程的操作,所以在sleep 等待的时候,之前已经执行完成的线程会在这等待,而后续的进程在等待的5秒这段时间也执行完成 ,等待print。同样由于global 的原理,x被重新斌值。所以打印出的结果全是30 ;
3、便于理解,可以尝试将sleep等注释,你再看下结果,就会发现有不同。
在实际应用中,如抓取程序等,也会出现类似于sleep等待的情况。在前后调用有顺序或打印有输出的时候,就会现并发竞争,造成结果或输出紊乱。这里就引入了锁的概念,上面的代码修改下,如下:
1
|
[root@361way lock] # cat lock2.py |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
#!/usr/bin/env python # coding=utf-8 import threading # 导入threading模块 import time # 导入time模块 class mythread(threading.Thread): # 通过继承创建类 def __init__( self ,threadname): # 初始化方法 threading.Thread.__init__( self ,name = threadname) def run( self ): # 重载run方法 global x # 使用global表明x为全局变量 lock.acquire() # 调用lock的acquire方法 for i in range ( 3 ): x = x + 1 time.sleep( 5 ) # 调用sleep函数,让线程休眠5秒 print x lock.release() # 调用lock的release方法 lock = threading.Lock() # 类实例化 tl = [] # 定义列表 for i in range ( 10 ): t = mythread( str (i)) # 类实例化 tl.append(t) # 将类对象添加到列表中 x = 0 # 将x赋值为0 for i in tl: i.start() # 依次运行线程 |
执行的结果如下:
1
|
[root@361way lock] # python lock2.py |
1
2
3
4
5
6
7
8
9
10
|
3 6 9 12 15 18 21 24 27 30 |
加锁的结果会造成阻塞,而且会造成开锁大。会根据顺序由并发的多线程按顺序输出,如果后面的线程执行过快,需要等待前面的进程结束后其才能结束 --- 写的貌似有点像队列的概念了 ,不过在加锁的很多场景下确实可以通过队列去解决。