python3学习笔记之多进程分布式小例子_Python

python3学习笔记之多进程分布式小例子

2021-01-16 00:12xh15 Python

本篇文章主要介绍了python3学习笔记之多进程分布式小例子，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧

最近一直跟着廖大在学Python，关于分布式进程的小例子挺有趣的，这里做个记录。

分布式进程

Python的multiprocessing模块不但支持多进程，其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者，将任务分布到其他多个进程中，依靠网络通信。由于managers模块封装很好，不必了解网络通信的细节，就可以很容易地编写分布式多进程程序。

master服务端原理：通过managers模块把Queue通过网络暴露出去，其他机器的进程就可以访问Queue了
服务进程负责启动Queue，把Queue注册到网络上，然后往Queue里面写入任务，代码如下:

									#task_master.py

									#coding=utf-8

									#多进程分布式例子

									#服务器端

									from multiprocessing.managers import BaseManager

									from multiprocessing import freeze_support #server启动报错，提示需要引用此包

									import random,time,queue

									#发送任务的队列

									task_queue = queue.Queue()

									#接收结果的队列

									result_queue = queue.Queue()

									#从BaseManager继承的QueueManager

									class QueueManager(BaseManager):

									  pass

									#win7 64 貌似不支持callable下调用匿名函数lambda，这里封装一下

									def return_task_queue():

									  global task_queue

									  return task_queue

									def return_result_queue():

									  global result_queue

									  return result_queue

									def test():

									  #把两个Queue注册到网络上，callable参数关联了Queue对象

									  #QueueManager.register('get_task_queue',callable=lambda:task_queue)

									  #QueueManager.register('get_result_queue',callable=lambda:result_queue)

									  QueueManager.register('get_task_queue',callable=return_task_queue)

									  QueueManager.register('get_result_queue',callable=return_result_queue)

									  #绑定端口5000，设置验证码‘abc'

									  manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#这里必须加上本地默认ip地址127.0.0.1

									  #启动Queue

									  manager.start()

									  #server = manager.get_server()

									  #server.serve_forever()

									  print('start server master')

									  #获得通过网络访问的Queue对象

									  task = manager.get_task_queue()

									  result = manager.get_result_queue()

									  #放几个任务进去

									  for i in range(10):

									    n = random.randint(0,10000)

									    print('put task %d...' % n)

									    task.put(n)

									  #从result队列读取结果

									  print('try get results...')

									  for i in range(10):

									    r = result.get(timeout=10)

									    print('result:%s' % r)

									  #关闭

									  manager.shutdown()

									  print('master exit')

									if __name__ == '__main__':

									  freeze_support()

									  test()

运行截图如下：

python3学习笔记之多进程分布式小例子

在分布式多进程环境下，添加任务到Queue不可以直接对原始的task_queue进行操作，那样就绕过了QueueManager的封装，必须通过manager.get_task_queue()获得的Queue接口添加。

任务进程,代码如下：

									#task_worker.py

									#coding=utf-8

									#多进程分布式例子

									#非服务端：worker

									import time,sys,queue

									from multiprocessing.managers import BaseManager

									#创建类似的QueueManager

									class QueueManager(BaseManager):

									  pass

									#由于这个QueueManager只从网络上获取Queue，所以注册时只提供名字即可

									QueueManager.register('get_task_queue')

									QueueManager.register('get_result_queue')

									#连接到服务器，也就是运行task_master.py的机器

									server_addr = '127.0.0.1'

									print('connect to server %s...'% server_addr)

									#端口和验证码注意要保持完全一致

									m = QueueManager(address=(server_addr,5000),authkey=b'abc')

									#从网络连接

									m.connect()

									#获取Queue的对象

									task = m.get_task_queue()

									result = m.get_result_queue()

									#从task队列获取任务，并把结果写入result队列

									for i in range(10):

									  try:

									    n = task.get(timeout=1)

									    print('run task %d * %d...'% (n,n))

									    r = '%d * %d = %d' % (n,n,n*n)

									    time.sleep(1)

									    result.put(r)

									  except queue.Empty:

									    print('task queue is empty')

									#处理结果

									print('worker exit')