Redis线程模型的原理分析_Redis

一、概述
二、网络io模型发展史
- 2.1 阻塞io
- 2.2 非阻塞
- 2.3 io多路复用
三、nio线程模型解释
- 3.1 单reactor单线程模型
- 3.2 单reactor多线程模型
- 3.3 多reactor多线程模型
四、redis的线程模型
- 4.1 概述
- 4.2 模型图
- 4.3 一次客户端和服务端的交互流程
- 4.4 模型优缺点
- 4.5 redis多线程模式
五、总结

一、概述

众所周知，redis是一个高性能的数据存储框架，在高并发的系统设计中，redis也是一个比较关键的组件，是我们提升系统性能的一大利器。深入去理解redis高性能的原理显得越发重要，当然redis的高性能设计是一个系统性的工程，涉及到很多内容，本文重点关注redis的io模型，以及基于io模型的线程模型。

我们从io的起源开始，讲述了阻塞io、非阻塞io、多路复用io。基于多路复用io，我们也梳理了几种不同的reactor模型，并分析了几种reactor模型的优缺点。基于reactor模型我们开始了redis的io模型和线程模型的分析，并总结出redis线程模型的优点、缺点，以及后续的redis多线程模型方案。本文的重点是对redis线程模型设计思想的梳理，捋顺了设计思想，就是一通百通的事了。

注：本文的代码都是伪代码，主要是为了示意，不可用于生产环境。

二、网络io模型发展史

我们常说的网络io模型，主要包含阻塞io、非阻塞io、多路复用io、信号驱动io、异步io，本文重点关注跟redis相关的内容，所以我们重点分析阻塞io、非阻塞io、多路复用io，帮助大家后续更好的理解redis网络模型。

我们先看下面这张图；

Redis线程模型的原理分析

2.1 阻塞io

我们经常说的阻塞io其实分为两种，一种是单线程阻塞，一种是多线程阻塞。这里面其实有两个概念，阻塞和线程。

阻塞：指调用结果返回之前，当前线程会被挂起，调用线程只有在得到结果之后才会返回；
线程：系统调用的线程个数。

像建立连接、读、写都涉及到系统调用，本身是一个阻塞的操作。

2.1.1 单线程阻塞

服务端单线程来处理，当客户端请求来临时，服务端用主线程来处理连接、读取、写入等操作。

以下用代码模拟了单线程的阻塞模式；

				?

									import java.net.socket;

									public class biotest {

									    public static void main(string[] args) throws ioexception {

									        serversocket server=new serversocket(8081);

									        while(true) {

									            socket socket=server.accept();

									            system.out.println("accept port:"+socket.getport());

									            bufferedreader  in=new bufferedreader(new inputstreamreader(socket.getinputstream()));

									            string indata=null;

									            try {

									                while ((indata = in.readline()) != null) {

									                    system.out.println("client port:"+socket.getport());

									                    system.out.println("input data:"+indata);

									                    if("close".equals(indata)) {

									                        socket.close();

									                    }

									                }

									            } catch (ioexception e) {

									                e.printstacktrace();

									            } finally {

									                try {

									                    socket.close();

									                } catch (ioexception e) {

									                    e.printstacktrace();

									                }

									            }      

									        }

									    }

									}

我们准备用两个客户端同时发起连接请求、来模拟单线程阻塞模式的现象。同时发起连接，通过服务端日志，我们发现此时服务端只接受了其中一个连接，主线程被阻塞在上一个连接的read方法上。

Redis线程模型的原理分析

我们尝试关闭第一个连接，看第二个连接的情况，我们希望看到的现象是，主线程返回，新的客户端连接被接受。

Redis线程模型的原理分析

从日志中发现，在第一个连接被关闭后，第二个连接的请求被处理了，也就是说第二个连接请求在排队，直到主线程被唤醒，才能接收下一个请求，符合我们的预期。

此时不仅要问，为什么呢？

主要原因在于accept、read、write三个函数都是阻塞的，主线程在系统调用的时候，线程是被阻塞的，其他客户端的连接无法被响应。

通过以上流程，我们很容易发现这个过程的缺陷，服务器每次只能处理一个连接请求，cpu没有得到充分利用，性能比较低。如何充分利用cpu的多核特性呢？自然而然的想到了——多线程逻辑。

2.1.2 多线程阻塞

对工程师而言，代码解释一切，直接上代码。

bio多线程

				?

									package net.io.bio;

									import java.io.bufferedreader;

									import java.io.ioexception;

									import java.io.inputstreamreader;

									import java.net.serversocket;

									import java.net.socket;

									public class biotest {

									    public static void main(string[] args) throws ioexception {

									        final serversocket server=new serversocket(8081);

									        while(true) {

									            new thread(new runnable() {

									                public void run() {

									                    socket socket=null;

									                    try {

									                        socket = server.accept();

									                        system.out.println("accept port:"+socket.getport());

									                        bufferedreader  in=new bufferedreader(new inputstreamreader(socket.getinputstream()));

									                        string indata=null;

									                        while ((indata = in.readline()) != null) {

									                            system.out.println("client port:"+socket.getport());

									                            system.out.println("input data:"+indata);

									                            if("close".equals(indata)) {

									                                socket.close();

									                            }

									                        }

									                    } catch (ioexception e) {

									                        e.printstacktrace();

									                    } finally {

									                    }

									                }

									            }).start();

									        }

									    }

									}

同样，我们并行发起两个请求；

Redis线程模型的原理分析

两个请求，都被接受，服务端新增两个线程来处理客户端的连接和后续请求。

Redis线程模型的原理分析

我们用多线程解决了，服务器同时只能处理一个请求的问题，但同时又带来了一个问题，如果客户端连接比较多时，服务端会创建大量的线程来处理请求，但线程本身是比较耗资源的，创建、上下文切换都比较耗资源，又如何去解决呢？

2.2 非阻塞

如果我们把所有的socket（文件句柄，后续用socket来代替fd的概念，尽量减少概念，减轻阅读负担）都放到队列里，只用一个线程来轮训所有的socket的状态，如果准备好了就把它拿出来，是不是就减少了服务端的线程数呢？

一起看下代码，单纯非阻塞模式，我们基本上不用，为了演示逻辑，我们模拟了相关代码如下；

				?

									package net.io.bio;

									import java.io.bufferedreader;

									import java.io.ioexception;

									import java.io.inputstreamreader;

									import java.net.serversocket;

									import java.net.socket;

									import java.net.sockettimeoutexception;

									import java.util.arraylist;

									import java.util.list;

									import org.apache.commons.collections4.collectionutils;

									public class niotest {

									    public static void main(string[] args) throws ioexception {

									        final serversocket server=new serversocket(8082);

									        server.setsotimeout(1000);

									        list<socket> sockets=new arraylist<socket>();

									        while (true) {

									            socket socket = null;

									            try {

									                socket = server.accept();

									                socket.setsotimeout(500);

									                sockets.add(socket);

									                system.out.println("accept client port:"+socket.getport());

									            } catch (sockettimeoutexception e) {

									                system.out.println("accept timeout");

									            }

									            //模拟非阻塞：轮询已连接的socket，每个socket等待10ms，有数据就处理，无数据就返回，继续轮询

									            if(collectionutils.isnotempty(sockets)) {

									                for(socket sockettemp:sockets ) {

									                    try {

									                        bufferedreader  in=new bufferedreader(new inputstreamreader(sockettemp.getinputstream()));

									                        string indata=null;

									                        while ((indata = in.readline()) != null) {

									                            system.out.println("input data client port:"+sockettemp.getport());

									                            system.out.println("input data client port:"+sockettemp.getport() +"data:"+indata);

									                            if("close".equals(indata)) {

									                                sockettemp.close();

									                            }

									                        }

									                    } catch (sockettimeoutexception e) {

									                        system.out.println("input client loop"+sockettemp.getport());

									                    }

									                }

									            }

									        }

									    }

									}

系统初始化，等待连接；

Redis线程模型的原理分析

发起两个客户端连接，线程开始轮询两个连接中是否有数据。

Redis线程模型的原理分析

两个连接分别输入数据后，轮询线程发现有数据准备好了，开始相关的逻辑处理（单线程、多线程都可）。

Redis线程模型的原理分析

再用一张流程图辅助解释下（系统实际采用文件句柄，此时用socket来代替，方便大家理解）。

Redis线程模型的原理分析

服务端专门有一个线程来负责轮询所有的socket，来确认操作系统是否完成了相关事件，如果有则返回处理，如果无继续轮询，大家一起来思考下？此时又带来了什么问题呢。

cpu的空转、系统调用（每次轮询到涉及到一次系统调用，通过内核命令来确认数据是否准备好），造成资源的浪费，那有没有一种机制，来解决这个问题呢？

2.3 io多路复用

server端有没专门的线程来做轮询操作（应用程序端非内核），而是由事件来触发，当有相关读、写、连接事件到来时，主动唤起服务端线程来进行相关逻辑处理。模拟了相关代码如下；

io多路复用

				?

									import java.net.inetsocketaddress;

									import java.nio.bytebuffer;

									import java.nio.channels.selectionkey;

									import java.nio.channels.selector;

									import java.nio.channels.serversocketchannel;

									import java.nio.channels.socketchannel;

									import java.nio.charset.charset;

									import java.util.iterator;

									import java.util.set;

									public class nioserver {

									    private static  charset charset = charset.forname("utf-8");

									    public static void main(string[] args) {

									        try {

									            selector selector = selector.open();

									            serversocketchannel chanel = serversocketchannel.open();

									            chanel.bind(new inetsocketaddress(8083));

									            chanel.configureblocking(false);

									            chanel.register(selector, selectionkey.op_accept);

									            while (true){

									                int select = selector.select();

									                if(select == 0){

									                    system.out.println("select loop");

									                    continue;

									                }

									                system.out.println("os data ok");

									                set<selectionkey> selectionkeys = selector.selectedkeys();

									                iterator<selectionkey> iterator = selectionkeys.iterator();

									                while (iterator.hasnext()){

									                    selectionkey selectionkey = iterator.next();

									                    if(selectionkey.isacceptable()){

									                        serversocketchannel server = (serversocketchannel)selectionkey.channel();

									                        socketchannel client = server.accept();

									                        client.configureblocking(false);

									                        client.register(selector, selectionkey.op_read);

									                        //继续可以接收连接事件

									                        selectionkey.interestops(selectionkey.op_accept);

									                    }else if(selectionkey.isreadable()){

									                        //得到socketchannel

									                        socketchannel client = (socketchannel)selectionkey.channel();

									                        //定义缓冲区

									                        bytebuffer buffer = bytebuffer.allocate(1024);

									                        stringbuilder content = new stringbuilder();

									                        while (client.read(buffer) > 0){

									                            buffer.flip();

									                            content.append(charset.decode(buffer));

									                        }

									                        system.out.println("client port:"+client.getremoteaddress().tostring()+",input data: "+content.tostring());

									                        //清空缓冲区

									                        buffer.clear();

									                    }

									                    iterator.remove();

									                }

									            }

									        } catch (exception e) {

									            e.printstacktrace();

									        }

									    }

									}

同时创建两个连接；

Redis线程模型的原理分析

两个连接无阻塞的被创建；

Redis线程模型的原理分析

无阻塞的接收读写；

Redis线程模型的原理分析

再用一张流程图辅助解释下（系统实际采用文件句柄，此时用socket来代替，方便大家理解）。

Redis线程模型的原理分析

当然操作系统的多路复用有好几种实现方式，我们经常使用的select()，epoll模式这里不做过多的解释，有兴趣的可以查看相关文档，io的发展后面还有异步、事件等模式，我们在这里不过多的赘述，我们更多的是为了解释redis线程模式的发展。

三、nio线程模型解释

我们一起来聊了阻塞、非阻塞、io多路复用模式，那redis采用的是哪种呢？

redis采用的是io多路复用模式，所以我们重点来了解下多路复用这种模式，如何在更好的落地到我们系统中，不可避免的我们要聊下reactor模式。

首先我们做下相关的名词解释；

reactor：类似nio编程中的selector，负责i/o事件的派发；

acceptor：nio中接收到事件后，处理连接的那个分支逻辑；

handler：消息读写处理等操作类。

3.1 单reactor单线程模型

Redis线程模型的原理分析

处理流程

reactor监听连接事件、socket事件，当有连接事件过来时交给acceptor处理，当有socket事件过来时交个对应的handler处理。

优点

模型比较简单，所有的处理过程都在一个连接里；
实现上比较容易，模块功能也比较解耦，reactor负责多路复用和事件分发处理，acceptor负责连接事件处理，handler负责scoket读写事件处理。

缺点

只有一个线程，连接处理和业务处理共用一个线程，无法充分利用cpu多核的优势。
在流量不是特别大、业务处理比较快的时候系统可以有很好的表现，当流量比较大、读写事件比较耗时情况下，容易导致系统出现性能瓶颈。

怎么去解决上述问题呢？既然业务处理逻辑可能会影响系统瓶颈，那我们是不是可以把业务处理逻辑单拎出来，交给线程池来处理，一方面减小对主线程的影响，另一方面利用cpu多核的优势。这一点希望大家要理解透彻，方便我们后续理解redis由单线程模型到多线程模型的设计的思路。

3.2 单reactor多线程模型

Redis线程模型的原理分析

这种模型相对单reactor单线程模型，只是将业务逻辑的处理逻辑交给了一个线程池来处理。

处理流程

reactor监听连接事件、socket事件，当有连接事件过来时交给acceptor处理，当有socket事件过来时交个对应的handler处理。
handler完成读事件后，包装成一个任务对象，交给线程池来处理，把业务处理逻辑交给其他线程来处理。

优点

让主线程专注于通用事件的处理（连接、读、写），从设计上进一步解耦；
利用cpu多核的优势。

缺点

貌似这种模型已经很完美了，我们再思考下，如果客户端很多、流量特别大的时候，通用事件的处理（读、写）也可能会成为主线程的瓶颈，因为每次读、写操作都涉及系统调用。

有没有什么好的办法来解决上述问题呢？通过以上的分析，大家有没有发现一个现象，当某一个点成为系统瓶颈点时，想办法把他拿出来，交个其他线程来处理，那这种场景是否适用呢？

3.3 多reactor多线程模型

Redis线程模型的原理分析

这种模型相对单reactor多线程模型，只是将scoket的读写处理从mainreactor中拎出来，交给subreactor线程来处理。

处理流程

mainreactor主线程负责连接事件的监听和处理，当acceptor处理完连接过程后，主线程将连接分配给subreactor；
subreactor负责mainreactor分配过来的socket的监听和处理，当有socket事件过来时交个对应的handler处理；

handler完成读事件后，包装成一个任务对象，交给线程池来处理，把业务处理逻辑交给其他线程来处理。

优点

让主线程专注于连接事件的处理，子线程专注于读写事件吹，从设计上进一步解耦；
利用cpu多核的优势。

缺点

实现上会比较复杂，在极度追求单机性能的场景中可以考虑使用。

四、redis的线程模型

4.1 概述

以上我们聊了，io网路模型的发展历史，也聊了io多路复用的reactor模式。那redis采用的是哪种reactor模式呢？在回答这个问题前，我们先梳理几个概念性的问题。

redis服务器中有两类事件，文件事件和时间事件。

文件事件：在这里可以把文件理解为socket相关的事件，比如连接、读、写等；
时间时间：可以理解为定时任务事件，比如一些定期的rdb持久化操作。

本文重点聊下socket相关的事件。

4.2 模型图

首先我们来看下redis服务的线程模型图；

Redis线程模型的原理分析

io多路复用负责各事件的监听（连接、读、写等），当有事件发生时，将对应事件放入队列中，由事件分发器根据事件类型来进行分发；

如果是连接事件，则分发至连接应答处理器；get、set等redis命令分发至命令请求处理器。

命令处理完后产生命令回复事件，再由事件队列，到事件分发器，到命令回复处理器，回复客户端响应。

4.3 一次客户端和服务端的交互流程

4.3.1 连接流程

Redis线程模型的原理分析

连接过程

redis服务端主线程监听固定端口，并将连接事件绑定连接应答处理器。
客户端发起连接后，连接事件被触发，io多路复用程序将连接事件包装好后丢人事件队列，然后由事件分发处理器分发给连接应答处理器。
连接应答处理器创建client对象以及socket对象，我们这里关注socket对象，并产生ae_readable事件，和命令处理器关联，标识后续该socket对可读事件感兴趣，也就是开始接收客户端的命令操作。
当前过程都是由一个主线程负责处理。

4.3.2 命令执行流程

Redis线程模型的原理分析