前言
Java中的ThreadPoolExecutor类
- 构造方法
  - 构造方法参数含义
    - corePoolSize：线程池核心线程数大小
    - maximumPoolSize：线程池最大线程数
    - keepAliveTime：空闲线程存活时间
    - unit：空闲线程存活时间单位
    - workQueue：任务等待队列
    - threadFactory：线程工厂
    - handler：表示当拒绝处理任务时的策略
- 源码解析
深入剖析线程池的实现原理
- 线程池状态
- 任务的执行
  - 任务执行的生命周期
    - execute()方法
    - addWorker()方法

前言

如果并发的线程数量很多，并且每个线程都是执行一个时间很短的任务就结束了，这样频繁创建线程就会大大降低系统的效率，因为频繁创建线程和销毁线程需要时间。

那么有没有一种办法使得线程可以复用，就是执行完一个任务，并不被销毁，而是可以继续执行其他的任务？

在Java中可以通过线程池来达到这样的效果。今天我们就来详细讲解一下Java的线程池，首先我们从最核心的ThreadPoolExecutor类中的方法讲起，然后再讲述它的实现原理，接着给出了它的使用示例，最后讨论了一下如何合理配置线程池的大小。

Java中的ThreadPoolExecutor类

java.uitl.concurrent.ThreadPoolExecutor类是线程池中最核心的一个类，因此如果要透彻地了解Java中的线程池，必须先了解这个类。下面我们来看一下ThreadPoolExecutor类的具体实现源码。

构造方法

 
            public  
            class  
            ThreadPoolExecutor  
            extends  
            AbstractExecutorService { 
           
            ........ 
           
            public  
            ThreadPoolExecutor( 
            int  
            corePoolSize,  
            int  
            maximumPoolSize,  
            long  
            keepAliveTime, TimeUnit unit, BlockingQueue workQueue); 
           
            public  
            ThreadPoolExecutor( 
            int  
            corePoolSize,  
            int  
            maximumPoolSize,  
            long  
            keepAliveTime, TimeUnit unit, BlockingQueue workQueue, ThreadFactory threadFactory); 
           
            public  
            ThreadPoolExecutor( 
            int  
            corePoolSize,  
            int  
            maximumPoolSize,  
            long  
            keepAliveTime, TimeUnit unit, BlockingQueue workQueue, RejectedExecutionHandler handler); 
           
            public  
            ThreadPoolExecutor( 
            int  
            corePoolSize,  
            int  
            maximumPoolSize,  
            long  
            keepAliveTime, TimeUnit unit, BlockingQueue workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler); 
           
            ........ 
           
            }

从上面的源码中我们可以看到，ThreadPoolExecutor是继承于AbstractExecutorService类，并提供了四个构造器，事实上，前三个构造器都是通过第四个构造器进行初始化工作的。

构造方法参数含义

corePoolSize：线程池核心线程数大小

这个参数与后面讲述的线程池工作原理有很大的关系。在创建了线程池之后，默认是没有任何线程的，而是等待有任务到来时才会创建线程去执行任务，除非调用 prestartAllCoreThreads() 或者 prestartCoreThread() 方法时，会创建全部或者一个核心线程。在默认情况下，当有任务到来时，创建工作线程去执行任务，当线程池中的线程数目到达corePoolSize时，就会把提交的任务放到等待队列中。

maximumPoolSize：线程池最大线程数

它标识线程池中最大可创建的多少个线程

keepAliveTime：空闲线程存活时间

这个参数只有线程池中的线程数达到corePoolSize时才会起效，直到线程池中的线程数小于等于corePoolSize。如果调用allowCoreThreadTimeOut(boolean value)方法，则当线程池中的线程数小于等于corePoolSize，keepAliveTime参数也会起作用，直到线程池中的线程数为0

unit：空闲线程存活时间单位

该参数的值是TimeUnit的7个静态属性：

 
            TimeUnit.DAYS;                
            //天 
           
            TimeUnit.HOURS;              
            //小时 
           
            TimeUnit.MINUTES;            
            //分钟 
           
            TimeUnit.SECONDS;            
            //秒 
           
            TimeUnit.MILLISECONDS;       
            //毫秒 
           
            TimeUnit.MICROSECONDS;       
            //微妙 
           
            TimeUnit.NANOSECONDS;        
            //纳秒

workQueue：任务等待队列

一个阻塞队列，用来存储等待执行的任务。这个参数非常重要，会对线程池的运行产生很大的影响。一般来说，阻塞队列有如下几种选择：

 
            ArrayBlockingQueue; 
           
            LinkedBlockingQueue; 
           
            SynchronousQueue;

ArrayBlockingQueue和PriorityBlockingQueue使用较少，一般使用LinkedBlockingQueue和Synchronous。线程池的排队策略与BlockingQueue有关。

threadFactory：线程工厂

主要用来创建线程

handler：表示当拒绝处理任务时的策略

有以下四种取值：

 
            ThreadPoolExecutor.AbortPolicy:丢弃任务并抛出RejectedExecutionException异常。 
           
            ThreadPoolExecutor.DiscardPolicy：也是丢弃任务，但是不抛出异常。 
           
            ThreadPoolExecutor.DiscardOldestPolicy：丢弃队列最前面的任务，然后重新尝试执行任务（重复此过程） 
           
            ThreadPoolExecutor.CallerRunsPolicy：由调用线程处理该任务

源码解析

从上面给出的ThreadPoolExecutor类的代码可以知道，ThreadPoolExecutor继承了AbstractExecutorService，我们来看一下AbstractExecutorService的实现：

 
            public  
            abstract  
            class  
            AbstractExecutorService  
            implements  
            ExecutorService { 
           
            protected  
             RunnableFuture newTaskFor(Runnable runnable, T value) { }; 
           
            protected  
             RunnableFuture newTaskFor(Callable callable) { }; 
           
            public  
            Future submit(Runnable task) {}; 
           
            public  
             Future submit(Runnable task, T result) { }; 
           
            public  
             Future submit(Callable task) { }; 
           
            private  
             T doInvokeAny(Collection 
            extends  
            Callable> tasks, 
           
            boolean  
            timed,  
            long  
            nanos) 
           
            throws  
            InterruptedException, ExecutionException, TimeoutException { 
           
            }; 
           
            public  
             T invokeAny(Collection 
            extends  
            Callable> tasks) 
           
            throws  
            InterruptedException, ExecutionException { 
           
            }; 
           
            public  
             T invokeAny(Collection 
            extends  
            Callable> tasks, 
           
            long  
            timeout, TimeUnit unit) 
           
            throws  
            InterruptedException, ExecutionException, TimeoutException { 
           
            }; 
           
            public  
             List> invokeAll(Collection 
            extends  
            Callable> tasks) 
           
            throws  
            InterruptedException { 
           
            }; 
           
            public  
             List> invokeAll(Collection 
            extends  
            Callable> tasks, 
           
            long  
            timeout, TimeUnit unit) 
           
            throws  
            InterruptedException { 
           
            }; 
           
            }

AbstractExecutorService是一个抽象类，它实现了ExecutorService接口。

 
            public  
            interface  
            ExecutorService  
            extends  
            Executor { 
           
            // 关闭线程池，队列中已经存在的任务还可以被继续执行 
           
            void  
            shutdown(); 
           
            // 关闭线程池，中断正在执行的任务 
           
            List shutdownNow(); 
           
            // 判断线程池是否关闭 
           
            boolean  
            isShutdown(); 
           
            // 判断线程池是否终止 
           
            boolean  
            isTerminated(); 
           
            // 设置超时终止 
           
            boolean  
            awaitTermination( 
            long  
            timeout, TimeUnit unit)  
            throws  
            InterruptedException; 
           
            // 提交Callable任务 
           
             Future submit(Callable task); 
           
            // 提交Runnable任务，并带返回值 
           
             Future submit(Runnable task, T result); 
           
            // 提交Runnable任务，不带返回值 
           
            Future submit(Runnable task); 
           
            // invokeAll是同步的，需要等待其他任务完成才会返回结果。而Submit是异步的 
           
             List> invokeAll(Collection 
            extends  
            Callable> tasks)  
            throws  
            InterruptedException; 
           
             List> invokeAll(Collection 
            extends  
            Callable> tasks,  
            long  
            timeout, TimeUnit unit)  
            throws  
            InterruptedException; 
           
            // invokeAny是取第一个任务的返回值，并中断其他任务 
           
             T invokeAny(Collection 
            extends  
            Callable> tasks)  
            throws  
            InterruptedException, ExecutionException; 
           
             T invokeAny(Collection 
            extends  
            Callable> tasks,  
            long  
            timeout, TimeUnit unit)  
            throws  
            InterruptedException, ExecutionException, TimeoutException; 
           
            }

而ExecutorService又是继承了Executor接口，我们看一下Executor接口的实现：

 
            public  
            interface  
            Executor { 
           
            // 启动任务 
           
            void  
            execute(Runnable command); 
           
            }

到这里，我们应该可以看到ThreadPoolExecutor、AbstractExecutorService、ExecutorService和Executor几个之间的关系了。

Executor是一个顶层接口，它只声明了一个execute(Runnable)方法，返回值是void，参数是Runnable，从字面意思可以理解，这个是用来执行传入的线程任务的。

然后ExecutorService接口继承了Executor接口，并声明了一些方法：submit、invokeAll、invokeAny以及shutDown等；

抽象类AbstractExecutorService实现了ExecutorService接口，基本实现了ExecutorService中声明的所有方法；

然后ThreadPoolExecutor继承了类AbstractExecutorService。整体类图如下：

在ThreadPoolExecutor类中有几个非常重要的方法：

 
            // Executor中声明的方法，在ThreadPoolExecutor进行了具体的实现，这个方法是ThreadPoolExecutor的核心方法，通过这个方法可以向线程池提交一个任务，交由线程池去执行 
           
            execute() 
           
            // ExecutorService中声明的方法，在AbstractExecutorService就已经有了具体的实现，在ThreadPoolExecutor中并没有对其进行重写，这个方法也是用来向线程池提交任务的，但是它和execute()方法不同，它能够返回任务执行的结果，去看submit()方法的实现，会发现它实际上还是调用的execute()方法，只不过它利用了Future来获取任务执行结果 
           
            submit() 
           
            // 关闭线程池，会在线程池中的线程执行完成后关闭，执行完该方法后，不再接受新的任务 
           
            shutdown() 
           
            // 立即关闭线程池 
           
            shutdownNow()

深入剖析线程池的实现原理

线程池状态

在ThreadPoolExecutor中定义了几个static final变量表示线程池的各个状态：

 
            // 线程池使用一个int来存储线程池当前的状态和工作线程数 
           
            // int是4字节，32位，用高三位存储线程池的工作状态，低29位存储线程池的工作线程数 
           
            // 为什么这样？节省空间，一个int可以表述两个含义 
           
            private  
            final  
            AtomicInteger ctl =  
            new  
            AtomicInteger(ctlOf(RUNNING,  
            0 
            )); 
           
            // 29 
           
            private  
            static  
            final  
            int  
            COUNT_BITS = Integer.SIZE -  
            3 
            ; 
           
            // 创建线程池后，初始时的线程池状态 
           
            private  
            static  
            final  
            int  
            RUNNING    = - 
            1  
            << COUNT_BITS; 
           
            // 调用了shutdown()方法后，线程池状态。此时线程池不再接受新任务，它会等待所有任务执行完毕 
           
            private  
            static  
            final  
            int  
            SHUTDOWN   =   
            0  
            << COUNT_BITS; 
           
            // 调用了shotdownNow()方法后，线程池状态。此时线程池不再接收新任务，并尝试主动终止正在执行的任务 
           
            private  
            static  
            final  
            int  
            STOP       =   
            1  
            << COUNT_BITS; 
           
            // 临时过渡状态，所有任务都执行完了，当线程池的有效线程数为0时，这个时候为该状态。执行terminated()方法，流转下一个状态 
           
            private  
            static  
            final  
            int  
            TIDYING    =   
            2  
            << COUNT_BITS; 
           
            // 终止状态，terminated()方法完成后的状态 
           
            private  
            static  
            final  
            int  
            TERMINATED =   
            3  
            << COUNT_BITS;

任务的执行

在了解任务提交到线程池到任务执行完成的整个过程前，我们先来看下ThreadPoolExecutor中比较重要的成员变量：

 
            // 任务缓存队列，用来存放等待执行的任务 
           
            private  
            final  
            BlockingQueue workQueue; 
           
            // 线程池的主要状态锁，对线程池的状态及属性的变化，都要依赖这个锁来保证同步 
           
            private  
            final  
            ReentrantLock mainLock =  
            new  
            ReentrantLock(); 
           
            // 用来存放工作集 
           
            private  
            final  
            HashSet workers =  
            new  
            HashSet();  
           
            // 线程空闲时间 
           
            private  
            volatile  
            long  
            keepAliveTime; 
           
            // 是否允许为核心线程设置存活时间 
           
            private  
            volatile  
            boolean  
            allowCoreThreadTimeOut;   
           
            // 核心池的大小（即线程池中的线程数目大于这个参数时，提交的任务会被放进任务缓存队列） 
           
            private  
            volatile  
            int    
            corePoolSize; 
           
            // 线程池最大能容忍的线程数 
           
            private  
            volatile  
            int    
            maximumPoolSize; 
           
            // 当前线程池的线程数 
           
            private  
            volatile  
            int    
            poolSize; 
           
            // 线程池的拒绝策略 
           
            private  
            volatile  
            RejectedExecutionHandler handler; 
           
            // 线程工厂，用来创建线程 
           
            private  
            volatile  
            ThreadFactory threadFactory;  
           
            // 用来记录线程池中曾经出现过的最大线程数 
           
            private  
            int  
            largestPoolSize; 
           
            // 用来记录已经执行完毕的任务个数  
           
            private  
            long  
            completedTaskCount;

每个变量的作用都已经标明出来了，这里要重点解释一下corePoolSize、maximumPoolSize、largestPoolSize三个变量。

corePoolSize在很多地方都被翻译成核心线程数量，但是我的理解是这个值就是线程池的大小。举个例子：假如一个工厂有10个工人，当有人空闲的时候，就分配任务给一个工人。如果10个工人都在忙碌，就把任务置放在等待队列。如果任务繁多，就招临时工进行工作（maximumPoolSize）。当任务增长缓和，就辞退临时工，只保持10个工人。不过为了保持认知的一致性，本文还是继续将corePoolSize解释为核心线程数。

largestPoolSize只是一个用来记录的变量，和线程池的容量没有关系。

任务执行的生命周期

在ThreadPoolExecutor类中，最核心的任务提交方法是execute()方法，虽然通过submit也可以提交任务，但是实际上submit方法里面最终调用的还是execute()方法，所以我们只需要研究execute()方法的实现原理即可。

execute()方法

 
            public  
            void  
            execute(Runnable command) { 
           
            // 判断提交的任务是否为空 
           
            if  
            (command ==  
            null 
            ) 
           
            throw  
            new  
            NullPointerException(); 
           
            // 获取线程池状态和工作线程数量结合体(下文统称为ctl) 
           
            int  
            c = ctl.get(); 
           
            // 判断工作线程数量是否小于核心线程数 
           
            if  
            (workerCountOf(c) < corePoolSize) { 
           
            // 把任务添加Worker，添加成功则返回 
           
            if  
            (addWorker(command,  
            true 
            )) 
           
            return 
            ; 
           
            // 添加失败，再次获取ctl 
           
            c = ctl.get(); 
           
            } 
           
            // 如果线程池的状态是运行中，并且向等待队列提交成功 
           
            if  
            (isRunning(c) && workQueue.offer(command)) { 
           
            // double-check机制，如果线程池已经不是running状态，就要把提交的任务移除并拒绝 
           
            int  
            recheck = ctl.get(); 
           
            if  
            (! isRunning(recheck) && remove(command)) 
           
            reject(command); 
           
            else  
            if  
            (workerCountOf(recheck) ==  
            0 
            ) 
           
            // 如果核心线程都超时退出，因为任务已经放入队列，所以不需要再提交一个任务，同时创建一个线程并启动 
           
            addWorker( 
            null 
            ,  
            false 
            ); 
           
            } 
           
            // 执行到这里有两种情况 
           
            // 1. 线程池已经不是RUNNING状态  2.等待队列的长度已经超过定义 
           
            else  
            if  
            (!addWorker(command,  
            false 
            )) 
           
            reject(command); 
           
            }

addWorker()方法

 
            private  
            boolean  
            addWorker(Runnable firstTask,  
            boolean  
            core) { 
           
            retry: 
           
            for  
            (;;) { 
           
            int  
            c = ctl.get(); 
           
            // 获取线程池运行状态 
           
            int  
            rs = runStateOf(c); 
           
            // Check if queue empty only if necessary. 
           
            // 如果线程池的状态是：STOP TYDING TERMINATD状态，直接返回false，任务添加失败 
           
            // 如果线程池的状态为SHUTDOWN 同时first！=null 或者 workQueue为空，任务添加失败。此时代表：线程池已经停止，正在等待仅有的一个任务执行完成 
           
            // 为什么要做两次判断？有可能任务是在线程池RUNNING状态的时候将任务到队列中，但是放入完成后状态变为SHUTDOWN，此时不应该再执行新的任务 
           
            if  
            (rs >= SHUTDOWN && 
           
            ! (rs == SHUTDOWN && 
           
            firstTask ==  
            null  
            && 
           
            ! workQueue.isEmpty())) 
           
            return  
            false 
            ; 
           
            for  
            (;;) { 
           
            int  
            wc = workerCountOf(c); 
           
            if  
            (wc >= CAPACITY || 
           
            wc >= (core ? corePoolSize : maximumPoolSize)) 
           
            return  
            false 
            ; 
           
            if  
            (compareAndIncrementWorkerCount(c)) 
           
            break  
            retry; 
           
            c = ctl.get();   
            // Re-read ctl 
           
            if  
            (runStateOf(c) != rs) 
           
            continue  
            retry; 
           
            // else CAS failed due to workerCount change; retry inner loop 
           
            } 
           
            } 
           
            boolean  
            workerStarted =  
            false 
            ; 
           
            boolean  
            workerAdded =  
            false 
            ; 
           
            Worker w =  
            null 
            ; 
           
            try  
            { 
           
            w =  
            new  
            Worker(firstTask); 
           
            final  
            Thread t = w.thread; 
           
            if  
            (t !=  
            null 
            ) { 
           
            final  
            ReentrantLock mainLock =  
            this 
            .mainLock; 
           
            mainLock.lock(); 
           
            try  
            { 
           
            // Recheck while holding lock. 
           
            // Back out on ThreadFactory failure or if 
           
            // shut down before lock acquired. 
           
            int  
            rs = runStateOf(ctl.get()); 
           
            if  
            (rs < SHUTDOWN || 
           
            (rs == SHUTDOWN && firstTask ==  
            null 
            )) { 
           
            if  
            (t.isAlive())  
            // precheck that t is startable 
           
            throw  
            new  
            IllegalThreadStateException(); 
           
            workers.add(w); 
           
            int  
            s = workers.size(); 
           
            if  
            (s > largestPoolSize) 
           
            largestPoolSize = s; 
           
            workerAdded =  
            true 
            ; 
           
            } 
           
            }  
            finally  
            { 
           
            mainLock.unlock(); 
           
            } 
           
            if  
            (workerAdded) { 
           
            t.start(); 
           
            workerStarted =  
            true 
            ; 
           
            } 
           
            } 
           
            }  
            finally  
            { 
           
            if  
            (! workerStarted) 
           
            addWorkerFailed(w); 
           
            } 
           
            return  
            workerStarted; 
           
            }

线程池

前言