艽野尘梦better

时间序列分析：ARIMA 模型（Python实践）

全文共 25000 余字，预计阅读时间约 50~83.33 分钟 | 满满干货，建议收藏！

这里写目录标题

- 1. ARIMA 模型的由来
- 2. ARIMA 模型的基本概念
- - 2.1 ARIMA 模型的基本思想
  - 2.2 ARIMA 模型的数学表达式
- 3. 差分过程（I）的详解
- - 3.1 什么是差分
  - 3.2 差分的阶数
  - 3.3 什么是滞后
  - 3.4 滞后差分（多步差分）
  - 3.5 使用差分消除数据波动
  - 3.6 概念总结
- 4. ARIMA(p,d,q) 模型的参数选择
- - 4.1 p 和 q 到底是什么
  - 4.2 d 到底是什么
- 5. ACF 与 PACF
- - 5.1 时序数据的平稳性
  - 5.2 自相关函数 ACF (Auto-Correlation Function)
  - 5.3 偏自相关函数（Partial Auto-correlation Function， PACF）
  - 5.4 ACF 和 PACF 计算示例
  - 5.5 ACF 和 PACF 的图形解读
- 6 实践中如何选择超参数 p、q 和 d
- - 6.1 不同的 p、d 和 q 能决定模型类型
  - 6.2 超参数 p 的确定
  - 6.3 超参数 q 的确定
  - 6.4 一般情况下如何确定 p 和 q
- 7. 评估指标
- - 7.1 赤池信息准则（Akaike Information Criterion，AIC）
  - 7.2 贝叶斯信息准则（Bayesian Information Criterion，BIC）
- 8. 总结

1. ARIMA 模型的由来

首先，我们要了解为什么需要把 AR 模型和 MA 模型合并为 ARIMA 模型。这就需要我们从这两种模型的优缺点出发。

AR 模型，即自回归模型，其优势是对于具有较长历史趋势的数据，AR 模型可以捕获这些趋势，并据此进行预测。但是 AR 模型不能很好地处理某些类型的时间序列数据，例如那些有临时、突发的变化或者噪声较大的数据。AR 模型相信 “历史决定未来”，因此很大程度上忽略了现实情况的复杂性、也忽略了真正影响标签的因子带来的不可预料的影响。

相反地，MA 模型，即移动平均模型，可以更好地处理那些有临时、突发的变化或者噪声较大的时间序列数据。但是对于具有较长历史趋势的数据，MA 模型可能无法像 AR 模型那样捕捉到这些趋势。MA 模型相信 “时间序列是相对稳定的，时间序列的波动是由偶然因素影响决定的”，但现实中的时间序列很难一直维持“稳定” 这一假设。

基于以上两个模型的优缺点，我们引入了 ARIMA 模型，这是一种结合了 AR 模型和 MA 模型优点的模型，可以处理更复杂的时间序列问题。

2. ARIMA 模型的基本概念

2.1 ARIMA 模型的基本思想

ARIMA 模型全称为自回归差分移动平均模型（Autoregressive Integrated Moving Average Model）。ARIMA 模型主要由三部分构成，分别为自回归模型（AR）、差分过程（I）和移动平均模型（MA）。

ARIMA 模型的基本思想是利用数据本身的历史信息来预测未来。一个时间点上的标签值既受过去一段时间内的标签值影响，也受过去一段时间内的偶然事件的影响，这就是说，ARIMA 模型假设：标签值是围绕着时间的大趋势而波动的，其中趋势是受历史标签影响构成的，波动是受一段时间内的偶然事件影响构成的，且大趋势本身不一定是稳定的

简而言之，ARIMA 模型就是试图通过数据的自相关性和差分的方式，提取出隐藏在数据背后的时间序列模式，然后用这些模式来预测未来的数据。其中：

1、AR 部分用于处理时间序列的自回归部分，它考虑了过去若干时期的观测值对当前值的影响。

2、I 部分用于使非平稳时间序列达到平稳，通过一阶或者二阶等差分处理，消除了时间序列中的趋势和季节性因素。

3、MA 部分用于处理时间序列的移动平均部分，它考虑了过去的预测误差对当前值的影响。

结合这三部分，ARIMA 模型既可以捕捉到数据的趋势变化，又可以处理那些有临时、突发的变化或者噪声较大的数据。所以，ARIMA 模型在很多时间序列预测问题中都有很好的表现。

2.2 ARIMA 模型的数学表达式

先回顾一下 AR 和 MA 模型的数学表达式：

：

$AR：Y_t = c + φ_1Y_{t-1} + φ_2Y_{t-2} + ... + φ_pY_{t-p} + \xi_t \tag{1}$

$MA：Y_t = \mu + \epsilon_t + \theta_1\epsilon_{t-1} + \theta_2\epsilon_{t-2} + \cdots + \theta_q\epsilon_{t-q} \tag{2}$

如果我们暂时不考虑差分（即假设 d=0），那么 ARIMA 模型可以被看作是 AR 模型和 MA 模型的直接结合，形式上看，ARIMA 模型的公式可以表示为：

$Y_t = c + φ_1Y_{t-1} + φ_2Y_{t-2} + ... + φ_pY_{t-p} + θ_1\epsilon_{t-1} + θ_2\epsilon_{t-2} + ... + θ_q\epsilon_{t-q} + \epsilon_t \tag{3}$

在这个公式中：

$Y_t$ Y_t 是我们正在考虑的时间序列数据。
到 $φ_1到φ_p$ 是 AR 模型的参数，这些参数用来描述当前值与过去 p 个时间点值之间的关系。
到 $θ_1到θ_q$ 是 MA 模型的参数，这些参数用来描述当前值与过去 q 个时间点的误差之间的关系。
是 $ε_t是$ 是在 t 时间点的误差项。
c 是一个常数项。

这个公式基本上是将 AR 模型和 MA 模型的公式组合在一起：

1、AR 部分（即 $φ_1Y_{t-1} + φ_2Y_{t-2} + ... + φ_pY_{t-p}$ 表示当前值 $Y_t$ 与它过去的值有关，这个部分的形式与 AR 模型的公式一致。

2、MA 部分（即 $θ_1\epsilon_{t-1} + θ_2\epsilon_{t-2} + ... + θ_q\epsilon_{t-q}$ 表示当前值 $Y_t$ 与它过去的误差项有关，这个部分的形式与 MA 模型的公式一致。

值得注意的是，MA 模型中代表长期趋势的均值 $\mu$ 并不存在于 ARIMA 模型的公式当中，因为 ARIMA 模型中 “预测长期趋势” 这部分功能由 AR 模型来执行，因此 AR 模型替代了原本的 $\mu$ 。在 ARIMA 模型中，c 可以为 0。

另外，这个公式的基础是假设我们正在处理的时间序列是平稳的，这样我们可以直接应用 AR 和 MA 模型。如果时间序列是非平稳的，那么我们就需要考虑 ARIMA 模型中的 I 部分，也就是进行差分处理。

上述模型被称之为 ARIMA(p,d,q) 模型，其中 p 和 q 的含义与原始 MA、AR 模型中完全一致，且 p 和 q 可以被设置为不同的数值，而 d 是 ARIMA 模型需要的差分的阶数，下面要重点讲解的参数，请继续往下看。

3. 差分过程（I）的详解

3.1 什么是差分

差分是一种数学操作，用于计算一组数值序列中相邻数据点的差值。在时间序列分析中，差分常用于将非平稳序列转化为平稳序列，也就是减小或消除时间序列的趋势和季节性变化。

当我们对一个序列进行差分运算，就意味着我们会计算该序列中的不同观测值之间的差异

简单地说，如果我们有一个时间序列 ${Y_t}$ ，那么该序列的一阶差分就可以定义为：

$\Delta Y_t = Y_t - Y_{t-1} \tag{4}$

这样，我们得到一个新的时间序列，其每一个值都是原时间序列中相邻两个值的差。

让我们以一个简单的例子来具体理解理解差分操作：

假设我们有以下一组时间序列数据：

$\tag{5}$

我们可以看到，这个序列的长度是 6。现在，我们希望对这个序列进行一阶差分。

第一步，我们计算第二个数据点和第一个数据点的差，也就是 8-4=4。

第二步，我们计算第三个数据点和第二个数据点的差，也就是 6-8=-2。

依次类推，我们计算出所有相邻数据点之间的差值，得到一个新的序列：

$\Delta Y = {4, -2, -1, -2, 1} \tag{6}$

我们可以看到，差分后的序列比原序列短了一位，因为差分操作实际上计算的是原序列中的相邻数据点之间的差值。同时，差分后的序列相比于原序列，其趋势和季节性变化都得到了一定程度的消除。通常进行一次差分运算，原始的序列会变短 1 个单位。

在实际进行差分运算时，我们可以改变差分运算的两个相关因子来执行不同的差分：一个是差分的阶数（order），另一个是差分的滞后（lag）。

3.2 差分的阶数

在上一节，我们介绍了一阶差分。然而，实际上，差分的阶数可以是任何正整数。差分的阶数就是我们需要进行多少次差分操作才能得到一个平稳序列。

具体地说，二阶差分就是对一阶差分后的序列再次进行差分。如果我们有一个时间序列 ${Y_t}$ ，那么该序列的二阶差分就可以定义为：

$\Delta^2 Y_t = \Delta(Y_t - Y_{t-1}) = (Y_t - Y_{t-1}) - (Y_{t-1} - Y_{t-2}) = Y_t - 2Y_{t-1} + Y_{t-2} \tag{7}$

这样，我们得到一个新的时间序列，其每一个值都是原时间序列中相邻两个值的差的差。

让我们以一个简单的例子来具体理解高阶差分操作：

假设我们有以下一组时间序列数据：

$\tag{8}$

首先，我们进行一阶差分，就像我们之前讲解的，具体的计算步骤如下：

计算第二个数据点和第一个数据点的差，也就是 8-4=4。
计算第三个数据点和第二个数据点的差，也就是 6-8=-2。
以此类推，我们计算出所有相邻数据点之间的差值。

所以，一阶差分的结果如下：

$\Delta Y = {4, -2, -1, -2, 1} \tag{9}$

然后，我们对这个一阶差分序列进行二阶差分。同样，我们从头开始计算相邻数据点的差值：

计算第二个数据点和第一个数据点的差，也就是 (-2)-4=-6。
计算第三个数据点和第二个数据点的差，也就是 (-1)-(-2)=1。
以此类推，我们计算出所有相邻数据点之间的差值。

所以，二阶差分的结果如下：

$\Delta^2 Y = {-6, 1, -1, 3} \tag{10}$

我们可以看到，二阶差分后的序列比一阶差分的序列又短了一位。实际上是需要对序列 Y 进行两次一阶差分，

因此，n 阶差分就是在原始数据基础上进行 n 次一阶差分。在现实中，我们使用的高阶差分一般阶数不会太高。在 ARIMA 模型中，超参数 $d$ 最常见的取值是 0、1、2 这些很小的数字。

3.3 什么是滞后

在时间序列分析中，“滞后” 是一个非常重要的概念。滞后实际上是描述了时间序列数据点之间的时间差。举个例子，对于一个月度数据的时间序列，就代表了 $Y_{t-1} 就代表了Y_t$ 就代表了 Y_t 的一个月的滞后。

差分的滞后（lag）与差分的阶数完全不同。正常的一阶差分是滞后为 1 的差分（lag-1 Differences），这代表在差分运算中，我们让相邻的两个观测值相减，即让间隔为（lag-1）的两个观测值相减。因此，当滞后为 2 时，则代表我们需要让相隔 1 个值的两个观测值相减。

在 ARIMA 模型中，我们经常需要计算滞后 d 期的时间序列数据。这就意味着我们需要查找在 t 时刻前 d 个时间单位的数据。

让我们通过一个具体的例子来了解如何进行滞后操作。

假设我们有以下一组时间序列数据：

$\tag{11}$

如果我们想要计算这个时间序列的一阶滞后序列，我们只需要将原序列向右移动一个单位，然后删除掉移动后超出的数据点，具体操作如下：

我们先将整个序列向右移动一个单位，得到 {_, 4, 8, 6, 5, 3, 4}。
然后，我们删除掉移动后超出的数据点，得到滞后序列 {4, 8, 6, 5, 3}。

如果我们想要计算二阶滞后序列，我们可以按照同样的方式进行操作：

我们先将一阶滞后序列再向右移动一个单位，得到 {, , 4, 8, 6, 5, 3}。
然后，我们删除掉移动后超出的数据点，得到二阶滞后序列 {4, 8, 6, 5}。

通过以上的操作，我们可以得到任意阶的滞后序列。

3.4 滞后差分（多步差分）

滞后差分（Lag Differences）是在进行差分操作时，不是用相邻的观测值进行相减，而是用相隔一定数量（即滞后数量）的观测值进行相减。这种操作通常在时间序列具有周期性的情况下非常有用，例如，当我们处理的数据随季节有规律地波动或者随一周的时间有规律地波动时。

让我们以一个简单的例子来具体理解滞后差分的操作：

假设我们有一个时间序列：

$\tag{12}$

现在，我们想要计算这个时间序列的 2 步滞后差分（lag-2 Differences）序列。首先，我们让相隔 1 个值的两个观测值相减，具体操作如下：

首先，我们对序列进行滞后 2 差分运算，即进行 6-5、7-4、9-6、12-7 的运算。
最终我们得到的新的时间序列：

$X_{lag_2} = [1, 3, 3 ,5] \tag{13}$

通过这个例子，我们可以看出滞后差分的操作就是令序列中索引更大的值减去与其相隔（lag-1）个样本的索引更小的值。在实际操作中，我们可以根据数据的特性，选择合适的滞后阶数，来对数据进行滞后差分操作。

带滞后的差分也叫做多步差分，例如，滞后为 2 的差分就叫做 2 步差分。相比起平时不怎么使用的高阶差分，多步差分应用非常广泛。在时间序列中，标签往往具备一定的周期性：例如，标签可能随季节有规律地波动（比如在夏季标签值高、在冬季标签值较低等），也可能随一周的时间有规律地波动（比如在周末较高、在工作日较低等）

3.5 使用差分消除数据波动

在时间序列中，标签往往具备一定的周期性：例如，标签可能随季节有规律地波动（比如在夏季标签值高、在冬季标签值较低等），也可能随一周的时间有规律地波动（比如在周末较高、在工作日较低等）。这种波动可以通过滞后差分来消除，我们生成一个人造的不平稳时间序列，并通过差分使其平稳。我们将利用 Numpy 和 Pandas 库生成这个序列，然后用同样的步骤进行检验和可视化。代码如下：

# 导入必要的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.stattools import adfuller

# 创建一个函数来检查数据的平稳性
def test_stationarity(timeseries):
    # 执行Dickey-Fuller测试
    print('Results of Dickey-Fuller Test:')
    dftest = adfuller(timeseries, autolag='AIC')
    dfoutput = pd.Series(dftest[0:4], index=['Test Statistic', 'p-value', '#Lags Used', 'Number of Observations Used'])
    for key, value in dftest[4].items():
        dfoutput['Critical Value (%s)' % key] = value
    print(dfoutput)

# 生成不平稳的时间序列
np.random.seed(0)
n = 100
x = np.cumsum(np.random.randn(n))

# 把它转换成Pandas的DataFrame格式
df = pd.DataFrame(x, columns=['value'])

# 检查原始数据的平稳性
test_stationarity(df['value'])

# 进行一阶差分
df['first_difference'] = df['value'] - df['value'].shift(1)

# 检查一阶差分后的数据的平稳性
test_stationarity(df['first_difference'].dropna())

# 进行二阶差分
df['second_difference'] = df['first_difference'] - df['first_difference'].shift(1)

# 检查二阶差分后的数据的平稳性
test_stationarity(df['second_difference'].dropna())

# 可视化原始数据和差分后的数据
plt.figure(figsize=(12, 6))
plt.plot(df['value'], label='Original')
plt.plot(df['first_difference'], label='1st Order Difference')
plt.plot(df['second_difference'], label='2nd Order Difference')
plt.legend(loc='best')
plt.title('Original and Differenced Time Series')
plt.show()

这段代码首先创建了一个不平稳的时间序列。然后，它对原始数据、一阶差分数据和二阶差分数据进行了平稳性检验。最后，它画出了原始数据以及一阶和二阶差分数据的图形。

在你运行这段代码之后，你应该会看到，原始数据不平稳，一阶差分后的数据仍然不完全平稳，而二阶差分后的数据就已经变得平稳了。

从图像上可以看出，已经成功展示了如何通过多步差分将一个非平稳时间序列转换为平稳时间序列。

我们更具体的分析，执行上述代码后，输出如下：

Results of Dickey-Fuller Test:
Test Statistic                 -1.132038
p-value                         0.702128
#Lags Used                      0.000000
Number of Observations Used    99.000000
Critical Value (1%)            -3.498198
Critical Value (5%)            -2.891208
Critical Value (10%)           -2.582596
dtype: float64
Results of Dickey-Fuller Test:
Test Statistic                -9.158402e+00
p-value                        2.572287e-15
#Lags Used                     0.000000e+00
Number of Observations Used    9.800000e+01
Critical Value (1%)           -3.498910e+00
Critical Value (5%)           -2.891516e+00
Critical Value (10%)          -2.582760e+00
dtype: float64
Results of Dickey-Fuller Test:
Test Statistic                 -5.459820
p-value                         0.000003
#Lags Used                     11.000000
Number of Observations Used    86.000000
Critical Value (1%)            -3.508783
Critical Value (5%)            -2.895784
Critical Value (10%)           -2.585038
dtype: float64

原始数据：Dickey-Fuller 检验的 p 值为 0.702128，这个值大于常用的显著性水平（例如 0.05 或 0.01）。这意味着我们无法拒绝原假设（时间序列是非平稳的）。因此，我们可以确认原始数据是非平稳的。

一阶差分数据：一阶差分后，p 值为 2.572287e-15（接近于 0），远小于 0.05 或 0.01，我们可以拒绝原假设（时间序列是非平稳的），因此我们可以认为一阶差分后的数据是平稳的。

二阶差分数据：二阶差分后，p 值为 0.000003，也是远小于 0.05 或 0.01，我们也可以拒绝原假设（时间序列是非平稳的），我们可以认为二阶差分后的数据是平稳的。

因此，从上述结果来看，一阶差分已经足够使数据平稳。这就表明了差分的作用：它可以帮助我们把一个非平稳的时间序列转换成平稳的时间序列，从而更好地进行进一步的时间序列分析或预测。

至于你的图形，可以看到：原始数据是典型的非平稳时间序列的特征。一阶差分后的数据虽然波动减小，但还是有一些非常规波动。二阶差分后的数据在 0 附近波动，看起来更像是一个平稳的时间序列。

差分运算可以消除数据中激烈的波动，因此可以消除时间序列中的季节性、周期性、节假日等影响。一般我们使用滞后为 7 的差分消除星期的影响，而使用滞后为 12 的差分来消除月份的影响（一般这种情况下每个样本所对应的时间单位是月），我们也常常使用滞后 4 来尝试消除季度所带来的影响。在统计学中，差分运算本质是一种信息提取方式，其最擅长提取的关键信息就是数据中的周期性，和其他信息提取方式一样，它会舍弃部分信息、提炼出剩下的信息供模型使用。也因此，差分最重要的意义之一就是能够让带有周期性的数据变得平稳.

3.6 概念总结

上述这么多概念，是不是有点懵？没关系，我们来总结一下：

当我们谈论时间序列分析中的 “差分”、“滞后差分” 和 “多步差分” 时，我们通常是在谈论同一种基本概念，即比较一个时间序列在不同时间点的值。然而，这些术语的具体含义可能会根据上下文有所不同。让我为你详细解释一下：

1、差分（Differencing）：这是一种预处理技术，用于使非平稳时间序列变得平稳。在时间序列中进行一阶差分，就是将每个观察值与其前一步的观察值进行比较，然后取这两个观察值之间的差异。例如，如果我们有一个时间序列 ${x1, x2, x3, ..., xn}$ {x1, x2, x3, …, xn} ，那么一阶差分序列将是 ${x2 - x1, x3 - x2, ..., xn - xn-1}$ {x2 - x1, x3 - x2, …, xn - xn-1} 。

2、滞后差分（Lagged Differencing）：这个术语和 “差分” 非常相似。当我们说 “滞后” 时，我们是在说比较一个观察值和其 “前一步” 或 “几步前” 的观察值。因此，“滞后一阶差分” 实际上就是常规的一阶差分，因为我们比较的是每个观察值与其前一步的观察值。如果我们进行的是 “滞后 k 阶差分”，那么我们比较的是每个观察值与其 k 步前的观察值。

3、n 阶差分（n-th Order Differencing）：n 阶差分是差分的一种更一般的形式。一阶差分是比较每个观察值与其前一步的观察值，二阶差分是对一阶差分序列进行再一次的差分（也就是比较一阶差分序列中的每个值与其前一步的值）。更一般地，n 阶差分就是连续进行 n 次一阶差分。

4、多步差分（Multi-step Differencing）：这个术语可能根据上下文有不同的含义。它可能指的是 n 阶差分（即进行多次连续的一阶差分）。也可能指的是滞后差分，比如比较每个观察值与其几步前的观察值。

4. ARIMA(p,d,q) 模型的参数选择

4.1 p 和 q 到底是什么

在 ARIMA(p, d, q) 模型中：

p 代表 “自回归部分 (Autoregressive)”：这部分描述了模型中使用的观测值的滞后值（即前面 p 个期的值）。自回归模型的出发点是认为观测值是它前面的 p 个值的线性组合。具体的数学形式如下：

：

$AR：Y_t = c + φ_1Y_{t-1} + φ_2Y_{t-2} + ... + φ_pY_{t-p} + \xi_t \tag{14}$

其中， $\epsilon_{t-1}, \epsilon_{t-2}, ..., \epsilon_{t-q}$ 是模型参数，c 是常数， $\xi_t$ 是白噪声。这个方程的阶数 p 决定了模型回溯观测值的数量。

q 代表 “移动平均部分 (Moving Average)”：这部分描述了模型中使用的错误项的滞后值（即前面 q 个期的值）。移动平均模型是将当前值和过去的白噪声之间建立关系。具体的数学形式如下：

：

$MA：Y_t = \mu + \epsilon_t + \theta_1\epsilon_{t-1} + \theta_2\epsilon_{t-2} + \cdots + \theta_q\epsilon_{t-q} \tag{15}$

其中， $\theta_1, \theta_2, ..., \theta_q$ 是模型参数，c 是常数， $e_t$ 是当前时期的白噪声， $\epsilon_{t-1}, \epsilon_{t-2}, ..., \epsilon_{t-q}$ 是过去的白噪声。这个方程的阶数 q 决定了模型回溯白噪声的数量。

因此，ARIMA 模型将自回归模型（AR）和移动平均模型（MA）结合在一起，同时加入了差分（I）这个操作。而 p, d, q 这三个参数，分别代表了模型中的自回归部分、差分阶数、以及移动平均部分。

4.2 d 到底是什么

d 就是差分的阶数。差分的目标是将非平稳序列转变为平稳序列。具体的数学表达如下：

滞后运算是 “向后移动一个单位” 的运算，当用于时间序列时，它特指 “向过去移动一个时间单位” 的运算。大部分时候，滞后运算被简写为字母 B（Backshift）或者字母 L（Lag），我们可以对单一的时序样本或整个时间序列做滞后运算。假设有一时间序列 $y_{t}$ 定义滞后运算（lag operator）B，它将一个时刻的观测值转化为前一时刻的观测值：

$By_{t} = y_{t-1} \tag{16}$

我们可以扩展这个运算符的概念，使之滞后 n 个时间步长。例如：

$B^{n}y_{t} = y_{t-n} \tag{17}$

此外，我们可以利用滞后运算来表示一阶差分和 n 阶差分。一阶差分可以看做是相邻的标签值之间的差，它可以表示为：

$\Delta y_{t} = y_{t} - y_{t-1} = y_{t} - By_{t} = (1-B)y_{t} \tag{18}$

类似的，n 阶差分就是相隔 n-1 个标签值进行相减：

$\Delta^{n} y_{t} = y_{t} - y_{t-n} = y_{t} - B^{n}y_{t} = (1-B^{n})y_{t} \tag{19}$

这个式子告诉我们，如果我们想对一组数据进行 n 阶差分，那么我们就可以使用滞后运算。

同时，我们还可以利用滞后运算来表示高阶差分。如果我们对时间序列进行两次一阶差分，那么我们就得到了二阶差分。二阶差分可以表述为：

$\Delta^{2}y_{t} = \Delta(\Delta y_{t}) = (y_{t} - y_{t-1}) - (y_{t-1} - y_{t-2}) = y_{t} - 2y_{t-1} + y_{t-2} = (1-2B + B^{2})y_{t} = (1-B)^{2}y_{t} \tag{20}$

这个式子告诉我们，如果我们想对一组数据进行二阶差分，那么我们可以直接对原始数据应用滞后运算符。

以此类推，d 阶差分可以被表示为：

$d\_order\_y = (1-B)^dy_t \tag{21}$

一般来说，ARIMA 模型中的 d 代表的就是这样的差分阶数。当我们在 ARIMA 模型中设定 d 等于一个特定的数值时，我们实际上是在告诉模型，我们应用了多少次滞后运算（也就是进行了多少次差分）来使数据变得平稳。这就是为什么在进行 ARIMA 模型拟合前，我们需要先通过画图或者 ADF 检验等方式，确定最小的 d 使得数据平稳。在确定了 d 之后，我们就可以将 d 阶差分后的序列代入模型进行拟合。

上面的推导，可以帮助我们理解 ARIMA(p, d, q) 中的 d 是如何通过滞后运算与差分建立起来的关系，以及它是如何影响我们的模型的。

在实际使用中，我们经常将多步差分和高阶差分混用，最典型的就是在 ARIMA 模型建模之前：一般我们会先使用多步差分令数据满足 ARIMA 模型的基础建模条件，再在 ARIMA 模型中使用低阶的差分帮助模型更好地建模。例如，先对数据进行 12 步差分、再在模型中进行 1 阶差分，这样可以令数据变得平稳的同时、又提取出数据中的周期性，极大地提升模型对数据的拟合精度。

5. ACF 与 PACF

5.1 时序数据的平稳性

当我们说一个时间序列是平稳的，基本上意味着其统计特性（如均值，方差）在时间上是常数或不会随时间变化。平稳性是 ARIMA 模型所假设的关键特性，因为模型的预测能力在很大程度上取决于这个假设。

我们生成 1000 个数据点的平稳和非平稳时间序列。在非平稳序列中，我们增加了一个正弦项，以产生更明显的波动。这样，就可以看到一个具有明显周期性和变化幅度的非平稳序列

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 设置随机种子以确保结果可重复
np.random.seed(0)

# 生成平稳时间序列
stationary = np.random.normal(loc=0, scale=1.0, size=1000)
s_ts = pd.Series(stationary)
s_ts.plot()
plt.title('Stationary Time Series')
plt.show()

# 生成非平稳时间序列
non_stationary = np.cumsum(np.random.normal(loc=0, scale=2.0, size=1000)) + 10 * np.sin(np.linspace(-10, 10, 1000))
ns_ts = pd.Series(non_stationary)
ns_ts.plot()
plt.title('Non-Stationary Time Series')
plt.show()

在第一幅图中，我们看到的序列有一个明显的周期性波动模式。这个序列的均值和方差都在随时间变化。均值在随时间变化是因为我们在生成这个序列时，将随机数进行了累加；方差在随时间变化是因为我们增加了一个正弦项，使得序列在不同的时间点具有不同的波动幅度。这些性质都违反了平稳时间序列的定义，所以我们称这个序列为非平稳时间序列。

在第二幅图中，我们可以看到序列在 0 附近随机波动。这个序列的均值和方差都是常数。均值是因为我们在生成这个序列时，从均值为 0 的正态分布中抽取了随机数；方差也是常数，因为这些随机数是独立同分布的。这些性质都满足平稳时间序列的定义，所以我们称这个序列为平稳时间序列。

在时间序列分析中，我们通常需要将非平稳时间序列转化为平稳时间序列，因为许多时间序列模型（如 AR、MA 和 ARIMA 模型）都假设输入的数据是平稳的。这种转化可以通过差分或其他预处理方法来实现。

ACF (Auto-Correlation Function) 和 PACF (Partial Auto-Correlation Function) 是时间序列分析中的两个重要工具，它们可以用来检验一个时间序列是否是平稳的，以及帮助确定 ARIMA 模型的参数。

5.2 自相关函数 ACF (Auto-Correlation Function)

在深入理解 ACF 之前，我们先来理解一下 “相关性” 的基本概念。一般来说，“相关性” 用于衡量两个变量之间的线性关系。对于时间序列数据，这两个变量通常是在不同时间点的观测值。例如，假设我们有以下一组观测值：[3, 5, 4, 6, 7, 8, 7, 6, 5, 4, 3]，我们可能会问，第 t 个观测值与第 t-1 个观测值有多大的相关性？这时，我们就需要用到自相关系数（ACF）来衡量。

在实际应用中，ACF 通常被定义为当前时间点上的观测值与历史时间点观测值之间的相关性。这种相关性可以用多种方法来衡量，其中最常用的是皮尔逊相关系数。

这是一个相对宽泛的定义，而在时间序列分析中，ACF 有着更为严格的定义。对于任意的滞后（lag）k，我们都计算出在时间 t 和时间 t+k 的数据点之间的协方差，然后除以该时间序列的方差。这样得到的结果反映了时间序列自身的相关性。

数学上，自相关函数（ACF）的定义如下：

如果我们有一个时间序列 {X_t}，那么对于任意的滞后（lag）k，自相关函数 ρ(k) 可以表示为：

$Cov(X_t, X_{t+k}) / Var(X_t) \tag{22}$

其中， $Cov(X_t, X_{t+k})$ 是时间点 t 和时间点 t+k 的观测值的协方差， $Var(X_t)$ 是时间序列 ${X_t}$ 的方差。

ACF 的取值范围是 -1 到 1。当 ACF 接近 1 时，表示两个时间点的观测值高度正相关；当 ACF 接近 -1 时，表示两个时间点的观测值高度负相关；当 ACF 接近 0 时，表示两个时间点的观测值之间的相关性较弱。

通过计算不同滞后值下的 ACF，我们可以得到一个关于滞后的函数，这就是自相关函数。我们通常使用自相关图（ACF 图）来直观地表示这个函数，这将在后面的内容中详细介绍。

5.3 偏自相关函数（Partial Auto-correlation Function， PACF）

在理解 PACF 之前，我们需要先理解什么是 “直接相关性”。直接相关性是指一个变量与另一个变量之间的相关性，而不考虑其他变量的影响。例如，假设我们有以下一组观测值：[3, 5, 4, 6, 7, 8, 7, 6, 5, 4, 3]，我们可能会问，第 t 个观测值与第 t-2 个观测值之间有多大的直接相关性，而这个直接相关性并没有考虑第 t-1 个观测值的影响。这时，我们就需要用到偏自相关系数（PACF）来衡量。

在时间序列分析中，偏自相关函数（PACF）衡量的是在其他更早期的滞后（lag）观测值已经被考虑后，当前时间点的观测值与某个滞后观测值之间的 “直接相关性”。换句话说，PACF 表示的是两个观测值之间的相关性，去掉其他滞后观测值的影响。

数学上，偏自相关函数（PACF）的定义如下：

如果我们有一个时间序列 {X_t}，那么对于任意的滞后（lag）k，偏自相关函数 φ(k) 可以表示为：

$Cov(X_t - E[X_t | X_{t-1},...,X_{t-k+1}], X_{t-k} - E[X_{t-k} | X_{t-k+1},...,X_{t-1}]) / Var(X_t) \tag{23}$

其中，Cov 表示协方差，E 表示期望，也就是平均值，Var 表示方差。我们可以看到，PACF 的计算过程实际上是先去掉其他更早期的滞后观测值的影响，然后再计算相关性。

PACF 的取值范围也是 -1 到 1。当 PACF 接近 1 时，表示两个时间点的观测值高度正相关；当 PACF 接近 -1 时，表示两个时间点的观测值高度负相关；当 PACF 接近 0 时，表示两个时间点的观测值之间的直接相关性较弱。

通过计算不同滞后值下的 PACF，我们可以得到一个关于滞后的函数，这就是偏自相关函数。我们通常使用偏自相关图（PACF 图）来直观地表示这个函数，这将在后面的内容中详细介绍。

5.4 ACF 和 PACF 计算示例

对于自相关系数（ACF）和偏自相关系数（PACF），一开始可能会感觉有些难以理解。以下是一个更加详细的例子，希望能帮助你更好地理解。

假设我们有以下一组观测值：X = [3, 5, 4, 6, 7, 8, 7, 6, 5, 4, 3]，使用自相关系数（ACF）的计算第 t 个观测值 $X_t$ 与第 t-2 个观测值 $X_{t-2}$ 的自相关系数。这里，我们只需要关注当前观测值和滞后 2 的观测值，不需要考虑滞后 1 的观测值。所以，我们可以使用以下公式计算 ACF：

$Cov(X_t, X_{t-2}) / sqrt(Var(X_t) * Var(X_{t-2})) \tag{24}$

那如果使用偏自相关系数 PACF 的计算第 t 个观测值 $X_t$ 与第 t-2 个观测值 $X_{t-2}$ 的偏自相关系数。与自相关系数的计算不同，这里我们需要考虑其他更早期的滞后观测值的影响。所以，我们需要使用以下公式计算 PACF：

$Cov(X_t - E[X_t | X_{t-1}], X_{t-2} - E[X_{t-2} | X_{t-1}]) / sqrt(Var(X_t) * Var(X_{t-2})) \tag{25}$

其中，Cov 表示协方差，E 表示期望，也就是平均值，Var 表示方差。我们首先去掉和对 $X_t和X_{t-2}对X_{t-1}$ 的条件期望，然后再计算剩下的部分的协方差，最后除以 $X_t$ 和 $X_{t-2}$ 的方差的乘积的平方根。

可以看到，偏自相关系数的计算过程要复杂一些，因为我们需要考虑其他更早期的滞后观测值的影响。但这也使得偏自相关系数能够更好地衡量当前观测值和滞后观测值之间的 “直接相关性”。

让我们换一种更通俗的方式来理解 ACF 和 PACF。

假设我们在观察一个湖泊的水温。假设我们每天都在固定的时间测量水温，并记录下来

1、自相关系数（ACF）：自相关就好比我们在考虑 “今天的水温是否会受到昨天水温的影响？” 如果昨天的水温很高，那么今天的水温可能也会偏高。这种相互影响可以用自相关系数来衡量。换句话说，自相关系数可以帮助我们理解在时间序列中，一个时间点的值如何影响另一个时间点的值。

2、偏自相关系数（PACF）：偏自相关在这个例子中，可以被理解为 “在已知昨天水温的情况下，今天的水温还会受到前天水温的影响吗？” 也就是说，我们在计算今天和前天的水温关系时，已经考虑并剔除了昨天水温的影响。这种关系被称为 “偏自相关”。

用这种方式理解，我们可以更直观地看到 ACF 和 PACF 的区别。ACF 是直接考虑相邻两天的水温的关系，而 PACF 是在已知昨天水温的情况下，考虑今天和前天的水温的关系。

在实际应用中，我们通常使用相关的统计软件来计算 ACF 和 PACF，而不需要手动计算。所以理解就好。

5.5 ACF 和 PACF 的图形解读

ACF 和 PACF 的取值范围都是 [-1,1]，其中 1 代表两个序列完全正相关，-1 代表两个序列完全负相关，0 代表两个序列不相关。

我们生成一个 AR(1) 模型的时间序列数据，然后使用 statsmodels 库中的 plot_acf 和 plot_pacf 函数来绘制其自相关函数（ACF）和部分自相关函数（PACF）的图像。以下是 Python 代码：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
import statsmodels.api as sm

# 设置随机种子以确保结果可重复
np.random.seed(0)

# 生成AR(1)时间序列数据
ar = np.array([1, -0.5])  # 我们将使用的AR模型的参数
ma = np.array([1])  # 这是MA模型的参数，在这个例子中我们不需要它
n = int(1000)  # 我们将生成的数据点的数量

arma_process = sm.tsa.ArmaProcess(ar, ma)
y = arma_process.generate_sample(nsample=n)

# 绘制ACF图像
plot_acf(y, lags=20)
plt.title('ACF of AR(1) Time Series')
plt.show()

# 绘制PACF图像
plot_pacf(y, lags=20)
plt.title('PACF of AR(1) Time Series')
plt.show()

在这个代码中，我们首先设置了随机种子以确保结果可重复，然后定义了 AR(1) 模型的参数和我们将生成的数据点的数量。接下来，我们使用 statsmodels.tsa.ArmaProcess 对象和其 generate_sample 方法来生成 AR(1) 时间序列数据。最后，我们使用 plot_acf 和 plot_pacf 函数来绘制 ACF 和 PACF 图像。

ACF 图和 PACF 图的横坐标相同，都是不同的滞后程度，纵坐标是当前滞后程度下序列的 ACF 和 PACF 值。背景为蓝色的区域代表着 95% 或 99% 的置信区间，当 ACF/PACF 值在蓝色区域之外时，我们就认为当前滞后程度下的 ACF/PACF 是统计上显著的值，即这个滞后程度下的序列之间的相关性很大程度上是信任的、不是巧合。需要注意的是，当滞后为 0 时，ACF 和 PACF 值必然为 1，因为一个序列与自己始终完全相关，因此 ACF 和 PACF 图上有意义的值是从滞后为 1 的值开始看

详细地解释一下这个过程：

AR(1) 模型是一种自回归模型，它的当前值只依赖于前一步的值。所以，对于一个 AR(1) 模型，我们有：

$\tag{26}$

其中 X[t] 是当前时间点的值，X[t-1] 是前一时间点的值，c 是常数，φ是自回归系数，ε[t] 是噪声项。

ACF 衡量的是时间序列与其自身滞后版本之间的相关性。对于 AR(1) 模型，其 ACF 应在滞后 1 时有一个峰值，然后逐渐衰减。原因是，当滞后 1 时，我们实际上在比较 X[t] 和 X[t-1]，它们是直接相关的，所以有一个峰值。而当滞后增加时，比如滞后 2 时，我们在比较 X[t] 和 X[t-2]，虽然 X[t] 和 X[t-2] 之间存在间接的关联（通过 X[t-1]），但是这种关联会随着滞后的增加而衰减。

部分自相关函数（PACF）：PACF 衡量的是时间序列与其滞后版本之间的相关性，但是要剔除中间滞后项的影响。对于 AR(1) 模型，其 PACF 应在滞后 1 时有一个峰值，然后突然降到 0。原因是，当滞后 1 时，我们实际上在比较 X[t] 和 X[t-1]，它们是直接相关的，所以有一个峰值。而当滞后增加时，比如滞后 2 时，我们在比较 X[t] 和 X[t-2]，尽管它们之间存在间接的关联，但是这种关联被 X[t-1] 的影响所剔除，所以 PACF 在滞后 2 以后的值应接近于 0。

因此，ACF 和 PACF 的图像是反映 AR(1) 模型结构的重要工具。通过它们，我们可以看出时间序列的当前值主要依赖于前一步的值，而与更早的历史值的关联性较弱。

6 实践中如何选择超参数 p、q 和 d

6.1 不同的 p、d 和 q 能决定模型类型

回顾一下：ARIMA 模型的公式可以表示为：

$Y_t = c + φ_1Y_{t-1} + φ_2Y_{t-2} + ... + φ_pY_{t-p} + θ_1\epsilon_{t-1} + θ_2\epsilon_{t-2} + ... + θ_q\epsilon_{t-q} + \epsilon_t \tag{27}$

上面我们已经提到过了，ARIMA 模型中的三个参数 p、q、d 分别代表的含义是：p 和 q 分别控制 ARIMA 模型中自回归和移动平均的部分，而 d 则控制输入 ARIMA 模型的数据被执行的差分的阶数。我们可以这样理解：

ARIMA(p,d,q)	模型类型	模型解释
ARIMA(0,d,0)	随机游走模型或白噪声模型	当 d=1 时，是随机游走模型；当 d=0 时，是白噪声模型
ARIMA(0,d,q)	MA 模型或 IMA 模型	当 d=0 时，是 MA(q) 模型；当 d≠0 时，是 IMA(d,q) 模型
ARIMA(p,d,0)	AR 模型或 ARIMA 模型	当 d=0 时，是 AR 模型；当 d≠0 时，是 ARIMA(p,d,0) 模型
ARIMA(p,d,q)	ARMA 模型或 ARIMA 模型	当 d=0 时，是 ARMA(p, q) 模型；当 d≠0 时，是 ARIMA(p,d,q) 模型

模型解释：

1、AR 模型（Autoregressive Model）：自回归模型，它将当前值与过去 p 个值的线性组合进行比较。

2、MA 模型（Moving Average Model）：移动平均模型，它将当前值与过去 q 个误差项的线性组合进行比较。

3、ARMA 模型（Autoregressive Moving Average Model）：自回归移动平均模型，它是 AR 模型和 MA(q) 模型的组合。

4、ARIMA 模型（Autoregressive Integrated Moving Average Model）：自回归积分移动平均模型，它是 ARMA(p, q) 模型的扩展，增加了差分的步骤，使得非平稳序列变得平稳。

5、IMA 模型（Integrated Moving Average Model）：积分移动平均模型，它是 MA(q) 模型的扩展，增加了差分的步骤，使得非平稳序列变得平稳。

6.2 超参数 p 的确定

对于 AR 模型，ACF 会展现出拖尾的形式，而 PACF 则在 p 阶后突然截尾。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.arima_process import ArmaProcess
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# 参数
ar = np.array([1, -0.5, -0.4])
ma = np.array([1])

# 生成AR(2)过程
ar2_process = ArmaProcess(ar, ma)
ar2_sample = ar2_process.generate_sample(nsample=1000)

# 绘制ACF和PACF
plt.figure(figsize=(12,8))
plt.subplot(211)
plot_acf(ar2_sample, ax=plt.gca())
plt.subplot(212)
plot_pacf(ar2_sample, ax=plt.gca())
plt.show()

对任意时间序列，当 ACF 图像呈现拖尾、且 PACF 图像呈现截尾状态时，当前时间序列适用 AR 模型，且 PACF 截尾的滞后阶数就是超参数 p 的理想值，如图：

6.3 超参数 q 的确定

对于 MA 模型，ACF 在 q 阶后突然截尾，而 PACF 则呈现拖尾的形式

import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.arima_process import ArmaProcess
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# 定义MA模型的参数
ar = np.array([1])
ma = np.array([1, 0.5, 0.7])
np.random.seed(1)

# 创建ARMA模型
arma_process = ArmaProcess(ar, ma)
sample = arma_process.generate_sample(nsample=1000)

# 绘制ACF和PACF图
plt.figure(figsize=(12,8))
plt.subplot(211)
plot_acf(sample, ax=plt.gca(), lags=30)
plt.subplot(212)
plot_pacf(sample, ax=plt.gca(), lags=30)
plt.show()

对任意时间序列，当 PACF 图像呈现拖尾、且 ACF 图像呈现截尾状态时，当前时间序列适用 MA 模型，且 ACF 截尾的滞后阶数就是超参数 q 的理想值

对于 MA 模型，PACF 的拖尾可能不会很明显，这主要是因为在实际的样本数据中，PACF 可能会受到噪声的影响。不过，在理论上，MA(q) 模型的 PACF 应该在 q 阶后展现出拖尾的特性。

6.4 一般情况下如何确定 p 和 q

如果我们有一个纯随机（也称为白噪声）序列，那么它的自相关和部分自相关应该都是接近零的。这就是所谓的 “不截尾，几乎没有显著的值” 的情况。我们可以用 numpy 来生成这样一个序列。

import numpy as np
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
import matplotlib.pyplot as plt

np.random.seed(0)
random_series = np.random.normal(size=1000)

plt.figure(figsize=(12,8))
plt.subplot(211)
plot_acf(random_series, ax=plt.gca())
plt.subplot(212)
plot_pacf(random_series, ax=plt.gca())
plt.show()

对任意时间序列，当 ACF 图像和 PACF 图像都呈现不呈现拖尾状态时，无论图像是否截尾，时间序列都适用于 ARIMA 模型，且此时 ACF 和 PACF 图像无法帮助我们确定 p 和 q 的具体值，但能确认 p 和 q 一定都不为 0。

总的来说，ACF 和 PACF 图像可以给我们一些关于应该使用什么类型的模型（AR、MA 还是 ARIMA）以及可能的 p 和 q 值的初步想法。然而，它们不能给我们绝对的答案，因为在实际数据中可能存在一些噪声和复杂性，这就需要我们使用一些模型选择准则（如 AIC 和 BIC）来帮助我们选择最好的模型。

更准确地说，如果 ACF 拖尾，PACF 在某阶后截尾，那么应该考虑 AR 模型，PACF 截尾的阶数可能是 AR 模型的阶数。如果 ACF 在某阶后截尾，PACF 拖尾，那么应该考虑 MA 模型，ACF 截尾的阶数可能是 MA 模型的阶数。如果 ACF 和 PACF 都拖尾，那么应该考虑 ARIMA 模型。如果 ACF 和 PACF 图像都不呈现拖尾状态，那么时间序列可能是一个白噪声序列。

关于 ARIMA 模型的 p 和 q 值的选择，如果 ACF 和 PACF 都不呈现明显的拖尾或截尾，那么 p 和 q 的值可能都不为 0，这种情况下，我们可以通过 AIC 或 BIC 来选择最优的 p 和 q。

目前实践中最好的方法依然是傻瓜式尝试。在 ARIMA 模型当中，p 和 q 的值往往取值不高，一般是 [1,5] 以内的正整数，因此实践中更常用的方法是从最小值 p=1、q=1 的方式开始进行尝试，不断改变 p 和 q 的取值，直到模型通过检验或达到我们需要的精度要求。

另外还有其他表现形式:

7. 评估指标

ARIMA 模型的性能通常可以使用均方误差（Mean Squared Error，MSE）、均方根误差（Root Mean Squared Error，RMSE）、平均绝对误差（Mean Absolute Error，MAE）等评估指标来评估，当选择评估模型时，我们常使用模型评估质量指标赤池信息准则（Akaike Information Criterion，AIC）和贝叶斯信息准则（Bayesian Information Criterion，BIC），这两个准则都是用于模型选择的，它们考虑了模型的复杂度和拟合优度。AIC 和 BIC 越小，表示模型越好。

7.1 赤池信息准则（Akaike Information Criterion，AIC）

赤池信息准则（Akaike Information Criterion, AIC）是一个评估统计模型质量的准则，它是基于信息论的观点提出的。AIC 并非越小越好，而是应用于比较不同的模型，值越小说明模型越好。AIC 的公式如下：

$\tag{28}$

其中，k 是模型中估计参数的数量，L 是模型拟合的最大对数似然。

公式的第一部分 $2 k$ 表示了模型的复杂性。参数越多（模型复杂度越高），这部分的值就越大。复杂的模型可能会导致过拟合问题，因此这部分起到了一个对模型复杂度的惩罚作用。

公式的第二部分 $- 2 l n (L)$ 表示了模型的拟合优度， $L$ L 是模型的似然函数值， $l n (L)$ 就是似然函数的对数，取负数后再乘以 2。模型拟合得越好， $L$ 的值就越大，那么 $- 2 l n (L)$ 的值就越小。

因此，AIC 公式在平衡了模型的拟合优度（对数似然）和模型的复杂性（参数数量）之间的关系，寻找到既能很好地拟合数据又不会导致过拟合的模型。模型选择时，我们通常会比较不同模型的 AIC 值，选择 AIC 值最小的那个模型。

需要注意的是，AIC 只能用来比较同一数据集下的不同模型，不同数据集下计算出的 AIC 无法进行比较。此外，AIC 并不能保证选择出来的模型一定就是 “真实” 的模型，只能说在候选模型中，AIC 值最小的模型是最优的。

7.2 贝叶斯信息准则（Bayesian Information Criterion，BIC）

贝叶斯信息准则（Bayesian Information Criterion，BIC）也是用于模型选择的一种标准，它和 AIC 有很大的相似性，但在处理模型复杂性时更加严格。BIC 的公式如下：

$\tag{29}$
其中，n 是观察的数据数量，k 是模型中估计参数的数量，L 是模型拟合的最大对数似然。

公式的第一部分 $l n (n) * k$ 表示了模型的复杂性。这部分与 AIC 的主要区别在于，BIC 考虑了样本数据量 n 的大小。这意味着，当数据量增加时，模型复杂性的惩罚项会增加。因此，与 AIC 相比，BIC 更倾向于选择简单的模型。

公式的第二部分 $- 2 l n (L)$ 与 AIC 公式中的这一部分相同，表示了模型的拟合优度。模型拟合得越好，L 的值就越大，那么 $- 2 l n (L)$ 的值就越小。

所以，BIC 也是在平衡模型的拟合优度和模型的复杂性，但是对于复杂模型给予了更大的惩罚。在模型选择时，我们通常会比较不同模型的 BIC 值，选择 BIC 值最小的模型。

同样的，BIC 只能用来比较同一数据集下的不同模型，不同数据集下计算出的 BIC 无法进行比较。BIC 也不能保证选择出来的模型一定就是 “真实” 的模型，只能说在候选模型中，BIC 值最小的模型是最优的。

这两个准则在实践中常常一起使用，并且可以为我们提供关于模型相对质量的有价值的信息。但是，这两个准则并不能保证我们选择的模型一定是最好的模型，还需要根据具体的业务需求和数据特性来进行选择和调整。

8. 总结

在本篇文章中，详细介绍了 ARIMA 模型的基本概念，包括 AR、I、MA 三部分的含义，以及这些概念如何组合形成 ARIMA 模型。我们也深入解释了 ARIMA 模型中的超参数 p、d 和 q 的含义，并展示了如何通过 ACF 和 PACF 图形来确定这些超参数。

最后，感谢您阅读这篇文章！如果您觉得有所收获，别忘了点赞、收藏并关注我，这是我持续创作的动力。您有任何问题或建议，都可以在评论区留言，我会尽力回答并接受您的反馈。如果您希望了解某个特定主题，也欢迎告诉我，我会乐于创作与之相关的文章。谢谢您的支持，期待与您共同成长！

期待与您在未来的学习中共同成长。

你可能感兴趣的:(python计量,python,开发语言)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p