十年一梦实验室

【机器学习】循环神经网络（二）-LSTM示例（keras）国际航空乘客问题的回归问题...

使用 Keras 在 Python 中使用 LSTM 循环神经网络进行时间序列预测

国际航空乘客问题的回归问题

这个文件是一个CSV格式的数据集，它包含了从1949年1月到1960年12月的每个月的国际航空乘客的总数（以千为单位）。第一行是列名，分别是"Month"和"International airline passengers: monthly totals in thousands. Jan 49 ? Dec 60"。第一列是每个月的日期，格式是"年份-月份"。第二列是每个月的乘客总数，单位是千人。这个数据集可以用来训练一个LSTM模型，来预测未来的乘客数量。LSTM是一种循环神经网络，它可以利用长期的时间序列信息来进行预测。

"Month","International airline passengers: monthly totals in thousands. Jan 49 ? Dec 60"
"1949-01",112
"1949-02",118
"1949-03",132
"1949-04",129
"1949-05",121
"1949-06",135
"1949-07",148
"1949-08",148
"1949-09",136
"1949-10",119
"1949-11",104
"1949-12",118
"1950-01",115
"1950-02",126
"1950-03",141
"1950-04",135
"1950-05",125
"1950-06",149
"1950-07",170
"1950-08",170
"1950-09",158
"1950-10",133
"1950-11",114
"1950-12",140
"1951-01",145
"1951-02",150
"1951-03",178
"1951-04",163
"1951-05",172
"1951-06",178
"1951-07",199
"1951-08",199
"1951-09",184
"1951-10",162
"1951-11",146
"1951-12",166
"1952-01",171
"1952-02",180
"1952-03",193
"1952-04",181
"1952-05",183
"1952-06",218
"1952-07",230
"1952-08",242
"1952-09",209
"1952-10",191
"1952-11",172
"1952-12",194
"1953-01",196
"1953-02",196
"1953-03",236
"1953-04",235
"1953-05",229
"1953-06",243
"1953-07",264
"1953-08",272
"1953-09",237
"1953-10",211
"1953-11",180
"1953-12",201
"1954-01",204
"1954-02",188
"1954-03",235
"1954-04",227
"1954-05",234
"1954-06",264
"1954-07",302
"1954-08",293
"1954-09",259
"1954-10",229
"1954-11",203
"1954-12",229
"1955-01",242
"1955-02",233
"1955-03",267
"1955-04",269
"1955-05",270
"1955-06",315
"1955-07",364
"1955-08",347
"1955-09",312
"1955-10",274
"1955-11",237
"1955-12",278
"1956-01",284
"1956-02",277
"1956-03",317
"1956-04",313
"1956-05",318
"1956-06",374
"1956-07",413
"1956-08",405
"1956-09",355
"1956-10",306
"1956-11",271
"1956-12",306
"1957-01",315
"1957-02",301
"1957-03",356
"1957-04",348
"1957-05",355
"1957-06",422
"1957-07",465
"1957-08",467
"1957-09",404
"1957-10",347
"1957-11",305
"1957-12",336
"1958-01",340
"1958-02",318
"1958-03",362
"1958-04",348
"1958-05",363
"1958-06",435
"1958-07",491
"1958-08",505
"1958-09",404
"1958-10",359
"1958-11",310
"1958-12",337
"1959-01",360
"1959-02",342
"1959-03",406
"1959-04",396
"1959-05",420
"1959-06",472
"1959-07",548
"1959-08",559
"1959-09",463
"1959-10",407
"1959-11",362
"1959-12",405
"1960-01",417
"1960-02",391
"1960-03",419
"1960-04",461
"1960-05",472
"1960-06",535
"1960-07",622
"1960-08",606
"1960-09",508
"1960-10",461
"1960-11",390
"1960-12",432


International airline passengers: monthly totals in thousands. Jan 49 ? Dec 60

长短时记忆网络（LSTM）

长短时记忆网络（Long Short-Term Memory network，LSTM网络）是使用通过时间反向传播进行训练的循环神经网络，它克服了梯度消失问题。

因此，它可用于创建大型循环网络，进而可用于解决机器学习中的困难序列问题，并取得最先进的结果。

与神经元不同，LSTM网络通过层连接的记忆块。

一个块具有使其比经典神经元更智能的组件以及用于最近序列的记忆。一个块包含管理块状态和输出的门。块对输入序列进行操作，块内的每个门使用Sigmoid激活单元来控制它是否被触发，从而使块的状态变化和通过块的信息添加成为有条件的。

在一个单元内有三种类型的门：

遗忘门（Forget Gate）：有条件地决定从块中丢弃哪些信息
输入门（Input Gate）：有条件地决定从输入中更新内存状态的哪些值
输出门（Output Gate）：有条件地决定基于输入和块的记忆输出什么

每个单元都像一个小型状态机，其中单元的门具有在训练过程中学到的权重。

您可以看到如何通过LSTM层实现复杂的学习和记忆，并且不难想象如何通过多个这样的层堆叠多层高阶抽象。

1. LSTM网络用于回归用一个步长预测一个，监督学习数据类型1->1

您可以将问题表述为回归问题。

也就是说，给定本月的乘客数（以千为单位），下个月的乘客数是多少？

您可以编写一个简单的函数将单列数据转换为两列数据集：第一列包含本月（t）的乘客数，第二列包含要预测的下个月（t+1）的乘客数。

用 Python 和 Keras 实现的长短期记忆网络（LSTM）的源代码，用于解决国际航空乘客问题的回归问题。

# 导入所需的模块
import numpy # 用于进行科学计算
import matplotlib.pyplot as plt # 用于进行数据可视化
from pandas import read_csv # 用于读取 CSV 文件
import math # 用于进行数学运算
from keras.models import Sequential # 用于构建顺序模型
from keras.layers import Dense # 用于构建全连接层
from keras.layers import LSTM # 用于构建长短期记忆网络层
from sklearn.preprocessing import MinMaxScaler # 用于进行数据缩放
from sklearn.metrics import mean_squared_error # 用于计算均方误差


"""
用一个步长预测一个，监督学习数据类型1->1
X        Y
112    118
118    132
132    129
129    121
121    135
"""
# 定义一个函数，将数据截取成1->1的监督学习格式
def create_dataset(dataset, look_back=1):
  dataX, dataY = [], [] # 初始化输入和输出的空列表
  for i in range(len(dataset)-look_back-1): # 循环遍历数据集，除去最后一个步长和最后一个元素
    a = dataset[i:(i+look_back), 0] # 取出当前位置到下一个步长的数据，作为输入
    dataX.append(a) # 将输入添加到输入列表中
    dataY.append(dataset[i + look_back, 0]) # 取出下一个步长的数据，作为输出
  return numpy.array(dataX), numpy.array(dataY) # 将输入和输出列表转换为 numpy 数组，并返回


# 定义随机种子，以便重现结果
numpy.random.seed(7)
# 加载数据
dataframe = read_csv('LSTM\\LSTM_Fly\\airline-passengers.csv', usecols=[1], engine='python') # 读取 CSV 文件，只使用第二列（乘客数）的数据
dataset = dataframe.values # 将数据框转换为 numpy 数组
dataset = dataset.astype('float32') # 将数据类型转换为浮点数
# 缩放数据
scaler = MinMaxScaler(feature_range=(0, 1)) # 创建一个数据缩放器，将数据缩放到 0 到 1 的范围
dataset = scaler.fit_transform(dataset) # 对数据集进行缩放，并返回缩放后的数据集
# 分割2/3数据作为训练集，剩余的作为测试集
train_size = int(len(dataset) * 0.67) # 计算训练集的大小，为数据集长度的 2/3
test_size = len(dataset) - train_size # 计算测试集的大小，为数据集长度减去训练集的大小
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:] # 将数据集分割为训练集和测试集，分别为前 2/3 和后 1/3 的数据
# 预测数据步长为1,一个预测一个，1->1
look_back = 1 # 定义预测数据的步长为 1，即用一个数据预测下一个数据
trainX, trainY = create_dataset(train, look_back) # 调用 create_dataset 函数，将训练集转换为 1->1 的监督学习格式，得到训练集的输入和输出
testX, testY = create_dataset(test, look_back) # 调用 create_dataset 函数，将测试集转换为 1->1 的监督学习格式，得到测试集的输入和输出
# 重构输入数据格式 [samples, time steps, features] = [95,1,1]
trainX = numpy.reshape(trainX, (trainX.shape[0], 1, trainX.shape[1])) # 将训练集的输入重构为三维数组，第一维为样本数，第二维为时间步数，第三维为特征数，分别为 95，1，1
testX = numpy.reshape(testX, (testX.shape[0], 1, testX.shape[1])) # 将测试集的输入重构为三维数组，第一维为样本数，第二维为时间步数，第三维为特征数，分别为 46，1，1
# 构建 LSTM 网络
model = Sequential() # 创建一个顺序模型
model.add(LSTM(4, input_shape=(1, look_back))) # 向模型中添加一个 LSTM 层，设置 LSTM 单元的数量为 4，输入的形状为 (1, 1)，即一个时间步，一个特征
model.add(Dense(1)) # 向模型中添加一个全连接层，设置输出的维度为 1，即一个预测值
model.compile(loss='mean_squared_error', optimizer='adam') # 编译模型，设置损失函数为均方误差，优化器为 adam
model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=2) # 训练模型，设置迭代次数为 100，批量大小为 1，显示训练过程
# 对训练数据的Y进行预测
trainPredict = model.predict(trainX) # 调用模型的 predict 方法，对训练集的输入进行预测，得到训练集的预测值
# 对测试数据的Y进行预测
testPredict = model.predict(testX) # 调用模型的 predict 方法，对测试集的输入进行预测，得到测试集的预测值
# 对数据进行逆缩放
trainPredict = scaler.inverse_transform(trainPredict) # 调用数据缩放器的 inverse_transform 方法，对训练集的预测值进行逆缩放，得到原始的乘客数
trainY = scaler.inverse_transform([trainY]) # 调用数据缩放器的 inverse_transform 方法，对训练集的输出进行逆缩放，得到原始的乘客数
testPredict = scaler.inverse_transform(testPredict) # 调用数据缩放器的 inverse_transform 方法，对测试集的预测值进行逆缩放，得到原始的乘客数
testY = scaler.inverse_transform([testY]) # 调用数据缩放器的 inverse_transform 方法，对测试集的输出进行逆缩放，得到原始的乘客数
# 计算RMSE误差
trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0])) # 调用 sklearn 的 mean_squared_error 函数，计算训练集的真实值和预测值之间的均方误差，然后开平方，得到训练集的均方根误差
print('Train Score: %.2f RMSE' % (trainScore)) # 打印训练集的均方根误差
testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0])) # 调用 sklearn 的 mean_squared_error 函数，计算测试集的真实值和预测值之间的均方误差，然后开平方，得到测试集的均方根误差
print('Test Score: %.2f RMSE' % (testScore)) # 打印测试集的均方根误差


# 构造一个和dataset格式相同的数组，共145行，dataset为总数据集，把预测的93行训练数据存进去
trainPredictPlot = numpy.empty_like(dataset) # 创建一个和数据集形状相同的空数组，用于存放训练集的预测值
# 用nan填充数组
trainPredictPlot[:, :] = numpy.nan # 将数组的所有元素填充为 nan
# 将训练集预测的Y添加进数组，从第1位到第95+1位，共95行
trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict
# 这一行的作用是将训练集的预测值插入到 trainPredictPlot 数组中，以便于和原始数据集进行对比。由于我们的预测数据步长为 1，所以我们需要从第 1 位开始，到第 95+1 位结束，共 95 行。注意，这里的索引是从 0 开始的，所以第 1 位实际上是第 2 个元素。


# 构造一个和 dataset 格式相同的数组，共144行，把预测的后46行测试数据数据放进去
testPredictPlot = numpy.empty_like(dataset)
testPredictPlot[:, :] = numpy.nan
# 这两行的作用是创建一个和数据集形状相同的空数组，用于存放测试集的预测值，并将所有元素填充为 nan，表示空缺。


# 将测试集预测的Y添加进数组，从第95+1位到最后，共46行     #look_back * 2  为了让训练集预测线条与测试集预测线条分开
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict
# 这一行的作用是将测试集的预测值插入到 testPredictPlot 数组中，以便于和原始数据集进行对比。由于我们的预测数据步长为 1，所以我们需要从第 95+1 位开始，到最后一位结束，共 46 行。注意，这里的索引是从 0 开始的，所以第 95+1 位实际上是第 98 个元素，最后一位实际上是第 144 个元素。
#print(testPredictPlot.shape[1]) 1
# 画图
plt.plot(scaler.inverse_transform(dataset))
plt.plot(trainPredictPlot)
plt.plot(testPredictPlot)
plt.show()
# 这四行的作用是使用 matplotlib.pyplot 模块绘制图形，显示原始数据集，训练集的预测值，和测试集的预测值。由于我们之前对数据集进行了缩放，所以我们需要先用数据缩放器的 inverse_transform 方法将数据恢复到原始的范围。然后，我们分别用 plt.plot 函数绘制三条曲线，分别用不同的颜色表示。最后，我们用 plt.show 函数显示图形。

运行输出：

……
Epoch 94/100
95/95 - 0s - loss: 0.0020 - 258ms/epoch - 3ms/step
Epoch 95/100
95/95 - 0s - loss: 0.0021 - 263ms/epoch - 3ms/step
Epoch 96/100
95/95 - 0s - loss: 0.0020 - 276ms/epoch - 3ms/step
Epoch 97/100
95/95 - 0s - loss: 0.0020 - 295ms/epoch - 3ms/step
Epoch 98/100
95/95 - 0s - loss: 0.0021 - 279ms/epoch - 3ms/step
Epoch 99/100
95/95 - 0s - loss: 0.0020 - 265ms/epoch - 3ms/step
Epoch 100/100
95/95 - 0s - loss: 0.0020 - 271ms/epoch - 3ms/step
Train Score: 22.96 RMSE
Test Score: 52.15 RMSE

2. 用三个步长数据预测一个数据 1个时间步长 3个特征预测1个数据

如何使用窗口方法（Window Method）构建回归问题，使得可以利用多个最近的时间步长来预测下一个时间步长的值。

窗口方法是指将问题表述为使用多个最近的时间步长进行预测，而窗口的大小是一个可以为每个问题调整的参数。

举例来说，假设给定当前时间（t）来预测序列中下一个时间点（t+1）的值，可以将当前时间（t）以及两个先前的时间点（t-1和t-2）作为输入变量。当将其表述为回归问题时，输入变量为t-2、t-1和t，而输出变量为t+1。

在先前部分创建的create_dataset()函数允许通过将look_back参数从1增加到3来创建这种形式的时间序列问题。

示例数据集的一部分如下所示：

X1  X2  X3  Y
112  118  132  129
118  132  129  121
132  129  121  135
129  121  135  148
121  135  148  148

通过使用较大的窗口大小，可以重新运行先前部分的示例。以下是带有窗口大小更改的完整代码清单，以便更好地理解。

# 修改 create_dataset() 函数的 look_back 参数
look_back = 3
trainX, trainY = create_dataset(train, look_back)
testX, testY = create_dataset(test, look_back)

通过这样的修改，你就可以使用更大的窗口来构建时间序列回归问题，从而利用多个最近的时间步长进行预测

# LSTM 用于国际航班乘客问题的窗口回归框架
import numpy # 导入 numpy 库，用于处理数组和矩阵
import matplotlib.pyplot as plt # 导入 matplotlib 库，用于绘制图形
from pandas import read_csv # 导入 pandas 库，用于读取和处理 csv 文件
import math # 导入 math 库，用于进行数学运算
from keras.models import Sequential # 导入 keras 库，用于构建和训练神经网络
from keras.layers import Dense # 导入 keras.layers 库，用于添加全连接层
from keras.layers import LSTM # 导入 keras.layers 库，用于添加长短期记忆（LSTM）层
from sklearn.preprocessing import MinMaxScaler # 导入 sklearn.preprocessing 库，用于对数据进行最小最大缩放
from sklearn.metrics import mean_squared_error # 导入 sklearn.metrics 库，用于计算均方误差（MSE）
import pandas as pd # 导入 pandas 库，用于处理数据框
"""
用三个步长数据预测一个数据，数据类型：
X1  X2  X3  Y
112  118  132  129
118  132  129  121
132  129  121  135
129  121  135  148
121  135  148  148


数据形状：
x -> y = [93,1,3] -> [93,1]
x = [[[x1,x2,x3]], 
     [[x1,x2,x3]], 
     [[x1,x2,x3]], 
     ...]


y = [[y1],
     [y2],
     [y3], 
     ...]


input_shape=(1,3)
代码变动部分：
look_back = 3
"""
pd.set_option('display.max_columns',1000) # 设置 pandas 的显示选项，使得最多显示 1000 列
pd.set_option('display.width', 1000) # 设置 pandas 的显示选项，使得每行的宽度为 1000
pd.set_option('display.max_colwidth',1000) # 设置 pandas 的显示选项，使得每列的最大宽度为 1000


# 将数据截取成3个一组的监督学习格式
def create_dataset(dataset, look_back=1): # 定义一个函数，用于将数据转换为监督学习的格式
  dataX, dataY = [], [] # 初始化两个空列表，用于存储输入和输出数据
  for i in range(len(dataset)-look_back-1): # 遍历数据集，从第一个元素到倒数第 look_back+1 个元素
    a = dataset[i:(i+look_back), 0] # 取出当前位置到当前位置加上 look_back 的数据，作为输入
    dataX.append(a) # 将输入数据添加到 dataX 列表中
    dataY.append(dataset[i + look_back, 0]) # 取出当前位置加上 look_back 的数据，作为输出
  return numpy.array(dataX), numpy.array(dataY) # 将列表转换为 numpy 数组，并返回
# 定义随机种子，以便重现结果
numpy.random.seed(7) # 设置 numpy 的随机种子为 7，保证每次运行的结果一致
# 加载数据
dataframe = read_csv('LSTM\\LSTM_Fly\\airline-passengers.csv', usecols=[1], engine='python') # 使用 pandas 的 read_csv 函数，读取 csv 文件中的第二列（乘客数量）数据，存储为 dataframe
dataset = dataframe.values # 将 dataframe 转换为 numpy 数组，存储为 dataset
dataset = dataset.astype('float32') # 将 dataset 的数据类型转换为 float32，便于后续处理
# 缩放数据
scaler = MinMaxScaler(feature_range=(0, 1)) # 创建一个最小最大缩放器，用于将数据缩放到 0 到 1 的范围
dataset = scaler.fit_transform(dataset) # 使用缩放器对 dataset 进行拟合和转换，得到缩放后的数据
# 分割2/3数据作为测试
train_size = int(len(dataset) * 0.67) # 计算训练集的大小，为数据集长度的 2/3，取整数
test_size = len(dataset) - train_size # 计算测试集的大小，为数据集长度减去训练集大小
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:] # 将数据集分割为训练集和测试集，前 train_size 个数据为训练集，后 test_size 个数据为测试集
# 预测数据步长为3,三个预测一个，3->1
look_back = 3 # 设置预测数据的步长为 3，即用三个数据预测一个数据
trainX, trainY = create_dataset(train, look_back) # 调用 create_dataset 函数，将训练集转换为监督学习的格式，得到训练集的输入和输出
testX, testY = create_dataset(test, look_back) # 调用 create_dataset 函数，将测试集转换为监督学习的格式，得到测试集的输入和输出
# 重构输入数据格式 [samples, time steps, features] = [93,1,3]
trainX = numpy.reshape(trainX, (trainX.shape[0], 1, trainX.shape[1])) # 将训练集的输入数据重塑为 [样本数，时间步长，特征数] 的格式，即 [93,1,3]，便于 LSTM 层的输入
testX = numpy.reshape(testX, (testX.shape[0], 1, testX.shape[1])) # 将测试集的输入数据重塑为 [样本数，时间步长，特征数] 的格式，即 [47,1,3]，便于 LSTM 层的输入
# 构建 LSTM 网络
model = Sequential() # 创建一个顺序模型，用于堆叠神经网络层
# 输入形状为 (1, 3) 表示每个样本只有一个时间步长，每个时间步长有 3 个特征
model.add(LSTM(4, input_shape=(1, look_back))) # 添加一个 LSTM 层，设置神经元个数为 4，输入形状为 (1, look_back)，即 (1, 3)
model.add(Dense(1)) # 添加一个全连接层，设置神经元个数为 1，用于输出预测值
model.compile(loss='mean_squared_error', optimizer='adam') # 编译模型，设置损失函数为均方误差，优化器为 adam
model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=2) # 训练模型，设置迭代次数为 100，批次大小为 1，显示训练过程
# 对训练数据的Y进行预测
trainPredict = model.predict(trainX) # 使用模型对训练集的输入数据进行预测，得到训练集的预测值
# 对测试数据的Y进行预测
testPredict = model.predict(testX) # 使用模型对测试集的输入数据进行预测，得到测试集的预测值
# 对数据进行逆缩放
trainPredict = scaler.inverse_transform(trainPredict) # 使用缩放器对训练集的预测值进行逆转换，得到原始数据范围的预测值
trainY = scaler.inverse_transform([trainY]) # 使用缩放器对训练集的输出数据进行逆转换，得到原始数据范围的真实值
testPredict = scaler.inverse_transform(testPredict) # 使用缩放器对测试集的预测值进行逆转换，得到原始数据范围的预测值
testY = scaler.inverse_transform([testY]) # 使用缩放器对测试集的输出数据进行逆转换，得到原始数据范围的真实值
# 计算训练集和测试集的均方根误差（RMSE）
trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0])) # 使用 math 库的 sqrt 函数，计算训练集的真实值和预测值的均方误差的平方根，存储为 trainScore
print('Train Score: %.2f RMSE' % (trainScore)) # 打印训练集的 RMSE，保留两位小数
testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0])) # 使用 math 库的 sqrt 函数，计算测试集的真实值和预测值的均方误差的平方根，存储为 testScore
print('Test Score: %.2f RMSE' % (testScore)) # 打印测试集的 RMSE，保留两位小数


# 创建两个空数组，用于绘制训练集和测试集的预测值
trainPredictPlot = numpy.empty_like(dataset) # 使用 numpy 库的 empty_like 函数，创建一个和 dataset 形状相同的空数组，存储为 trainPredictPlot
trainPredictPlot[:, :] = numpy.nan # 将 trainPredictPlot 中的所有元素赋值为 numpy.nan，表示空值
trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict # 将 trainPredict 中的预测值填充到 trainPredictPlot 中的相应位置，从 look_back 到 len(trainPredict)+look_back


testPredictPlot = numpy.empty_like(dataset) # 使用 numpy 库的 empty_like 函数，创建一个和 dataset 形状相同的空数组，存储为 testPredictPlot
testPredictPlot[:, :] = numpy.nan # 将 testPredictPlot 中的所有元素赋值为 numpy.nan，表示空值
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict # 将 testPredict 中的预测值填充到 testPredictPlot 中的相应位置，从 len(trainPredict)+(look_back*2)+1 到 len(dataset)-1


# 画图
plt.plot(scaler.inverse_transform(dataset)) # 使用 matplotlib 库的 plot 函数，绘制原始数据集的折线图，使用 scaler 的 inverse_transform 函数，将数据转换回原始范围
plt.plot(trainPredictPlot) # 使用 matplotlib 库的 plot 函数，绘制训练集的预测值的折线图
plt.plot(testPredictPlot) # 使用 matplotlib 库的 plot 函数，绘制测试集的预测值的折线图
plt.show() # 使用 matplotlib 库的 show 函数，显示图

运行输出：

Epoch 97/100
93/93 - 0s - loss: 0.0017 - 228ms/epoch - 2ms/step
Epoch 98/100
93/93 - 0s - loss: 0.0017 - 223ms/epoch - 2ms/step
Epoch 99/100
93/93 - 0s - loss: 0.0017 - 229ms/epoch - 2ms/step
Epoch 100/100
93/93 - 0s - loss: 0.0017 - 234ms/epoch - 3ms/step
Train Score: 21.91 RMSE
Test Score: 63.09 RMSE

3. 时间步长型回归 3个时间步长 1个特征预测一个数据

在使用LSTM进行回归任务时，如何处理具有时间步长（time steps）的数据。

首先，在为LSTM网络准备数据时，包括了时间步长的概念。对于一些序列问题，每个样本可能具有不同数量的时间步长。例如，你可能有一台物理机器的测量数据，记录了故障或突增发生之前的情况。每个事件都可以被看作是一组观察值的样本，这些观察值构成了导致事件发生的时间步长，而观察到的变量则是特征。

时间步长为解决时间序列问题提供了另一种表述方式。与之前的窗口示例类似，你可以将过去的时间步长作为输入，用于预测下一个时间步长的输出。

与将过去的观察作为单独的输入特征不同，可以将它们视为一个输入特征的时间步长，这实际上更准确地描述了问题。

在代码示例中，通过与之前基于窗口的示例相同的数据表示方式，对数据进行重新整形，将列设置为时间步长维度，并将特征维度更改回1。例如：

# 重新整形输入为 [样本数, 时间步长, 特征数]
trainX = np.reshape(trainX, (trainX.shape[0], trainX.shape[1], 1))
testX = np.reshape(testX, (testX.shape[0], testX.shape[1], 1))

最后，完整的代码清单以供参考。这段代码用于演示如何使用LSTM进行时间序列回归，其中数据的表示考虑了时间步长的概念。

# LSTM 用于国际航空旅客问题的时间步回归框架
import numpy # 导入 numpy 库，用于数组和矩阵运算
import matplotlib.pyplot as plt # 导入 matplotlib 库，用于绘图和可视化
from pandas import read_csv # 导入 pandas 库，用于读取和处理 csv 文件
import math # 导入 math 库，用于数学计算
from keras.models import Sequential # 导入 keras 库，用于构建和训练神经网络
from keras.layers import Dense # 导入 Dense 层，用于构建全连接层
from keras.layers import LSTM # 导入 LSTM 层，用于构建长短期记忆网络
from sklearn.preprocessing import MinMaxScaler # 导入 MinMaxScaler 类，用于将数据缩放到 0 到 1 的范围
from sklearn.metrics import mean_squared_error # 导入 mean_squared_error 函数，用于计算均方误差


import pandas as pd # 重新导入 pandas 库，并简写为 pd
pd.set_option('display.max_columns',1000) # 设置 pandas 的显示选项，最大列数为 1000
pd.set_option('display.width', 1000) # 设置 pandas 的显示选项，宽度为 1000
pd.set_option('display.max_colwidth',1000) # 设置 pandas 的显示选项，最大列宽为 1000
"""
数据形状：
x -> y = [93,3,1] -> [93,1]
x = [[[x1],[x2],[x3]] , 
     [[x1],[x2],[x3]] ,
     ... ]


y = [[y1],
     [y2],
     [y3], 
     ... ]


输入形状：
input_shape=(3,1)


代码差异：
trainX = numpy.reshape(trainX, (trainX.shape[0], trainX.shape[1], 1))
testX = numpy.reshape(testX, (testX.shape[0], testX.shape[1], 1))
model.add(LSTM(4, input_shape=(look_back, 1)))。
"""
# 定义一个函数，将数据转换为监督学习的格式，即每 3 个数据作为输入，下一个数据作为输出
def create_dataset(dataset, look_back=1):
  dataX, dataY = [], [] # 初始化两个空列表，用于存储输入和输出
  for i in range(len(dataset)-look_back-1): # 遍历数据集，从第 0 个到倒数第 look_back+1 个
    a = dataset[i:(i+look_back), 0] # 取出第 i 个到第 i+look_back-1 个数据，作为输入
    dataX.append(a) # 将输入添加到 dataX 列表中
    dataY.append(dataset[i + look_back, 0]) # 取出第 i+look_back 个数据，作为输出
  return numpy.array(dataX), numpy.array(dataY) # 将列表转换为 numpy 数组，并返回


numpy.random.seed(7) # 设置 numpy 的随机种子，保证每次运行结果一致
dataframe = read_csv('LSTM\\LSTM_Fly\\airline-passengers.csv', usecols=[1], engine='python') # 读取 csv 文件，只使用第一列，即旅客数
dataset = dataframe.values # 将数据框转换为 numpy 数组
dataset = dataset.astype('float32') # 将数据类型转换为浮点数


scaler = MinMaxScaler(feature_range=(0, 1)) # 创建一个数据缩放器，将数据缩放到 0 到 1 的范围
dataset = scaler.fit_transform(dataset) # 对数据集进行缩放


train_size = int(len(dataset) * 0.67) # 计算训练集的大小，为数据集的 2/3
test_size = len(dataset) - train_size # 计算测试集的大小，为数据集的 1/3
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:] # 将数据集分割为训练集和测试集
# 预测数据步长为3,三个预测一个，3->1
look_back = 3 # 设置预测数据步长为 3，即使用三个月的旅客数预测下一个月的旅客数
trainX, trainY = create_dataset(train, look_back) # 使用 create_dataset 函数将训练集转换为监督学习格式
testX, testY = create_dataset(test, look_back) # 使用 create_dataset 函数将测试集转换为监督学习格式


trainX = numpy.reshape(trainX, (trainX.shape[0], trainX.shape[1], 1)) # 将训练集输入重构为 [samples, time steps, features] 的形状，即 [93,3,1]
testX = numpy.reshape(testX, (testX.shape[0], testX.shape[1], 1)) # 将测试集输入重构为 [samples, time steps, features] 的形状，即 [44,3,1]
# 构建 LSTM 网络
model = Sequential() # 创建一个顺序模型
model.add(LSTM(4, input_shape=(look_back,1))) # 添加一个 LSTM 层，有四个神经元，输入形状为 (3,1)
model.add(Dense(1)) # 添加一个全连接层，有一个神经元，用于输出预测值
model.compile(loss='mean_squared_error', optimizer='adam') # 编译模型，使用均方误差作为损失函数，使用 Adam 作为优化器
model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=2) # 训练模型，使用 100 个周期，每个批次一个样本，打印训练过程


trainPredict = model.predict(trainX) # 对训练集的 Y 进行预测
testPredict = model.predict(testX) # 对测试集的 Y 进行预测
trainPredict = scaler.inverse_transform(trainPredict) # 将训练集预测结果逆缩放回原始范围
trainY = scaler.inverse_transform([trainY]) # 将训练集真实值逆缩放回原始范围
testPredict = scaler.inverse_transform(testPredict) # 将测试集预测结果逆缩放回原始范围
testY = scaler.inverse_transform([testY]) # 将测试集真实值逆缩放回原始范围
trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0])) # 计算训练集的 RMSE 误差
print('Train Score: %.2f RMSE' % (trainScore)) # 打印训练集的 RMSE 误差
testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0])) # 计算测试集的 RMSE 误差
print('Test Score: %.2f RMSE' % (testScore)) # 打印测试集的 RMSE 误差




trainPredictPlot = numpy.empty_like(dataset) # 创建一个和数据集形状相同的空数组，用于绘制训练集的预测值
trainPredictPlot[:, :] = numpy.nan # 将数组的所有元素设置为 nan，表示空值
trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict # 将训练集的预测值填充到数组的相应位置，注意要留出 look_back 的空间


testPredictPlot = numpy.empty_like(dataset) # 创建一个和数据集形状相同的空数组，用于绘制测试集的预测值
testPredictPlot[:, :] = numpy.nan # 将数组的所有元素设置为 nan，表示空值
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict # 将测试集的预测值填充到数组的相应位置，注意要留出 look_back 的空间和最后一个空值
# 画图
plt.plot(scaler.inverse_transform(dataset)) # 绘制原始数据集的曲线，将缩放后的数据转换回原始范围
plt.plot(trainPredictPlot) # 绘制训练集的预测值的曲线
plt.plot(testPredictPlot) # 绘制测试集的预测值的曲线
plt.show() # 显示图像




testPredictPlot = numpy.empty_like(dataset) # 创建一个和数据集形状相同的空数组，用于绘制测试集的预测值
testPredictPlot[:, :] = numpy.nan # 将数组的所有元素设置为 nan，表示空值
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict # 将测试集的预测值填充到数组的相应位置，注意要留出 look_back 的空间和最后一个空值
# 画图
plt.plot(scaler.inverse_transform(dataset)) # 绘制原始数据集的曲线，将缩放后的数据转换回原始范围
plt.plot(trainPredictPlot) # 绘制训练集的预测值的曲线
plt.plot(testPredictPlot) # 绘制测试集的预测值的曲线
plt.show() # 显示图像

运行输出：

Epoch 96/100
93/93 - 0s - loss: 0.0021 - 261ms/epoch - 3ms/step
Epoch 97/100
93/93 - 0s - loss: 0.0021 - 297ms/epoch - 3ms/step
Epoch 98/100
93/93 - 0s - loss: 0.0021 - 247ms/epoch - 3ms/step
Epoch 99/100
93/93 - 0s - loss: 0.0021 - 256ms/epoch - 3ms/step
Epoch 100/100
93/93 - 0s - loss: 0.0021 - 260ms/epoch - 3ms/step
Train Score: 22.91 RMSE
Test Score: 49.07 RMSE

4. 批次间具有记忆功能的 LSTM

在Keras中如何使用“Memory Between Batches”来控制LSTM网络的内部状态。通常情况下，在每次训练批次（batch）结束、调用model.predict()或model.evaluate()时，LSTM网络的状态都会被重置。然而，通过在Keras中将LSTM层设置为“stateful”（有状态的），可以更精细地控制内部状态的清除。

具体而言，通过设置LSTM层的“stateful”参数，可以使其在整个训练序列上建立状态，并在需要时保持该状态以进行预测。为了实现这一点，有几个关键步骤：

不打乱训练数据：在拟合网络时，训练数据不能被打乱。
手动重置网络状态：在每次暴露于训练数据（一个epoch）后，需要通过调用model.reset_states()来显式地重置网络状态。
设置LSTM层为stateful：在构建LSTM层时，需要将stateful参数设置为True。此外，不再指定输入维度，而是通过设置batch_input_shape参数来硬编码批次中的样本数、样本中的时间步数以及时间步中的特征数。

示例代码如下：

for i in range(100):
  model.fit(trainX, trainY, epochs=1, batch_size=batch_size, verbose=2, shuffle=False)
  model.reset_states()

在这个例子中，通过循环进行训练，每个epoch结束后手动重置网络状态。在构建LSTM层时，指定了batch_input_shape和stateful参数。

model.add(LSTM(4, batch_input_shape=(batch_size, time_steps, features), stateful=True))

最后，进行模型评估和预测时，需要使用相同的批次大小：

model.predict(trainX, batch_size=batch_size)

这样就实现了LSTM网络在训练序列之间保持记忆状态的控制。

完整代码：

# 使用 LSTM 模型预测国际航空旅客数量的问题，考虑到模型的记忆能力
import numpy # 导入 numpy 库，用于处理多维数组和矩阵运算
import matplotlib.pyplot as plt # 导入 matplotlib 库，用于绘制图形和可视化数据
from pandas import read_csv # 导入 pandas 库，用于读取和处理 CSV 文件
import math # 导入 math 库，用于进行数学计算
from keras.models import Sequential # 导入 keras 库，用于构建和训练深度学习模型
from keras.layers import Dense # 导入 keras 库中的 Dense 层，用于实现全连接层
from keras.layers import LSTM # 导入 keras 库中的 LSTM 层，用于实现长短期记忆网络
from sklearn.preprocessing import MinMaxScaler # 导入 sklearn 库中的 MinMaxScaler 类，用于将数据缩放到 0 到 1 的范围
from sklearn.metrics import mean_squared_error # 导入 sklearn 库中的 mean_squared_error 函数，用于计算均方误差
"""
之前是网络训练100个周期
model.fit(trainX, trainY, epochs=100, batch_size=1, verbose=2)


每次网络训练1个周期，循环执行100次，每次循环重置网络状态
for i in range(100):
  model.fit(trainX, trainY, epochs=1, batch_size=batch_size, verbose=2, shuffle=False)
  model.reset_states()


model.add(LSTM(4, batch_input_shape=(batch_size, time_steps, features), stateful=True))
model.
"""
# 定义一个函数，用于将数据集转换为有监督学习的格式，即给定输入序列，预测下一个值
# 参数 dataset 是一个二维数组，表示数据集
# 参数 look_back 是一个整数，表示输入序列的长度
# 返回值是两个二维数组，分别表示输入数据和输出数据
def create_dataset(dataset, look_back=1):
  dataX, dataY = [], [] # 初始化两个空列表，用于存储输入数据和输出数据
  for i in range(len(dataset)-look_back-1): # 遍历数据集中的每个元素，除了最后 look_back + 1 个
    a = dataset[i:(i+look_back), 0] # 取出当前位置开始的 look_back 个元素，作为输入序列
    dataX.append(a) # 将输入序列添加到输入数据列表中
    dataY.append(dataset[i + look_back, 0]) # 取出当前位置后的第一个元素，作为输出值
  return numpy.array(dataX), numpy.array(dataY) # 将输入数据和输出数据列表转换为 numpy 数组，并返回


numpy.random.seed(7) # 设置随机数种子，保证每次运行的结果一致


dataframe = read_csv('LSTM\\LSTM_Fly\\airline-passengers.csv', usecols=[1], engine='python') # 读取 CSV 文件中的第二列数据，即航空旅客数量
dataset = dataframe.values # 将数据框转换为二维数组
dataset = dataset.astype('float32') # 将数据类型转换为浮点数


scaler = MinMaxScaler(feature_range=(0, 1)) # 创建一个 MinMaxScaler 对象，用于将数据缩放到 0 到 1 的范围
dataset = scaler.fit_transform(dataset) # 对数据集进行缩放，并返回缩放后的数据集


train_size = int(len(dataset) * 0.67) # 计算训练集的大小，为数据集长度的 67%
test_size = len(dataset) - train_size # 计算测试集的大小，为数据集长度减去训练集的大小
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:] # 将数据集划分为训练集和测试集，前 67% 为训练集，后 33% 为测试集


look_back = 3 # 设置输入序列的长度为 3，即用前 3 个值来预测下一个值
trainX, trainY = create_dataset(train, look_back) # 调用 create_dataset 函数，将训练集转换为有监督学习的格式，得到训练输入和训练输出
testX, testY = create_dataset(test, look_back) # 调用 create_dataset 函数，将测试集转换为有监督学习的格式，得到测试输入和测试输出


trainX = numpy.reshape(trainX, (trainX.shape[0], trainX.shape[1], 1)) # 将训练输入的形状转换为 (样本数, 时间步数, 特征数)，即 (96, 3, 1)
testX = numpy.reshape(testX, (testX.shape[0], testX.shape[1], 1)) # 将测试输入的形状转换为 (样本数, 时间步数, 特征数)，即 (44, 3, 1)


batch_size = 1 # 设置批处理的大小为 1，即每次训练或预测一个样本
model = Sequential() # 创建一个 Sequential 对象，用于构建一个顺序模型
model.add(LSTM(4, batch_input_shape=(batch_size, look_back, 1), stateful=True)) # 向模型中添加一个 LSTM 层，设置神经元的个数为 4，输入的形状为 (批处理大小, 时间步数, 特征数)，即 (1, 3, 1)，并设置 stateful 参数为 True，表示保留上一批次的状态
model.add(Dense(1)) # 向模型中添加一个 Dense 层，设置输出的维度为 1，即预测值
model.compile(loss='mean_squared_error', optimizer='adam') # 编译模型，设置损失函数为均方误差，优化器为 adam
for i in range(100): # 迭代 100 次
  model.fit(trainX, trainY, epochs=1, batch_size=batch_size, verbose=2, shuffle=False) # 用训练输入和训练输出拟合模型，设置每次迭代的轮数为 1，批处理大小为 1，显示训练过程，不打乱数据顺序
  model.reset_states() # 重置模型的状态，以便下一次迭代


trainPredict = model.predict(trainX, batch_size=batch_size) # 用训练输入预测训练输出，设置批处理大小为 1


model.reset_states() # 重置模型的状态，以便预测测试输出
testPredict = model.predict(testX, batch_size=batch_size) # 用测试输入预测测试输出，设置批处理大小为 1


trainPredict = scaler.inverse_transform(trainPredict) # 将训练预测值从 0 到 1 的范围还原为原始范围
trainY = scaler.inverse_transform([trainY]) # 将训练真实值从 0 到 1 的范围还原为原始范围
testPredict = scaler.inverse_transform(testPredict) # 将测试预测值从 0 到 1 的范围还原为原始范围
testY = scaler.inverse_transform([testY]) # 将测试真实值从 0 到 1 的范围还原为原始范围


trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0])) # 计算训练集的均方根误差
print('Train Score: %.2f RMSE' % (trainScore)) # 打印训练集的均方根误差
testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0])) # 计算测试集的均方根误差
print('Test Score: %.2f RMSE' % (testScore)) # 打印测试集的均方根误差


trainPredictPlot = numpy.empty_like(dataset) # 创建一个和数据集形状相同的空数组，用于绘制训练预测值
trainPredictPlot[:, :] = numpy.nan # 将数组中的所有元素设置为 nan，表示空值
 # 将训练集预测的Y添加进数组，从第3位到第93+3位，共93行
trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict   
                              
testPredictPlot = numpy.empty_like(dataset) # 创建一个和数据集形状相同的空数组，用于绘制测试预测值
testPredictPlot[:, :] = numpy.nan # 将数组中的所有元素设置为 nan，表示空值
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict # 将测试预测值填充到数组中的相应位置


# 绘制原始数据，训练预测值和测试预测值的折线图，并显示
plt.plot(scaler.inverse_transform(dataset)) # 绘制原始数据的折线图，使用 scaler 对象将数据还原为原始范围
plt.plot(trainPredictPlot) # 绘制训练预测值的折线图
plt.plot(testPredictPlot) # 绘制测试预测值的折线图
plt.show() # 显示图形

运行输出：

……
93/93 - 0s - loss: 0.0022 - 323ms/epoch - 3ms/step
93/93 - 0s - loss: 0.0022 - 291ms/epoch - 3ms/step
93/93 - 0s - loss: 0.0022 - 285ms/epoch - 3ms/step
93/93 - 0s - loss: 0.0022 - 270ms/epoch - 3ms/step
93/93 - 0s - loss: 0.0022 - 325ms/epoch - 3ms/step
Train Score: 24.88 RMSE
Test Score: 51.26 RMSE

5. 带批次间记忆的堆叠LSTM

最后，让我们看一看LSTM的一个重大优势：它们能够在深度网络结构中成功训练的事实。

在Keras中，LSTM网络可以像堆叠其他类型的层一样进行堆叠。在配置时，需要添加一项配置，即在每个后续的LSTM层之前的LSTM层必须返回整个序列。可以通过将该层的return_sequences参数设置为True来实现。

您可以在前一节的状态化LSTM的基础上扩展为具有两个层，如下所示：

model.add(LSTM(4, batch_input_shape=(batch_size, look_back, 1), stateful=True, return_sequences=True))
model.add(LSTM(4, batch_input_shape=(batch_size, look_back, 1), stateful=True))

为了保持完整性，下面提供了完整的代码清单。

# Stacked LSTM for international airline passengers problem with memory
# 使用堆叠 LSTM 网络来解决国际航班乘客问题，考虑网络的记忆效果
import numpy # 导入 numpy 库，用于数组和矩阵运算
import matplotlib.pyplot as plt # 导入 matplotlib 库，用于绘图
from pandas import read_csv # 导入 pandas 库，用于读取 csv 文件
import math # 导入 math 库，用于数学计算
from keras.models import Sequential # 导入 keras 库，用于构建神经网络模型
from keras.layers import Dense # 导入 keras 库，用于添加全连接层
from keras.layers import LSTM # 导入 keras 库，用于添加 LSTM 层
from sklearn.preprocessing import MinMaxScaler # 导入 sklearn 库，用于数据缩放
from sklearn.metrics import mean_squared_error # 导入 sklearn 库，用于计算均方误差


# 将数据截取成3个一组的监督学习格式
# 定义一个函数，将数据集转换为监督学习的格式，即每三个数据作为输入，下一个数据作为输出
def create_dataset(dataset, look_back=1):
  dataX, dataY = [], [] # 初始化输入和输出的空列表
  for i in range(len(dataset)-look_back-1): # 遍历数据集，从第一个元素到倒数第四个元素
    a = dataset[i:(i+look_back), 0] # 取出当前元素和后两个元素，作为输入的一部分
    dataX.append(a) # 将输入添加到 dataX 列表中
    dataY.append(dataset[i + look_back, 0]) # 取出当前元素后的第三个元素，作为输出的一部分
  return numpy.array(dataX), numpy.array(dataY) # 将列表转换为 numpy 数组，并返回
# 定义随机种子，以便重现结果
# 设置随机数种子为 7，保证每次运行的结果一致
numpy.random.seed(7)
# 加载数据
# 使用 pandas 库的 read_csv 函数，读取 csv 文件中的数据，只使用第二列（乘客数量）
dataframe = read_csv('LSTM\\LSTM_Fly\\airline-passengers.csv', usecols=[1], engine='python')
dataset = dataframe.values # 将数据转换为 numpy 数组
dataset = dataset.astype('float32') # 将数据类型转换为浮点数
# 缩放数据
# 使用 sklearn 库的 MinMaxScaler 函数，将数据缩放到 0 到 1 的范围
scaler = MinMaxScaler(feature_range=(0, 1))
dataset = scaler.fit_transform(dataset)
# 分割2/3数据作为测试
# 将数据集分割为训练集和测试集，训练集占 2/3，测试集占 1/3
train_size = int(len(dataset) * 0.67) # 计算训练集的大小，为数据集长度的 2/3，取整数
test_size = len(dataset) - train_size # 计算测试集的大小，为数据集长度减去训练集的大小
train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:] # 将数据集按照训练集和测试集的大小分割
# 预测数据步长为3,三个预测一个，3->1
# 设置预测数据的步长为 3，即每三个数据作为输入，下一个数据作为输出，3->1
look_back = 3
trainX, trainY = create_dataset(train, look_back) # 将训练集转换为监督学习的格式，得到输入和输出
testX, testY = create_dataset(test, look_back) # 将测试集转换为监督学习的格式，得到输入和输出
# 重构输入数据格式 [samples, time steps, features] = [93,3,1]
# 将输入数据的形状重构为 [样本数，时间步长，特征数]，即 [93,3,1]，符合 LSTM 层的输入要求
trainX = numpy.reshape(trainX, (trainX.shape[0], trainX.shape[1], 1)) # 将训练集输入重构为 [93,3,1]
testX = numpy.reshape(testX, (testX.shape[0], testX.shape[1], 1)) # 将测试集输入重构为 [44,3,1]
# 构建 LSTM 网络
# 设置批处理大小为 1，即每次输入一个样本
batch_size = 1
model = Sequential() # 创建一个顺序模型
# 堆叠两层 LSTM 网络，参数 return_sequences=True 表示将上层的输入形状向下继续传递
model.add(LSTM(4, batch_input_shape=(batch_size, look_back, 1), stateful=True, return_sequences=True)) # 添加第一层 LSTM 层，设置神经元个数为 4，输入形状为 (1,3,1)，保持网络状态，向下传递输入形状
model.add(LSTM(4, batch_input_shape=(batch_size, look_back, 1), stateful=True)) # 添加第二层 LSTM 层，设置神经元个数为 4，输入形状为 (1,3,1)，保持网络状态
model.add(Dense(1)) # 添加一个全连接层，设置输出神经元个数为 1
model.compile(loss='mean_squared_error', optimizer='adam') # 编译模型，设置损失函数为均方误差，优化器为 adam
# 网络训练一个周期，循环训练100次
# 使用 for 循环，将模型训练 100 次，每次训练一个周期
for i in range(100):
  model.fit(trainX, trainY, epochs=1, batch_size=batch_size, verbose=2, shuffle=False) # 使用 fit 函数，将训练集输入和输出作为参数，设置周期数为 1，批处理大小为 1，显示训练过程，不打乱数据顺序
    # 每次训练完都重置网络状态
  model.reset_states() # 使用 reset_states 函数，重置网络状态，避免上一次训练的影响
# 对训练数据的Y进行预测
# 使用 predict 函数，将训练集输入作为参数，得到训练集的预测输出
trainPredict = model.predict(trainX, batch_size=batch_size)
# 重置网络状态
# 使用 reset_states 函数，重置网络状态，避免上一次预测的影响
model.reset_states()
# 对测试数据的Y进行预测
# 使用 predict 函数，将测试集输入作为参数，得到测试集的预测输出
testPredict = model.predict(testX, batch_size=batch_size)
# 对数据进行逆缩放
# 使用 scaler.inverse_transform 函数，将预测输出和真实输出逆缩放，还原为原始数据的范围
trainPredict = scaler.inverse_transform(trainPredict) # 将训练集预测输出逆缩放
trainY = scaler.inverse_transform([trainY]) # 将训练集真实输出逆缩放
testPredict = scaler.inverse_transform(testPredict) # 将测试集预测输出逆缩放
testY = scaler.inverse_transform([testY]) # 将测试集真实输出逆缩放


# 计算RMSE误差
# 使用math库的sqrt函数，计算训练集和测试集的预测值和真实值之间的均方根误差（RMSE），并存储为trainScore和testScore变量
trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0]))
testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0]))
# 打印RMSE误差
# 使用print函数，输出训练集和测试集的RMSE误差，保留两位小数
print('Train Score: %.2f RMSE' % (trainScore))
print('Test Score: %.2f RMSE' % (testScore))


# 构造一个和dataset格式相同的数组，共145行，dataset为总数据集，把预测的93行训练数据存进去
# 使用numpy库的empty_like函数，创建一个和dataset数组形状相同的空数组，用于存储训练集的预测值，命名为trainPredictPlot
trainPredictPlot = numpy.empty_like(dataset)
# 使用numpy库的nan值，填充trainPredictPlot数组，使其所有元素都为nan
trainPredictPlot[:, :] = numpy.nan
# 将训练集的预测值trainPredict数组，添加到trainPredictPlot数组中，从第look_back位开始，到第len(trainPredict)+look_back位结束，共len(trainPredict)行
trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict


# 构造一个和dataset格式相同的数组，共145行，把预测的后44行测试数据数据放进去
# 使用numpy库的empty_like函数，创建一个和dataset数组形状相同的空数组，用于存储测试集的预测值，命名为testPredictPlot
testPredictPlot = numpy.empty_like(dataset)
# 使用numpy库的nan值，填充testPredictPlot数组，使其所有元素都为nan
testPredictPlot[:, :] = numpy.nan
# 将测试集的预测值testPredict数组，添加到testPredictPlot数组中，从第len(trainPredict)+(look_back*2)+1位开始，到第len(dataset)-1位结束，共len(testPredict)行
testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict


# 画图
# 使用matplotlib库的pyplot模块，绘制图形
# 使用plt.plot函数，绘制原始数据集dataset的曲线，颜色为蓝色，标签为'Original Data'
plt.plot(scaler.inverse_transform(dataset), color='blue', label='Original Data')
# 使用plt.plot函数，绘制训练集预测值trainPredictPlot的曲线，颜色为绿色，标签为'Train Prediction'
plt.plot(trainPredictPlot, color='green', label='Train Prediction')
# 使用plt.plot函数，绘制测试集预测值testPredictPlot的曲线，颜色为红色，标签为'Test Prediction'
plt.plot(testPredictPlot, color='red', label='Test Prediction')
# 使用plt.legend函数，显示图例
plt.legend()
# 使用plt.show函数，显示图形
plt.show()

运行输出：

……
93/93 - 0s - loss: 0.0017 - 422ms/epoch - 5ms/step
93/93 - 0s - loss: 0.0017 - 412ms/epoch - 4ms/step
93/93 - 0s - loss: 0.0017 - 450ms/epoch - 5ms/step
93/93 - 0s - loss: 0.0017 - 414ms/epoch - 4ms/step
93/93 - 0s - loss: 0.0017 - 411ms/epoch - 4ms/step
93/93 - 0s - loss: 0.0017 - 420ms/epoch - 5ms/step
93/93 - 0s - loss: 0.0017 - 426ms/epoch - 5ms/step
93/93 - 0s - loss: 0.0017 - 437ms/epoch - 5ms/step
93/93 - 0s - loss: 0.0017 - 412ms/epoch - 4ms/step
93/93 - 0s - loss: 0.0017 - 453ms/epoch - 5ms/step
Train Score: 20.86 RMSE
Test Score: 59.16 RMSE

附-LSTM模型参数和调用说明：

LSTM 模型的参数:

units: LSTM 层的输出空间的维度，即 LSTM 单元的个数，也就是隐藏层的大小。这个参数决定了 LSTM 层的复杂度和表达能力，一般来说，越大越强，但也会增加计算量和过拟合的风险。
activation: LSTM 层的激活函数，用于计算单元状态（cell state）和输出门（output gate）的输出。默认为双曲正切函数（tanh），也可以选择其他的激活函数，如 ReLU，sigmoid 等。激活函数的作用是引入非线性，增强模型的拟合能力。
recurrent_activation: LSTM 层的循环激活函数，用于计算遗忘门（forget gate），输入门（input gate）和输出门（output gate）的激活值。默认为硬 S 型函数（hard_sigmoid），也可以选择其他的激活函数，如 sigmoid，ReLU 等。循环激活函数的作用是控制门的开关，调节信息的流动。
use_bias: 布尔值，表示是否使用偏置向量。偏置向量是神经网络中的一个常数项，可以增加模型的灵活性，改善拟合效果。
kernel_initializer: 权重矩阵的初始化器，用于输入的线性变换。权重矩阵是神经网络中的一个参数矩阵，用于将输入数据映射到隐藏层。初始化器是一种方法，用于给权重矩阵赋予初始值，影响模型的收敛速度和效果。
recurrent_initializer: 循环权重矩阵的初始化器，用于循环状态的线性变换。循环权重矩阵是神经网络中的一个参数矩阵，用于将上一时刻的隐藏层状态映射到当前时刻的隐藏层。初始化器的作用同上。
bias_initializer: 偏置向量的初始化器。偏置向量的作用同上。初始化器的作用同上。
unit_forget_bias: 布尔值，表示是否在初始化时给遗忘门的偏置向量加上 1。这样做的好处是让遗忘门更倾向于记住信息，而不是忘记信息。这是一种启发式的方法，有助于提高模型的性能。如果设置为 True，那么偏置向量的初始化器将被强制为零初始化器（zeros）。
kernel_regularizer: 权重矩阵的正则化函数。正则化函数是一种方法，用于给模型添加一些额外的约束，防止过拟合或欠拟合。常见的正则化函数有 L1，L2，dropout 等。
recurrent_regularizer: 循环权重矩阵的正则化函数。作用同上。
bias_regularizer: 偏置向量的正则化函数。作用同上。
activity_regularizer: 输出的正则化函数。作用同上，但是作用于 LSTM 层的输出，而不是参数。
kernel_constraint: 权重矩阵的约束函数。约束函数是一种方法，用于限制权重矩阵的取值范围，防止梯度爆炸或消失。常见的约束函数有 max_norm，min_max_norm，unit_norm 等。
recurrent_constraint: 循环权重矩阵的约束函数。作用同上。
bias_constraint: 偏置向量的约束函数。作用同上。
dropout: 0 到 1 之间的浮点数，表示输入的线性变换中丢弃的单元的比例。丢弃是一种正则化方法，用于随机关闭一些神经元，减少模型的复杂度，防止过拟合。
recurrent_dropout: 0 到 1 之间的浮点数，表示循环状态的线性变换中丢弃的单元的比例。作用同上，但是作用于循环状态，而不是输入。
return_sequences: 布尔值，表示是否返回输出序列中的最后一个输出，或者完整的序列。如果为 True，那么 LSTM 层的输出将是一个三维张量，形状为 (batch_size, timesteps, units)；如果为 False，那么 LSTM 层的输出将是一个二维张量，形状为 (batch_size, units)。这个参数决定了 LSTM 层的输出能否作为另一个 LSTM 层的输入。
return_state: 布尔值，表示是否除了输出之外，还返回最后一个状态。如果为 True，那么 LSTM 层的返回值将是一个列表，包含输出，最后一个隐藏状态和最后一个单元状态；如果为 False，那么 LSTM 层的返回值将只有输出。这个参数决定了 LSTM 层的状态能否作为另一个 LSTM 层的初始状态。
go_backwards: 布尔值，表示是否反向处理输入序列，并返回反向的序列。如果为 True，那么 LSTM 层将从最后一个时间步开始，逐步向前处理输入序列，并返回反向的输出序列；如果为 False，那么 LSTM 层将正常处理输入序列，并返回正向的输出序列。这个参数可以用于构建双向 LSTM（Bidirectional LSTM）。
stateful: 布尔值，表示是否保持批次之间的状态。如果为 True，那么 LSTM 层将在每个批次结束时，将最后一个状态作为下一个批次的初始状态；如果为 False，那么 LSTM 层将在每个批次开始时，重置状态为零。这个参数可以用于处理较长的序列，或者实现序列到序列的模型（Seq2Seq）。
unroll: 布尔值，表示是否展开循环。如果为 True，那么 LSTM 层将展开循环，使用静态计算图，提高计算效率，但是增加内存消耗；如果为 False，那么 LSTM 层将使用动态计算图，节省内存，但是降低计算效率。展开循环只适用于较短的序列，否则可能会导致内存溢出。
time_major: 布尔值，表示输入和输出张量的形状格式。如果为 True，那么输入和输出的形状将是 (timesteps, batch_size, ...)，即时间步优先；如果为 False，那么输入和输出的形状将是 (batch_size, timesteps, ...)，即批次优先。使用时间步优先的格式可以提高计算效率，因为它避免了在 RNN 计算的开始和结束时的转置操作。但是，大多数 TensorFlow 的数据都是批次优先的，所以默认情况下，这个函数接受批次优先的输入，并输出批次优先的输出。

LSTM 模型的调用参数:

inputs: 一个三维张量，表示输入序列，形状为 (batch_size, timesteps, input_dim) 或 (timesteps, batch_size, input_dim)，取决于 time_major 参数的值。
mask: 一个二维的布尔张量，形状为 (samples, timesteps)，表示是否对给定的时间步进行掩码。一个 True 的元素表示对应的时间步应该被使用，而一个 False 的元素表示对应的时间步应该被忽略。掩码的作用是让 LSTM 层能够处理不等长的序列，或者忽略一些无效的数据。
training: 一个 Python 布尔值，表示 LSTM 层应该在训练模式还是推理模式下运行。这个参数会传递给 LSTM 单元在调用时。这个参数只有在使用 dropout 或 recurrent_dropout 时才有意义。训练模式下，LSTM 层会随机丢弃一些单元，以防止过拟合；推理模式下，LSTM 层会使用所有的单元，以保持最佳的预测效果。
initial_state: 一个张量列表，表示传递给 LSTM 单元的第一次调用的初始状态。这个参数可以用于指定 LSTM 层的初始隐藏状态和初始单元状态，而不是使用零状态。这个参数可以用于实现序列到序列的模型（Seq2Seq），或者在多层 LSTM 之间传递状态。

参考网址：

https://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/

你可能感兴趣的:(机器学习,rnn,lstm,keras,回归)

Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
无题回归自然HAO
“横看成岭侧成峰，远看高低各不同。"世间的事，对与错，都是站的角度不同，而得出了不同的结论。慨叹故人的寥寥数语，就告诉了世人朴素主义哲学的真意：和谐生存，尊重自然。古人说：读万卷书，行万里路。刻苦读书，回归自然，不会有错。因为书中自有清目剂，自然就是个大讲堂。图片发自App
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
极简生活让我变得孤僻了，习惯是个可怕的东西小雅_10a7
最近这段时间，我从小喇叭变成了沉默的小绵羊，发现自己有点孤僻了，不想去管那么多人和事，自己默默的回归极简生活，本人是典型的双子女。以前的自己爱好跟形形色色的人聊天，聊八卦，喜欢听各种故事，不夸张的说，就是人群中的小精灵，小蜜蜂，突然有一天，感觉自己突然变成不爱说了，也不怎么听别人的故事了，感觉就沉浸在自己的小世界，固守着自己曾经的认知，不接触新事物，连回家的路，都习惯性走同样的路，一次不是以往的路
营销：让销售回归销售，别再说“把梳子卖给和尚”了！ _蚊子爱上蚊香_
环顾一下现如今的营销界，都是那类“把冰箱卖到北极”、“把梳子卖给和尚”的营销故事，简直成了营销界的精神偶像，但“假、大、空”现象层出不穷，销售出路在哪里？有这样一个故事与大家共同分享感受下：在纽约第五大道有一家复印机制造公司，他们需要招聘一名优秀的推销员。老板从数十位应聘者中初选出3位进行考核，其中包括来自费城的年轻姑娘安妮。老板给他们一天的时间，让他们在这一天里尽情地展现自己的能力！可是，什么事
回归故园风中的秋叶
我，一个尘世间平凡的女人，经年困于城市的嘈杂与喧嚣，于某个不眠的深夜，听着窗外淅淅沥沥的雨声，触动了灵魂深处那痕一直没能愈合的疼，手抚满脸沧桑，禁不住潸然泪下。或许，故园的回归，是一帖医心的良药。红土地，绿草滩，我终于回到了您的怀抱____这个生我养我，聆听我初来人世的第一声啼哭，留下我童稚岁月的十年苦乐，甚至造就我一生性格命运的小村庄，我回来了！四十五年岁月流逝，那间破旧的小矮屋居然还在原处。她
后半生，享受生活就是最好的养老方式 alisonliu
人生百年，后半生的日子，其实才是属于你的黄金时代！因此，记住下面十句话，就能过上无忧无虑、享受人生的黄金时代。1、后半生，请学会沉默有时候，被人误解，不想争辩，所以我们选择沉默。生活中，不是所有的是非都能说清楚，甚至可能根本没有真正的是与非。那么，不想说话，就不说吧，在多说无益的时候，也许沉默就是最好的解释。2、后半生，请回归平静人到了一定的年纪，反而不喜欢喧闹的环境，平静的心态更有利于身体健康、
2020年高考倒计时最后30天，如何高效复习和备考呢？韦彪爱创作
到了最后一个月，很多高考生逐渐感觉到比较紧张，而且很茫然，到底怎样才能能快速提高成绩，更好的复习。其实很简单，此时现在要做就是复习教材，好好看之前的试题，多练习试题，而且还要有针对性和有计划性的复习。有些同学看书很没有效率，看着就快睡着了，而且效率低下，看了一天什么东西都没记进去，纯属浪费时间，所以最后一个月，建议同学们可以做如下的复习和冲刺：一、30天回归教材有的同学可能会问，高中课本我都看了十
期望，其实是一种负能量晓玉_5c35
所有关系，父母子女关系也好，夫妻情侣关系也罢，兄弟姐妹关系也好，亲戚朋友关系也罢，都只是锦上添花的幸福。一个人精神上的长久幸福，最终还是来自于自己心灵的丰盈。有很多人在我的后台留言，抱怨她们的另一半，抱怨婚姻生活不幸福，然后这些抱怨都会回归到同一个问题——该去还是留？我们都知道，亲密关系是修行最好的道场，你的配偶就是你修行的最佳对象，否则你也不会遇见他。可是每个人的功课都不一样。该去该留，外人岂能
再度融合吾宗老孙子
在之前融合的时候，方向就是不断的回归本心。在金刚经里，是说达到无所住的时候，本心也就找到了。在道德经里，是说那个虚极、静笃的状态也就是回归本心的状态。于是我就顺着这个方向在前行。虽然修行继续，但我仍然想要作用现实。在读了零极限之后，发现它们融合的很好。我通过回归零点来更清楚的察觉现实的模样，观察自己的行为。这样无有本来也是一个整体。在学习了阿纳丝塔夏之后，我对于这种融合的理解又更近了一步。她提出的
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
20190916没对比没伤害，有对比没伤害冯妇两年
收拾整理抽屉桌面，座位要轮动了，上周四放假前忘了。纸巾，空瓶子，废弃簿册和文具，丢丢丢，个个瞄准垃圾桶，投投投。垃圾桶上大下小，四方形，约，高度五十厘米，口子三十乘四十，深蓝色。嗯嗯嗯？垃圾袋垃圾袋！前排一女生随即上来，拉开图书橱柜的门，拿出一个巨大的黑色塑料袋。蒙头蒙脸套在桶上，端住桶身，将桶倒立过来，轻轻摇两摇，把桶取出放回地上。所有桶里垃圾都回归袋子里，都是干垃圾，没异味没毒害没危害。前排女
从0开始学习R语言--Day58--竞争风险模型
在用传统生存分析方法的场景中（如Kaplan-Meier和Cox回归），假设所有事件都是独立且互斥的，但在现实中，研究对象可能面临多种互斥的终点事件（如癌症患者可能死于癌症本身，也可能死于其他原因），如果直接去分析，模型会把这种结局时间错误地纳入评估，从而提高了病症的分析。而竞争风险模型可以在考虑其他竞争风险存在的情况下，排除干扰求得某特定事件发生的概率。以下是一个例子：library(cmprs
Python_day55序列预测任务介绍且慢.589 Python_60 python 人工智能开发语言
在进入rnn相关变体的内容前，我们必须要搞懂序列任务的前生今世，这是我当初自学的时候非常迷茫和痛苦的，只有理解了序列任务，才知道模型为什么这么选择，数据为什么这么处理一、序列预测任务介绍1.1序列预测是什么？我们之前接触到的结构化数据，它本身不具备顺序，我们认为每个样本之间独立无关，样本之间即使调换顺序，仍然不影响模型的训练。但是日常中很多数据是存在先后关系的，而他们对应的任务是预测下一步的值，我
Python 4.0新特性解析：性能优化与语法升级知识产权13937636601 计算机 python 性能优化开发语言
本文针对Python4.0的核心升级展开系统性分析，从性能优化与语法革新两个维度揭示其技术突破。首先解析新型解释器架构对运算效率的提升路径，其次探讨模式匹配、异步编程简化和类型系统强化等语法特性，最后结合机器学习与高并发场景验证新版本的实践价值。研究发现，Python4.0通过JIT编译器与内存管理重构实现3倍以上性能跃升，同时静态类型推导的完善显著提升大型项目维护效率，标志着Python从"胶水
Python,C++,go语言开发社会犯罪人群回归社会跟踪与辅助管理APP Geeker-2025 python c++golang
开发一款用于**社会犯罪人群回归社会跟踪与辅助管理**的App，结合Python、C++和Go语言的优势，可以实现高效的数据处理、实时的跟踪监控以及用户友好的前端界面。以下是一个详细的开发方案，涵盖技术选型、功能模块、开发步骤等内容。##技术选型###后端（Python+Go）-**编程语言**：-**Python**：用于数据处理、机器学习（如风险评估、行为预测）、脚本编写等。-**Go**：用
高赞小说林黎叶昭（和闺蜜一起穿进仙界救赎文）完结阅读_林黎叶昭和闺蜜一起穿进仙界救赎文好书慢看
高赞小说林黎叶昭（和闺蜜一起穿进仙界救赎文）完结阅读_林黎叶昭和闺蜜一起穿进仙界救赎文主角配角：林黎叶昭小说别名：和闺蜜一起穿进仙界救赎文简介：和闺蜜穿越到仙侠文的第一千年。系统终于大发慈悲的告诉了我们，回归现实世界的方法。闺蜜站在诛仙台上，对着我笑道：“黎黎，我要回家了。”说完，她就当着他战神夫君的面一跃而下。前一秒还在指责她演戏，上不得台面的战神，顿时白了脸。那是我被关在血渊的第十天。这十天里
IoTDB智能分析节点AINode：时序数据分析的新引擎时序数据说 iotdb 数据分析数据挖掘时序数据库数据库大数据 ai
在大数据与物联网的驱动下，时序数据处理需求激增，如何高效存储、管理并实时分析海量时序数据成为技术挑战。作为专为时序数据设计的数据库，IoTDB通过引入智能分析节点（AINode），将机器学习能力原生集成到数据库中，实现了“数据存储-分析-决策”的一体化闭环。本文将深入解析AINode的核心功能、技术优势及实际应用场景。AINode：IoTDB的智能分析引擎AINode是IoTDB推出的第三种内生节
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">