Python 机器学习实战 —— 监督学习（上）

近年来AI人工智能成为社会发展趋势，在IT行业引起一波热潮，有关机器学习、深度学习、神经网络等文章多不胜数。从智能家居、自动驾驶、无人机、智能机器人到人造卫星、安防军备，无论是国家级军事设备还是广泛的民用设施，都充斥着AI应用的身影。接下来的一系列文章将会由浅入深从不同角度分别介绍机器学习、深度学习之间的关系与区别，通过一系统的常用案例讲述它们的应用场景。
本文将会从最常见的机器学习开始介绍相关的知识应用与开发流程。

一、浅谈机器学习

1.1 机器学习简介

其实AI人工智能并非近代的产物，早在19世纪的50到80年代，科学家们就有着让计算机算法代替人脑思考的想法。通过几十年的努力，到了90年代成为了机器学习蓬勃发展期，很多科技公司在不同领域提供了相关的技术支持。在最初，机器学习只用于垃圾邮件清理，数学公式分析等简单领域，然而后来其应用场景越来越多，无论是图片过滤，语音分析，数据清洗等领域都能看到机器学习的身影。到如今无论是智能手机，航空运输，智能驾驶等方方面面都可以看到 AI 的身影。

从不同领域分析，AI人工智能包含了机器学习与深度学习。

机器学习主要应用数据科学领域，它与普通程序开发的主要区别在于一般程序，数据往往来源于不同的数据库，通过对数据进行复杂转化，运算得到最后的结果。
而机器学习目的并不是为了得到最后的运算结果，而是对计算过程进行分析，总结出一套运算的规则。只要数据量足够多，运算规则就越准确。最后可以根据这套规则对没有通过验证的数据进行预算，得到预算后的值。只要使用的规则正确，预算的结果的正确率往往可以达到95%以上。

而深度学习开始只是机器学习的一分支领域，它更强调从连续的层中进行学习，这种层级结构中的每一层代表不同程序的抽象，层级越高，抽象程度越大。这些层主要通过神经网络的模型学习得到的，最大的模型会有上百层之多。而最简单的神经网络分为输入层，中间层（中间层往往会包含多个隐藏层），输出层。

经过多年的发展，深度学习的应用层面越来越广，从而诞生出 Tensorflow、Keras、Theano、CNTK 等框架的支持，逐渐发展形成独立的技术领域。根据不同的应用场景，深度学习又分为多层感知器MLP、深度神经网络DNN、卷积神经网络CNN、递归神经网络RNN、生成对抗网络BNN等多个方面。

由于本系统文章主要是对机器学习进行介绍，对深度学习有兴趣有朋友可以留意后面的文章，将会对神经网络进行更深入全面的讲解。

1.2 机器学习分类

机器学习可分为监督学习与无监督学习两种

1.2.1 监督学习

从输入 / 输出中总结运算规律进行机械学习的算法叫做监督学习。在监督学习中，每个实例都是由一个输入对象（通常为矢量）和一个期望的输出值（也称为监督信号）组成。监督学习算法是分析该数据的输入对象与输出值，总结当中的运算规律并产生一个推断的逻辑，并可以把此逻辑用于映射出的新实例，对没有运算过的数据结果进行预测。
其过程就像读小学时候的数学应用题，课堂上老师会先讲解应用题的公式与计算方法，然后学生可以在做作业时根据此计算规律完成类似的题目。

常见的监督学习包含了线性回归、k近邻、朴素贝叶斯分类、决策树、随机森林与梯度提升决策树、支持向量机等多种算法，在下面将用不同实例介绍其应用场景。

1.2…2 无监督学习

相比之下无监督学习只有输入数据，没有提供输出结果，只能通过计算评估其中的运行规律。就好比在考试中遇到作业上没有做过的应用题，只能通过思考总结才能得出答案。它的最大挑战在于实例没有包含最终结果，所以无法在学习中评估算法是否学到了有用的东西。

常见的无监督学习分为聚类、降维两大类，包含了PCA（主成分分析）、NMF（非负矩阵分解）、t-SNE（流形学习）、k均值聚类、DBSCAN 等多种算法，将在下一篇文章《 [Python 机器学习实战 —— 无监督学习]》中详细介绍，敬请留意。

回到目录

二、基本概念

在机器学习里，每一行的数据实例被看作是一个样本，每一列的数据被看作是一个特征。学过面向对象开发的朋友应该好理解，这相当于一个类与其属性的关系。而监督学习是通过一系列样本计算，总结出特征与计算结果之间的关系，这被称为特征提取。

2.1 分类与回归的区别

监督学习分成分类与回归两大类：分类与回归
分类的目标是预测类别标签，类似于通过人脸识别分出黄种人、白种人、黑种人。
回归的目标则是预测一个连续值，相当于数学里面的坐标图，它可以通过已有的数据计算出坐标的走向，从而对末知值进行预测。类似于气温预计，GDP增速预算。
其实区分分类与回归很简单，只要判断输出值是否具备连续性，具有连续性的就是回归，只有若干个固定值的就是分类。

2.2 数据划分

从监督学习的概念可以了解，其学习目标是要从已有的数据中总结出各个特征与结果之间的关系，然而这个计算模型的泛化能力如何，我们无法从已通过运算过的数据中得知。所以在运算前，一般会先对数据进行划分，一部分是训练数据，专门用作模型的学习，另一部分是测试数据，用作模型的测试，其比例一般是75%对25%。
为了方便数据划分，sklearn 提供 train_test_split 函数方便日常使用，下一节将有介绍。

2.3 过拟合与欠拟合

对于训练数据最重要的目标是将其泛化，总结出每个特征的比重，因此并非正确率越高越好。如果在训练过程中，得到的正确率是100%，然而在测试时候，正常率却很低，不能泛化到测试数据当中。这往往是因为训练过程中存在过似合，过度重视某些特征，而忽略某些关键因素。
相反，如果模型过分简单，考虑的因素太少，甚至导致在训练过程中的正确率就很低，这可能就是因为模型的欠拟合造成。

所以在选择模型的时候，需要在过拟合与欠拟合之间作出权衡（如图）。

2.4 损失函数

损失函数一方面跟数学计算原理的应用关系比较密切，另一个方面它也是机器学习的基层原理，此章节想做一个简单的介绍。由于网上关于这方面的学习材料很多，所以此章节主要是想通过最容易理解的方式去讲述计算的原理，至于复杂的计算流程可以在网上查找。
在写这篇文章的时候，恰好是高考的开考日，在这里预祝师弟师妹能顺利闯关，金榜题名。毕竟最近疫情有复发的情况，学习实在不容易。通过此章节想告诉理工科的学子们，辛勤学习并非一无所用。公式里所蕴藏的原理，他日参加工作时候还是有很广的应用场景。

在日常对数据模型的测试中，预测值与真实值总会存在一定的偏差，以直线方程 y=a*x+b 为例，如下图。在预测值 [x1,y1] [x2,y2] [x3,y3] … [x(i),y(i)] 中,并非每个点与方程匹配，而是存在一定的误差。所以在测试中，当误差值最小时，可以看作这条直线的正确答案。

损失函数就是用来评价模型的预测值和真实值不一样的程度，当损失值越小，证明预计值越接近真实值，模型的训练程度就越好。为了让预测值 y^ (i) 尽量接近于真实值 y(i) ，学者提出了多个方法进行计算损失值，最常见的损失函数有均方误差（MSE）、交叉熵误差（CEE）等。
均方误差（MSE） 中，因为每个预测值与真实值大小不同，为了解决差值的正负值之分，所以误差大小就用差值平方来表示，差值越小，平方值小，误差越小。
均方误差计算公式就是求预测值与真实值之间的方差平均值，如果均方误差越小，那就证明预测值越接近于真实值。

交叉熵误差（CEE） 的公式如下，其中 $t=(t_{1},t_{2},...,t_{n})$ 为实际的分类结果， $y={y_{1},y_{2},...,y_{n}}$ 为预测的结果

把它用于分类模型时有一个很好的特性，可以真实的反应出真实分类结果和预测结果的误差，假设 $t_{i}=1$ , 即真实的分类结果是 , 则交叉熵误差可以简化为 $E=-logy_{i}$ ，那函数图像如下。可以看到， $y_{i}$ 越接近，即预测结果和真实分类结果越接近，误差越接近，即误差越小。

关于损失函数有多种算法，下面介绍两种最常用也是最容易理解的算法：最小二乘法（OLS）与梯度下降法（GD）

2.4.1 最小二乘法

最小二乘法是基于 MSE 均方误差而来，它的目标就是求出 n 个 y^ (i) 与 y(i) 误差值平方和最小时各常量参数的值。还是以上面提到的直线方程 y=a*x+b 为例，均方误差越小，证明预测值越接近于真实值，这时候只要求出最小均方误差时 a，b的值，也就可以得出此直线的方程。因为 n 是个常数，所以求最小均方误差的公式可以转化为求预测值 y^ (i) 与真实值之 y(i) 间的最小方差，这就是最小二乘法的由来。

代入 y=a*x+b 后，计算公式可得到转换成下图，由于计算的是平方和，所以表达式必然存在最小值，通过偏导数为 0 时得极值的原理，可得到计算公式：

此时好办，最小二乘法已经变成高考的导数题，要了解求解过程的程序猿建议去复习一下高考时偏导数求解的方法（若怕麻烦通过几条简单的语法计算也可得到最终结果）。根据以下得出的公式，代入已知的数据点 [x1,y1] [x2,y2] [x3,y3] … [x(i),y(i)] 便可得到最后的 a、b 参数值，最后把 a、b 值代入直线方程就是最终的答案。

第四节介绍的线性回归模型中，有部分就是使用最小二乘法来实现的，敬请留意。
当然，现实情形下数据模型是复杂的，不可能完全按照直线模型来走，所以复杂的线性模型还可以通过多次方程式，基函数，线性分割等多种方法来处理，在后面章节将会详细讲述。

2.4.2 梯度下降法

上面提到损失函数就是用来评价模型的预测值和真实值不一样的程度，损失值越小证明参数的预测值越接近于真实值。梯度下降法就是用于求损失值最小时的参数值，相对于最小二乘法复杂的数学公式，它可以通过偏导数斜率的变化更形象地描述解决的过程。

先介绍梯度下降法用到的基本概念：
切线斜率：从数学的角度可知，一维函数在点 x 的导数叫做函数在点 x 的切线斜率，二维函数在点（x0,x1) 的偏导数称为点（x0,x1) 的切线斜率，如此类推。
鞍点：函数的极小值（最小值）被称为鞍点，从数学原理可知当到达鞍点时，切线斜率接近于 0。
梯度：以常用的二元方程 f(x0,x1)=x02+x12 为例子，把全部变量的偏导数（切线斜率）汇总成的向量称为梯度

下面以一个二次方程 f(x)=x2+1 为例，介绍一下如何通过梯度下降法求极值
首先，切线的斜率可以通过导数原理求得，例如 f(x) 分别经过点 A(- 4,17) ，B(- 5,26)，此时会发现，两点之间的距离越小，它们所组成的直线就越接近于该点的切线。两点距离无限接近于0时，此时可认为这条直线就是该点的切线，这也是微积分的基本原理。

下面的例子就是实现上述的原理，画出与点（- 4,17) 间 x 轴的距离分别为 0.3、0.2、0.001，0.0001 的直线。调用 tangent（）可以返回该直线的斜率，当 h 使用默认值 0.0001 值，该直线斜率已经无限接近于导数值（即切线斜率）。

 1 class gradinet_drop():
 2     def __init__(self):
 3         return
 4 
 5     def f(self, x):
 6         return x*x+1
 7 
 8     def polt_line(self):
 9         # 画出 y=x*x+1 图
10         x = np.linspace(-5, 5, 100)
11         plt.plot(x.reshape(-1, 1), self.f(x))
12         plt.xlabel('x')
13         plt.ylabel('f(x)')
14 
15     def tangent(self,x,h=0.0001):
16         #根据 y=ax+b 直线公式
17         #求导数，即切线斜率
18         a=(self.f(x+h)-self.f(x))/h
19         #求截距
20         b=self.f(x+h)-a*(x+h)
21         #划出切线
22         seft.polt_tangent(a,b)
23         return a
24 
25     def polt_tangent(self,a,b):
26         #划出直线 y=ax+b
27         x = np.linspace(-5, -1, 100)
28         y=a*x+b
29         plt.plot(x.reshape(-1,1),y,'--')
30 
31 gradientdrop=gradinet_drop()
32 gradientdrop.polt_line()
33 # 分别以 h 等于 -0.3，-0.2，-0.001 ,0.0001求斜率
34 # 将发现 h 越小，所得斜率越接于近切线斜率
35 for h in [-0.3,-0.2,0.001,0.0001]:
36     print('h={0}, tangent={1}'.format(h,gradientdrop.tangent(-4,h)))
37 plt.show()

运行结果

梯度下降法最终的目标是求得切线斜率接近无限于0时的数据点（鞍点），所以函数可以使用最简单的方法，使取值沿着当前梯度方向不断前进，然后重复计算梯度。通过此递归方式，切线斜率就是无限接近于0。
用数学公式表达如下图，η 表示学习率，学习率可以根据实际需要而改变，将学习率乘以该点的切线斜率代表学习量。

根据此公式，可以在上面的代码中加入一个简单的方法gradient()，以 0.01 的学习率，重复1000次进行计算。随着梯度不断地下降，x 坐标就会根据学习量不断接近鞍点，在重复1000后可以看到在数据点（0，1）处的切线斜率 tangent 为 -1.0098588631990424e-08，已无限接近于 0 ，此时鞍点的函数值 f(x)=1 就是此函数的最小值。

 1 class gradinet_drop():
 2     def __init__(self):
 3         return
 4 
 5     def f(self, x):
 6         return x*x+1
 7 
 8     def polt_line(self):
 9         # 画出 y=x*x+1 图
10         x = np.linspace(-5, 5, 100)
11         plt.plot(x.reshape(-1, 1), self.f(x))
12         plt.xlabel('x')
13         plt.ylabel('f(x)')
14 
15     def tangent(self,x,h=0.0001):
16         #根据 y=ax+b 直线公式
17         #求导数（切线斜率）
18         a=(self.f(x+h)-self.f(x))/h
19         #求截距
20         b=self.f(x+h)-a*(x+h)
21         #随机画出切线
22         n=np.random.randint(100)
23         if(n==5):
24             self.polt_tangent(a,b)
25         return a
26 
27     def polt_tangent(self,a,b):
28         #划出切线 y=ax+b
29         x = np.linspace(-5, 1, 100)
30         y=a*x+b
31         plt.plot(x.reshape(-1,1),y,'--')
32 
33     def gradinet(self,x,rate=0.01,n=1000):
34         #学习率默认为0.01，默认重复1000次
35         for i in range(n):
36             x-=self.tangent(x)*rate
37             print('x={0},f(x)={1},tangent slope={2}'.format(x,self.f(x),self.tangent(x)))
38 
39 gradientdrop=gradinet_drop()
40 gradientdrop.polt_line()
41 #使用学习率默认0.01，默认重复1000次求出鞍点
42 gradientdrop.gradinet(-3)
43 plt.show()

运行结果

到此不防思考一下使用梯度下降法找到鞍点的目标是什么，其实只要把简单的二次方程 f(x) 替换成为损失函数便会豁然开朗。以均方误差 MSE 为例，当找到鞍点，意味着找到函数最小值，即在该点时均方误差最小，在这点得到的参数值就是该函数的常量。
同样以最小二乘法中的直线 y=a*x+b 为例，把代码稍微修改一下。首先把方程改为均方误差公式，通过 sympy 包中的函数 diff 分别对 a，b 求偏导数，把学习率设置为0.01，训练1000次，a，b的默认初始值均为 1。使用 sklearn 中的测试数据 make_regression 进行训练，最后画出该直线并输出斜率和截距。

 1 class gradinet_drop():
 2     def __init__(self,train_x,train_y):
 3         #定义测试数据
 4         self.x=train_x
 5         self.y=train_y
 6         return
 7 
 8     def mes(self,a,b):
 9         #均方误差计算公式
10         return mean((self.y-a*self.x-b)**2)
11 
12     def partial_derivative(self):
13         #求 mes(a,b)对 a,b 的偏导数
14         partial_derivative_a=sp.diff(self.mes(a,b), a)
15         partial_derivative_b=sp.diff(self.mes(a,b),b)
16         return [partial_derivative_a,partial_derivative_b]
17 
18     def gradinet(self,rate=0.01,n=1000):
19         #学习率默认为0.01，默认重复1000次
20         #把 y=a*x+b 参数 a,b 的初始值设为 1，1
21         a1=1
22         b1=1
23         #默认训练1000次，找到最小均方误差时的 a,b 值
24         for i in range(n):
25             deri=self.partial_derivative()
26             a1-=deri[0].subs({a:a1,b:b1})*rate
27             b1-=deri[1].subs({a:a1,b:b1})*rate
28         #输出直线参数 a,b 值
29         print('y=a*x=b\n  a={0},b={1}'.format(a1,b1))
30         return [a1,b1]
31 
32     def polt_line(self,param):
33         #根据a,b参数值划出直线 y=a*x+b
34         x = np.linspace(-3, 3, 100)
35         y=param[0]*x+param[1]
36         plt.plot(x,y,20)
37         plt.legend(['train data','line'])
38 
39 #输入测试数据
40 X,y=dataset.make_regression(n_features=1,noise=5)
41 gradient_drop=gradinet_drop(np.squeeze(X),y)
42 #画出数据点
43 plt.plot(X,y,'.')
44 #训练数据找出最小均方误差时的参数 a,b 值
45 param=gradient_drop.gradinet()
46 #画出训练后的直线
47 gradient_drop.polt_line(param)
48 plt.show()

运行结果

可见计算后的直线与训练库中的点已相当接近，使用梯度下降法只需要牢记一点：计算目标是求出鞍点，在损失值最低时的参数值就是该函数的常量。下面介绍到的 SGD 模型正是使用梯度下降法进行计算，后面将有详细说明。
对损失函数就介绍到这里，希望对各位的理解有所帮助。

三、常用方法介绍

Scikit-Learn 是目录最常用的机器学习库，所以在本文当中大部实例都是运用当中的方法完成。
在 sklearn.datasets 中包含了大量的数据集，可为运算提供测试案例。例如鸢尾花数据集 load_iris()、癌症数据集 load_breast_cancer()、波士顿放假数据集 load_boston() 这些都是各大技术文章里常用的数据集，为了方便阅读下面大部分的例子中都会用到这些数据作为例子进行解说。

3.1 train_test_split 方法

上面曾经提起，为了方便区分训练数据与测试数据，sklearn 提供了 train_test_split 方法去划分训练数据与测试数据

train_test_split( * arrays, test_size=None, train_size=None, random_state=None, shuffle=True,stratify=None)

*arrays： 可以是列表、numpy数组、scipy稀疏矩阵或pandas的数据框

test_size： 可以为浮点、整数或None，默认为None

①若为浮点时，表示测试集占总样本的百分比

②若为整数时，表示测试样本样本数

③若为None时，test size自动设置成0.25

train_size： 可以为浮点、整数或None，默认为None

①若为浮点时，表示训练集占总样本的百分比

②若为整数时，表示训练样本的样本数

③若为None时，train_size自动被设置成0.75

random_state： 可以为整数、RandomState实例或None，默认为None

①若为None时，每次生成的数据都是随机，可能不一样

②若为整数时，每次生成的数据都相同

stratify *： *可以为类似数组或None

①若为None时，划分出来的测试集或训练集中，其类标签的比例也是随机的

②若不为None时，划分出来的测试集或训练集中，其类标签的比例同输入的数组中类标签的比例相同，用于处理不均衡数据集

常用例子：

把1000个数据集按 75% 与 25% 的比例划分为训练数据与测试数据

1     X,y=make_wave(1000)
2     X_train,X_test,y_train,y_test=train_test_split(X,y)

train_size 与 test_size 默认值为75% 与 25% ，所以上面的例子与下面例子得出结果相同

1     X,y=make_wave(1000)
2     X_train,X_test,y_train,y_test=train_test_split(X,y,train_size=0.75,test_size=0.25)

为了每次测试得到相同的数据集，可以把 RandomState 设置为相同值，只要RandomState相同，则产生的数据集相同。
因为 RandomState 默认为空，因此在不填写的情况下，每次产生的数据集都是随机数据

1     X,y=make_wave(1000)
2     X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0)

3.2 predict 方法与 accuracy_score 方法

在分类模型中，通常使用 predict（selt, X：any）方法预测新数据的标签，通常在完成训练后，就是通过此方法输入测试数据，把计算结果与测试结果进行对比。
accuracy_score 主要用于对比预测结果的准备率
下面的代码就是最简单的流程，先划分训练数据与测试数据，然后选择模型，输入训练数据进行泛化，输入测试数据求出计算结果，最后把计算结果与已有的测试结果进行对比，查看其正确率。

 1     X,y=make_blobs(n_samples=150,n_features=2)
 2     #划分训练数据与测试数据
 3     X_train,X_test,y_train,y_test=train_test_split(X,y)
 4     #绑定模型
 5     knn_classifier=KNeighborsClassifier(n_neighbors=7)
 6     #输入训练数据
 7     knn_classifier.fit(X_train,y_train)
 8     #运行测试数据
 9     y_model=knn_classifier.predict(X_test)
10     #把运行结果与测试结果进行对比
11     print(accuracy_score(y_test,y_model))

3.3 score 方法

在回归模型当中，由于测试结果并非固定值，所以一般通过使用 score(self, X, y, sample_weight=None) 方法，通过对 R^2（判定系数）来衡量与目标均值的对比结果。
R^{2=1，则表示模型与数据完成吻合，如果R}2为负值，侧表示模型性能非常差。

1     X,y=make_wave(1000)
2     X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0)
3     linearReg=LinearRegression()
4     linearReg.fit(X_train,y_train)
5     print(linearReg.score(X_train,y_train))

3.4 numpy.meshgrid 方法

生成网格点矩阵坐标，往往用于对平面内数据的预测值进行评估。生成一定范围内的网格数据，再把数据代入公式内进行计算，得到预测结果。

1 x=np.array([1,2,3])
2 y=np.array([4,5])
3 #显示网格矩阵坐标
4 X,Y=np.meshgrid(x,y)
5 print('X:\n '+str(X))
6 print('Y:\n '+str(Y))

运行结果

3.5 contour 和 contourf 方法

pyplot 的 contour 和 contourf 方法都是画三维等高线图的，不同点在于contour 是绘制轮廓线，contourf 会填充轮廓。本文在分类模型中，将会大量地使用此方法，让各位可以更直观的看到模型预测值的分布。
pyplot.contour (X，Y，Z，levels , linestyles，alpha，cmap )

X、Y : 必须是 2-D，且形状与 Z 相同。
Z：绘制轮廓的高度值。
levels：int 数组，可选填，确定需要显示的轮廓线区域的数量和位置。例如： levels = [-2,-1,0,1,2] 表示显示从-2级到2级的线区轮廓。
linestyles：数组，可选填，确定线条形状，例如：linestyles = [ ‘–’ , ‘-’ , ‘=’ ] 。
alpha: 透明度
cmap：颜色

1 def f(x,y):
2     return 3*x**2+x+y**+1
3 
4 x=np.linspace(-3,3,100)
5 y=np.linspace(-3,15,100)
6 X,Y=np.meshgrid(x,y)
7 plt.contourf(X,Y,f(X,Y))
8 plt.show()

运行结果

3.6 decision_function 方法

在分类模型中，通常使用 decision_function(self, X) 方法计算预测新数据的距离值。
与 predict 方法不同的是：predict 得到的标签值， decision_function 得到的是与分隔超平面的距离值。

 1     # 训练数据
 2     X,y=dataset.make_blobs(centers=2,random_state=2,n_features=2)
 3     # 使用 LinearSVC 模型，设置 C=100
 4     linear=LinearSVC(C=100)
 5     linear.fit(X,y)
 6     # 画出数据点
 7     plt.scatter(X[:,0],X[:,1],c=y,marker='^',s=50)
 8     # 建立网格数据
 9     xx=np.linspace(-5,6,2)
10     yy=np.linspace(-13,3,2)
11     XX,YY=np.meshgrid(xx,yy)
12     ZZ=np.c_[XX.ravel(),YY.ravel()]
13     # 根据网络数据推算出预测值
14     zz=linear.decision_function(ZZ)
15     aa=linear.predict(ZZ)
16     print('predict: '+str(aa))
17     print('decision_function:'+str(zz))

运行结果

predict 得到的最终的分类结果：0或1，而 decision_function 得到的是与分隔平面的距离，正值代表分类是 1，负值代表分类为 0，值越大代表与分隔面的距离越大。

3.7 confusion_matrix 混淆矩阵

在数据分析的过程中，往往需要观察各分类数据的占比，准确数，错误数等相关信息，为此 sklearn 特意预备了混沌矩阵 confusion_matrix 函数帮助分析数据，完成分析后用 Seaborn 把图画出来。
下面的例子就可以通过混淆矩阵把测试中的 0，1，2，3 … 9 的数字分布数量很明确显示出来。

 1     (X_train, y_train), (X_test, y_test) = keras.datasets.mnist.load_data()
 2     # 把28*28图像数据进行转换
 3     X_train = X_train.reshape(-1, 784)
 4     X_test = X_test.reshape(-1, 784)
 5     # 使用SGDClassfier模式，使用多核计算,学习率为0.01
 6     sgd_classifier = SGDClassifier(learning_rate='constant', early_stopping=True,
 7                                    eta0=0.001, loss='squared_hinge',
 8                                    n_jobs=-1, max_iter=10000)
 9     sgd_classifier.fit(X_train, y_train)
10     y_model=sgd_classifier.predict(X_test)
11     #建立混淆矩阵
12     mat=confusion_matrix(y_test,y_model)
13     #显示分类数据的测试分布
14     heatmap(mat,square=True,annot=True,fmt='d')
15     plt.show()

运行结果

3.8 validation_curve 验证曲线

上一节曾经讲过，要提高模型的质量，应该在过拟合跟欠拟合当中，选择一个平衡点。
有见及此，为了更直观地了解模型的质量，sklearn 特意准备了 validation_curve 方法，可以更直观与观察到验证曲线的示意图。

validation_curve(estimator, X, y, *, param_name, param_range, groups=None,
　　 cv=None, scoring=None, n_jobs=None, pre_dispatch=“all”,
　　 verbose=0, error_score=np.nan, fit_params=None)

estimator：实现了fit 和 predict 方法的对象
X : 训练的向量
y : 目标相对于X分类或回归
param_name:将被改变的变量名称
param_range:param_name对应的变量的取值
cv:如果传入整数，测试数据将分成对应的分数，其中一份作为cv集，其余n-1作为traning（默认为3份）

只需要简单地绑定模型，输入数据，便可得到模型的准确率变化曲线

 1     # validation_curve 绑定 SVC
 2     X, y = load_digits(return_X_y=True)
 3     param_range = np.logspace(-6, -1, 5)
 4     train_scores, test_scores = validation_curve(
 5         SVC(), X, y, param_name="gamma", param_range=param_range,
 6         scoring="accuracy", n_jobs=1)
 7     #训练数据与测试数据的平均得分
 8     train_scores_mean = np.mean(train_scores, axis=1)
 9     test_scores_mean = np.mean(test_scores, axis=1)
10     #显示数据
11     plt.title("Validation Curve with SVM")
12     plt.xlabel(r"$\gamma$")
13     plt.ylabel("Score")
14     plt.ylim(0.0, 1.1)
15     lw = 2
16     plt.semilogx(param_range, train_scores_mean, label="Training score",
17                  color="darkorange", lw=lw)
18     plt.semilogx(param_range, test_scores_mean, label="Cross-validation score",
19                  color="navy", lw=lw)
20     plt.legend(loc="best")
21     plt.show()

运行结果

下面的章节开始介绍 sklearn 中监督学习的一些常用模型，可能模型的使用方法基本一致，看起来似乎千篇一律。实则不然，因为机器学习与一般的开发不一样，主要是了解不同模型的运算规则和适用场景。从原理中理解实质，希望读者能够明白。

回到目录

四、线性模型

线性模型是实践中应用最为广泛的模型之一，它支持分类与回归，最常用的线性分类算法有 LogisticRegression , LinearSVC、SGDClassifier，常用的线性回归算法有 LinearRegression、Ridge、Lasso 、SGDRegressor 等，后面将一一讲解。前几节，将从最常用的线性回归开始入手，介绍几个最常用的线性模型。

从最简单的直线函数 y = w * x + k 开始介绍，这就是线性模型当中最简单的单一特征模型，模型训练的目标是通过数据计算出最接近数据点的模型参数 w 与 k。
其中 x 是输入变量，也是唯一的特征;
w 为斜率，也被称为权重被保存在 coef_ 属性当中;
k 为载矩也称偏移量，被保存于 intercept_ 属性当中。
线性函数的运算结果类似于下图，是一条斜率为 w，偏移量为 k 的直线

模型看似简单，然而在机器学习中模型往往是由浅入深，当输入特征由一个变为两个时，模型变会从一条直线变为一个平面，当特征变为三个时，模型将变成一个立体三维空间 …

由此可得，线性模型的最终公式如下，模型会有 n+1 个特征

y = w[0] * x[0] + w[1] * x[1] + w[2] * x[2] + w[3] * x[3] + … + w[n] * x[n] + k

为了更好地理解线性模型，下面先由最简单的 “线性回归 LinearRegression” 开始讲起

4.1 线性回归 LinearRegression

LinearRegression 是最简单的的线性模型，此模型就是通过第二节介绍的最小二乘法，找出参数 w 与 k，使得训练集与预测集的均方误差 MSE 最小，最终确定 w 与 k 值。
下面就是一个单一特征的数据集进行测试，用 100 条数据计算出斜率和偏移量，再划出此直线。

 1 def linear_regression_test():
 2     #测试数据
 3     line=np.linspace(-3,3,50)
 4     datasets.make_regression(n_features=1,noise=35，random_state=1)
 5     X_train,X_test,y_train,y_test=train_test_split(X,y)
 6     #线性回归模型训练
 7     linear=LinearRegression()
 8     linear.fit(X_train,y_train)
 9     #准确率
10     print('train data prec:'+str(linear.score(X_train,y_train)))
11     print('test data prec:'+str(linear.score(X_test,y_test)))
12     #斜率与截距
13     print('coef:'+str(linear.coef_))
14     print('intercept:'+str(linear.intercept_))
15     #图形显示
16     plt.plot(X_train,y_train,'*','')
17     result=linear.predict(line.reshape(-1,1))
18     plt.plot(line,result,'r')
19     plt.legend(['training data','model'])
20     plt.show()

输出结果

线性模型

LinearRegression 模型比较简单，不需要任何参数，但因此也无法调节模型的复杂程度，可以看到训练数据与测试数据的准确都不高。在实际应用中，LinearRegression 模型的应用场景并不多。

4.2 Ridge 岭回归

为了提高准确率，sklearn 设计了 Ridge 岭回归模型来代替 LinearRegression。岭回归也是使用最小二乘法进行计算，然而与 LinearRegression 不同的是岭回归使用了正则化 L2，它会让 w 的元素尽量偏向于0。
Ridge 构造函数

1 class Ridge(MultiOutputMixin, RegressorMixin, _BaseRidge):
2     @_deprecate_positional_args
3     def __init__(self, alpha=1.0, *, fit_intercept=True, normalize=False,
4                  copy_X=True, max_iter=None, tol=1e-3, solver="auto",
5                  random_state=None):
6     ......

参数说明

alpha 是正则项系数，初始值为1，数值越大，则对复杂模型的惩罚力度越大。
fit_intercept：bool类型，默认为True，表示是否计算截距 ( 即 y=wx+k 中的 k )。
normalize：bool类型，默认为False，表示是否对各个特征进行标准化(默认方法是：减去均值并除以L2范数)，推荐设置为True。如果设置为False，则建议在输入模型之前，手动进行标准化。当fit_intercept设置为False时，将忽略此参数。
copy_X：默认值为True，代表 x 将被复制，为 False 时，则 x 有可能被覆盖。
max_iter：默认值为None，部分求解器需要通过迭代实现，这个参数指定了模型优化的最大迭代次数。
tol：默认为小数点后3位，代表求解方法精度
solver：求解优化问题的算法，默认值 auto，可以根据数据类型选择最合适的算法。可选的算法有：

1).svd:采用奇异值分解的方法来计算。

2).cholesky:采用scipy.linalg.solve函数求得闭式解。

3).sparse_cg:采用scipy.sparse.linalg.cg函数来求取最优解。

4).lsqr:使用scipy.sparse.linalg.lsqr求解，它是最快的。

5).sag:使用随机平均梯度下降，当n_samples和n_features都较大时，通常比其他求解器更快。

random_state：随机数种子，推荐设置一个任意整数，同一个随机值，模型可以复现。

Ridge 使用了 L2 正则化规范，对模型系数 w 进行约束，使每个特征的 w 尽可能的小，避免过度拟合。相比 LinearRegression ，可见 Ridge 使用 L2 正则化规范后，分数有进一步的提升。

 1 def ridge_test():
 2     #测试数据
 3     line=np.linspace(-3,3,100)
 4     X,y=datasets.make_regression(n_features=1,noise=35,random_state=1)
 5     X_train,X_test,y_train,y_test=train_test_split(X,y)
 6     #岭回归模型
 7     ridge=Ridge(alpha=1)
 8     ridge.fit(X_train,y_train)
 9     #计算准确率
10     print('train data prec:'+str(ridge.score(X_train,y_train)))
11     print('test data prec:'+str(ridge.score(X_test,y_test)))
12     #斜率与截距
13     print('coef:'+str(ridge.coef_))
14     print('intercept:'+str(ridge.intercept_))
15     # 图形显示
16     plt.plot(X_train, y_train, '*', '')
17     plt.legend(['training data', 'model'])
18     result = ridge.predict(line.reshape(-1, 1))
19     plt.plot(line, result, 'r')
20     plt.show()

运算结果

Ridge 模型

除此以外，Ridge 模型还提供了一个参数 alpha 用于控制其泛化性能，alpha 默认值为 1。
alpha 越大，w 会更趋向于零，因此泛化性能越高，但训练集上的性能会降低，在数据量较大的时候需要权衡利弊。
alpha 越小，w 的限制就会越小，训练集上的性能就会越高。要注意的是如果把 alpha 调到接近于 0，那 L2 正则化基本不起作用，Ridge 的计算结果将接近于 LinearRegression。
下面试着把 alpha 值调为 0.2 ，可以看到测试集上的分数有一定提升。

4.3 Lasso 模型

Lasso 跟 Ridge 一样都是线性回归模型，两者的主要区别在 Ridge 默认是使用 L2 正则化，而 Lasso 使用的是 L1 正则化规范。L1 会把参数控制趋向于0，从而抽取更有关键代表性的几个特征。
Lasso的构造函数

 1 class Lasso(ElasticNet):
 2     @_deprecate_positional_args
 3     def __init__(self, alpha=1.0, *, fit_intercept=True, normalize=False,
 4                  precompute=False, copy_X=True, max_iter=1000,
 5                  tol=1e-4, warm_start=False, positive=False,
 6                  random_state=None, selection='cyclic'):       ......

参数说明

alpha 是正则项系数，初始值为1，数值越大，则对复杂模型的惩罚力度越大。
fit_intercept：bool类型，默认为True，表示是否计算截距(即y=wx+k中的k)。
normalize：bool类型，默认为False，表示是否对各个特征进行标准化(默认方法是：减去均值并除以L2范数)，推荐设置为True。如果设置为False，则建议在输入模型之前，手动进行标准化。当fit_intercept设置为False时，将忽略此参数。
precompute：默认值为 Falise，表示是否使用预计算的 Gram 矩阵来加速计算。如果设置为 auto 代表让计算机来决定。Gram 矩阵也可以作为参数传递。对于稀疏输入这个选项总是正确的，用于保持稀疏性。
copy_X：默认值为True，代表 x 将被复制，为 False 时，则 x 有可能被覆盖。
max_iter：默认值为10000，部分求解器需要通过迭代实现，这个参数指定了模型优化的最大迭代次数。
tol：默认为小数点后 4 位，代表求解方法精度。
warm_start：默认值为 False，当设置为True时，重用之前调用的解决方案作为初始化，否则，只需要删除前面的解决方案。
positive：默认值为 False，当设置为 True 时，则系数总是为正数。
random_state：随机数种子，推荐设置一个任意整数，同一个随机值，模型可以复现。
selection：默认值为 cyclic ，如果设置为 random，则每一次迭代都会更新一个随机系数，而不是在默认情况下按顺序循环，这样做通常会导致更快的收敛速度，尤其是当tol大于1e-4时。

Lasso 模型当中包含两个主要参数：
alpha 默认值为 1 ，按照 L1的正则化规范，alpha 值越大，特征提取数越少，更多的权重会接近于0，alpha 越小，特征提取越多，当alpha 接近于0时，Lasso 模型与 Ridge 类似，所有特征权重都不为 0
max_iter 默认值为10000，它标志着运行迭代的最大次数，有需要时可以增加 max_iter 提高准确率。

下面尝试对 100 特征的数据进行测试，把 alpha 值设置为 0.2，可以看到测试数据的准确率比较低，只有 0.82，有效的特征有72个。

 1 def lasso_test():
 2     # 测试数据
 3     X,y=datasets.make_regression(n_features=100,noise=40,random_state=1)
 4     X_train,X_test,y_train,y_test=train_test_split(X,y,train_size=0.75,test_size=0.25)
 5     # 把alpha设置为30
 6     lasso=Lasso(alpha=0.2,max_iter=10000)
 7     lasso.fit(X_train,y_train)
 8     #输出正确率
 9     print('lasso\n train data:{0}'.format(lasso.score(X_train,y_train)))
10     print(' test data:{0}'.format(lasso.score(X_test,y_test)))
11     #有效特征数与总数
12     print(' used features: {0}'.format(sum(lasso.coef_!=0)))
13     print(' total features: {0}'.format(lasso.n_features_in_))
14     plt.plot(lasso.coef_,'o',color='red')
15     plt.legend(['feature'])
16     plt.show()

运行结果

试着把 alpha 调为2，此时有效特征下降到 45，而测试数据的分数达到 0.94

4.4 浅谈正则化概念

通过 Ridge 与 Lasso 的例子，相信大家对正则化概念会有一定的了解。在这里简单介绍一下L1、L2 正则化的区别。
正则化（Regularization）是机器学习中一种常用的技术，其主要目的是控制模型复杂度，减小过拟合。最基本的正则化方法是在原目标函数中添加惩罚项，对复杂度高的模型进行“惩罚”。其数学表达形式为：

[公式]

式中为训练样本和相应标签，为目标函数，控制控制正则化强弱。不同的的最优解有不同的偏好，因而会产生不同的正则化效果。最常用的范数和正则化和 [公式] 正则化。

[公式]

由表达式可以看出，L1 正则化则是以累加绝对值来计算惩罚项，因此使用 L1 会让 W(i) 元素产生不同量的偏移，使某些元素为0，从而产生稀疏性，提取最有效的特征进行计算。
L2 正则化则是使用累加 W 平方值计算惩罚项，使用 L2 时 W(i) 的权重都不会为0，而是对每个元素进行不同比例的放缩。

通过 Ridge 与 Lasso 对比 L1 与 L2 的区别

 1 def ridge_test():
 2     #测试数据
 3     line=np.linspace(-3,3,100)
 4     X,y=datasets.make_regression(n_features=100,noise=40,random_state=1)
 5     X_train,X_test,y_train,y_test=train_test_split(X,y)
 6     #岭回归模型
 7     ridge=Ridge()
 8     ridge.fit(X_train,y_train)
 9     #计算准确率
10     print('ridge\n  train data:{0}'.format(ridge.score(X_train,y_train)))
11     print('  test data:'.format(ridge.score(X_test,y_test)))
12     print('  used features: {0}'.format(sum(ridge.coef_!=0)))
13     print('  total features: {0}'.format(ridge.n_features_in_))
14     plt.plot(ridge.coef_,'^',color='g')
15 
16 
17 def lasso_test():
18     # 测试数据
19     X,y=datasets.make_regression(n_features=100,noise=40,random_state=1)
20     X_train,X_test,y_train,y_test=train_test_split(X,y)
21     # 把alpha设置为2
22     lasso=Lasso(alpha=2,max_iter=10000)
23     lasso.fit(X_train,y_train)
24     #输出正确率
25     print('lasso\n  train data:{0}'.format(lasso.score(X_train,y_train)))
26     print('  test data:{0}'.format(lasso.score(X_test,y_test)))
27     #斜率与截距
28     print('  used features: {0}'.format(sum(lasso.coef_!=0)))
29     print('  total features: {0}'.format(lasso.n_features_in_))
30     plt.plot(lasso.coef_,'o',color='red')
31     plt.legend(['feature'])
32 
33 ridge_test()
34 lasso_test()
35 plt.show()

运行结果

可见 Ridge 模型中有效特征仍为100，而 Lasso 的有效特征仅为 48。在一般运算中，往往会优先使用 Ridge 模型。但当数据的特征数太多时，Lasso 更显出其优势。

4.5 SGDRegressor 模型

前面介绍的 LinearRegression、Ridge、Lasso 等几个模型，都是使用最小二乘法和求逆运算来计算参数的，下面介绍的 SGDRegressor 模型是使用梯度下降法进行计算的。
在第二节已经使用基础的 Python 代码实现最简单的梯度下降法算法，但其实在 sklearn 模型中早已准备了 SGDRegressor 模型支持梯度下降计算，运算时它比最小二乘法和求逆运算更加快节，当模型比较复杂，测试数据较大时，可以考虑使用 SGDRegressor 模型。
SGDRegressor 构造函数

1 class SGDRegressor(BaseSGDRegressor):
2     @_deprecate_positional_args
3     def __init__(self, loss="squared_loss", *, penalty="l2", alpha=0.0001,
4                  l1_ratio=0.15, fit_intercept=True, max_iter=1000, tol=1e-3,
5                  shuffle=True, verbose=0, epsilon=DEFAULT_EPSILON,
6                  random_state=None, learning_rate="invscaling", eta0=0.01,
7                  power_t=0.25, early_stopping=False, validation_fraction=0.1,
8                  n_iter_no_change=5, warm_start=False, average=False):
9      ......

loss：默认为“squared_loss”, 选择要使用的损失函数。可用的回归损失函数有：‘squared_loss’、‘huber’、epsilon_unsensitive’或’squared_epsilon_unsensitive’。
penalty：默认为 L2，用于指定惩罚项中使用的规范，可选参数为 L1 、 L2、elasticnet
alpha：默认值为 0.0001 乘以正则项的常数。值越大，正则化越强。当学习率设为“optimal”时，用于计算学习率。
l1_ratio：默认值为 0.15 弹性净混合参数，0 <= l1_ratio <= 1. l1_ratio=0对应于L2惩罚，l1_ratio=1到 l1。仅当 penalty 为 elasticnet 时使用。
fit_intercept：bool类型，默认为True，表示是否计算截距 ( 即 y=wx+k 中的 k )。
max_iter：默认值为 1000，部分求解器需要通过迭代实现，这个参数指定了模型优化的最大迭代次数。
tol：默认值为1e-3,默认为小数点后 3 位，代表求解方法精度
shuffle：默认值为 True ，是否在每个epoch之后对训练数据进行洗牌。
verbose：默认值为 0 详细程度。
epsilon：当 loss 选择 “huber” 时，它决定了一个阈值，在这个阈值下，预测值将被忽略。若选择 “epsilon-insensitive” 表示若当前预测和正确标签之间的差异小于此阈值，将被忽略。
random_state：默认值为None 随机数种子，推荐设置一个任意整数，同一个随机值，模型可以复现。
learning_rate：学习率，默认值为 ’invscaling’ ,可选 constant、optimal、invscaling、adaptive

1）‘constant’: eta = eta0；

2）‘optimal: eta = 1.0 / (alpha * (t + t0)) ;

3）‘invscaling’: eta = eta0 / pow(t, power_t);

4）‘adaptive’: eta = eta0

eta0：默认值为0.01，初始学习速率。
power_t：默认值为0.25 反向缩放学习速率的指数
early_stopping：默认值为 False 验证分数没有提高时，是否使用提前停止终止培训。如果设置为True，它将自动将训练数据的分层部分作为验证，并且当分数方法返回的验证分数对 n_iter_no_change 连续时间段没有至少提高tol时终止训练。
validation_fraction：默认值为 0.1 作为早期停机验证设置的培训数据的比例。必须介于0和1之间。仅在“早停”为真时使用。
n_iter_no_change：默认值为 5 在提前停止之前没有改进的迭代次数。
warm_start：bool, 默认值为 False 当设置为True时，将上一个调用的解决方案重用为fit作为初始化，否则，只需删除以前的解决方案。
average：默认值为 False 当设置为True时，计算所有更新的 averaged SGD权重，并将结果存储在coef_ 属性中。如果设置为大于1的整数，则当看到的样本总数达到平均值时，将开始平均。所以average=10将在看到10个样本后开始平均。

SGDRegressor 模型与 Ridge 类似，默认使用 L2 正则化，所有特征权重都不为 0 而是对每个元素进行不同比例的放缩。
max_iter 默认值为1000，它标志着运行迭代的最大次数，有需要时可以增加 max_iter 提高准确率。
从第二节的例子可以理解，SGD默认使用 squared_loss 均方误差作为损失函数，参数 eta0 =0.01 是初始的学习速率，当 learning_rate 为 constant 时，学习速率则恒定为 0.01，若使用默认值 invscaling，学习速率则通过公式 eta = eta0 / pow(t, power_t) 计算。
在下面的例子，把学习率设为恒定的 0.001，然后使用二个特征的数据进行测试，最后使用三维图形把计算出来的结果进行显示

 1 def sgd_regressor_test():
 2     # 测试数据
 3     X,y=dataset.make_regression(n_samples=100,n_features=2)
 4     X_train, X_test, y_train, y_test = train_test_split(X, y)
 5     # SGD 模型
 6     sgd = SGDRegressor(learning_rate='constant',eta0=0.001,average=True)
 7     sgd.fit(X_train,y_train)
 8     # 准确率
 9     print('SGD:\n  train data:{0}\n  test data:{1}'
10         .format(sgd.score(X_train,y_train),sgd.score(X_test,y_test)))
11     ax=plt.axes(projection='3d')
12     print('  coef:{0}   intercept:{1}'.format(sgd.coef_,sgd.intercept_))
13     # 生成3维图
14     ax.scatter3D(X[:,0],X[:,1],y,color='red')
15     # 生成格网矩阵
16     x0, x1 = np.meshgrid(X[:,0], X[:,1])
17     z = sgd.coef_[0] * x0 + sgd.coef_[1] * x1+sgd.intercept_
18     # 绘制3d
19     ax.plot_surface(x0, x1, z,color='white',alpha=0.01)
20     plt.show()

运行结果

对大数据进行测试时，相比起最小二乘法，使用梯度下降法效率会更高。下面的例子就是分别使用 LinearRegrssion 与 SGDRegressor 对 100 个特征的 100000 条数据进行测试，结果 SGD 节省了大约 30%的时间。

 1 def linear_regression_test():
 2     # 测试数据
 3     X, y = dataset.make_regression(n_samples=100000,n_features=100, random_state=2)
 4     X_train, X_test, y_train, y_test = train_test_split(X, y)
 5     # 线性回归模型训练
 6     linear = LinearRegression()
 7     linear.fit(X_train, y_train)
 8     # 准确率
 9     print('Linear:\n  train data:{0}\n  test data:{1}'
10           .format(linear.score(X_train,y_train),linear.score(X_test,y_test)))
11 
12 def sgd_regressor_test():
13     # 测试数据
14     X,y=dataset.make_regression(n_samples=100000,n_features=100,random_state=2)
15     X_train, X_test, y_train, y_test = train_test_split(X, y)
16     # SGD 模型
17     sgd = SGDRegressor(learning_rate='constant',eta0=0.01)
18     sgd.fit(X_train,y_train)
19     # 准确率
20     print('SGD:\n  train data:{0}\n  test data:{1}'
21         .format(sgd.score(X_train,y_train),sgd.score(X_test,y_test)))
22 
23 print('  Utime:{0}'.format(timeit.timeit(stmt=linear_regression_test, number=1)))
24 print('  Utime:{0}'.format(timeit.timeit(stmt=sgd_regressor_test, number=1)))

运行结果

4.6 LogisticRegression 模型

上面几个例子，都是讲述线性回归，下面将开始介绍线性分类的模型。LogisticRegression 模型虽然名称里包含了 Regression ，但其实它是一个线性分类模型。
LogisticRegression 的构造函数

 1 class LogisticRegression(LinearClassifierMixin,
 2                          SparseCoefMixin,
 3                          BaseEstimator):
 4 　　　　 @_deprecate_positional_args   
 5  　　　　def __init__(self, penalty='l2', *, dual=False, tol=1e-4, C=1.0,
 6                  fit_intercept=True, intercept_scaling=1, class_weight=None,
 7                  random_state=None, solver='lbfgs', max_iter=100,
 8                  multi_class='auto', verbose=0, warm_start=False, n_jobs=None,
 9                  l1_ratio=None):
10         ......

参数说明

penalty：默认为 L2，用于指定惩罚项中使用的规范，可选参数为 L1 和 L2。
dual：默认为False，对偶或原始方法。对偶方法只用在求解线性多核(liblinear)的L2惩罚项上。当样本数量>样本特征的时候，dual通常设置为False。
tol：默认为小数点后 4 位，代表求解方法精度。
C：正则化系数 λ 的倒数，float类型，默认为1.0，越小的数值表示越强的正则化。
fit_intercept：bool类型，默认为True，表示是否计算截距 ( 即 y=wx+k 中的 k )。
intercept_scaling：float类型，默认为1，仅在 solver 为 ”liblinear”，且 fit_intercept设置为True时有用。
class_weight：用于标示分类模型中各种类型的权重，默认值为None，即不考虑权重。也可选择balanced 让类库自己计算类型权重，此时类库会根据训练样本量来计算权重，某种类型样本量越多，则权重越低，样本量越少，则权重越高。或者输入类型的权重比，例如 class_weight={0:0.9, 1:0.1}，此时类型0的权重为90%，而类型1的权重为10%。
random_state：随机数种子，推荐设置一个任意整数，同一个随机值，模型可以复现。
solver：求解优化算法，默认值 lbfgs，可以根据数据类型选择最合适的算法。可选的算法有：

1）liblinear：使用了开源的liblinear库实现，内部使用了坐标轴下降法来迭代优化损失函数。

2）lbfgs：利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。

3）newton-cg：利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。

4）sag：即随机平均梯度下降，是梯度下降法的变种，每次迭代仅仅用一部分的样本来计算梯度，适合数据量较大时使用。

5）saga：线性收敛的随机优化算法的的变重。

max_iter：默认值为 100，部分求解器需要通过迭代实现，这个参数指定了模型优化的最大迭代次数。
multi_class：分类方式选择参数，str类型，可选参数为ovr和multinomial，默认为ovr。如果是二元逻辑回归，ovr和multinomial并没有任何区别，区别主要在多元逻辑回归上。
verbose：日志冗长度，int类型。默认为0。就是不输出训练过程，1的时候偶尔输出结果，大于1，对于每个子模型都输出。
warm_start：默认值为 False，当设置为True时，重用之前调用的解决方案作为初始化，否则，只需要删除前面的解决方案。
n_jobs：CPU 并行数，默认为None，代表1。若设置为 -1 的时候，则用所有 CPU 的内核运行程序。
l1_ratios ：默认为None，表示弹性网混合参数列表。

LogisticRegression 包含两个最常用的参数 penalty 正则化规则、C 正则化程度，由构造函数可以看到，一般情况下 LogisticRegression 使用的是 L2 正则规范。此时决定正则化规范强度的参数是由 C 值决定，C 越大，对应的正则化越弱，数据集的拟合度会更高，C 越小，则模型的权重系统 w 更趋向于 0。

最典型的例子就是使用 make_forge 库里的例子进行测试

 1 def logistic():
 2     #生成数据集
 3     X,y=datasets.make_forge()
 4     X_train,X_test,y_train,y_test=train_test_split(X,y)
 5     #对Logistic模型进行训练
 6     logistic=LogisticRegression(C=1.0,random_state=1)
 7     logistic.fit(X_train,y_train)
 8     #输入正确率
 9     print('logistic\n  train data:{0}'.format(logistic.score(X_train,y_train)))
10     print('  test data:{0}'.format(logistic.score(X_test,y_test)))
11     #输出模型点
12     plt.scatter(X[:,0], X[:,1],c=y,s=100)
13     plt.legend(['model','data'])
14     #输出模型决策边界
15     line = np.linspace(7, 13, 100)
16     y=(-logistic.coef_[0][0]*line-logistic.intercept_)/logistic.coef_[0][1]
17     plt.plot(line,y,'-')
18     plt.show()

运行结果

此时，虽然测试数据集比较简单，但仍可见类型为0和1的数据仍有产生一定的错位。此时，尝试将参数 C 调整为 100，得出的结果如下图。
可见，当C值越大时，正则化规则越弱，数据集的拟合度会更高

相反，若将 C 调整为 0.01 时，权重系数 w 会越趋向于0，它会让公式适用于更多的数据点

LogisticRegression 除了可以通过 C 控制其正则化强度外，还可以通过 penalty 参数选择正则化规则，penalty 默认值为 L2，但是当数据集的特征较多时，可以尝试通过设置 penalty 让其使用 L1 正则化。但需要注意的是，当使用 L1 正则化时 solver 必须使用 liblinear 算法，否则系统会报错。

 1 def logistic(penalty,c):
 2     #生成数据集
 3     X,y=dataset.make_classification(n_samples=1000,n_features=100,random_state=1)
 4     X_train,X_test,y_train,y_test=train_test_split(X,y)
 5     #对Logistic模型进行训练
 6     if(penalty=='l1'):
 7         solver='liblinear'
 8     else:
 9         solver='lbfgs'
10     logistic=LogisticRegression(penalty=penalty,C=c,solver=solver,random_state=1)
11     logistic.fit(X_train,y_train)
12     #输入正确率
13     print('{0}\n  train data:{1}'.format(penalty,logistic.score(X_train,y_train)))
14     print('  test data:{0}'.format(logistic.score(X_test,y_test)))
15 
16     #输出模型决策边界
17     print('  total features:{0}'.format(logistic.n_features_in_))
18     print('  used features:{0}'.format(sum(logistic.coef_[0]!=0)))
19     plt.plot(logistic.coef_[0],'^')
20 logistic('l1',0.2)
21 logistic('l2',0.2)
22 plt.show()

运行结果

可以看到当使用 L1 规则时，系统只使用了 4 个特征，此方法更适用于特征数量比较多的数据集。
使用 L2 时 C 值为 0.2，系统使用了100个特征，由特征图形可见，其权重系数 w 都接近于 0

此时可尝试调节一下参数，对比一下运行 L2 ，输入不同 C 值时的变化。

1 logistic("l2", 0.01)
2 logistic('l2',100)
3 plt.legend(['c=0.01','c=100'])
4 plt.show()

运行结果

可见 C 值越小，w 就会越趋向于0，C 值越大，w 就会越分散且受正则化的约束越小

4.7 LinearSVC 线性支持向量机

上面的例子所看到的线性分类模型，大部分的例子都只二分类的，下面介绍一下可用于多分类的线性模型 LinearSVC
LinearSVC 的构造函数

1 class LinearSVC(LinearClassifierMixin,
2                 SparseCoefMixin,
3                 BaseEstimator):
4     @_deprecate_positional_args
5     def __init__(self, penalty='l2', loss='squared_hinge', *, dual=True,
6                  tol=1e-4, C=1.0, multi_class='ovr', fit_intercept=True,
7                  intercept_scaling=1, class_weight=None, verbose=0,
8                  random_state=None, max_iter=1000):
9         ......

参数说明

penalty：默认为 L2，用于指定惩罚项中使用的规范，可选参数为 L1 和 L2。当使用 L1 准则时，参数 loss 必须为 squared_hinge , dual 必须为 False。
loss : 指定损失函数，默认值为 squared_hinge，可选择 ‘hinge’ 或 ‘squared_hinge’ 。
dual：默认为False，对偶或原始方法。对偶方法只用在求解线性多核(liblinear)的L2惩罚项上。当样本数量>样本特征的时候，dual通常设置为False。
tol：默认为小数点后 4 位，代表求解方法精度。
C：正则化系数 λ 的倒数，float类型，默认为1.0，越小的数值表示越强的正则化。
multi_class : 默认值为 ovr，可选择 ‘ovr’ 或 ‘crammer_singer’ ，用于确定多类策略。 “ovr” 训练n_classes one-vs-rest 分类器，而 “crammer_singer” 优化所有类的联合目标。如果选择“crammer_singer”，则将忽略选项 loss，penalty 和 dual 参数。
fit_intercept：bool类型，默认为True，表示是否计算截距 ( 即 y=wx+k 中的 k )。
intercept_scaling：float类型，默认为1，仅在 fit_intercept设置为True时有用。
class_weight：用于标示分类模型中各种类型的权重，默认值为None，即不考虑权重。也可选择balanced 让类库自己计算类型权重，此时类库会根据训练样本量来计算权重，某种类型样本量越多，则权重越低，样本量越少，则权重越高。或者输入类型的权重比，例如 class_weight={0:0.9, 1:0.1}，此时类型0的权重为90%，而类型1的权重为10%。
verbose：日志冗长度，int类型。默认为0。就是不输出训练过程，1的时候偶尔输出结果，大于1，对于每个子模型都输出
random_state：随机数种子，推荐设置一个任意整数，同一个随机值，模型可以复现。
max_iter：默认值为 10000，部分求解器需要通过迭代实现，这个参数指定了模型优化的最大迭代次数。

与LogisticRegression相似，LinearSVC 默认也是使用 L2 准则，同样可以通过 C 控制其正则化强度，C 越大，对应的正则化越弱，数据集的拟合度会更高，C 越小，则模型的权重系统 w 更趋向于 0。
还可以通过 penalty 参数选择正则化规则，当使用 L1 准则时，参数 loss 必须为 squared_hinge , dual 必须为 False。

当用于多个类别时，LinearSVC 会使用一对其余的方式，每次学习都会使用一个二分类模型，然后把余下的数据集再次进行二分类，不断循环最后得出预测结果。

 1 def linearSVC():
 2     #生成数据集    
 3     X,y=mglearn.datasets.make_blobs(n_samples=200,random_state=23,centers=3)
 4     X_train,X_test,y_train,y_test=train_test_split(X,y)
 5     #使用 LinearSVC 模型，使用 L1 准则
 6     linearSVC=LinearSVC(penalty='l1',loss='squared_hinge', dual=False)
 7     linearSVC.fit(X_train,y_train)
 8     #输出准确率
 9     print('LinearSVC\n  train data:{0}'.format(linearSVC.score(X_train,y_train)))
10     print('  test data:{0}'.format(linearSVC.score(X_test,y_test)))
11     #划出图形分隔线
12     plt.scatter(X[:,0], X[:,1],c=y,s=100,cmap='autumn',marker='*')
13     n=np.linspace(-8,8,100)
14     value0=(-n*linearSVC.coef_[0][0] - linearSVC.intercept_[0]) / linearSVC.coef_[0][1]
15     value1=(-n*linearSVC.coef_[1][0] - linearSVC.intercept_[1]) / linearSVC.coef_[1][1]
16     value2=(-n*linearSVC.coef_[2][0] - linearSVC.intercept_[2]) / linearSVC.coef_[2][1]
17     plt.plot(n.reshape(-1, 1), value0,'-')
18     plt.plot(n.reshape(-1, 1), value1,'--')
19     plt.plot(n.reshape(-1, 1), value2,'+')
20     plt.legend(['class0','class1','class2'])
21     plt.show()

运行结果

4.8 SGDClassifier 分类模型

SGDClassifier 与 SGDRegressor 类似，都是使用梯度下降法进行分类计算，由于SGD是以一次一个的方式独立处理训练实例，所以它能够有效处理大型的数据集。SDGClassifier 默认也是使用 L2 准则，注意与SGDRegressor不同的是它的学习率 learning_rate 默认使用 optimal，此时 eta0 无效，若要使用 eta 0 需要提前修改 learning_rate 参数。

构造函数

 1 class SGDClassifier(BaseSGDClassifier):
 2     @_deprecate_positional_args
 3     def __init__(self, loss="hinge", *, penalty='l2', alpha=0.0001,
 4                  l1_ratio=0.15,
 5                  fit_intercept=True, max_iter=1000, tol=1e-3, shuffle=True,
 6                  verbose=0, epsilon=DEFAULT_EPSILON, n_jobs=None,
 7                  random_state=None, learning_rate="optimal", eta0=0.0,
 8                  power_t=0.5, early_stopping=False, validation_fraction=0.1,
 9                  n_iter_no_change=5, class_weight=None, warm_start=False,
10                  average=False):
11     ......

loss：默认为“hinge”, 选择要使用的损失函数。可用的损失函数有：‘hinge’, ‘log’, ‘modified_huber’,‘squared_hinge’, ‘perceptron’。log 损失使逻辑回归成为概率分类器。 'modified_huber’是另一个平滑的损失，它使异常值和概率估计具有一定的容忍度。“ squared_hinge”与hinge类似，但会受到二次惩罚。“perceptron”是感知器算法使用的线性损失。
penalty：默认为 L2，用于指定惩罚项中使用的规范，可选参数为 L1 、 L2、elasticnet
alpha：默认值为 0.0001 乘以正则项的常数。值越大，正则化越强。当学习率设为“optimal”时，用于计算学习率。
l1_ratio：默认值为 0.15 弹性净混合参数，0 <= l1_ratio <= 1. l1_ratio=0对应于L2惩罚，l1_ratio=1到 l1。仅当 penalty 为 elasticnet 时使用。
fit_intercept：bool类型，默认为True，表示是否计算截距 ( 即 y=wx+k 中的 k )。
max_iter：默认值为 1000，部分求解器需要通过迭代实现，这个参数指定了模型优化的最大迭代次数。
tol：默认值为1e-3,默认为小数点后 3 位，代表求解方法精度
shuffle：默认值为 True ，是否在每个epoch之后对训练数据进行洗牌。
verbose：默认值为 0 详细程度。
epsilon：默认值为0.1 loss 选择 “huber” 时，它决定了一个阈值，在这个阈值下，预测值将被忽略。若选择 “epsilon-insensitive” 表示若当前预测和正确标签之间的差异小于此阈值，将被忽略。
n_job：CPU 并行数，默认为None，代表1。若设置为 -1 的时候，则用所有 CPU 的内核运行程序。
random_state：默认值为None 随机数种子，推荐设置一个任意整数，同一个随机值，模型可以复现。
learning_rate：学习率，默认值为 ’optimal’ ,可选 constant、optimal、invscaling、adaptive

1）‘constant’: eta = eta0；

2）‘optimal: eta = 1.0 / (alpha * (t + t0)) ;

3）‘invscaling’: eta = eta0 / pow(t, power_t);

4）‘adaptive’: eta = eta0

eta0：默认值为0.0，初始学习速率。当 learning_rate 为 optimal 时，此值无效。
power_t：默认值为0.5 反向缩放学习速率的指数
early_stopping：默认值为 False 验证分数没有提高时，是否使用提前停止终止培训。如果设置为True，它将自动将训练数据的分层部分作为验证，并且当分数方法返回的验证分数对 n_iter_no_change 连续时间段没有至少提高tol时终止训练。
validation_fraction：默认值为 0.1 作为早期停机验证设置的培训数据的比例。必须介于0和1之间。仅在“早停”为真时使用。
n_iter_no_change：默认值为 5 在提前停止之前没有改进的迭代次数。
class_weight: 类别关联的权重，使用字典格式，默认值 {class_label: None} 也可选择balanced 让类库自己计算类型权重，此时类库会根据训练样本量来计算权重，某种类型样本量越多，则权重越低，样本量越少，则权重越高。或者输入类型的权重比，例如 class_weight={0:0.9, 1:0.1}，此时类型0的权重为90%，而类型1的权重为10%。
warm_start：bool, 默认值为 False 当设置为True时，将上一个调用的解决方案重用为fit作为初始化，否则，只需删除以前的解决方案。
average：默认值为 False 当设置为True时，计算所有更新的 averaged SGD权重，并将结果存储在coef_ 属性中。如果设置为大于1的整数，则当看到的样本总数达到平均值时，将开始平均。所以average=10将在看到10个样本后开始平均。

下面尝试用 SDGClassifier 区分MNIST的数字图片，由于图片有70000张，运行可能较慢，尝试使用多核运算，把 n_job 设置为 -1，把学习率设置为固定值 0.01，可以看到准确率可以达到将近 90%

 1 def sgd_classifier_test():
 2     # 输入入数据
 3     (X_train, y_train), (X_test, y_test)=keras.datasets.mnist.load_data()
 4     # 把28*28图像数据进行转换
 5     X_train=X_train.reshape(-1,784)
 6     X_test=X_test.reshape(-1,784)
 7     #使用SGDClassfier模式，使用多核计算,学习率为0.01
 8     sgd_classifier=SGDClassifier(learning_rate='constant',eta0=0.01,n_jobs=-1)
 9     sgd_classifier.fit(X_train,y_train)
10     #查看准确率
11     print('SGDClassfier\n  train data:{0}\n  test data:{1}'.format(
12         sgd_classifier.score(X_train,y_train)
13         ,sgd_classifier.score(X_test,y_test)))
14     #查看测试数量第256幅图
15     data=X_test[256].reshape(28,28)
16     plt.imshow(data,cmap='binary')
17     plt.show()
18     print('  test number is:{0}'.format(y_test[256]))

运行结果

4.9 多项式转换器与管道

4.9.1 PolynomialFeatures 转换器

到此以上所有的例子用的都是纯线性的实例，然而现实场景中并非如此，比如说一个简单的二元一次的方程 y = axx+b*x+c 所构成的数据（如下图），就不可能通过直线进行连接。

为此，sklearn 准备了多项式转换器 PolynomialFeatures 来解决此问题。前面提到普通的线性模型每个特征都是符合单次方规则：y = w[0] * x[0] + w[1] * x[1] + w[2] * x[2] + w[3] * x[3] + … + w[n] * x[n] + k，每个模型会有 n+1 个特征。而 PolynomialFeatures 转换器可以把单个特征转换成多次方关系: 当 degree=n 时，每个特征都会符合关系式 y = w[0]+w[1]*x+w[2]*x2+w[3]*x3+…+w[n]*xn。如此类推如果有 m 个特征且degree = m 时，则

构造函数

1 class PolynomialFeatures():
2     @_deprecate_positional_args
3     def __init__(self, degree=2, *, interaction_only=False, include_bias=True,
4                  order='C'):
5         self.degree = degree
6         self.interaction_only = interaction_only
7         self.include_bias = include_bias
8         self.order = order
9         ......

degree：默认值为2，控制多项式的次数；
interaction_only：默认为 False，如果指定为 True，那么就不会有特征自己和自己结合的项，组合的特征中没有 X12或 X1 * X23
include_bias：默认为 True 。如果为 True 的话，那么结果中就会有 0 次幂项，即全为 1 这一列。
order: 默认为"C" ，可选择 “F” 。“C” 表示是在密集情况（dense case）下的输出array的顺序，“F” 可以加快操作但可能使得subsequent estimators变慢。

用一个二元一次的方程 y = axx+b*x+c 作为例子，首先生成100 个点的测试数据画在图上，然后使用多项式转换器 PolynomialFeatures 把 degree 设置为默认值 2，相当于使用 x 的最高次为 2 的多次项作为特征，最后使用 LinearRegression 模型根据斜率和变量画出曲线。

 1 # 测试数据，根据 y=3*x*x+2*x+1 生成
 2 def getData():
 3     x=np.linspace(-3.5,3,100)
 4     y=3*x*x+2*x+1
 5     d=np.random.random(100)*2
 6     y=y-d
 7     plt.plot(x,y,'.')
 8     return [x,y]
 9 
10 def polynomial_test():
11     # 获取测试数据
12     data=getData()
13     X=data[0].reshape(-1,1)
14     y=data[1]
15     # 生成多项式回归模型
16     polynomial=PolynomialFeatures(degree=2)
17     X_poly=polynomial.fit_transform(X)
18     # 把运算过的数据放到 LinearRegression 进行运算
19     linearRegression=LinearRegression()
20     
21     linearRegression.fit(X_poly,y)
22     # 打印数据
23     print('PolynomialFeature:\n  coef:{0}\n  intercept:{1}\n  score:{2}'
24           .format(linearRegression.coef_,linearRegression.intercept_,
25                   linearRegression.score(X_poly,y)))
26     # 根据斜率和截距画出图
27     x=np.linspace(-3.5,3,100)
28     y=linearRegression.coef_[2]*x*x+linearRegression.coef_[1]*x+linearRegression.intercept_
29     plt.plot(x,y)
30     plt.legend(['data','model'])
31     plt.show()

运行结果

可见使用 PolynomialFeatures 多项式转换器可以向数据中加入非线性特征，让线性模型变得更加强大。

4.9.2 Pipeline 管道

正如上一章节的例子，如果繁杂的模型每次都需要经过多个步骤运算，那将是一个耗时费力的操作，有见及此，sklearn 中有一个 Pipeline 类可以按工作流程分步骤执行模型训练。在上一章节数据先经过 PolynomialFeatures 模型训练再进行 LinearRegression 训练可写为 pipe=Pipeline([(‘polynomial’,PolynomialFeatures()),(‘linearRegression’,LinearRegression())]) ，在 Pipeline 参数是以字典的形式输入，先输入名称，再输入类型。如果觉得每次都要为模型对象定义参数名称比较麻烦，sklearn 还有一个更简单的方法 make_pipeline ，使用此方法只需要直接把模型的类按顺序输入即可 pipe=make_pipeline(PolynomialFeatures(),LinearRegression()) ，事实上这种写法也是管道最常用的方法。
使用 Pipeline 管道，可以把上一节的例子简化成下面的代码，输出完全一样的结果。

 1 # 测试数据根据 y=3*x*x+2*x+1 生成
 2 def getData():
 3     x=np.linspace(-3.5,3,100)
 4     y=3*x*x+2*x+1
 5     d=np.random.random(100)*2
 6     y=y-d
 7     plt.plot(x,y,'.')
 8     return [x,y]
 9 
10 def polynomial_test():
11     # 获取测试数据
12     data=getData()
13     X=data[0].reshape(-1,1)
14     y=data[1]
15     # 生成管道先执行 PolynomialFeatures 再执行 LinearRegression
16     pipe=make_pipeline(PolynomialFeatures(degree=2),LinearRegression())
17     # 训练数据
18     pipe.fit(X,y)
19     # 获取执行对象
20     linearRegression=pipe.steps[1][1]
21     # 打印数据
22     print('PolynomialFeature:\n  coef:{0}\n  intercept:{1}\n  score:{2}'
23           .format(linearRegression.coef_,linearRegression.intercept_,
24                   pipe.score(X,y)))
25     # 根据斜率和截距画出图
26     x=np.linspace(-3.5,3,100)
27     y=linearRegression.coef_[2]*x*x+linearRegression.coef_[1]*x+linearRegression.intercept_
28     plt.plot(x,y)
29     plt.legend(['data','model'])
30     plt.show()

本篇总结

本文主要讲述了机械学习的相关概念与基础知识，监督学习的主要流程。对损失函数进行了基础的介绍，并对常用的均方误差与递度下降法的计算过程进行演示，希望能帮助大家更好地理解。
在线性模型方法，对常用的 LogisticRegression , LinearSVC、SGDClassifier、 LinearRegression、Ridge、Lasso 、SGDRegressor 等线性模型进行了介绍。最后对非线性的 PolynomialFeatures 多项式转换器进行介绍，讲解管道 Pipe 的基本用法。
希望本篇文章对相关的开发人员有所帮助，由于时间仓促，错漏之处敬请点评。

你可能感兴趣的:(python,机器学习,学习,chatgpt,pytorch,人工智能,服务器)

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
大学播音主持都学什么内容？播音主持专业学什么？配音新手圈
有些喜欢播音主持并且犹豫要不要报考这个大学专业的小伙伴们就会想要了解大学播音主持都学什么内容吧，毕竟如果不够了解就直接选择这个专业真的等选择完进去学习以后才知道这个专业并不是自己想要学习的东西那就来不及了。下面是小编为大家整理出来的一些播音主持专业学习的内容，请往下看吧。大学播音主持专业主要学习的课程有：播音发声、播音创作基础、广播播音主持、电视播音主持、文艺作品演播学概论、新闻学概论、新闻采编、
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
2022年河南省高等职业教育技能大赛云计算赛项竞赛赛卷（样卷）忘川_ydy 云计算云计算 openstack kubernetes docker python k8s ansible
#需要资源（软件包及镜像）或有问题的，可私博主！！！#需要资源（软件包及镜像）或有问题的，可私博主！！！#需要资源（软件包及镜像）或有问题的，可私博主！！！第一部分：私有云任务1私有云服务搭建(10分)使用提供的用户名密码，登录竞赛用的云计算平台，按要求自行使用镜像创建两台云主机，创建完云主机后确保网络正常通信，然后按要求配置服务器。根据提供安装脚本框架，补充脚本完成OpenStack平台的安装搭
浪潮 M5系列服务器IPMI无法监控存储RAID卡问题. Songxwn 硬件服务器服务器运维
简介浪潮的M5代服务器，可能有WebBMC无法查看存储RAID/SAS卡状态的情况，可以通过以下方式修改。修改完成后重启BMC即可生效。ESXiIPMITools使用：https://songxwn.com/ESXi8_IPMI/（Linux也可以直接使用）Linux/ESXiIPMITool下载：https://songxwn.com/file/ipmitoolWindows下载：https:/
新网师的精神肤色（幕布笔记）悦读书香
王子老师的《极简100小妙招》收到已经几天了，之前大概的浏览了全书，今天起给自己定了一个计划，必须每天学习极简小妙招里面的一个妙招，并加以运用。一、今天要打卡什么内容因有完成每天学习极简小妙招的计划，所以今天晚饭吃的比较简单，草草吃完以后带着小宝到广场溜达一圈，急忙赶回来学习极简小妙招。再重看的时候不知道自己要学点什么，打卡哪一招，感觉哪个都简单，就看这一环节像王子老师说的“一看就会”，但做这一环
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
学习JavaEE的日子 Day32 线程池 A 北枝学习JavaEE 学习 java-ee java 线程池
Day32线程池1.引入一个线程完成一项任务所需时间为：创建线程时间-Time1线程中执行任务的时间-Time2销毁线程时间-Time32.为什么需要线程池(重要)线程池技术正是关注如何缩短或调整Time1和Time3的时间，从而提高程序的性能。项目中可以把Time1，T3分别安排在项目的启动和结束的时间段或者一些空闲的时间段线程池不仅调整Time1，Time3产生的时间段，而且它还显著减少了创建
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
没有如释重负君远近
虽然只有短短的一个多月的努力复习时间，但今天的整个考试经过，还是发现了效果的，题目做的比较自如，没有慌里慌张，而且提前五分钟完成。至于考试成绩，没有实足的把握，60分都不敢保证。但绝对相信自己，比去年肯定要好！今天早早的赶到考场，见到了刘老师，谈起来学习情况，坦率的说，真的是自己不够重视。总以为会很难，没有信心。其实不是的，只要认真对待，树立足够的信心，绝对可以通过考试的。还向老师询问了，后续再报
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
C++学习笔记（lambda函数） __TAT__ C&C++c++学习笔记
C++learningnote1、lambda函数的语法2、lambda函数的几种用法1、lambda函数的语法lambda函数的一般语法如下：[capture_clause](parameters)->return_type{function_body}capture_clause：需要捕获的变量，但要求该变量必须在这个作用域中。通常的捕获方式有以下几种：[]：不捕获任何变量[&]：按引用捕获变
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
心赏（2018.10.8）六一节_3928
1.上班第一天，同事彤休完产假，回来上班，给我带了酸奶和水果。她生小孩时，我给她发了一个小红包贺喜，哪知她就记在心里了。心赏这个有心的90后。2.女儿放学回来，说自己当了小组长。一边说不想当，一边得意的样子。心赏老师给了孩子这个锻炼的机会。3.老妈今天做了"蚂蚁上树"的菜，得到女儿的高度肯定。心赏老妈还在不断学习。
ChatGPT一路狂飙？何鲸洛
2月2日。根据投行瑞银集团在周三发布的一份研究报告。爆红聊天机器人ChatGPT的月活跃用户在今年1月份预计达到了1亿，这距离它推出只有2个月时间，成为史上增长最快的消费者应用。①ChatGPT一路火花带闪电？▽2014年。OpenAI创始人SamAltman早年曾执掌著名的硅谷孵化器YCombinator。2015年。Altman联合马斯克、彼得·泰尔、AWS、印度Infosys和YC等作为出资
2022-2-13晨间日记越亮也打烊
今天是什么日子起床：7:00就寝：12:08天气：晴心情：糟糕纪念日：无任务清单昨日完成的任务，最重要的三件事：寒假作业，网课，画画改进：作业时间剪短习惯养成：网课不逃～周目标·完成进度数学卷子100％学习·信息·阅读《傅雷家书》《钢铁是怎样炼成的》健康·饮食·锻炼我终于不喝饮料啦，喝茶～人际·家人·朋友邝姐姐带我吃火锅工作·思考啥时候开学，我还有几天赶完作业最美好的三件事1.卷子写完了2.我有冰
中原焦点团队38期王芳芳坚持分享第236天，20230630总约练134次，来访113次，咨8次，观察员13次芳芳王
学习焦点的初心是想拯救孩子，孩子由于沉迷游戏，成绩下滑，在学习的过程中发现是自己的教育方式出了状况。经过半年的学习，一些焦点的基本技巧，如接纳、欣赏、倾听、同理心、尊重等都有了一定的了解。但在实际应用时仍然存在很多问题，感觉自己仍然没有放下对孩子成绩的期望，仍然把握不住对孩子管理的度。我该如何去陪伴好孩子？多用心去听课，并加强反思，多约练。去思考如何让自己快乐起来？
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
#D174-读书会作业-《财务自由之路》3 白洲笔记
最近沉迷于写作营，一直就没时间去弄读书会的作业，书的第二遍也就看了个开头，趁着日更的时间，赶紧把作业做了，这次是15到21课。【1.印象最深刻的部分】(本周所读内容中印象最深刻的部分)*活在未来，最正确的方法是什么？用正确的方法做正确的事情，判断什么是正确的？逻辑。学会思考。"作对事情"永远比“把事情作对“重要的多。”长远思考，耐心验证，小心总结提炼“证明自己正确并不是学习的任务和目标，时刻成长，
3、JavaWeb-Ajax/Axios-前端工程化-Element 所谓远行Misnearch #JavaWeb 前端 ajax elementui java 前端框架
P34Ajax介绍Ajax:AsynchroousJavaScriptAndXML，异步的JS和XMLJS网页动作，XML一种标记语言，存储数据，作用：数据交换：通过Ajax给服务器发送请求，并获取服务器响应的数据异步交互：在不重新加载整个页面的情况下，与服务器交换数据并实现更新部分网页的技术，例如：搜索联想、用户名是否可用的校验等等。同步与异步：同步：服务器在处理中客户端要处于等待状态，输入域名
docker怎么端口映射 Lance_mu docker 容器运维
1、默认固定的端口#Web服务器：WebApache或Nginx通常使用80端口HTTP：80HTTPS：443#数据库服务器MySQL：3306PostgreSQL：5432MongoDB：27017Redis：6379#邮件服务器SMTP：25POP3：110IMAP：143#其他服务SSH：22FTP：21DNS（域名解析）：53代理服务器Squid：3128版本控制系统Git：9418(S
新注册的阿里云账号有哪些优惠？阿里云新用户必看优惠大合集阿里云最新优惠和活动汇总
很多用户看到阿里云各种活动中的云服务器、云数据库、企业邮箱等云产品都仅限新用户购买之后，都纷纷直接注册了阿里云新账号之后购买，其实，阿里云新用户不仅可以优惠购买活动中的各种云产品，还有很多优惠，下面是“阿里云最新优惠和活动汇总”整理汇总的阿里云新用户必看优惠大合集。新注册的阿里云账号在购买活动中的云产品之前，还有免费领云产品通用代金券、抽取无门槛代金券、免费试用云服务器和正式购买云服务器等阿里云产
账务处理又出错？资深会计来教你，学会效率翻倍！共同学习小橘子要努力吖
作为一名会计，在实际工作中会遇到各种麻烦的账务处理问题。那么，最常用的会计处理方法都有哪些呢？今天小编为大家带来了从业二十六年的资深老会计分享的十四中会计常用的账务处理问题的解决方案，快来看看吧！一、促销品的账务处理在促销时公司经常会把一些商品按进价赠送给消费者使用二、款已付清但发票未到的账务处理三、购买材料发生不合理损耗的账务处理问题公司在购买材料时，常常会发生一些不合理的损耗，那么这种问题该怎
【真诚子】通晓鬼谷第七篇读书日记。真诚子l通晓鬼谷
今天把个人品牌，从193读到208页，书的内容质量出奇的高，尤其是这一段。对标学习法，找一个比自己强，或者你期望成为的人进行模仿性学习，对标学习，不是到处，去找人对标兵学习很多人的优点，或是学习自己认为好的方面，而是找准一个对标高手，然后全方位的学习这个人。我在做品牌咨询时就对标，学习了一个在国内很有名的行业顶尖大咖。我先找到他公司的方案，进行完全模仿，连PPT的排版都一样，而且我只参照他一个人的
ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
2018-11-18成长小组学习笔记实验中学45
因为嗓子“罢工”，我面对众人只能借“微笑”代言。在开始授课前，绣霞老师先反馈上次作业的情况，提到“接纳”需是真正发自内心的完全接纳，而不是口头上的接纳，内心却是排斥的。提到一个“问题”孩子恰恰对家爱的更加“深沉”，夫妻间的问题不能影响到孩子，对孩子更好的爱不是你为他做的更多，而是给他自由、健康成长的空间。图片发自App一、孩子：家庭的一面镜子夫妻成了彼此的“投射”，婚姻便“吵的不可开交”，婚姻便成
Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
过去一年，这16本好书不容错过 m0_54050778 perl
编者按：2023年在动荡与希望中收尾，2023年注定会被载入史册。疫情寒冬结束，ChatGPT横空出世，带动了人工智能技术的飞速发展；淄博烧烤、天津大爷、尔滨之旅等充满感动与幸福。但与此同时，2023年又是动荡与不安的一年，俄乌冲突的延宕，新一轮的巴以冲突，极端天气频发。在这个大环境下，有一些经典的书籍著作诞生。本文将分享2023年最值得一读的16本书籍，文章来自翻译，希望对你有所启示。关于202
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st