《机器学习》学习笔记(5) - 神经网络

机器学习中，神经网络一般指的是“神经网络学习”，是机器学习与神经网络两个学科的交叉部分。所谓神经网络，目前用得最广泛的一个定义是“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应”。

5.1 神经元模型

神经网络中最基本的单元是神经元模型（neuron）。在生物神经网络的原始机制中，每个神经元通常都有多个树突（dendrite），一个轴突（axon）和一个细胞体（cell body）；在功能上，树突用于传入其它神经元传递的神经冲动，而轴突用于将神经冲动传出到其它神经元，当树突或细胞体传入的神经冲动使得神经元兴奋时，该神经元就会通过轴突向其它神经元传递兴奋。

神经元的生物学结构如下图所示：

一直沿用至今的“ M-P神经元模型”正是对这一结构进行了抽象，也称“阈值逻辑单元”，其中树突对应于输入部分，每个神经元收到n个其他神经元传递过来的输入信号，这些信号通过带权重的连接传递给细胞体，这些权重又称为连接权（connection weight）。细胞体分为两部分，前一部分计算总输入值（即输入信号的加权和，或者说累积电平），后一部分先计算总输入值与该神经元阈值的差值，然后通过激活函数（activation function）的处理，产生输出从轴突传送给其它神经元。

M-P神经元模型如下图所示：

与线性分类十分相似，神经元模型最理想的激活函数也是阶跃函数，即将神经元输入值与阈值的差值映射为输出值1或0，若差值大于零输出1，对应兴奋；若差值小于零则输出0，对应抑制。 但阶跃函数不连续，不光滑，故在M-P神经元模型中，也采用Sigmoid函数来近似， Sigmoid函数将较大范围内变化的输入值挤压到 (0,1) 输出值范围内，所以也称为挤压函数（squashing function）。

将多个神经元按一定的层次结构连接起来，就得到了神经网络,它是一种包含多个参数的模型。

比方说10个神经元两两连接，则有100个参数需要学习（每个神经元有9个连接权以及1个阈值），若将每个神经元都看作一个函数，则整个神经网络就是由这些函数相互嵌套而成。

5.2 感知机与多层网络

感知机（Perceptron）是由两层神经元组成的一个简单模型，但只有输出层是M-P神经元，即只有输出层神经元进行激活函数处理，也称为功能神经元（functional neuron）；输入层只是接受外界信号（样本属性）并传递给输出层（输入层的神经元个数等于样本的属性数目），而没有激活函数。

这样一来，感知机与之前线性模型中的对数几率回归的思想基本是一样的，都是通过对属性加权与另一个常数求和，再使用sigmoid函数将这个输出值压缩到0-1之间，从而解决分类问题。

不同的是感知机的输出层应该可以有多个神经元，从而可以实现多分类问题，同时两个模型所用的参数估计方法十分不同。

即通过阈值大小来实现"与",“或”,“非”。

给定训练集，则感知机的n+1个参数（n个权重+1个阈值）都可以通过学习得到。阈值Θ可以看作一个输入值固定为-1的哑结点的权重ωn+1，即假设有一个固定输入xn+1=-1的输入层神经元，其对应的权重为ωn+1，这样就把权重和阈值统一为权重的学习了。

则感知机权重可以这样调整：

5.2公式推导（基于梯度下降法）：

此处感知机的模型为：

将θ看成哑结点后，模型可化简为：

此处损失函数应为均方误差，通过均方误差求偏导也可以得到5.2。

简单感知机的结构如下图所示：

感知机逐个地输入样本数据，若输出值与真实标记相同则继续输入下一个样本，若不一致则更新权重，然后再重新逐个检验，直到每个样本数据的输出值都与真实标记相同。

容易看出：感知机模型总是能将训练数据的每一个样本都预测正确，和决策树模型总是能将所有训练数据都分开一样，感知机模型很容易产生过拟合问题。

由于感知机模型只有一层功能神经元，因此其功能十分有限，只能处理线性可分的问题，对于这类问题，感知机的学习过程一定会收敛（converge），因此总是可以求出适当的权值。

但是对于异或问题，只通过一层功能神经元往往不能解决，因此要解决非线性可分问题，需要考虑使用多层功能神经元，即神经网络。多层神经网络的拓扑结构如下图所示：

在神经网络中，输入层与输出层之间的层称为隐含层或隐层（hidden layer），隐层和输出层的神经元都是具有激活函数的功能神经元。只需包含一个隐层便可以称为多层神经网络，常用的神经网络称为“多层前馈神经网络”（multi-layer feedforward neural network）:

该结构满足以下几个特点：

每层神经元与下一层神经元之间完全互连
神经元之间不存在同层连接
神经元之间不存在跨层连接

根据上面的特点可以得知：这里的“前馈”指的是网络拓扑结构中不存在环或回路，而不是指该网络只能向前传播而不能向后传播（下面介绍的BP神经网络正是基于前馈神经网络而增加了反馈调节机制）。

神经网络的学习过程就是根据训练数据来调整神经元之间的“连接权”以及每个神经元的阈值，换句话说：神经网络所学习到的东西都蕴含在网络的连接权与阈值中。

5.3 误差逆传播算法（BP神经网络算法）

前面学习可知神经网络的学习主要蕴含在权重和阈值中，多层网络使用上面简单感知机的权重调整规则显然不够用了，BP神经网络算法即误差逆传播算法（error BackPropagation）正是为学习多层前馈神经网络而设计，BP神经网络算法是迄今为止最成功的的神经网络学习算法。

一般而言，只需包含一个足够多神经元的隐层，就能以任意精度逼近任意复杂度的连续函数[Hornik et al.,1989]，故下面以训练单隐层的前馈神经网络为例，介绍BP神经网络的算法思想。

图5.7给出一个拥有d个输入神经元，l个输出神经元，q个隐层神经元的多层前馈神经网络结构，其中输出层第j个神经元的阈值用θj表示，隐层第h个神经元的阈值用γh表示。

假定使用的5.2(b)中的Sigmoid函数。

上图为一个单隐层前馈神经网络的拓扑结构，BP神经网络算法也使用梯度下降法（gradient descent），以单个样本的均方误差的负梯度方向对权重进行调节。

可以看出：BP算法首先将误差反向传播给隐层神经元，调节隐层到输出层的连接权重与输出层神经元的阈值；接着根据隐含层神经元的均方误差，来调节输入层到隐含层的连接权值与隐含层神经元的阈值。

BP算法基本的推导过程与感知机的推导过程原理是相同的，得到类似的更新估计：

下面公式过程明天补充！！！

下面给出调整隐含层到输出层的权重调整规则的推导过程：

链式法则：

5.12推导过程如下：

5.13推导过程如下：

5.14推导过程如下：

学习率η∈（0，1）控制着沿反梯度方向下降的步长，若步长太大则下降太快容易产生震荡，若步长太小则收敛速度太慢，一般地常把η设置为0.1，有时更新权重时会将输出层与隐含层设置为不同的学习率。

BP算法的基本流程如下所示：

先将输入示例提供给输入层神经元，然后依次将信号前传，直到产生输出层结果；然后计算输出层的误差（4-5行），再将误差逆向传播至隐层神经元（6行），最后根据隐层神经元的误差来对连接权和阈值进行调整（7行）；最后反复迭代，直到达到某个条件停止。如图5.9给出的西瓜数据随着训练次数增加，网络参数和分类边界的变化情况：

BP算法的更新规则是基于每个样本的预测值与真实类标的均方误差来进行权值调节，即BP算法每次更新只针对于单个样例。

需要注意的是：BP算法的最终目标是要最小化整个训练集D上的累积误差，即：

如果基于累积误差最小化的更新规则，则得到了累积误差逆传播算法（accumulated error backpropagation），即每次读取全部的数据集一遍，进行一轮学习，从而基于当前的累积误差进行权值调整，因此参数更新的频率相比标准BP算法低了很多，但在很多任务中，尤其是在数据量很大的时候，往往标准BP算法会获得较好的结果。另外对于如何设置隐层神经元个数的问题，至今仍然没有好的解决方案，常使用“试错法”进行调整。

前面提到，BP神经网络强大的学习能力常常容易造成过拟合问题，有以下两种策略来缓解BP网络的过拟合问题：

• 早停：将数据分为训练集与测试集，训练集用于学习，测试集用于评估性能，若在训练过程中，训练集的累积误差降低，而测试集的累积误差升高，则停止训练。

• 引入正则化（regularization）：基本思想是在累积误差函数中增加一个用于描述网络复杂度的部分，例如所有权值与阈值的平方和。

其中λ∈（0,1）用于对累积经验误差与网络复杂度这两项进行折中，常通过交叉验证法来估计。

5.4 全局最小与局部最小

模型学习的过程实质上就是一个寻找最优参数的过程，例如BP算法试图通过最速下降来寻找使得累积经验误差最小的权值与阈值，在谈到最优时，一般会提到局部极小（local minimum）和全局最小（global minimum）。

局部极小解：参数空间中的某个点，其邻域点的误差函数值均不小于该点的误差函数值。
全局最小解：参数空间中的某个点，所有其他点的误差函数值均不小于该点的误差函数值。

要成为局部极小点，只要满足该点在参数空间中的梯度为零。局部极小可以有多个，而全局最小只有一个。全局最小一定是局部极小，但局部最小却不一定是全局最小。

显然在很多机器学习算法中，都试图找到目标函数的全局最小。梯度下降法的主要思想就是沿着负梯度方向去搜索最优解，负梯度方向是函数值下降最快的方向，若迭代到某处的梯度为0，则表示达到一个局部最小，参数更新停止。因此在现实任务中，通常使用以下策略尽可能地去接近全局最小。

我们不希望在参数寻优过程中陷入了局部极小，显然我们希望可以找到全局最小。

因此我们采用了以下一些策略试图“跳出”局部极小，从而进一步接近全局最小：

以多组不同参数值初始化多个神经网络，按标准方法训练，迭代停止后，取其中误差最小的解作为最终参数。（即相当于从多个不同初始点开始搜索，可能陷入不同的局部极小，从中选择有可能最接近全局最小的结果）
使用“模拟退火”技术，即每一步都以一定的概率接受比当前解更差的结果，从而有助于“跳出”局部极小。而每次迭代过程中，此概率随着时间推移而逐渐降低，从而保证算法稳定。（若不逐渐降低，后续频繁“跳出”，算法会不稳定）
使用随机梯度下降，即在计算梯度时加入了随机因素，使得在局部最小时，计算的梯度仍可能不为0，从而有机会跳出局部极小，实现继续迭代搜索。

5.5 其他常见神经网络

介绍了RBF、ART、SOM、级联相关、Elman网络以及Boltzmann机这六种神经网络

详情课本108页

5.6 深度学习

理论上，参数越多，模型复杂度就越高，容量（capability）就越大，从而能完成更复杂的学习任务。而之前复杂模型可能带来过拟合的结果，但随着云计算和大数据的到来降低了过拟合风险，而深度学习（deep learning）正是其中一种极其复杂而强大的模型。

怎么增大模型复杂度呢？两个办法，一是增加隐层的数目，二是增加隐层神经元的数目。 前者更有效一些，因为它不仅增加了功能神经元的数量，还增加了激活函数嵌套的层数。但是对于多隐层神经网络，经典算法如标准BP算法往往会在误差逆传播时发散（diverge），无法收敛达到稳定状态。

那要怎么有效地训练多隐层神经网络呢？一般来说有以下两种方法：

• 无监督逐层训练（unsupervised layer-wise training）：每次训练一层隐节点，把上一层隐节点的输出当作输入来训练，本层隐结点训练好后，输出再作为下一层的输入来训练，这称为预训练（pre-training）。全部预训练完成后，再对整个网络进行微调（fine-tuning）训练。一个典型例子就是深度信念网络（deep belief network，简称DBN）。这种做法其实可以视为把大量的参数进行分组，先找出每组较好的设置，再基于这些局部最优的结果来训练全局最优。

• 权共享（weight sharing）：令同一层神经元使用完全相同的连接权，典型的例子是卷积神经网络（Convolutional Neural Network，简称CNN）。这样做可以大大减少需要训练的参数数目。

深度学习可以理解为一种特征学习（feature learning）或者表示学习（representation learning），无论是DBN还是CNN，都是通过多个隐层来把与输出目标联系不大的初始输入转化为与输出目标更加密切的表示，使原来只通过单层映射难以完成的任务变为可能。即通过多层处理，逐渐将初始的“低层”特征表示转化为“高层”特征表示，从而使得最后可以用简单的模型来完成复杂的学习任务。

传统任务中，样本的特征需要人类专家来设计，这称为特征工程（feature engineering）。特征好坏对泛化性能有至关重要的影响。而深度学习为全自动数据分析带来了可能，可以自动产生更好的特征。

学习过程中参考了资料如下：

1、机器学习 - 周志华
2、百度百科
3、https://blog.csdn.net/u011826404/article/details/75577216
4、https://datawhalechina.github.io/pumpkin-book/#/

机器学习LDA线性判别器代码实现 Longlongaaago 机器学习 LDA 线性判别分析代码实现
机器学习LDA线性判别器代码实现西瓜书P60线性判别器LDA代码实现：importnumpyasnpimportmatplotlib.pyplotaspltdefload_data(file_name):'''数据导入函数:paramfile_name:(string)训练数据位置:return:feature_data(mat)特征lable_data(mat)标签'''fr=open(file
西瓜书-机器学习5.4 全局最小与局部极小 lestat_black 西瓜书机器学习
两种“最优”：“局部极小”(localminimum)和"全局最小"(globalminimum)对和，若存在使得多组不同参数值初始化多个神经网络使用“模拟退火”：以一定的概率接受比当前解更差的结果，有助于“跳出”局部极小使用随机梯度下降遗传算法(geneticalgorithms)[Goldberg,1989]也常用来训练神经网络以上用于跳出局部极小的技术大多是启发式，理论上商缺乏保障。Gold
2019-05-14《西瓜书》难啃杨熊猫Yang
周志华老师的《西瓜书：机器学习》这周看完1~10章锻炼：太极云手、100手/组，3组虎刨功（简）、100个/组，2组
机器学习——集成学习三三木木七机器学习集成学习人工智能
参考：ysu老师课件+西瓜书+期末复习笔记1.集成学习的基本概念集成学习（ensemblelearing）通过构建并结合多个学习器来完成学习任务。有时也被称为多分类器系统（multi-classifiersystem）、基于委员会的学习(committee-basedlearning)等。理解：集成学习是一种机器学习方法，其核心思想是将多个学习器（弱学习器）集成在一起，以达到比单个学习器更好的性能
西瓜书学习笔记——低维嵌入（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍低维嵌入（Low-DimensionalEmbedding）是一种降低高维数据维度的技术，目的是在保留数据特征的同时减少数据的复杂性。这种技术常用于可视化、特征学习、以及数据压缩等领域。低维嵌入的目标是将高维数据映射到一个低维空间，以便更好地理解和可视化数据。在kkk近邻学习中，随着数据维度的增加，样本之间的距离变得更加稀疏，导致KNN算法性能下降。这是因为在高维空
西瓜书学习笔记——核化线性降维（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍核化线性降维是一种使用核方法（KernelMethods）来进行降维的技术。在传统的线性降维方法中，例如主成分分析（PCA）和线性判别分析（LDA），数据被映射到一个低维线性子空间中。而核化线性降维则通过使用核技巧，将数据映射到一个非线性的低维空间中。核技巧的核心思想是通过一个非线性映射将原始数据转换到一个高维的特征空间，然后在该特征空间中应用线性降维方法。这种映射
西瓜书学习笔记——k近邻学习（公式推导+举例应用） Nie同学机器学习学习笔记机器学习
文章目录算法介绍实验分析算法介绍K最近邻（K-NearestNeighbors，KNN）是一种常用的监督学习算法，用于分类和回归任务。该算法基于一个简单的思想：如果一个样本在特征空间中的kkk个最近邻居中的大多数属于某个类别，那么该样本很可能属于这个类别。KNN算法不涉及模型的训练阶段，而是在预测时进行计算。以下是KNN算法的基本步骤：选择K值：首先，确定用于决策的邻居数量K。K的选择会影响算法的
西瓜书学习笔记——主成分分析（公式推导+举例应用） Nie同学机器学习学习笔记机器学习降维
文章目录算法介绍实验分析算法介绍主成分分析（PrincipalComponentAnalysis，PCA）是一种常用的降维技术，用于在高维数据中发现最重要的特征或主成分。PCA的目标是通过线性变换将原始数据转换成一组新的特征，这些新特征被称为主成分，它们是原始特征的线性组合。对于一个正交属性空间（各个属性之间是线性无关的）中的样本点，存在以下两个性质的超平面可对所有样本点进行恰当的表达：最近重构性
朴素贝叶斯分类算法三三木木七 #机器学习机器学习人工智能 sklearn
本文介绍了朴素贝叶斯分类算法，标记后的话一般是自己简要总结的，是比较通俗易懂的，也就是必看的。参考：西瓜书，ysu老师课件【摘要】1.分类算法：分类算法的内容是根据给定特征，求出它所属类别。2.先验概率：就是根据以往的数据分析所得到的概率。后验概率：是得到信息之后重新加以修正得到的概率。3.贝叶斯决策：贝叶斯决策理论中，我们希望选择那个最小化总体期望损失的决策。决策损失的期望值通过对所有可能状态的
决策树的相关知识点三三木木七 #机器学习决策树算法机器学习
参考：ysu老师课件+西瓜书1.决策树的基本概念【决策树】：决策树是一种描述对样本数据进行分类的树形结构模型，由节点和有向边组成。其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果。理解：它是一个树状结构，其中每个节点代表一个特征属性的判断，每个分支代表这个判断的结果，而每个叶节点（叶子）代表一种类别或回归值。关于决策树要掌握的概念：根节点（Roo
西瓜书学习笔记——层次聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录算法介绍实验分析算法介绍层次聚类是一种将数据集划分为层次结构的聚类方法。它主要有两种策略：自底向上和自顶向下。其中AGNES算法是一种自底向上聚类算法，用于将数据集划分为层次结构的聚类。算法的基本思想是从每个数据点开始，逐步合并最相似的簇，直到形成一个包含所有数据点的大簇。这个过程被反复执行，构建出一个层次化的聚类结构。这其中的关键就是如何计算聚类簇之间的距离。但实际上，每个簇都是一个集合
西瓜书学习笔记——密度聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录算法介绍实验分析算法介绍密度聚类是一种无监督学习的聚类方法，其目标是根据数据点的密度分布将它们分组成不同的簇。与传统的基于距离的聚类方法（如K均值）不同，密度聚类方法不需要预先指定簇的数量，而是通过发现数据点周围的密度高度来确定簇的形状和大小。我们基于DBSCAN算法来实现密度聚类。DBSCAN是基于一组邻域参数(ϵ,MinPts)(\epsilon,MinPts)(ϵ,MinPts)来刻
【机器学习·西瓜书学习笔记·线性模型】线性回归——最小二乘法（least square method）慈善区一姐机器学习学习线性回归
线性模型的基本形式给定由个属性描述的实例,其中是在第个属性上的取值，线性模型（linearmodel）试图学得一个通过属性的线性组合来进行预测的函数，即一般用向量形式写成：和确定后，模型就得以确定参数查阅表把数据集表示为一个m*（d+1）大小的矩阵，其中每行对应于一个实例，每行前d个元素对应于实例的d个属性值，最后一个元素恒置于1，即（一）均方误差（meansquarederror）基于欧几里得距
如何系统学习机器学习？人邮异步社区学习机器学习人工智能
要系统学习机器学习，首先需要掌握一些基础编程技能，如Python。其次，学习基础的数学概念，如线性代数、概率论和统计学。然后，选择一些优质的在线课程和教材进行深入学习。最后，通过实践项目来巩固所学知识。以下是一些推荐的书籍：《动手学机器学习》，"西瓜书"作者周志华力荐的机器学习入门书。本书系统介绍了机器学习的基本内容及其代码实现，是一本着眼于机器学习教学实践的图书。本书包含4个部分：第一部分为机器
西瓜书学习笔记——原型聚类（公式推导+举例应用） Nie同学机器学习学习笔记聚类
文章目录k均值算法算法介绍实验分析学习向量量化（LVQ）算法介绍实验分析高斯混合聚类算法介绍实验分析总结k均值算法算法介绍给定样本集D={x1,x2,...,xm}D=\{x_1,x_2,...,x_m\}D={x1,x2,...,xm}，k均值算法针对聚类算法所得簇划分C={C1,C2,...,Ck}\mathcal{C}=\{C_1,C_2,...,C_k\}C={C1,C2,...,Ck}最
大数据学习之路金光闪闪耶
一、为什么要学习大数据？在我第一份实习的时候，忘记在什么场景下我leader突然说了一句：「干Java不就是增删改查嘛」，而恰好那时候知乎都是「干了3年Java，还是只会增删改查，迷茫」等问题，我听完leader那句话就心里一颤。因为这句话，我又一次的陷入迷茫，我不清楚自己是不是应该继续的Java，所以那段时间我干过爬虫，也撸了一阵子的西瓜书和统计学什么的。在知乎上所有相关的问题和答案我都看了，也
西瓜书学习笔记——Boosting（公式推导+举例应用） Nie同学机器学习学习笔记 boosting
文章目录引言AdaBoost算法AdaBoost算法正确性说明AdaBoost算法如何解决权重更新问题？AdaBoost算法如何解决调整下一轮基学习器样本分布问题？AdaBoost算法总结实验分析引言Boosting是一种集成学习方法，旨在通过整合多个弱学习器来构建一个强学习器。其核心思想是迭代训练模型，关注之前被错误分类的样本，逐步提升整体性能。Boosting的代表算法包括AdaBoost、G
浙江大学《机器学习》笔记——神经网络(Neural Network)【上】啵啵啵啵哲机器学习笔记神经网络机器学习人工智能
写在前面·最近在学习《机器学习》.主要是看浙江大学胡浩基老师的网课，结合周志华老师的西瓜书来学.为了理清思路和推公式就敲了这样一个读书笔记.初次学习难免会有错漏，欢迎批评指正.这份笔记主要用途还是用来自己复习回顾.当然如果对大家有帮助那就更好了hhh·注：神经网络这部分的笔记大部分是基于浙大《机器学习》的逻辑进行整理的.第5章神经网络(NeuralNetwork)·神经网络的诞生是集体的智慧·近年
西瓜书读书笔记整理（十二） —— 第十二章计算学习理论 smile-yan 机器学习西瓜书计算学习理论 PAC
第十二章计算学习理论（上）12.1基础知识12.1.1什么是计算学习理论（computationallearningtheory）12.1.2什么是独立同分布（independentandidenticallydistributed,简称i.i.d.i.i.d.i.i.d.）以及独立同分布样本12.1.3泛化误差以及经验误差12.1.4相关数学定义表示12.1.5误差参数12.1.6映射与样本集是
python自学（二）第二章正则表达式|字符串匹配、函数和面向对象程序设计 BrilandLiu python python 编程语言
为了能在开学后更好地融入实验室，本人计划用一个月的时间进行python3语言入门，该系列笔记适合已经有一门编程语言基础的朋友参考使用，欢迎同道者前来交流~使用教材：1.《python从入门到精通》清华大学出版社；（自带教学视频【二维码形式】）least17p/d2.《机器学习》周志华（西瓜书）清华大学出版社；least14p/d;3.BiliBili《和美女老师一起学python》视频。（一）正则
【机器学习】西瓜书要点个人整理 _hermit: 机器学习机器学习人工智能学习
目录前置基础知识第三章线性模型机器学习三要素1.函数集合2.目标函数3.优化方法4.模型评估方法对数几率回归（逻辑回归）第四章决策树第五章SVM第六章贝叶斯分类器第八章集成学习第九章神经网络前情提要：本文适合在学习机器学习课程前，对课程的要点进行简单预习。本文中提到的一些概念，大多是老师课上会重点讲的、考试要考的。此外，在进行复习时也可以通过这些概念引入，从而去更深入理解一些模型原理。前置基础知识
吃瓜教程Task1：概览西瓜书+南瓜书第1、2章卡拉比丘流形机器学习机器学习人工智能
由于本人之前已经学习过西瓜书，本次学习主要是对以往知识的查漏补缺，因此本博客记录了在学习西瓜书中容易混淆的点以及学习过程中的难点。更多学习内容可以参考下面的链接：南瓜书的地址：https://github.com/datawhalechina/pumpkin-book【视频链接】https://www.bilibili.com/video/BV1Mh411e7VU?p=1文章目录绪论如何对机器学习
西瓜书读书笔记整理（十） —— 第十章降维与度量学习 smile-yan 机器学习西瓜书
10.1k近邻学习10.1.1什么是kNN学习kNN算法（k-NearestNeighbors）是一种常用的分类和回归算法。它的基本思想是根据最近邻的样本来预测未知样本的标签或值。10.1.2kNN算法步骤kNN算法的步骤如下：计算未知样本与训练集中所有样本的距离（通常使用欧氏距离或其他距离度量方法）。选取与未知样本距离最近的k个样本。对于分类问题，根据这k个样本的标签进行投票或权重计算，确定未知
西瓜书第六章课后习题 lammmya
6.1试证明样本空间中任意点x到超平面(w,b)的距离为式(6.2)。画了个图在纸上进行了证明，感觉这样自会通俗易懂些。6.2试使用LIBSVM，在西瓜数据集3.0α上分别用线性核和高斯核训练一个SVM，并比较其支持向量的差别。导入相应的包主体函数：设置参数，输出。数据特征可视化输出结果以及数据特征可视化最终结果如下图结果表明，使用线性核和高斯训练核的支持向量实际是一样的(两条线重合)，且数量相同
机器学习西瓜书笔记1 糊了胡机器学习机器学习笔记人工智能
第一章机器学习之绪论目录第一章机器学习之绪论一、引言二、基本术语三、假设空间四、归纳偏好五、发展历程一、引言机器学习就是致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。Mitchell给出了更形式化的定义：假设用P来评估计算机程序在某任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能改善，则我们就说关于T和P，该程序对E进行了学习。二、基本术语收集一组西瓜数据，(色泽=青
西瓜书读书笔记整理（九） —— 第九章聚类 smile-yan 聚类支持向量机机器学习
第九章聚类9.1聚类算法概述9.1.1什么是聚类算法9.1.2聚类算法分类9.1.3聚类任务9.2性能度量（ClusterEvaluation）9.2.1外部指标（externalindex）9.2.2内部指数（internalindex）9.3距离度量（DistanceMeasures）9.3.1距离度量的性质9.3.2常见的几种距离的计算公式9.4原型聚类（prototype-basedclu
西瓜书*南瓜书*机器学习*周志华*第一章*学习小结 fyc300 笔记西瓜书机器学习机器学习人工智能自动驾驶
西瓜书*南瓜书*机器学习*周志华*第一章*学习小结第一章绪论1.1绪论通过一个关于瓜的故事引入了对于机器学习这门课的学习。机器学习正是这样一门学科，它致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。1.2基本术语数据集dataset示例instance样本sample属性attribute特征feature属性值attributevalue属性空间attributespace样本空间s
【机器学习】集成学习基础概念介绍 Avasla 机器学习算法机器学习集成学习人工智能
前言本文根据西瓜书总结了一些关键知识点，介绍了集成学习的原理、类型以及结合策略。、1.个体与集成集成学习（ensemblelearning）通过构建的并结合多个学习器来完成学习任务，有时也被成为多分类器系统（multi-classifiersystem)、基于委员会的学习（committee-basedlearning)等。……通过将多个学习器进行结合，常可获得比单一学习器显著优越的泛化性能。个体
赠书 | 周志华老师的西瓜书--《机器学习》茗创科技
作者：周志华著出版社：清华大学出版社ISBN：978-7-302-42328-7“本书的作者周志华教授在机器学习的许多领域都有出色的贡献，是中国机器学习研究的领军人物之一，在国际学术界有着很高的声誉。他在机器学习的一些重要领域，例如集成学习、半监督学习、多示例和多标记学习等方面都做出了在国际上有重要影响的工作，其中一些可以认为是中国学者在国际上的代表性贡献。”——陆汝铃中国科学院数学与系统科学研究
机器学习西瓜书 Day07 贝叶斯分类器（上）皇家马德里主教练齐达内
p147-p156今天来看第七章。同时，今天心情不错：）2018.5.16凌晨0:51不行了不行了，这一章感觉比SVM还烧脑，困了困了：(所以这一章分两天看吧。明天补上今天少看的6页第七章贝叶斯分类器7.1贝叶斯决策论假设有N种可能的类别标记c1,c2..cN。λij：将cj分成ci所带来的损失。则：将x分为ci所带来的期望损失：R(ci|x)=∑j=1~Nλij·P（cj|x）解释：分为Ci带来
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu