机器人中的数值优化（九）——拟牛顿方法（下）、BB方法

本系列文章主要是我在学习《数值优化》过程中的一些笔记和相关思考，主要的学习资料是深蓝学院的课程《机器人中的数值优化》和高立编著的《数值最优化方法》等，本系列文章篇数较多，不定期更新，上半部分介绍无约束优化，下半部分介绍带约束的优化，中间会穿插一些路径规划方面的应用实例

（3）BFGS公式

① 严格凸函数的BFGS方法

BFGS公式或者说 BFGS方法是 Broyden、Fletcher、Gold-farb和Shanno分别独立提出来的。

$B_{k+1}^{\mathrm{BFGS}}=B_k+\frac{y_ky_k^{\mathrm{T}}}{y_k^{\mathrm{T}}s_k}-\frac{B_k s_k s_k^{\mathrm{T}}B_k}{s_k^{\mathrm{T}}B_k s_k}.$

采用 BFGS公式来修正矩阵的拟 Newton方法称为 BFGS方法。假定 $B_{k+1}^{\mathrm{BFGS}}$ 与 $B_{k}^{\mathrm{BFGS}}$ 都可逆。根据Shermann-Morrison-Woodbury公式,由上式可导出 $H_k$ 的修正公式

$H_{k+1}^{\mathrm{BFGS}}=H_k+\left(1+\dfrac{y_k^{\mathrm{T}}H_k y_k}{y_k^{\mathrm{T}}s_k}\right)\dfrac{s_k s_k^{\mathrm{T}}}{y_k^{\mathrm{T}}s_k}-\left(\dfrac{s_k y_k^{\mathrm{T}}H_k+H_k y_k s_k^{\mathrm{T}}}{y_k^{\mathrm{T}}s_k}\right).$

通过观察可知，分别将DFP方法的 $H_{k+1}^{\mathrm{DFP}}$ 公式和 $B_{k+1}^{\mathrm{DFP}}$ 公式中的 $B_k$ 与 $H_k$ 对换， $s_k$ 与 $y_k$ 对换就可以得到 BFGS方法的 $B_{k+1}^{\mathrm{BFGS}}$ 和 $H_{k+1}^{\mathrm{BFGS}}$ 公式。因而 BFGS方法与DFP方法是互为对偶的方法,而 SR1方法为自对偶的方法。

上式也可写成如下形式：

$H_{k+1}^{\mathrm{BFGS}}=\left(I-\dfrac{\Delta x\Delta g^T}{\Delta g^T\Delta x}\right)H_k\left(I-\dfrac{\Delta g\Delta x^T}{\Delta g^T\Delta x}\right)+\dfrac{\Delta x\Delta x^T}{\Delta g^T\Delta x}$

其中， $\begin{aligned}H_0=I,\Delta x=x^{k+1}-x^k,\Delta g=\nabla f\bigl(x^{k+1}\bigr)-\nabla f\bigl(x^k\bigr)\end{aligned}$

$H_0$ 初始化为单位阵是正定的，若 $\Delta g^T\Delta x>0$ ，则当 $H_i$ 正定时，由上式得到的 $H_{i+1}$ 也正定。即当 $\Delta g^T\Delta x>0$ 时可以保证，迭代中的 $H_i$ 正定都是（严格）正定的。

下图中的例子对牛顿法和采用BFGS方法的拟牛顿法进行了比较，虽然牛顿法的迭代速度更快，但其复杂度高为 $n^3$ ，图中例子的维度为100，迭代次数为12，可用12x $100^3$ =12000000来评价，同理BFGS可用150x $100^2$ =1500000来评价，因此可以认为在下面的例子中BFGS的综合效果更好。

–
上述采用Armijo搜索准则，利用BFGS方法的拟牛顿法仅适合于严格凸函数，它存在以下的缺陷：

①严格梯度单调性在一般情况下不成立

②曲率信息远未达到最优，在较远的地方可能有负曲率

③迭代代价为二次型，计算复杂度为 $n^2$

④对非凸函数的适用性尚待验证

⑤对非光滑函数的适用性尚待验证

② 可能非凸函数的BFGS方法

上文中提到当 $\Delta g^T\Delta x>0$ 时可以保证，迭代中的 $H_i$ 正定都是（严格）正定的，当线搜索满足Wolfe准则时，必有 $\Delta g^T\Delta x>0$ 成立，所以当线搜索满足Wolfe准则时，迭代中的 $H_i$ 正定都是（严格）正定的，即可以保证迭代方向是下降方向。

针对非凸函数，Wolfe条件不能保证BFGS的收敛性，即不能保证一定收敛到最优解，若下述cautious update(Li and Fukushima 2001)条件满足，则可保证

$H_{k+1}=\begin{cases}\left(I-\dfrac{\Delta x\Delta g^T}{\Delta g^T\Delta x}\right)H_k\left(I-\dfrac{\Delta g\Delta x^T}{\Delta g^T\Delta x}\right)+\dfrac{\Delta x\Delta x^T}{\Delta g^T\Delta x}\quad\text{if}\Delta g^T\Delta x>\epsilon||g_k||\Delta x^T\Delta x,\epsilon=10^{-6}\\ H_k\quad\text{otherwise}\end{cases}$

但是BFGS本身的特性导致其发散的情况一般都在优化的初期，一般发生在前10步或者前50步，BFGS自身的优良稳定性使其在靠近局部极小值的附件时几乎一定会满足上述cautious update(Li and Fukushima 2001)条件，所以不需要加上以上条件就可以让BFGS较好的收敛，所以在工程上即使不加以上条件也是挺稳定的，一些优化库中也没有加以上条件，当然加上会使算法更稳定。

下面的例子中对上述BFGS方法与牛顿法进行了比较，结果表明上述BFGS方法是一种很有效的拟牛顿算法

③ L-BFGS方法

我们拿BFGS去迭代更新，它始终会保留所有历史的 $\Delta x$ 和 $\Delta g$ 的信息，但这样并不是必要的，迭代次数足够长以后得到的H阵是一个稠密的阵，不能将复杂度从O( $n^2$ )降到O( $n$ )，并不是所有的历史数据都有用，所以可以设置一个限制，丢弃掉太老的信息，使其仅使用最近m次的 $\Delta x$ 和 $\Delta g$ 信息。

因此，我们可以维护一个历史的滑动窗口，长度为m+1个x和m+1个g，即m对 $\Delta x$ 和 $\Delta g$ ，为方便描述就像前文那样将 $\Delta x$ 和 $\Delta g$ 分别用 $s_k$ 和 $y_k$ 表示，即储存从 $s_{k-m+1}$ 和 $y_{k-m+1}$ 到 $s_{k}$ 和 $y_{k}$ 的m组数据，在计算当前 $H_k$ 时，先初始化 $H_0$ 为单位阵 $I$ ，然后从滑动窗口初始处 $s_{k-m+1}$ 、 $y_{k-m+1}$ 开始利用这m组数据进行m次迭代，得到窗口结束处 $s_k$ 、 $y_k$ 的 $H_m$ ，即当前要求的 $H_k$ 。

如果每次都从窗口里额外的跑一遍BFGS，本来从 $H_k$ 到 $H_{k+1}$ 需要迭代一次，现在需要迭代m次，时间复杂度会从O( $n^2$ )升为O( $mn^2$ )，如下面的左图所示，然而这并不是必要的，我们采用巧妙的结构实现以上方法，如下面右图所示，而将时间复杂度降为O( $mn$ )，m是一个有限常数，因此，可以认为时间复杂度近似于O( $n$ )。

下面的例子对牛顿法，BFGS，L-BFGS进行了比较，L-BFGS的收敛速度近似于BFGS，但时间复杂度降为O( $mn$ )，且更加灵活，一般取m所以，L-BFGS几乎是高效光滑非凸优化的首选。

④ 非凸非平滑函数的BFGS方法

如果函数是非光滑的呢？即存在以下问题

梯度可能不存在、负次级梯度不下降、曲率可能非常大

L-BFGS算法能不能用于非光滑函数？

非凸非光滑函数的求解速度较慢，我们只期待经过有限次迭代后，可以得到解，而不会报错。

如果直接将L-BFGS算法用于非光滑情况，强Wolfe准则会出现问题，因为，其梯度是不连续的，可能没有在0附近的梯度，使得解为空集，如下面的右图所示

–

但是，如果使用一般的Wolfe准则，则不会有以上问题，如下图所示：

–

针对非光滑的情况，一般不使用二次或三次拟合的方法去求合适的步长，因为，拟合效果并不理想，不能很快的收敛，我们可以采用如下的Lewis & Overton线搜索策略：

（注：c1常取 $10^{-4}$ ，c2常取 $0.9$ ）

即初始化步长区间为【0，正无穷】，试探性初始化步长为a=1，若不满足Wolfe准则的第一个条件S（a），如假此时a位于下图中的①处，则将步长区间缩小为【0，a】，并将 a修改为区间【0，a】的中值处，进行下一次循环，直至两个条件都满足，返回步长a。若满足Wolfe准则的第一个条件，而不满足Wolfe准则的第二个条件C（a），如假设此时a位于下图中的②处，则将步长区间的下限L更改为a，并将步长扩大为2L，进行下一次循环，直至两个条件都满足，返回步长a。

将上述搜索步长的策略用于BFGS和L-BFGS算法的效果如下所示，只要 $x_0$ 处的导数存在使用Lewis & Overton线搜索策略的BFGS和L-BFGS算法几乎不可能遇到梯度不可导的点，所以他就可以正确的工作，正确的拟合。

–

当函数的条件数很大时，BFGS和L-BFGS算法依然可以较好的收敛，如下所示：

–

☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆

现在来汇总一下，怎样完成一个鲁棒性好，稳定性好，计算复杂度较低的拟牛顿算法：采用Lewis & Overton线搜索策略求取合适的步长，LBFGS采用滑动窗口有限内存版本的更新方式，且检查是否满足cautious update条件

–

（4）Broyden族公式

根据 $H_{k+1}^{\mathrm{DFP}}$ 公式和 $H_{k+1}^{\mathrm{BFGS}}$ 公式,可以构造出一族拟Newton方法的修正公式，我们称之为Broyden族公式

$H_{k+1}^{\varphi}=(1-\varphi)H_{k+1}^{\mathrm{DFP}}+\varphi H_{k+1}^{\mathrm{BFGS}},$

其中ψ ≥ 0. DFP公式与 BFGS 公式均是 Broyden族公式的特殊情形,分别对应于ψ= 0与ψ = 1.通常将用Broyden族公式来修正矩阵的拟Newton方法称为 Broyden族方法.这一族方法有许多共同的性质,故可以作为一个整体进行讨论.

我们还可以把上式写如下的形式：

$\begin{array}{c}H_{k+1}^{\varphi}=H_{k+1}^{\mathrm{DFP}}+\varphi\big(H_{k+1}^{\mathrm{BFGS}}-H_{k+1}^{\mathrm{DFP}}\big)\\ =H_{k+1}^{\mathrm{DFP}}+\varphi v_k v_k^{\mathrm{T}},\end{array}$

其中：

$v_{k}=(y_{k}^{\mathrm{T}}H_{k}y_{k})^{1/2}\bigg(\frac{s_{k}}{s_{k}^{\mathrm{T}}y_{k}}-\frac{H_{k}y_{k}}{y_{k}^{\mathrm{T}}H_{k}y_{k}}\bigg)$

这表明 Broyden族公式的所有矩阵 $H_{k+1}^{\varphi}$ 的差别仅在于秩1矩阵 $\varphi v_k v_k^{\mathrm{T}}$

十一、BB方法

最速下降方法与 BB方法都是负梯度方法,它们的不同仅在于步长的选取方式.最速下降方法是一种古老的方法.许多年来,最速下降方法由于收敛速度太慢而无法受到人们的重视。1988年,Barzilai和 Borwein提出了一种新的负梯度方法,即BB方法. BB方法诞生后，人们对负梯度方法产生了浓厚的兴趣，尽管该方法尚有许多理论问题没有解决,然而依然是一种有效的负梯度方法。

我们仅考虑用BB方法求解正定二次函数求极小值的问题，如下式所示，对一般的最优化问题,由于BB方法需要使用非单调线搜索的技巧,这里暂不进行讨论。

$\min f(x)=\dfrac{1}{2}x^{\mathrm T}Gx+b^{\mathrm T}x,$

其中 $G∈R^{n×n}$ 对称正定,考虑如下负梯度迭代:

$x_{k+1}=x_k-\alpha_k g_k,$

其中 $g_k=Gx_k+b$ ，如何选取合适的 $α_k$ 呢？

BB方法选取 $α_k$ 的基本思想源于拟 Newton方法,它是将 Hesse矩阵 $G_k$ 和Hesse逆矩阵 $G^{-1}_k$ 的近似矩阵 $B_k$ 和 $H_k$ 。分别取为 $α^{-1}I$ 和 $α I$ ,使得拟Newton条件在2范数意义下取极小,即要求 $α_k$ 为

$\alpha_k=\arg\min\limits_{\alpha>0}\|\alpha^{-1}s_{k-1}-y_{k-1}\|_2^2$

或
$\alpha_k=\arg\min\limits_{\alpha>0}\|s_{k-1}-\alpha y_{k-1}\|_2^2,$

其中 $s_{k-1}=x_{k}-x_{k-1},y_{k-1}= g_{k}-g_{k-1}$ ，解上述两个极小值问题，把对解分别记作 $α^{BB1}_k$ 和 $α^{BB2}_k$ ，并将其对应的方法分别记作BB1方法和BB2方法

$\alpha_k^{\mathrm{BB1}}=\frac{s_{k-1}^\mathrm{T}s_{k-1}}{s_{k-1}^\mathrm{T}y_{k-1}},\quad\alpha_k^{\mathrm{BB2}}=\frac{s_{k-1}^\mathrm{T}y_{k-1}}{y_{k-1}^\mathrm{T}y_{k-1}}.$

对于上述二次极小值问题， $g_k=Gx_k+b$ ，则：

$\begin{array}{c}s_{k-1}=x_k-x_{k-1}=-\alpha_{k-1}g_{k-1},\\ \\ y_{k-1}=g_k-g_{k-1}=-\alpha_{k-1}Gg_{k-1}.\end{array}$

因此BB方法的两个步长公式可分别化为

$\alpha_k^{\mathrm{BB1}}=\frac{g_{k-1}^{\mathrm{T}}g_{k-1}}{g_{k-1}^{\mathrm{T}}G g_{k-1}},$
$\alpha_k^{\mathrm{BB2}}=\frac{g_{k-1}^{\mathrm{T}}G g_{k-1}}{g_{k-1}^{\mathrm{T}}G^2g_{k-1}}.$

步长 $α^{BB1}_k$ 和 $α^{BB2}_k$ 与最速下降法（SD）、最小梯度法（MG）的步长的联系如下：

$\alpha_k^{\mathrm{SD}}=\arg\min\limits_{\alpha>0}f(x_k-\alpha g_k)=\dfrac{g_k^{\mathrm{T}}g_k}{g_k^{\mathrm{T}}G g_k};$
$\alpha_k^{\mathrm{MG}}=\arg\min\limits_{\alpha>0}||g(x_k-\alpha g_k)||_2^2=\dfrac{g_k^{\mathrm{T}}G g_k}{g_k^{\mathrm{T}}G^2g_k}.$

通过观察可以有如下结论：

$\alpha_k^{\mathrm{BB1}}=\alpha_{k-1}^{\mathrm{SD}},\quad\alpha_k^{\mathrm{BB2}}=\alpha_{k-1}^{\mathrm{MG}}.$

这两个式子表明，BB1方法和 BB2方法的当前步长分别是 SD方法和MG方法的前一步步长.虽然BB方法仅将SD方法或MG方法的步长延后一步使用,但是在实际计算中,BB方法的数值表现通常明显好于SD方法和 MG方法

另一方面,SD方法或者MG方法产生的向量序列{ $g_k$ }可能出现在两个方向之间来回震荡的情况，而BB方法的下降方向可能不是有规则的.这说明,选取合适的步长,可以避免规则下降方向的出现，我们已经得到了BB方法在收敛性方面的一些结果,然而令人遗憾的是，至今未能从理论上解释BB方法为什么能够明显地超越SD方法和MG方法.

不过，对一般的非线性函数，BB方法产生的迭代序列可能发散.为了保证算法的全局收敛性,Raydan[提出了将 BB方法与 GLL非单调线搜索结合起来的方法。

参考资料：

1、数值最优化方法（高立编著）

2、机器人中的数值优化

ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
java实体中返回前端的double类型四舍五入（格式化）婲落ヽ紅顏誶 java
根据业务，需要通过后端给前端返回部分double类型的数值，一般需要保留两位小数，使用jackson转换对象packagecom.ruoyi.common.core.config;importcom.fasterxml.jackson.core.JsonGenerator;importcom.fasterxml.jackson.databind.JsonSerializer;importcom.f
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
零基础机器学习(5)之线性回归模型的性能评估一只特立独行猪机器学习机器学习线性回归人工智能
文章目录线性回归模型的性能评估1.举例1-单一特征2.举例2-多特征线性回归模型的性能评估评估线性回归模型时，首先要建立评估的测试数据集（测试集不能与训练集相同），然后选择合适的评估方法，实现对线性回归模型的评估。回归任务中最常用的评估方法有均方误差、均方根误差和预测准确率（确定系数）。1.举例1-单一特征分别对两个模型进行评估，输入的测试集如表所示。面积/（m2）售价/（万元）面积/（m2）售价
408-计算机组成原理-注意点猫毛已经快要掉光的小猫系统架构
数据的表示IEEE754标准的特殊情况：阶码全为0，尾数不全为0表示非规格化的数值，0.M×2^(-126)阶码全为0，尾数也全为0，表示±0阶码全为1，尾数全为0，表示正负无穷大阶码全为1，尾数不全为0，表示非数符Nan存储器Cache：多少组相联指的是一组有多少个。LRU标记为一组有n个，就需要用logn表示区分计算cache数据区与cache容量，cache容量需要包括标志位。标志位大体包括
MySQL的zerofill 零填充程序员达芬奇数据库 mysql 数据库
在MySQL中，ZEROFILL是一种属性，用于在创建表时指定数值列的显示宽度，并在值不足指定宽度时使用零填充（前导零）。当将ZEROFILL属性应用于一个整数列时，MySQL会在显示该整数时使用零填充以达到指定的宽度。下面是一个简单的示例，演示如何在创建表时使用ZEROFILL零填充属性：CREATETABLEexample_table(idINT(5)ZEROFILL,nameVARCHAR(
贪心算法问题勒布朗-前端算法贪心算法算法
分发饼干-455假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值gi，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸sj。如果sj>=gi，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。注意：你可以假设胃口值为正。一个小朋友最多只能拥有一块饼干。示
2022-05-14 败者食尘_40a0
本文结构速览：一、SQL题二、机器学习&概率论三、开放性问题01SQL题面试真题：现有一张用户签到表（user_sign_d）,标记用户每日是否签到，表结构如下sign_date:日期user_id:用户IDif_sign:当日是否签到,1表示签到，0表示未签到问题①：请计算截止到当前每个用户已经连续签到的天数（输出表仅包含当天签到的所有用户，计算其连续签到的天数）输出表结构如下：user_id:
Android 实现照片抠出人像。 No Promises﹉ android
谢谢阅览、关注！！一、各平台的实现方式：1.Android实现方式：使用图像处理库（如OpenCV）：集成OpenCV库，利用其图像处理功能进行边缘检测和图像分割；使用机器学习模型（如TensorFlowLite）：集成TensorFlowLite和预训练的人像分割模型；使用第三方API服务：利用如百度AI、腾讯AI等提供的在线API进行图像处理。步骤：集成必要的库或API、加载和处理图像、应用抠
ActiViz中的单元类型仰望大佬007 c#vtk ActiViz 图像处理三维重建
文章目录前言一、点元素（Vertex）二、线元素（Line）三、面元素四、体元素五、示例代码六、总结前言在ActiViz中，单元类型是用于表示几何体的基本单元，它们构成了几何体模型的基础。ActiViz提供了丰富的单元类型支持，可以用来建立各种复杂的几何体模型，并在有限元分析、流体力学等领域中进行数值计算和可视化。一、点元素（Vertex）点元素是最基本的几何体单元，它代表一个点，不具有体积，仅有
【算法 & 动态规划 & 斐波那契数列模型】解码方法杰深入学习计算机算法动态规划算法动态规划
解码方法题目链接解题思路:动态规划状态表示:dp[i]表示前i个字符,可以解码方法的总数状态转移方程以i位置为结尾的字符,可以有两种情况进行解码单独解码如果该字符不为0,就可以解码成功,就相当于在区间[0,i-1]上,在添上一个字符,所以此时的dp[i]=dp[i-1]如果该字符为0,就说明单独解码失败与前一个字符一起解码如果两个字符的整数值在[10,26]之间,就表示解码成功,那么此时[0,i]
Python机器学习笔记：CART算法实战战争热诚
完整代码及其数据，请移步小编的GitHub传送门：请点击我如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote前言在python机器学习笔记：深入学习决策树算法原理一文中我们提到了决策树里的ID3算法，C4.5算法，并且大概的了
Mysql数据库——数据类型一坨小橙子ovo 数据库 mysql
目录一、数值类型1.整数型2.浮点型(float和double)，近似值3.定点数二、字符串型1.字符串2.char和varchar比较Mysql中定义数据字段的类型对数据库的优化是非常重要的Mysql支持多种类型，内置数据类型大致分为三类数值类型日期/时间类型字符串（字符）类型数据类型参考链接：https://dev.mysql.com/doc/refman/8.0/en/data-types.
MATLAB中的符号计算是什么？如何使用它？爱花的程序算法
一、符号计算概述符号计算，顾名思义，是一种基于符号而非数值的计算方式。在MATLAB中，符号计算是通过符号表达式来实现的，这些表达式由符号变量、符号运算符和括号等组成。符号变量可以是任何字母或单词，它们代表数学上的未知量或变量。符号运算符则包括加减乘除、幂运算、函数等常见的数学运算。符号计算的主要优点是能够进行精确的计算，避免了浮点数计算带来的误差。这对于需要高精度结果的工程和科学计算来说至关重要
训练时损失出现负数，正常吗？为什么苏苏大大机器学习深度学习人工智能
在训练神经网络时，通常期望损失函数的值是非负的，因为损失函数是用来度量模型预测与真实值之间的差异的。然而，有时候在训练过程中，损失函数可能会出现负数的情况，这可能是正常的，也可能是因为某些原因导致了不寻常的行为。出现损失函数为负数的情况可能有以下几种原因：1.数值不稳定性：如果在计算损失函数时使用了数值不稳定的操作，比如过大或过小的数值，可能会导致损失函数出现负数。这可能是由于数值计算中的舍入误差
机器学习是什么三花学编程机器学习
机器学习是什么？机器学习，这一词汇在当今的科技领域中可谓炙手可热，其影响深远，不仅改变了科学研究的方式，也推动了社会的快速发展。那么，机器学习到底是什么呢？机器学习，顾名思义，是机器（通常指计算机）进行学习的过程。这个过程模仿了人类的学习方式，通过经验积累，不断优化自身性能，最终能够在没有人类直接干预的情况下，进行决策或预测。简单来说，机器学习就是让计算机具备从数据中学习并自动改进的能力。机器学习
最新ChatGPT支持下的PyTorch机器学习与深度学习 zkzhzy ChatGPT 机器学习 python 机器学习深度学习 pytorch chatgpt 数据分析人工智能
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。郁磊（副教授）主要从事AI人工智能、大语言模型及软件开发、生理系统建模与仿真、生物医学信号处理，具有丰富的科研经验，主编《MATLAB智能算
神奇的微积分科学的N次方人工智能人工智能 ai
微积分在人工智能（AI）领域扮演着至关重要的角色，以下是其主要作用：优化算法：•梯度下降法：微积分中的导数被用来计算损失函数相对于模型参数的梯度，这是许多机器学习和深度学习优化算法的核心。梯度指出了函数值增加最快的方向，通过沿着负梯度方向更新权重，可以最小化损失函数并优化模型。•反向传播：在神经网络训练中，微积分的链式法则用于计算整个网络中每个参数对于最终损失函数的影响（偏导数），这一过程就是反向
【Python】使用高斯一勒让德求积(Gauss-Legendre)积分公式进行数值积分穿着帆布鞋也能走猫步课程设计成品 python
本设计实现了使用Gauss-Legendre积分公式进行数值积分的功能。它通过计算勒让德多项式的零点和权重，并结合被积函数的取值来进行积分的近似计算。通过调整积分节点数n，可以得到更准确的积分近似值。最后，将计算得到的近似值与精确值进行比较，以评估数值积分的准确性。importnumpyasnpimportmatplotlib.pyplotasplt#定义勒让德多项式deflegendre_pol
机器学习简介 Dayueban
@我的博客：有味写在前面在年前将要进行靶向代谢组学测定的样品送去公司，随之想想，还有一个半月的时间数据才会回来，那么这段时间是不是可以先学习下分类数据如何分析呢（PS:因为数据是属于分类性质的），所以不久前买的一本书——《机器学习与R语言》稍微系统学一遍，该书为美国的BrettLantz所著，翻译工作由我国学者李洪成、许金炜、李舰完成。学习本书的主要目的是了解机器学习的思想，以及所应用的领域，当然
regression机器学习回归预测模型参考学习后自我总结饮啦冰美式机器学习回归学习
简单来说，就是将样本的特征矩阵映射到样本标签空间。回归分析帮助我们理解在改变一个或多个自变量时，因变量的数值会如何变化。线性模型线性回归用于建立因变量和一个或多个自变量之间的线性关系模型。在线性回归中，假设因变量（被预测变量）与自变量（预测变量）之间存在着线性关系，也就是说，因变量的数值可以通过自变量的线性组合来预测。普通最小二乘线性回归。通过最小化实际观测值与模型预测值之间的误差平方和，可以找到
2024-3-17Go语言入门 weixin_51187533 golang 开发语言后端
在Go语言中：varachanint定义了一个名为a的变量，其类型为chanint。这意味着a是一个整型值的通道（channel）。通道是Go语言中用于goroutine之间通信的一种机制，你可以通过通道发送和接收特定类型的值。在这个例子中，通道允许传递整型数值。varafunc(string)int定义了一个名为a的变量，其类型为函数类型，具体来说是一个接受一个字符串作为参数并返回一个整数的函数
C++ (leetcode)min(const T& a, const T& b) 饿了就去喝水 c++leetcode java 算法
1.使用min()函数-包括标题或者简单使用头文件。参数：constT&a,constT&b–要比较的值。返回值：T–它返回T类型的最小值。如果使用在一个循环里，比较该数字和后一个数字的话，min(nums[i],nums[i-1])得到的结果就是一系列数组中差的最小值。例题：二叉搜索树的最小绝对差给你一个二叉搜索树的根节点root，返回树中任意两不同节点值之间的最小差值。差值是一个正数，其数值等
【C/C++ 学习笔记】内存糠帅傅蓝烧牛肉面 C/C++学习笔记 c++学习笔记
【C/C++学习笔记】内存视频地址:Bilibili内存分区模型代码区:存放函数体的二进制代码，由操作系统进行管理全局区:存放全局变量和静态变量以及常量栈区:由编译器自动分配释放，存放函数的参数值、局部变量等堆区:由程序员分配和释放，若程序员不释放，程序结束时由操作系统回收不同区域存放的数据，赋予不同的生命周期，给我们更大的灵活性可执行程序在程序编译后，生成了exe可执行程序，为执行该程序前分为两
线性回归和逻辑回归对比学习-含代码和数据 M.D 线性回归逻辑回归学习
线性回归和逻辑回归是两种常见的机器学习算法，它们在一些方面相似，但在其他方面则有明显的不同。以下是它们的对比以及您提供的代码示例：线性回归(LinearRegression)线性回归用于预测连续的数值。这种模型假设自变量和因变量之间存在线性关系。fromsklearn.linear_modelimportLinearRegressionimportmatplotlib.pyplotaspltimp
【Conda】详细讲解程序员不想敲代码啊 conda
Conda1.前言2.关键特点3.Conda命令1.前言Conda是一个流行的包管理器和环境管理器，主要用于Python编程语言，但也可以用来安装、运行和更新包和环境中的任何语言，如R、Ruby、Lua、Scala、Java等。Conda主要是为了方便数据科学、机器学习和类似应用的需要而设计的，但它对任何类型的软件都是适用的。下面，我将概述Conda的几个关键特点和常用命令：2.关键特点环境管理：
机器学习常用框架碧落&凡尘机器学习人工智能
机器学习是人工智能的一个重要分支，它通过让计算机系统利用数据自我学习来改进任务执行的能力。在机器学习领域，有许多成熟的框架被广泛使用，这些框架提供了构建和训练机器学习模型的工具。以下是一些常用的机器学习框架：TensorFlow：由Google开发，是一个开源的软件库，用于数据流编程，广泛应用于各类机器学习任务。它支持分布式计算，能够在大规模数据集上训练复杂的模型。PyTorch：由Faceboo
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

机器人中的数值优化（九）——拟牛顿方法（下）、BB方法

你可能感兴趣的:(数值优化方法,机器学习,最优化方法,数值优化,拟牛顿法,牛顿法,运动规划)