sangyongjia

决策树类的机器学习算法——决策树、Bagging、随机森林、Boosting、AdaBoost、GBDT、XGBoost

之所以将这几个算法记录在一起，是因为这些算法都是以决策树为基础！

1、决策树

决策树（decision tree）是一个树结构（可以是二叉树或非二叉树）。其每个非叶节点表示一个特征属性上的判定，每个分支代表这个特征属性在其值域上的输出，而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始，测试待分类项中相应的特征属性，并按照其值选择输出分支，直到到达叶子节点，将叶子节点存放的类别作为决策结果。

决策树的构造过程不依赖领域知识，决策树的构造就是根据计算公式（信息增益比）来确定优先选择哪个特征属性对训练数据进行划分，依次类推，直到叶子节点（叶子节点中的数据都属于同一个类别）。究竟优先选择哪个特征属性？其评价标准是让各个分裂子集尽可能地“纯”，尽可能“纯”就是尽量让一个分裂子集中待分类项属于同一类别，而这个任务就交给数学公式——信息增益比——来确定！

分裂属性分为三种不同的情况：

1、属性是离散值且不要求生成二叉决策树。此时用属性的每一个划分作为一个分支。

2、属性是离散值且要求生成二叉决策树。此时使用属性划分的一个子集进行测试，按照“属于此子集”和“不属于此子集”分成两个分支。

3、属性是连续值。此时确定一个值作为分裂点split_point，按照>split_point和<=split_point生成两个分支。

属性选择度量算法有很多，一般使用自顶向下递归分治法，并采用不回溯的贪心策略。这里介绍ID3和C4.5两种常用算法。

1.1、ID3算法

先介绍几个概念，摘录自知乎：

熵：表示随机变量的不确定性。

条件熵：在一个条件下，随机变量的不确定性。

信息增益：熵 - 条件熵（在一个条件下，信息不确定性减少的程度！）

例如：
通俗地讲，X(明天下雨)是一个随机变量，X的熵可以算出来， Y(明天阴天)也是随机变量，在阴天情况下下雨的信息熵（即条件熵）我们如果也知道的话。两者相减就是信息增益！原来明天下雨例如信息熵是2，条件熵是0.01（因为如果是阴天就下雨的概率很大，信息就少了），这样相减后为1.99，在获得阴天这个信息后，下雨信息不确定性减少了1.99！是很多的！所以信息增益大！也就是说，阴天这个信息对下雨来说是很重要的！即这个特征属性很重要！所以在特征选择的时候常常用信息增益，如果IG（信息增益）大的话那么这个特征对于分类来说很关键~~ 决策树就是这样来找特征的！

从信息论知识中我们知道，期望信息越小（条件熵），信息增益（熵减去条件熵）越大，从而纯度越高。所以ID3算法的核心思想就是以——信息增益——度量属性选择，选择分裂后信息增益最大的属性进行分裂。下面先定义几个要用到的概念。

设D为用类别（公式中m为类别的总数）对训练元组进行的划分（划分为m个类），则D的熵（entropy）表示为：

$info(D)=-\sum ^m_{i=1}p_ilog_2(p_i)$

其中pi表示第i个类别在整个训练元组中出现的概率，m表示类别的总数，可以用属于此类别元素的数量除以训练元组元素总数量作为估计。熵的实际意义表示是D中元组的类标号所需要的平均信息量。

现在我们假设将训练元组D按特征属性A进行划分，则A对D划分的期望信息为（即条件熵，在特征属性A分类的基础上）：

$info_A(D)=\sum ^v_{j=1}\frac{|D_j|}{|D|}info(D_j)$

Dj表示按特征属性A的一个分类，v表示特征属性A取值的种类个数。

信息增益即为两者的差值：

具体例子：

ID3算法就是在每次需要分裂时，计算每个属性的增益率，然后选择增益率最大的属性进行分裂。下面我们用SNS社区中不真实账号检测的例子说明如何使用ID3算法构造决策树。为了简单起见，我们假设训练集合包含10个元素：

其中s、m和l分别表示小、中和大。

设L、F、H和R表示日志密度、好友密度、是否使用真实头像和账号是否真实，下面计算各属性的信息增益。

$info_L(D)=0.3*(-\frac{0}{3}log_2\frac{0}{3}-\frac{3}{3}log_2\frac{3}{3})+0.4*(-\frac{1}{4}log_2\frac{1}{4}-\frac{3}{4}log_2\frac{3}{4})+0.3*(-\frac{1}{3}log_2\frac{1}{3}-\frac{2}{3}log_2\frac{2}{3})=0+0.326+0.277=0.603$

因此日志密度的信息增益是0.276。

用同样方法得到H和F的信息增益分别为0.033和0.553。

因为F具有最大的信息增益，所以第一次分裂选择F为分裂属性，分裂后的结果如下图表示：

在上图的基础上，再递归使用这个方法计算子节点的分裂属性，最终就可以得到整个决策树。

重要：

上面为了简便，将特征属性离散化了，其实日志密度和好友密度都是连续的属性。对于特征属性为连续值，可以如此使用ID3算法：先将D中元素按照特征属性排序，则每两个相邻元素的中间点可以看做潜在分裂点，从第一个潜在分裂点开始，分裂D并计算两个集合的期望信息，具有最小期望信息的点称为这个属性的最佳分裂点，其信息期望作为此属性的信息期望。

1.2、C4.5算法

ID3算法存在一个问题，就是偏向于多值属性，例如，如果存在唯一标识属性ID，则ID3会选择它作为分裂属性，这样虽然使得划分充分纯净，但这种划分对分类几乎毫无用处。ID3的后继算法C4.5使用增益率（gain ratio）的信息增益扩充，试图克服这个偏倚。

C4.5算法首先定义了“分裂信息”，其定义可以表示成：

$split\_info_A(D)=-\sum ^v_{j=1}\frac{|D_j|}{|D|}log_2(\frac{|D_j|}{|D|})$

其中各符号意义与ID3算法相同，然后，增益率被定义为：

C4.5选择具有最大增益率的属性作为分裂属性，其具体应用与ID3类似，不再赘述。

1.3、如果属性用完了怎么办

在决策树构造过程中可能会出现这种情况：所有属性都作为分裂属性用光了，但有的子集还不是纯净集，即集合内的元素不属于同一类别。在这种情况下，由于没有更多信息可以使用了，一般对这些子集进行“多数表决”，即使用此子集中出现次数最多的类别作为此节点类别，然后将此节点作为叶子节点。

1.4、关于剪枝

在实际构造决策树时，通常要进行剪枝，这时为了处理由于数据中的噪声和离群点导致的过分拟合问题。剪枝有两种：

先剪枝——在构造过程中，当某个节点满足剪枝条件，则直接停止此分支的构造。

后剪枝——先构造完成完整的决策树，再通过某些条件遍历树进行剪枝。

关于剪枝的具体算法这里不再详述，有兴趣的可以参考相关文献。

以上内容转载自： http://www.cnblogs.com/leoo2sk/archive/2010/09/19/decision-tree.html；略加补充，还需要继续加工，写的更加简明易懂。

2、Bagging

Bagging的策略:

（1）从样本集中重采样（有重复的）选出n个样本；

（2）在所有属性上，对这n个样本建立分类器（ID3、C4.5、CART、SVM、Logistic回归等）；

（3）重复以上两步m次，即获得了m个分类器；

（4）将数据放在这m个分类器上，最后根据这m个分类器的投票结果，决定数据属于哪一类。

疑问1：n的值如何选择？

疑问2：m的值如何选择？——选择奇数个分类器即可。

注：与其将Bagging理解为一个算法，不如将其理解为一种思想，即综合多个弱分类器的结果得到一个强分类器的思想！

3、随机森林

随机森林在bagging基础上做了修改。基本思路是：
（1）从样本集中用Bootstrap采样（有放回的采样）选出n个样本（重采样）；
（2）从所有属性中随机选择k个属性，选择最佳分割属性作为节点建立CART决策树；
（3）重复以上两步m次，即建立了m棵CART决策树
（4）这m个CART形成随机森林，通过投票表决结果，决定数据属于哪一类

3.1、随机森林、Bagging和决策树的关系

目前的理解Bagging和随机森林的却别如红色字体标注所示；Bagging方法选用所有特征属性，随机森林选用所有特征属性中的k个特征属性（特征属性的一个子集）。

当然可以使用决策树作为基本分类器，但也可以使用SVM、Logistic回归等其它分类器，习惯上，这些分类器组成的“总分类器”，仍然叫做随机森林。

以上参见自：http://blog.csdn.net/american199062/article/details/51314968

3.2、随机森林详述

决策树相当于一个大师，通过自己在数据集中学到的知识对于新的数据进行分类。但是俗话说得好，一个诸葛亮，玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠，希望最终的分类效果能够超过单个大师的一种算法。

那随机森林具体如何构建呢？有两个方面：数据的随机性选取，以及待选特征的随机选取。

3.2.1、数据的随机选取：

首先，从原始的数据集中采取有放回的抽样，构造子数据集，子数据集的数据量是和原始数据集相同的。不同子数据集的元素可以重复，同一个子数据集中的元素也可以重复。第二，利用子数据集来构建子决策树。最后，如果有了新的数据需要通过随机森林得到分类结果，就可以通过对子决策树的判断结果的投票，得到随机森林的输出结果了。如下图，假设随机森林中有3棵子决策树，2棵子树的分类结果是A类，1棵子树的分类结果是B类，那么随机森林的分类结果就是A类。

3.2.2、待选特征的随机选取：

与数据集的随机选取类似，随机森林中的子树的每一个分裂过程并未用到所有的待选特征，而是从所有的待选特征中随机选取一定的特征，之后再在随机选取的特征中选取最优的特征。这样能够使得随机森林中的决策树都能够彼此不同，提升系统的多样性，从而提升分类性能。
下图中，蓝色的方块代表所有可以被选择的特征，也就是目前的待选特征。黄色的方块是分裂特征。左边是一棵决策树的特征选取过程，通过在待选特征中选取最优的分裂特征（别忘了前文提到的ID3算法，C4.5算法，CART算法等等），完成分裂。右边是一个随机森林中的子树的特征选取过程。

1.有个疑问，生成多少个子树呢？（即抽样出多少个数据子集呢？）一般为奇数个是肯定的，要不然投票是个问题。

2.每个子树的训练选择多少个特征呢？

4、Boosting

Boosting方法和Bagging类似，与其将其理解为一个算法，不如将其理解为一类算法的思想。即：通过m次的迭代，每次迭代训练出不同的弱分类器，然后将这m个弱分类器进行组合，形成一个强分类器。Adaboost就是这类算法中最具代表性的一个算法。

5、Adaboost

待补充

6、Boosting Tree

待补充

7、GBDT

待补充

8、XGBoost

待添加

你可能感兴趣的:(决策树,随机森林,GBDT,xgboost)

从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
xgboost原理茶尽
阅读XGBoost与BoostedTree基学习器：CART每个叶子节点上面有一个分数不够厉害，所以找一个更强的模型treeensemble对每个样本的预测结果是每棵树预测分数的和目标函数采用boosting（additivetraining）方法，每一次都加入一个新的函数。依赖每个数据点上的误差函数的一阶导数和二阶导（区别于GBDT）。树的复杂度复杂度包含了一棵树里面的叶子个数和输出分数的L2模
数据挖掘算法：KNN、SVM、决策树详解大力出奇迹985 数据挖掘算法支持向量机
本文将详细解析数据挖掘领域中常用的三种经典算法：KNN（K近邻算法）、SVM（支持向量机）和决策树。首先分别阐述每种算法的核心原理、实现步骤，再分析它们的优缺点及适用场景，最后对这三种算法进行综合对比与总结。通过本文，读者能全面了解这三种算法的特性，为实际数据挖掘任务中算法的选择提供参考，助力提升数据处理与分析的效率和准确性。在当今信息爆炸的时代，数据挖掘技术在各行各业发挥着至关重要的作用，而算法
【树模型与集成学习】(task6)梯度提升树GBDT+LR 山顶夕景推荐算法 #集成学习与Kaggle GBDT 推荐算法机器学习
学习总结（1）不同问题的提升树学习算法，主要区别在于使用的损失函数不同，如用平方误差损失函数的回归问题、用指数损失函数的分类问题、用一般损失函数的一般决策问题等。（2）不管是二分类问题的提升树，还是回归问题的提升树，这里的损失函数都很方便：前者是用指数损失函数，所以可以当做是Adaboost的个例，Aadaboost的流程；而后者是当使用平方误差损失时，可以直接拟合残差。而使用不同的损失函数，对应
Python与机器学习库Scikit-learn进阶 master_chenchengg python python Python python开发 IT
Python与机器学习库Scikit-learn进阶Scikit-learn进阶之旅：从新手到高手的必经之路为什么选择Scikit-learn？安装与环境设置特征工程的艺术：打造更强大的预测模型数据清洗特征构造模型调优秘籍：网格搜索与交叉验证的最佳实践网格搜索交叉验证集成学习的魅力：提升模型性能的组合拳随机森林梯度提升机堆叠实战案例解析：使用Scikit-learn解决真实世界问题数据准备模型训练
深入详解：决策树在医学影像分割特征选择中的应用与实现猿享天开决策树算法机器学习人工智能
深入详解：决策树在医学影像分割特征选择中的应用与实现决策树（DecisionTree）作为一种经典的机器学习算法，以其简单、直观和可解释性强的特点，在医学影像分割的特征选择中扮演了重要角色。医学影像分割（如分割脑肿瘤、肝脏、肺结节等）需要从高维影像数据中提取关键特征，以提升分割模型的精度和效率。决策树通过构建树形结构，筛选对分割任务最重要的特征，降低数据维度，同时提供可解释的规则。本文将从原理、实
机器学习从入门到实践：算法、特征工程与模型评估详解
目录摘要1.引言2.机器学习概述2.1什么是机器学习？2.2机器学习的发展历史2.3机器学习的应用3.机器学习算法分类3.1监督学习（SupervisedLearning）3.2无监督学习（UnsupervisedLearning）3.3半监督学习（Semi-SupervisedLearning）4算法详解4.1分类算法详解（1）逻辑回归（LogisticRegression）（2）决策树（Dec
机器学习-XGBoost和SHAP解析数据 python机器学习ML 机器学习人工智能数据分析 python
一、引言在机器学习领域，XGBoost表现出色，具有高效性、准确性、灵活性和良好的防过拟合能力。高效性使其能快速处理大规模复杂数据，降低训练时间成本。通过组合弱学习器提高准确性和泛化能力。其支持多种任务和自定义指标，参数调优选项丰富。内置正则化机制防止过拟合。同时，SHAP对模型解释起关键作用，能计算特征的SHAP值来明确特征对预测结果的贡献，帮助理解模型决策。二、数据准备和模型训练1.导入所需库
数据挖掘实战-基于随机森林算法的空气质量污染预测模型艾派森数据挖掘实战合集信息可视化人工智能 python 数据挖掘随机森林
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具4.实验过程
跨境电商 ai架构设计 Java程序员拥抱ai ai 人工智能
一、核心理论基础AI生成知识库的本质是**“数据驱动的知识结构化与智能化生产”**，核心依赖三大理论支撑：知识工程理论将跨境电商业务中分散的“非结构化信息”（如产品参数、用户评价、物流规则、合规条款）转化为“结构化知识”（如实体关系、规则库、决策树），通过AI实现知识的自动提取、关联与更新。例：家具用品的“材质-环保标准-目标市场合规要求”（如欧盟E1级板材认证）可形成关联知识链。自然语言处理（N
深入详解：决策树在医学影像骨科分析中的应用与实现
深入详解：决策树在医学影像骨科分析中的应用与实现决策树（DecisionTree）是一种经典的机器学习算法，以其简单、直观和高可解释性的特点，在医学影像领域的骨科分析中应用广泛。骨科影像分析主要基于X光片、CT或MRI图像，用于骨折检测、骨关节炎分级、骨龄评估等任务。决策树通过构建树形结构，将复杂影像特征转化为清晰的决策规则，特别适合需要可解释性强的医疗场景。本文将从原理、实现细节到具体应用，深入
工业缺陷检测的计算机视觉方法总结思绪漂移计算机视觉人工智能缺陷检测
工业缺陷检测的计算机视觉方法总结传统方法特征提取方式：颜色：基于HSV/RGB空间分析，如颜色直方图、颜色矩等纹理：采用LBP、Haar、Gabor滤波器等算子提取纹理模式形状：基于Hu矩、Zernike矩等数学描述符刻画几何特性尺寸：通过连通域分析计算物体像素面积、周长等参数典型处理流程：手动设计特征提取算法建立规则分类器（如SVM、决策树）基于阈值分割目标区域深度学习方法核心特点：端到端学习：
《机器学习实战》笔记（03）：决策树巨輪机器学习机器学习决策树
决策树kNN算法可以完成很多分类任务，但是它最大的缺点就是给出数据的内在含义，决策树的主要优势就在于数据形式非常容易理解决策树的构造优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据。缺点：可能会产生过度匹配问题。适用数据类型：数值型和标称型。创建分支的伪代码函数createBranch()Checkifeveryiteminthedatasetisinthesa
机器学习实战笔记（四）：决策树（Python3 实现） max_bay 机器学习实战笔记机器学习实战决策树 python
1决策树的构造1.1决策树的特点优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据。缺点：可能会产生过度匹配问题。适用数据类型：数值型和标称型。在构造决策树时，我们需要解决的第一个问题就是，当前数据集上哪个特征在划分数据分类时起决定性作用。为了找到决定性的特征，划分出最好的结果，我们必须评估每个特征。完成测试之后，原始数据集就被划分为几个数据子集。这些数据子集会分
简单理解决策树野原星月决策树机器学习算法
简单理解决策树一、决策树学习简介决策树学习是一种逼近离散值目标函数的方法，决策树学习是通过某种手段对离散的目标函数的进行近似逼近的过程这种方法将从一组训练数据中学习到的函数表示为一棵决策树。该方法的基础是一组给定的样本数据，生成的函数表现为一棵决策树决策树叶子为类别名，其他的结点由实体的特征组成，每个特征的不同取值对应一个分枝。若要对一个实体分类，从树根开始进行测试，按特征的取值向下进入新结点，对
数据挖掘领域经典算法——CART算法丨程序之道丨
简介CART与C4.5类似，是决策树算法的一种。此外，常见的决策树算法还有ID3，这三者的不同之处在于特征的划分：ID3：特征划分基于信息增益C4.5：特征划分基于信息增益比CART：特征划分基于基尼指数基本思想CART假设决策树是二叉树，内部结点特征的取值为“是”和“否”，左分支是取值为“是”的分支，右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征，将输入空间即特征空间划分为有限
机器学习(一）KNN，K近邻算法（K-Nearest Neighbors）星期天要睡觉机器学习近邻算法人工智能
建议初学者掌握KNN作为理解其他复杂算法（如SVM、决策树、神经网络）的基石。K近邻算法（K-NearestNeighbors,KNN）详解：原理、实践与优化K近邻算法（K-NearestNeighboKrs，简称KNN）是一种经典、直观且易于实现的监督学习方法，既可用于分类，也可用于回归。它“懒惰”地存储所有训练样本，直到有新样本需要预测时才临时计算，因此也被称为“懒惰学习算法”。本文将系统介绍
机器学习算法解析:XGBoost与LightGBM AI天才研究院 AI人工智能与大数据 AI大模型应用入门实战与进阶 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
机器学习算法解析:XGBoost与LightGBM作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：XGBoost,LightGBM,高效特征选择,并行化训练,自动调参,弱分类器集成1.背景介绍1.1问题的由来随着数据科学和人工智能技术的发展，越来越多的问题需要利用机器学习算法进行解决。传统的一维决策树虽然直观且易于理解，但在面对高维度数据集时
数据处理和分析之分类算法：XGBoost：机器学习基础理论 kkchenkx 数据挖掘机器学习分类数据挖掘
数据处理和分析之分类算法：XGBoost：机器学习基础理论数据预处理与特征工程数据清洗数据清洗是数据预处理的第一步，旨在去除数据集中的噪声、不一致性和缺失值，确保数据的质量。这包括处理空值、异常值、重复数据和不一致的数据格式。示例：处理缺失值假设我们有一个包含用户年龄、性别和收入的数据集，其中年龄和收入字段存在缺失值。importpandasaspdimportnumpyasnp#创建示例数据集d
AI产品经理面试宝典第33天：AI+家居场景化解决方案问答技巧 TGITCIC AI产品经理一线大厂面试题人工智能产品经理面试 AI产品经理面试大模型产品经理面试大模型面试 AI面试
智能家电AI技术应用：如何设计宠物喂食器解决方案？面试官提问"如果让你设计一款智能喂食器，你会如何结合AI技术实现差异化？"你的回答聚焦"精准营养管理"与"行为习惯分析"双引擎。采用YOLOv7算法构建宠物体型识别模型，通过毫米波雷达捕捉进食姿态特征，结合云端数据库分析历史喂食数据，动态生成卡路里摄入建议。例如当系统检测到柯基犬连续三天进食速度下降15%，会联动智能水碗监测饮水量，最终通过决策树模
【独家原创】基于XGBoost+SHAP可解释性分析的分类预测 Matlab代码(多输入单输出) 机器学习和优化算法 SHAP（Matlab）机器学习分类 XGBoost SHAP shap分析可解释性分析
目录1、代码简介2、代码运行结果展示3、代码获取1、代码简介(XGBoost+SHAP)基于XGBoost的数据多输入单输出+SHAP可解释性分析的分类预测模型由于XGBoost在使用SHAP分析时速度较慢，程序中附带两种SHAP的计算文件(正常版和提速版本)，具体使用教程见使用步骤文件(你的数据适合哪种均有说明)，十分简单用哪个调用哪个即可！！！1、在机器学习和深度学习领域，模型复杂度的不断攀升
玩具语音方案选型决策OTP vs Flash 的成本功耗与灵活性唯创知音语音识别人工智能
玩具语音芯片方案选型的选择有很多的，但是基于各方面的限制和功能上的需求，那么在OTP和FLASH语音芯片之间如何做抉择?一、决策树总览玩具语音方案选型可先考虑产品语音内容后期是否需要修改，如果不需要修改且追求低成本、低功耗，优先选择OTP语音芯片;如果需要修改或语音内容，再评估成本和功耗接受度，考虑Flash芯片。二、成本对比(一)OTP芯片OTP芯片采用一次性可编程技术，生产流程相对简单，无需复
Java 大视界 -- Java 大数据机器学习模型在金融市场波动预测与资产配置动态调整中的应用（355）青云交大数据新视界 Java 大视界 java 大数据机器学习金融市场波动预测资产配置 LSTM
Java大视界--Java大数据机器学习模型在金融市场波动预测与资产配置动态调整中的应用（355））引言：正文：一、Java构建的金融数据处理架构1.1多源数据实时融合与清洗1.2跨市场数据关联（风险传导分析）二、Java驱动的市场波动预测模型2.1LSTM+随机森林融合预测（股市案例）2.2资产配置动态调整（风险预算模型）三、实战案例：从“被动亏损”到“主动盈利”3.1公募基金：加息波动中的1.
Vue3 业务落地全景：脚手架、权限、国际化、微前端、跨端与低代码 50 条实战心法代码老y 前端低代码
写给架构师、TL、全栈工程师的“踩坑地图”（零）阅读指南•不贴源码，用伪代码+流程图+决策树。•50条心法分6大篇章，可跳跃阅读。（一）脚手架与工程化8条心法1：用create-vue而不是vue-cli开启新项目，Vite冷启动300msvsWebpack30s。心法2：eslint-config-prettier+@vue/eslint-config-typescript一键集成，团队争议减少
基于SVm和随机森林算法模型的中国黄金价格预测分析与研究 python编程狮支持向量机算法随机森林 python 机器学习人工智能
摘要本研究基于回归模型，运用支持向量机（SVM）、决策树和随机森林算法，对中国黄金价格进行预测分析。通过历史黄金价格数据的分析和特征工程，建立了相应的预测模型，并利用SVM、决策树和随机森林算法进行训练和预测。首先，通过对黄金价格时间序列数据的探索性分析，发现黄金价格存在一定的趋势和季节性变化。随后，进行了数据预处理和特征选择，为建立准确的预测模型奠定了基础。分别使用SVM、决策树和随机森林算法建
打卡Day12 HAhhhiu python学习打卡 python 机器学习
@浙大疏锦行知识点：遗传算法：来源于自然界中的生物进化和基因遗传思想：模拟生物进化过程，通过“选择（保留优秀解）、交叉（组合解的特征）、变异（引入新特征）”迭代优化我想培养出一只超级泰迪犬？该怎么办呢？首先，我有一群泰迪犬，但是小泰迪们的各种基因不同，形态各色，我只想要一只高大、卷毛和聪明的泰迪。（这是初始解的集合，也是案例学习代码中，我们所设定的随机森林中的一堆的参数范围）接着，我开始挑选符合上
GEE土地分类——利用landsat 8 和随机森林方法进行土地分类此星光明 gee土地分类专栏前端 gee 机器学习土地分类随机森林 Landsat 土地利用
目录简介代码解释代码函数ee.Classifier.smileRandomForest(numberOfTrees,variablesPerSplit,minLeafPopulation,bagFraction,maxNodes,seed)Arguments:Returns:Classifier结果简介GEE土地分类——利用landsat8和随机森林方法进行土地分类代码解释这段代码是用Google
通俗易懂：什么是决策树？淦暴尼算法 python 决策树算法机器学习
1.引言：决策树就像“选择题”你是否曾经在生活中做过“选择题”？比如：今天要不要带伞？晚饭吃什么？该不该买那件心仪已久的商品？其实，我们的大脑经常会像“决策树”一样，通过一连串问题和判断，逐步缩小选择范围，最终做出决定。**决策树（DecisionTree）**就是这样一种模拟人类决策过程的机器学习模型。它通过“提问-分支-决策”的方式，把复杂问题拆解成一系列简单的判断，广泛应用于分类（如判断邮件
零基础学习性能测试第一章-性能测试和功能测试的区别试着性能测试学习功能测试性能测试零基础
目录零基础学习性能测试：性能测试与功能测试的核心区别一、核心概念对比（本质区别）1.测试目标差异2.测试方法对比3.工作流程差异二、实际工作场景应用指南1.何时使用功能测试？（适用场景）2.何时使用性能测试？（关键场景）3.协同应用模式三、工具链对比与实践1.工具选择矩阵2.工具使用对比（以用户登录为例）3.报告输出差异四、工作场景决策树决策指南：五、协同工作最佳实践1.项目各阶段配合2.协作工作
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他