今日说"法"

数学建模算法总结

一.数据预处理模型

1.对于缺失值的补全处理：插值拟合

1.插值

2.拟合总结：

拟合得到的是一条曲线，拟合得到的函数不一定过所有点

2.数据降维

主成分分析

3.数据异常值处查找与删除

聚类分析

4.数据整体描述性分析

二.优化模型

1.目标规划

1.多目标规划

2.线性规划

3.整数规划

3.1 0-1规划

4.非线性规划编辑

4.1最大化最小模型

4.2蒙特卡洛法（随机取样法）

2.图论

0.动态规划（一种思想：把问题转为多个子阶段决策问题进行求解，递推思想，详细看看动态规划PPT）

0.0原理：

0.1方法：

0.2建立动态规划模型的步骤

1.最短路径模型

三.启发式算法优化模型

1.遗传算法：http://t.csdn.cn/a7MPl

2.蚁群算法

3.粒子群算法

3.1 matlab自带粒子群函数

4.模拟退火算法

5. 利用模拟退火求解n元函数最值

6.启发式算法的应用（具体）

预测模型

预测类解题技巧

微分方程模型

回归分析预测

1.线性、非线性回归与拟合

2.马尔科夫预测

3.神经网络预测

4.时间序列预测

时间序列分解

一些可引用的时序模型

1.指数平滑模型

2.AR模型（自回归模型）

3.MA模型

4.ARMA(p,q)模型

5.ARIMA(p,d,q)模型

SPSS解决时序问题步骤

5.模糊预测

聚类模型

1.K-means聚类

适用场景

算法流程

2.K-means++算法

步骤

3.层次聚类

用图形估计聚类的数量（系统聚类选取类别数目的方法）

4.密度聚类（DBSCAN）

5.模糊聚类

步骤

6.神经网络聚类

python实现som神经网络聚类

7.贝叶斯判别

基本概念

基本思路

8.支持向量机

评价模型

1.模糊综合评价模型

编辑

2.层次分析法（AHP）

3.Topsis综合评价模型

4.熵权法

5.主成分分析&因子分析

6.数据包络分析模型（DEA）

7.灰色关联分析

一.数据预处理模型

总结：缺失值处理、数据降维、数据异常值处理数据描述性分析

1.对于缺失值的补全处理：插值拟合

样本点较少时（泛指样本点小于30个）采用插值方法，主要有拉格朗日插值算法、牛顿插值、双线性内插和双三次插值

样本点较多时（大于30个）则采用拟合函数

1.插值

总结：

插值得到的函数一定过所有点

拉格朗日插值、分段线性插值、牛顿插值、 三次样条插值、n维数据插值

拉格朗日插值法（不建议高次插值）

龙格现象：在两端处波动极大，产生明显的震荡，不要轻易使用高次插值

分段线性插值（选缺失值周围三个节点进行插值）

选取跟节点x最近的三个节点Xi-1，Xi，Xi+1进行二次插值

牛顿插值

三次样条插值

p = spline(x,y,new_x)

n维数据插值

p = interpn(x1,x2,…,xn,y,new_x1,new_x2,…,new_xn.method);
%x1，x2是已知样本点的横坐标
%y是已知样本点的纵坐标
%method：‘linear’，‘cubic’，‘spline’，‘nearest’

2.拟合
总结：

拟合得到的是一条曲线，拟合得到的函数不一定过所有点

拟合方法：最小二乘法、拟合工具箱（只能拟合3维及以下的数据：cftool）

最小二乘法

最小二乘法评价

评价拟合的好坏：
拟合优度R^2：只能在拟合函数是线性函数时作为参数 R2 = SSR/SST,R2越接近1，说明拟合越好
总体平方和SST：SST = SSE+SSR
回归平方和SSE：当拟合函数是线性函数或其他函数时可以只看SSE（越小越好）
残差平方和SSR

2.数据降维

主成分分析

主要用于多维数据的降维处理，减少数据冗余等
能将多个指标转换为少数几个主成分，这些主成分是原始变量的线性组合，且彼此之间互不相关，能反映出原始数据的大部分信息。
适用场景：问题涉及到多变量且变量之间存在很强的相关性时，可以考虑使用主成分分析的方法来对数据进行简化。

步骤：

首先对其进行标准化处理
计算标准化样本的协方差矩阵（一般是相关系数矩阵）
计算R的特征值和特征向量
计算主成分贡献率和累计贡献率
写出主成分：一般取累计贡献率超过80%的特征值所对应的第一、第二、…、第m个主成分
根据系数分析主成分代表的意义：指标前面的系数越大，代表该指标对于该主成分的影响越大
应用：主成分可用于聚类分析，可用于回归分析（其实就是根据主成分指标进行聚类和回归）
主成分分析要好好解释每个主成分的意义

clear;clc
%  load data1.mat   % 主成分聚类
 load data2.mat   % 主成分回归

% 注意，这里可以对数据先进行描述性统计
% 描述性统计的内容见第5讲.相关系数
[n,p] = size(x);  % n是样本个数，p是指标个数

%% 第一步：对数据x标准化为X
X=zscore(x);   % matlab内置的标准化函数（x-mean(x)）/std(x)

%% 第二步：计算样本协方差矩阵
R = cov(X);

%% 注意：以上两步可合并为下面一步：直接计算样本相关系数矩阵
R = corrcoef(x);
disp('样本相关系数矩阵为：')
disp(R)

%% 第三步：计算R的特征值和特征向量
% 注意：R是半正定矩阵，所以其特征值不为负数
% R同时是对称矩阵，Matlab计算对称矩阵时，会将特征值按照从小到大排列哦
% eig函数的详解见第一讲层次分析法的视频
[V,D] = eig(R);  % V 特征向量矩阵  D 特征值构成的对角矩阵


%% 第四步：计算主成分贡献率和累计贡献率
lambda = diag(D);  % diag函数用于得到一个矩阵的主对角线元素值(返回的是列向量)
lambda = lambda(end:-1:1);  % 因为lambda向量是从小大到排序的，我们将其调个头
contribution_rate = lambda / sum(lambda);  % 计算贡献率
cum_contribution_rate = cumsum(lambda)/ sum(lambda);   % 计算累计贡献率  cumsum是求累加值的函数
disp('特征值为：')
disp(lambda')  % 转置为行向量，方便展示
disp('贡献率为：')
disp(contribution_rate')
disp('累计贡献率为：')
disp(cum_contribution_rate')
disp('与特征值对应的特征向量矩阵为：')
% 注意：这里的特征向量要和特征值一一对应，之前特征值相当于颠倒过来了，因此特征向量的各列需要颠倒过来
%  rot90函数可以使一个矩阵逆时针旋转90度，然后再转置，就可以实现将矩阵的列颠倒的效果
V=rot90(V)';
disp(V)


%% 计算我们所需要的主成分的值
m =input('请输入需要保存的主成分的个数:  ');
F = zeros(n,m);  %初始化保存主成分的矩阵（每一列是一个主成分）
for i = 1:m
    ai = V(:,i)';   % 将第i个特征向量取出，并转置为行向量
    Ai = repmat(ai,n,1);   % 将这个行向量重复n次，构成一个n*p的矩阵
    F(:, i) = sum(Ai .* X, 2);  % 注意，对标准化的数据求了权重后要计算每一行的和
end

%% (1)主成分聚类 ： 将主成分指标所在的F矩阵复制到Excel表格，然后再用Spss进行聚类
% 在Excel第一行输入指标名称（F1,F2, ..., Fm）
% 双击Matlab工作区的F,进入变量编辑中，然后复制里面的数据到Excel表格
% 导出数据之后，我们后续的分析就可以在Spss中进行。

%%（2）主成分回归：将x使用主成分得到主成分指标，并将y标准化，接着导出到Excel，然后再使用Stata回归
% Y = zscore(y);  % 一定要将y进行标准化哦~
% 在Excel第一行输入指标名称（Y,F1, F2, ..., Fm）
% 分别双击Matlab工作区的Y和F,进入变量编辑中，然后复制里面的数据到Excel表格
% 导出数据之后，我们后续的分析就可以在Stata中进行。

3.数据异常值处查找与删除

聚类分析

主要用于分析诊断数据异常值并进行剔除
适用于空间分布的大样本/小样本异常值监测

4.数据整体描述性分析

均值、方差分析、协方差分析等统计方法

主要用于数据的截取或特征选择等（就是选取合适的指标以及合适的个案）

spss做描述性分析

二.优化模型

规划问题、图论问题

注意：图论问题就是一种规划问题，同样有目标函数，只是返回的值是一个序列（路径图）

三要素：

决策变量
通过变量的改变，获得更好的结果
可以理解为控制变量，或者是一些决定性的参数
目标函数
所求：评价是都想着好的方向发展，用来评测的标准
约束
限定了决策变量的具体的设置范围一个定义域的限定

总结
单目标优化：评测目标只有一个，只需要根据具体的约束条件，求得最值
适用场景：针对问题所建立的优化目标函数有且只有一个
多目标优化：多个评测函数的存在，而且使用不同的评测函数的解也是不同的。目标函数不唯一
适用场景：基于问题所构建的优化目标函数不唯一，常出现在金融投资领域，往往要求风险更小，收益更大
线性规划：目标函数和约束条件都是线性的
非线性规划：在目标函数和约束条件中只要有一个是非线性函数都是非线性规划
整数规划：规划中的决策变量都是整数
二次规划：目标函数是二次的，约束条件是线性的
动态规划：基本思想是将待求问题问题分解为若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的解
适用场景：背包问题、运输问题、分割问题
图论模型：
- 最短路模型：Dijkstra算法和Floyd算法（求解任意两个节点间的距离），用于求解两点间的最短距离。路径规划问题（修建道路，设定救援路线等）
- 最大流模型：道路可承载的最大车流量。企业生产运输问题、交通拥堵优化问题
- 最小生成树：包含所有顶点。道路规划、通讯网络规划、管道铺设、电线布设等
- 排队论模型：能抽象成一个排队的问题都可以用，商店购货、轮船进港、病人就诊等

1.目标规划

1.多目标规划

若一个规划问题中有多个目标，对多目标函数进行加权组合，使问题变为单目标规划，然后利用之前学的知识进行求解。
注意：

要先将多个目标函数统一为最大化或最小化问题后才可以进行加权组合
如果量纲不同，需要对其进行标准化后再进行加权（标准化的方法：用目标函数除以某一个常量，该常量是这个目标函数的某个值）
对多目标函数进行加权求和时，权重需要由该问题领域的专家给定，无特殊说明，可令权重相同
要对结果进行敏感性分析，通过逐一改变相关变量数值的方法来解释关键指标受这些因素变动影响大小的规律

2.线性规划

在matlab中默认求最小值，且不等式约束都是小于等于

[x,fval] = linprog(f,A,b,Aeq,beq,lb,ub)
//f：目标函数（决策变量前面的系数对应的矩阵）
//A，b：对应线性不等式约束
//Aeq，beq：对应线性等式约束
//lb，ub分别对应决策向量的下界向量和上界向量
[k,fval] = fminsearch(@Obj_fun,k0);
//Nelder-Mead单纯形法求最小值，适用于解决不可导或求导复杂的函数优化问题
[k,fval] = fminunc(@Obj_fun,k0)
//拟牛顿法求解无约束最小值，适用于解决容易求导的函数优化问题

当这种不是线性的情况，我们可以采用变换变量的方法，把它改造成线性的，这个需要一定的智商

min |x1|+|x2|+…+|xn|

xi = ui-vi |xi| = ui+vi
ui = (xi+|xi|)/2 vi = (|xi|-xi)/2

min c^y,
s.t. [A,-A][u,v]’<=b
求得解为u，v
x = u-v

3.整数规划

数学规划中的变量限制为整数时，称为整数规划

[x,favl] = intlinprog(c,intcon,A,b,Aeq,beq,lb,ub)
//intcon可以指定哪些决策变量是整数

3.1 0-1规划

决策变量只能取0或1

一般用于相互排斥的约束条件，指派问题等

4.非线性规划

[x,favl] = fmincon(@fun,x0,A,b,Aeq,beq,lb,ub,@nonlfun,option)//求得局部最优解
//x0为初始值，可以使用蒙特卡洛法先找合适的初始值
//option:interior-point,sqp,active-set,trust-region-reflective,可以都使用来求解，体现稳健性
//@fun：要写成一个单独的m文件存储目标函数
//@nonlfun：表示非线性部分的约束，同样也要单独编写一个m文件
//function [c,ceq] = nonlfun(x)
//c = [非线性不等式约束1；...];
//ceq = [非线性等式约束1；...];

4.1最大化最小模型

在最不利的条件下，寻求最有利的策略，如急救中心选址等

[x,fval] = fminimax(@Fun.x0,A,b,Aeq,beq,lb,ub,@nonlfun,option)
//目标函数用一个函数向量表示

4.2蒙特卡洛法（随机取样法）

是一种随机模拟方法，是使用随机数来解决很多计算问题的方法。由大数定律可知，当样本容量足够大时，事件发生的频率可以近似为其发生的概率。是计算机仿真的前期模型。
蒙特卡洛法更多的是一种想法，利用非常多次的随机数来模仿事件的发生，从而近似得到想要的结果，具体的算法根据不同的问题而决定。

2.图论

0.动态规划（一种思想：把问题转为多个子阶段决策问题进行求解，递推思想，详细看看动态规划PPT）

0.0原理：

动态规划是解决某一类问题的一种方法，是分析问题的一种途径，而不是一种特殊算法(如线性规划是一种算法)。因而，它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则，而必须对具体问题进行具体分析处理。在学习动态规划时，除了对基本概念和方法正确地理解外，应以丰富的想象力去建立模型，用创造性的技巧去求解。

处理多阶段决策，需将全过程划为若干阶段，每个阶段进行一次抉择。 q 各阶段按一定顺序联接在一起组成统一的整体。

0.1方法：

逆序递推法(Backward Induction Method) 将寻优过程看做连续递推的过程，从最终阶段开始，逆着实际决策过程的进展方向逐段求解，在每一段求解中都要利用刚刚求解完那段的结果，直到初始阶段求出结果回到始点为止。（常用）

顺序递推法(Forward Induction Method) 从初始阶段向后递推，直到最终阶段为止。顺序递推法本质上并无新的建树，只是对某些实际问题的求解，应用起来较为简便而已

0.2建立动态规划模型的步骤

1、划分阶段运用动态规划求解多阶段决策问题的第一步，在确定多阶段特性后，按时间或空间先后顺序，将过程划分为若干相互联系的阶段。对于静态问题要人为地赋予“时间”概念，以便划分阶段。

2、正确选择状态变量选择变量既要能确切描述过程演变又要满足无后效性，而且各阶段状态变量的取值能够确定。一般地，状态变量的选择是从过程演变的特点中寻找。

3、确定决策变量及允许决策集合通常选择所求解问题的可控的关键变量作为决策变量，同时要给出决策变量的取值范围，即确定允许决策集合。

4、确定状态转移方程根据k 阶段状态变量和决策变量，写出k+1阶段状态变量，状态转移方程应当具有递推关系。

5、确定阶段指标函数和最优指标函数，建立动态规划基本方程阶段指标函数是指第k 阶段的收益，最优指标函数是指从第k 阶段状态出发到第n 阶段末所获得收益的最优值，最后写出动态规划基本方程。

以上五步是建立动态规划数学模型的一般步骤。由于动态规划模型与线性规划模型不同，动态规划模型没有统一的模式，建模时必须根据具体问题具体分析，只有通过不断实践总结，才能较好掌握建模方法与技巧。

0.3例题（看动态规划PPT）

1.两点之间最短路径

2.分配投资问题（静态问题动态求解）

1.最短路径模型

迪杰斯特拉算法：可以用于有向图，但不能处理负权重

[p,d] = shortestpath(G,start,end,[,'Method',algorithm])
//G-输入图
//start 起始的节点，end目标节点
//[,'Method'] 计算最短路径的算法，一般不作具体设置
//P-最短路径经过的节点，d-最短距离

Method中可选的算法

d = distances(G,[,'Method',algorithm]) //返回距离矩阵
[nodeIDs,dist] = nearest(G,s,d,[,'Method',algorithm])
//找给定范围内所有的点，s是指定节点，d为指定距离
//nodeIDs是符合条件的节点，Dist是这些节点与s的距离

三.启发式算法优化模型

总结：遗传算法（ga函数，matlab自带）、蚁群算法、粒子群算法（particleswarm函数，matlab自带）、模拟退火算法

应用：求解出图论和规划的最优可行解，简单来说就是求目标函数的最优解，机器学习中最小损失函数、图论中最短距离函数、规划中的利润最大化函数，最小二乘法的残差平方和函数（启发式算法可以做拟合，其实也就是算出该残差平方和最小时的参数）等，启发式算法都能求解。一句话启发式算法就是用来解方程的。

1.遗传算法：http://t.csdn.cn/a7MPl

链接：http://t.csdn.cn/LyMPT

主要操作：初始群体的产生、求每一个体的适应度（生物个体对于生存环境的适应程度，越适应那么其得以存活和繁衍的概率就越大）、根据适者生存的原则选择优良个体、被选出的优良个体两两配对，通过随机交叉其染色体的基因并随机变异某些染色体的基因生成下一代群体，按此方法使群体逐代进化，知道满足进化终止条件

实现方法

根据具体问题确定可行解域，确定一种编码方法，能用数值串或字符串表示可行解域的每一解
对每一解应有一个度量好坏的依据，用适应度函数表示，一般由目标函数构成
确定进化参数群体规模M，交叉概率pc，变异概率pm，进化终止条件
编码长度。编码长度取决于问题解的精度，精度越高，编码越长；
种群规模。规模小，收敛快但降低了种群的多样性，N=20-200；
交叉概率。较大的交叉概率容易破坏种群中已形成的优良结构，使搜索具有太大随机性；较小的交叉概率发现新个体的速度太慢，一般取值为P_c=0.4-0.99
变异概率。变异概率太小，则变异操作产生新个体的能力和抑制早熟现象的能力会较差；变异概率过高随机性过大，一般建议取值范围为0.005～0.01
终止进化代数。算法运行结束的条件之一，一般取100～1000；也可以选择将精度作为结束条件

生物遗传概念   遗传算法中的作用
适者生存   算法停止时，最优目标值的可行解有最大的可能性被留住（轮盘赌选择法）
个体   可行解
染色体   可行解的编码（一般采用二进制编码）
基因   可行解中每一分量的特征
适应性   适应度函数值
种群   根据适应度函数值选取的一组可行解
交配   通过交配原则产生一组新可行解的过程，它决定了遗传算法的全局搜索能力
变异   编码的某一分量发生变化的过程，它决定了遗传算法的局部搜索能力

2.蚁群算法

起源：蚂蚁会找一条从巢穴到食物源之间的最短距离，当在这条路上放置一个障碍物后，一段时间后蚂蚁会再次重新走出一条最短距离。这个算法对于解决TSP问题取得了比较好的结果

本质：

选择机制：信息素越多的路径，被选择的概率越大。
更新机制：路径上面的信息素会随蚂蚁的经过而增长，而且同时也随时间的推移逐渐挥发消失。
协调机制：蚂蚁间实际上是通过分泌物来互相通信、协同工作的。
基本原理：
蚂蚁在路径上释放信息素。碰到还没走过的路口，就随机挑选一条路走。同时，释放与路径长度有关的信息素。信息素浓度与路径长度成反比。后来的蚂蚁再次碰到该路口时，就选择信息素浓度较高路径。最优路径上的信息素浓度越来越大。最终蚁群找到最优寻食路径。

算法的结果具有随机性，要多次运算

3.粒子群算法

链接：http://t.csdn.cn/eEl0A

这个算法是基于模拟鸟群捕食的行为提出的。它的核心思想是利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程，从而获得问题的可行解。

基本概念

粒子：优化问题的候选解
位置：候选解所在位置
速度：候选解移动的速度
适应度：评价粒子优劣的值，一般设置为目标函数值
个体最佳位置：单个粒子迄今为止找到的最佳位置
群体最佳位置：所有粒子迄今为止找到的最佳位置

具体算法

核心公式

一般情况下，个体学习因子和社会学习因子取2比较合适，惯性权重取0.9-1.2是比较合适的，一般取0.9即可

较大的惯性权重有利于进行全局搜索，而一个较小的权值则更有利于局部搜索。

参考文献：

较大的惯性权重有利于进行全局搜索，而一个较小的权值则更有利于局部搜索。

3.1 matlab自带粒子群函数

particleswarm函数采用的是自适应的邻域模式

邻域模式：粒子群在搜索过程中只将其周围部分粒子视为邻域粒子，这种模式使得粒子群可以被分割成多个不同的子群体，有利于在多个区域进行搜索。

全局模式：是邻域模式的极端情况，它将所有其他粒子都视为领域粒子，这种模式具有较快的收敛速度，但容易陷入局部最优。
自适应体现在：如果适应度开始停滞，粒子群搜索会从邻域模式向全局模式转化，一旦适应度开始下降，则恢复为邻域模式，以免陷入局部最优。当适应度的停滞次数足够大时，惯性系数开始逐渐变小，从而利于局部搜索

[x,fval] = particleswarm(@Obj_fun3,narvs,x_lb,x_ub,options)
% Obj_fun是单独存储的自适应函数，即目标函数
% narvs是自变量个数
% x_lb，x_ub分别是下界和上界

option中可以修改的参数

options = optimoptions('particleswarm','PlotFcn','pswplotbestf')

4.模拟退火算法

启发式算法核心思想类似爬山法：

爬山法
在解空间中随机生成一个初始解
根据初始解的位置，我们在下一步有两种走法：向左邻域或向右邻域走一步（步长越小越好）
比较不同走法下目标函数的大小，决定下一步往哪个方向走，如果向左目标函数比较大，就向左走（求最大值）
不断重复这个过程，直到找到一个极大值点，则结束搜索
这个方法容易陷入局部最优

温度一定时，△f越小，概率越大，即目标函数相差越小接受的可能性越大
△f一定时，温度越高，概率越大，即搜索前期温度较高时更有可能接受新解

4.1模拟退化参数选择

5. 利用模拟退火求解n元函数最值

6.启发式算法的应用（具体）

1.求解方程组
粒子群算法

利用最小二乘的思想
找一组解使得目标函数尽量小，即可得到最优解
2.多元函数拟合
粒子群算法主要用于三元及以上函数的拟合

[k,fval] = lsqcurvefit(@fit_fun,k0,x,y,lb,ub)
//非线性最小二乘拟合函数

3.拟合微分方程
如果微分方程或微分方程组有解析解（dsolve可解），则转化为函数拟合问题。
将残差平方和作为适应度函数，解出残差平方和最小时的参数数值。

预测模型

总结：微分方程预测（通过求速度预测路程）、回归预测（拟合线性和非线性函数）、马尔可夫预测（预测所有可能的概率值）、神经网络预测（机器学习对象预测）、模糊预测（灰色预测，生成新数据进行预测）

预测类解题技巧

微分方程模型

无法直接找到原始数据之间的关系，但可以找到原始数据变化速度之间的关系，通过公式推导转化为原始数据之间的关系。

常用模型：传染病模型、人口模型（Malthus模型和Logistic模型）
适用场景：疾病的传播预测、人口数量或城市发展水平预测等

解析解：给出解的具体表达式（通解）

[x,y] = dsolve('y-Dy = 2*x','x')
% dsolve('方程1'，'方程2',....,'方程n','初始条件'，‘自变量’)

数值解：对求解区间进行剖分，然后把微分方程离散成在节点上的近似公式或近似方程，最后结合定解条件求出近似解（特解）

[x,y] = ode45('df1',[0,1],3) % 解决非刚性问题
% df1为具体的微分方程（组），写成单独的m文件
% ode45('微分方程m文件名'，‘自变量范围’，‘初始值’)
% ode15s 解决刚性问题

微分方程模型的建立可以借鉴已有的微分方程模型，只要问题等价于已有模型求解的问题，就可以借来引用，或者直接引用，下面有几个经典的微分方程模型（都是可以解决某些类别的预测问题的，我们用微分方程一定要有问题类比的思维）：

1.人口预测模型（Malthus模型）
假定人口的增长率r为常数

2.阻滞增长模型（Logistic模型）
假设人口增长率为随人口数量变化的线性函数
r(x) = r-sx x = xm时，r(xm) = 0 -> s = r/xm

3.捕食者-猎物模型（Lotka-Volterra模型）
食饵的增长

捕食者的死亡

在考虑人工捕获时，假设e表示捕获能力

4.种群相互竞争模型
我们在阻滞增长模型的基础上进行建模

由于甲乙两种群的食物相同，所以对对方的增长会造成影响

其中σ1表示单位数量的乙种群消耗的供养甲的食物量为单位数量甲种群的σ1倍，如果σ1<1则乙的竞争力弱于甲
一般情况下σ1和σ2是相互独立的，若甲乙两种群食物完全一样则σ1σ2 = 1
5.种群相互依存模型

相互依存分为三种情况：甲乙均可以单独生存、甲乙均不可以单独生存、甲可以单独生存而乙不可以（或反过来）
情况一：甲可以单独生存而乙不可以

情况二：甲乙均可以单独生存

情况三：甲乙均不能独自生存，在这种情况下甲乙均会灭亡

6.传染性模型
符号系统：易感者（S）、潜伏者（E）、感染者（I）、康复者（R）

SI模型：

SIS模型

SIR模型

SIRS模型：N =S+ I + R

SEIR模型：潜伏者E不具有传染性

回归分析预测

在分析自变量和因变量之间相关关系的基础上，建立变量之间的回归方程，并将回归方程作为预测模型
适用场景：样本数量较少，自变量与因变量间的变化具有明显的逻辑关系，处理横截面数据（同一时间不同对象的数据）
主要有三个使命：识别重要变量、判断相关性的方向、确定权重（回归系数）

1.线性、非线性回归与拟合

1.一元线性回归
2.Logistic回归&Probit回归
输入的：因变量是分类变量，一般是0-1的二分类变量，但是也可以是多分类变量，如分为A B C类的，

输出的：返回的是各个个案的预测数值，然后压缩成0-1之间的数，而在这个数刚好就是各个个案是某一类的预测概率。

3.向量自回归

数据与自己本身做回归，因变量是自己，自变量也是自己

4.Pearson相关
Spearman等级相关系数，衡量两变量之间的相关关系
5.一般的回归
一个因变量对多个自变量之间的关系

6.偏最小二乘回归
多个变量和多个变量之间的关系

2.马尔科夫预测

对事件的全面预测，不仅要能够指出事件发生的各种可能结果，而且还必须给出每一种结果出现的可能性，说明被预测的视角在预测期内出现每一种结果的可能性程度。未来状态只和现在的状态有关
使用场景：市场占有率的预测和销售期望利润的预测以及其他商业领域的预测等。在各个期间或者状态是，变量面临的下一个期间或状态的转移概率都是一样的、不随时间变化的。

步骤
1、根据历史的数据推算出各类人员的转移概率，利用转移概率来计算出转移矩阵；
2、统计初始时刻点的各类人员的分布状况；
3、建立马尔科夫模型，预测未来各类人员的状况

3.神经网络预测

用非线性关系来预测问题
适合多指标预测
常用方法：利用前i年的数据预测第i+1年的数据

BP神经网络预测

BP神经网络代码以及工具箱：http://t.csdn.cn/8nwVx

训练集：用于模型拟合的数据样本
验证集：是模型训练过程中单独留出的样本集，主要用于调整模型的超参数和对模型的能力进行初步评估（验证集也是样本单独留的，超参数是指无法通过数据在回归拟合中算出来的）
测试集：用来评估最终模型的泛化能力（测试集是样本单独留的）
一般先在matlab中导入数据，然后使用神经网络拟合工具箱
要考虑过拟合现象
3个集的数据都是不一样的

4.时间序列预测

基本概念
同一对象按时间顺序排列的，随时间变化且相互关联的数据序列，是一种定理分析方法

常用模型：移动平均法、指数平滑法、自回归AR，移动平均MA，ARIMA模型等（这里的模型主要是解决数据不平稳来的）

适用场景：国民经济市场潜量预测，气象预测、生态平衡等等，数据量较大

时间序列分解

数值变化规律包括：

长期变动趋势（T）
统计指标在相当长的一段时间内，受到长期趋势因素的影响，表现出持续上升或持续下降的趋势
季节趋势（S）
由于季节的转变使得指标数值发生周期性变动，这里的季节可以是月、季、周为时间单位，不能以年为时间单位
循环变动（C）
与季节变动不同，通常以若干年为周期，这种周期变动的特征是增加和减少交替出现，而不是严格规定的周期性连续变动
不规则变动（I）
是某些随机因素导致的数值变化，这些因素不可预知而且没有规律可言（在回归中被称为扰动项）
这些变动可能会同时出现在一个时间序列里面，这四种变动与指标数值的关系可能是叠加也可能是叠乘
注意：
1.数据具有年内的周期性时才能使用时间序列分解
2.在具体的时间序列图上，如果随着时间的推移，序列的季节波动越来越大，则反映各种变动之间的关系发生变化，建议使用乘积模型，反之，使用叠加模型。如果不存在季节波动，则两种分解均可

一些可引用的时序模型

1.指数平滑模型

分为季节性和非季节性模型，季节性模型只有在为活动数据集定义周期数才可用，简单理解为季节性就是设周期性的，非季节性是非周期性的

1.Simple模型（只能预测下一期）
使用条件：不含趋势和季节成分（非周期性，而且不清楚变化趋势）

α为平滑系数，如果时间序列具有不规则的起伏变化，但长期趋势接近一个稳定常数，α一般较小；如果有迅速变化的倾向，α取较大值；如果变化缓慢，取较小的值
该模型：只能预测一期

2.Holt线性趋势模型
使用条件：线性趋势，不含季节成分（非周期性的，趋势是线性的）

预测数据通过预测方程求出

3.阻尼趋势模型（线性趋势减弱而且是非周期的）

使用条件：线性趋势逐渐减弱且不含季节成分
是在Holt模型的基础上缓解较高的线性趋势

通过预测方程得到预测数据

4.简单季节性（不清楚变化趋势而且是周期性的）

使用条件：含有稳定的季节成分、不含趋势

通过预测方程得到预测数据

5.温特加法模型（含有线性趋势和稳定的周期性）

使用条件：含有线性趋势和稳定的季节成分

通过预测方程得到预测数据

6.温特乘法模型（含有线性趋势和不稳定的周期性）

使用条件：含有线性趋势和不稳定的季节成分

通过预测方程得到预测数据

2.AR模型（自回归模型）

也称为自回归模型，所谓自回归就是将自己的1至p阶滞后项视为自变量来进行回归，AR模型一定是平稳的时间序列模型

只能用于预测与自身前期相关的经济现象，即受自身历史因素影响较大的经济线性

平稳序列

3.MA模型

称为q阶移动平均模型

4.ARMA(p,q)模型

自回归移动平均模型

ACF自相关系数（数据为平稳序列）

使用前提，数据为平稳序列。

PACF偏自相关函数

反映的是两个自变量之间的之间线性相关程度

5.ARIMA(p,d,q)模型

称为差分自回归移动平均模型

SARIMA模型

SPSS解决时序问题步骤

1.SPSS处理时间序列中的缺失值，如果缺失值在开头或尾部可以直接删除，如果在中间使用SPSS中转换->替换缺失值->选择替换方法

2.定义时间变量
3.画出时间序列图，并对数据进行分析，看波动性和周期性来决定下一步操作和使用的模型
4.（如果由季节变动）进行季节性分解，如果周期是奇数在移动平均值选择所有点相等，并对结果进行说明

如果是乘法模型，乘法季节因子的积为1，是全年的倍数
5.画出分解后的时序图
6.建立时间序列分析模型，使用SPSS自带的专家建模器

5.模糊预测

灰色预测（谨慎使用）
使用场景
使用背景：数据量较少，数据发展呈指数，数据分布位置
通过少量的、不完全的信息，建立数学模型并作出预测
适用场景：小样本情况下的发展预测问题

基本思想
灰色预测对原始数据进行生成处理来寻找系统变动的规律，并生成有较强规律性的数据序列，建立相应的微分方程，从而预测事物未来发展趋势情况

GM(1,1)
是使用原始的离散非负数据列，通过一次累加生成削弱随机性的较有规律的新的离散数据列，然后通过建立一阶微分方程模型，得到在离散点处的解经过累减生成的原始数据的近似估计值，从而预测原始数据的后续发展。

理论基础
数据具有准指数规律。

准指数规律（灰色预测前需要对数进行准指数规律检验）
定义级比

定义光滑比

如果任意的级比都落在一个区间长度小0.5的区间内，则数据具有准指数规律，我们可以间接用光滑比来判断，随着k的增加，光滑比会逐渐接近0，我们只要计算出光滑比在（0,0.5）的占比即可，占比越高越好（重点关注后面的期数）
基本原理
1-AGO：对原始数据经过一次累加后的数据列
1-AGO的紧邻均值生成数列：z(1)(m) = σx(1)(m)+(1-σ)x(1)(m-1)(m=2,3,…n) σ = 0.5
GM(1,1)模型的基本形式（灰色微分方程）：x(0)(k) + az(1)(k) = b
b为灰作用量，-a表示发展系数，可以将x(0)看做因变量，z(1)看做自变量
OLS（普通最小二乘法）：令所有观测值到回归直线的平方和最小
白化方程：dx(1)(t)/dt = -ax(1)(t) + b

评价
残差检验：

相对残差

平均相对残差

当平均相对残差小于20%，则认为GM(1,1)对原数据的拟合达到一般要求
如果平均相对残差小于10%，则认为GM(1,1)对原数据的拟合效果非常好
级比偏差检验

再根据预测出来的发展系数计算出相应的级比偏差和平均级比偏差

平均级比偏差小于0.2，则认为GM(1,1)对原数据的拟合达到一般要求；小于0.1，则认为对原数据的拟合非常好
拓展
新信息模型：设x(0)(n+1)为最新信息，将x(0)(n+1)置入X(0)，将新的模型称为新信息GM(1,1)
新陈代谢模型：在置入最新信息的同时，去掉最高的信息。这个模型是目前最理想的

聚类模型

总结：k-means聚类（初始聚类中心随机选择）、k-means++聚类（优化k-means,体现在初始聚类中心的选择）、系统聚类（不断得分类结合，得到一个聚类树，每一层代表聚类类别数+1）、密度聚类（不需要指定聚类个数）、模糊聚类（构建目标函数聚类）、神经网络聚类（smo聚类）、贝叶斯判别（使得误判损失最低）、支持向量机（划直线）

1.K-means聚类

适用场景

与地理位置有关的分类情形，如地物类别划分、村落划分、语言分布位置划分等

算法流程

1.指定需要划分的簇的个数（类的个数）
2.随机地选择K个数据对象作为初始的聚类中心（不一定是样本点）
3.计算其余的各个数据对象到这K个初始聚类中心的距离，把数据对象划分到距离它最近的那个中心所在的簇类中
4.调整新类并且重新计算出新类的中心
5.循环步骤三和四，看中心是否不变，如果不变或达到迭代次数则停止循环
6.结束

注意：在使用时数据的量纲要相同

2.K-means++算法

此算法只对K-means算法中选取初始聚类中心进行了优化
基本原则是：初始的聚类中心之间的相互距离要尽可能的远

步骤

随机选择一个样本点作为第一个聚类中心
计算每个样本与当前已有聚类中心的最短聚类，这个值越大，表示被选取作为聚类中心的概率越大；最后用轮盘法（根据概率大小来抽签）选出下一个聚类中心
重复步骤二，直到选出K个聚类中心，然后就继续使用标准的K-means算法

3.层次聚类

也叫系统聚类法，是根据个体间距离将个体向上两两聚类，再将聚合的小群体两两聚合一直到聚为一个整体。计算所有个体之间的距离，最相近距离的个体合体，不断合体。

适用场景
行政区域的划分或分级处理等，如根据城市经济指标划分城市发展等级、根据各类综合指标进行文明城市建设评选等

算法流程
1.将每个对象看做一类，计算两两之间的最小距离
2.将距离最小的两个类合并成一个新类
3.重新计算新类与所有类之间的聚类
4.重复步骤二和三，直到所有类最后合并成一类
5.生成聚类谱系图（树状图），结束

用图形估计聚类的数量（系统聚类选取类别数目的方法）

肘部法则：通过图形大致的估计出最优的聚类数量
各个类畸变程度之和：各个类的畸变程度等于该类重心与其内部成员位置距离的平方和

J为聚合系数
在excel中画出聚类系数折线图，取趋势最剧烈的类数

把每一类的J放到excel里面画折线图，选取波动点最高的类数

4.密度聚类（DBSCAN）

密度聚类（DBSCAN）
基本思想
聚类前不需要预先指定聚类的个数，生成的簇的个数与数据相关。
“谁和我挨得近，我就是谁的兄弟，兄弟的兄弟，也是我的兄弟”

基本概念
核心点：在规定的半径内有不少于MinPts数目的点
边界点：在半径内点的数量小于MinPts，但落在核心点的领域内
噪音点：即不是核心点也不是边界点

5.模糊聚类

基于目标函数的模糊聚类算法：该方法把聚类分析归结成一个带约束的非线性规划问题，通过优化求解获得数据集的最优模糊划分和聚类

链接：http://t.csdn.cn/VItbp

步骤

获取原始数据
数据标准化处理
建立模糊相似矩阵
聚类

6.神经网络聚类

采用竞争学习算法来指导网络的聚类过程，主要是无监督的学习

SOM神经网络模型
BP神经网络具有输入层、隐含层(一层或多层)和输出层，通过这三层的神经网络可以逼近任意非线性函数（神经网络可以近似逼近所有的的非线性函数，所以是相当强大的）

适用场景
样本数量较多时的分类问题

基本思想
SOM神经网络[11]是由芬兰神经网络专家Kohonen教授提出的，该算法假设在输入对象中存在一些拓扑结构或顺序，可以实现从输入空间(n维)到输出平面(2维)的降维映射，其映射具有拓扑特征保持性质,与实际的大脑处理有很强的理论联系。
　SOM网络包含输入层和输出层。输入层对应一个高维的输入向量，输出层由一系列组织在2维网格上的有序节点构成，输入节点与输出节点通过权重向量连接。 学习过程中，找到与之距离最短的输出层单元，即获胜单元，对其更新。同时，将邻近区域的权值更新，使输出节点保持输入向量的拓扑特征。

算法流程
1.网络初始化，对输出层每个节点权重赋初值；
2.将输入样本中随机选取输入向量，找到与输入向量距离最小的权重向量；
3.定义获胜单元，在获胜单元的邻近区域调整权重使其向输入向量靠拢；
4.提供新样本、进行训练；
5.收缩邻域半径、减小学习率、重复，直到小于允许值，输出聚类结果。

python实现som神经网络聚类

import numpy as np
import pylab as pl
 
class SOM(object):
    def __init__(self, X, output, iteration, batch_size):
        """
        :param X:  形状是N*D， 输入样本有N个,每个D维
        :param output: (n,m)一个元组，为输出层的形状是一个n*m的二维矩阵
        :param iteration:迭代次数
        :param batch_size:每次迭代时的样本数量
        初始化一个权值矩阵，形状为D*(n*m)，即有n*m权值向量，每个D维
        """
        self.X = X
        self.output = output
        self.iteration = iteration
        self.batch_size = batch_size
        self.W = np.random.rand(X.shape[1], output[0] * output[1])
        print (self.W.shape)
 
    def GetN(self, t):
        """
        :param t:时间t, 这里用迭代次数来表示时间
        :return: 返回一个整数，表示拓扑距离，时间越大，拓扑邻域越小
        """
        a = min(self.output)
        return int(a-float(a)*t/self.iteration)
 
    def Geteta(self, t, n):
        """
        :param t: 时间t, 这里用迭代次数来表示时间
        :param n: 拓扑距离
        :return: 返回学习率，
        """
        return np.power(np.e, -n)/(t+2)
 
    def updata_W(self, X, t, winner):
        N = self.GetN(t)
        for x, i in enumerate(winner):
            to_update = self.getneighbor(i[0], N)
            for j in range(N+1):
                e = self.Geteta(t, j)
                for w in to_update[j]:
                    self.W[:, w] = np.add(self.W[:,w], e*(X[x,:] - self.W[:,w]))
 
    def getneighbor(self, index, N):
        """
        :param index:获胜神经元的下标
        :param N: 邻域半径
        :return ans: 返回一个集合列表，分别是不同邻域半径内需要更新的神经元坐标
        """
        a, b = self.output
        length = a*b
        def distence(index1, index2):
            i1_a, i1_b = index1 // a, index1 % b
            i2_a, i2_b = index2 // a, index2 % b
            return np.abs(i1_a - i2_a), np.abs(i1_b - i2_b)
 
        ans = [set() for i in range(N+1)]
        for i in range(length):
            dist_a, dist_b = distence(i, index)
            if dist_a <= N and dist_b <= N: ans[max(dist_a, dist_b)].add(i)
        return ans
 
 
    def train(self):
        """
        train_Y:训练样本与形状为batch_size*(n*m)
        winner:一个一维向量，batch_size个获胜神经元的下标
        :return:返回值是调整后的W
        """
        count = 0
        while self.iteration > count:
            train_X = self.X[np.random.choice(self.X.shape[0], self.batch_size)]
            normal_W(self.W)
            normal_X(train_X)
            train_Y = train_X.dot(self.W)
            winner = np.argmax(train_Y, axis=1).tolist()
            self.updata_W(train_X, count, winner)
            count += 1
        return self.W
 
    def train_result(self):
        normal_X(self.X)
        train_Y = self.X.dot(self.W)
        winner = np.argmax(train_Y, axis=1).tolist()
        print (winner)
        return winner
 
def normal_X(X):
    """
    :param X:二维矩阵，N*D，N个D维的数据
    :return: 将X归一化的结果
    """
    N, D = X.shape
    for i in range(N):
        temp = np.sum(np.multiply(X[i], X[i]))
        X[i] /= np.sqrt(temp)
    return X
def normal_W(W):
    """
    :param W:二维矩阵，D*(n*m)，D个n*m维的数据
    :return: 将W归一化的结果
    """
    for i in range(W.shape[1]):
        temp = np.sum(np.multiply(W[:,i], W[:,i]))
        W[:, i] /= np.sqrt(temp)
    return W
 
#画图
def draw(C):
    colValue = ['r', 'y', 'g', 'b', 'c', 'k', 'm']
    for i in range(len(C)):
        coo_X = []    #x坐标列表
        coo_Y = []    #y坐标列表
        for j in range(len(C[i])):
            coo_X.append(C[i][j][0])
            coo_Y.append(C[i][j][1])
        pl.scatter(coo_X, coo_Y, marker='x', color=colValue[i%len(colValue)], label=i)
 
    pl.legend(loc='upper right')
    pl.show()
 
#数据集：每三个是一组分别是西瓜的编号，密度，含糖量
data = """
1,0.697,0.46,2,0.774,0.376,3,0.634,0.264,4,0.608,0.318,5,0.556,0.215,
6,0.403,0.237,7,0.481,0.149,8,0.437,0.211,9,0.666,0.091,10,0.243,0.267,
11,0.245,0.057,12,0.343,0.099,13,0.639,0.161,14,0.657,0.198,15,0.36,0.37,
16,0.593,0.042,17,0.719,0.103,18,0.359,0.188,19,0.339,0.241,20,0.282,0.257,
21,0.748,0.232,22,0.714,0.346,23,0.483,0.312,24,0.478,0.437,25,0.525,0.369,
26,0.751,0.489,27,0.532,0.472,28,0.473,0.376,29,0.725,0.445,30,0.446,0.459"""
 
a = data.split(',')
dataset = np.mat([[float(a[i]), float(a[i+1])] for i in range(1, len(a)-1, 3)])
dataset_old = dataset.copy()
 
som = SOM(dataset, (5, 5), 1, 30)
som.train()
res = som.train_result()
classify = {}
for i, win in enumerate(res):
    if not classify.get(win[0]):
        classify.setdefault(win[0], [i])
    else:
        classify[win[0]].append(i)
C = []#未归一化的数据分类结果
D = []#归一化的数据分类结果
for i in classify.values():
    C.append(dataset_old[i].tolist())
    D.append(dataset[i].tolist())
draw(C)
draw(D)

链接：http://t.csdn.cn/X7XZU

还可以使用matlab中的nctool工具箱

7.贝叶斯判别

是找到一个错判平均损失最小的判别准则

基本概念

错判损失：指的是将属于某类的实体错判为其他类，在实际生活中会导致的损失。
使用判别法D将第i类的样本错判为第j类，错判损失记作L ( j ∣ i ; D ) =L(j|i;D)=L(j∣i)。其实就是误选

基本思路

直接为每个类别产生一个判别函数式。如果原始个案被分为K类，则直接产生K个函数式。对于待判定类别的个案，直接把该个案各属性的取值代入到每个判别函数式中，那个函数式的值最大，该个案就被划归到那个类别中。
一般用spss进行

8.支持向量机

SVM 即支持向量机（Support Vector Machine），是有监督学习算法的一种，用于解决数据挖掘或模式识别领域中数据分类问题。
它的目的是寻找一个超平面来对样本进行分割，分割的原则是间隔最大化，最终转化为一个凸二次规划问题来求解。由简至繁的模型包括：

当训练样本线性可分时，通过硬间隔最大化，学习一个线性可分支持向量机
当训练样本近似线性可分时，通过软间隔最大化，学习一个线性支持向量机
当训练样本线性不可分时，通过核技巧和软间隔最大化，学习一个非线性支持向量机

（核技巧就是选取合适的核函数来对数据处理可以线性可分为止）

（线性可分支持向量机就是指所画的线）

（硬间隔是指可以画一条很直的直线就能分类，软间隔是指画一条不那么直的直线分类）

代码实现

clc;
clear;
N=10;
%下面的数据是我们实际项目中的训练样例（样例中有8个属性）
correctData=[0,0.2,0.8,0,0,0,2,2];
errorData_ReversePharse=[1,0.8,0.2,1,0,0,2,2];
errorData_CountLoss=[0.2,0.4,0.6,0.2,0,0,1,1];
errorData_X=[0.5,0.5,0.5,1,1,0,0,0];
errorData_Lower=[0.2,0,1,0.2,0,0,0,0];
errorData_Local_X=[0.2,0.2,0.8,0.4,0.4,0,0,0];
errorData_Z=[0.53,0.55,0.45,1,0,1,0,0];
errorData_High=[0.8,1,0,0.8,0,0,0,0];
errorData_CountBefore=[0.4,0.2,0.8,0.4,0,0,2,2];
errorData_Local_X1=[0.3,0.3,0.7,0.4,0.2,0,1,0];
 sampleData=[correctData;errorData_ReversePharse;errorData_CountLoss;errorData_X;errorData_Lower;errorData_Local_X;errorData_Z;errorData_High;errorData_CountBefore;errorData_Local_X1];%训练样例

type1=1;%正确的波形的类别，即我们的第一组波形是正确的波形，类别号用 1 表示
type2=-ones(1,N-2);%不正确的波形的类别，即第2~10组波形都是有故障的波形，类别号用-1表示
groups=[type1 ,type2]';%训练所需的类别号
j=1;
%由于没有测试数据，因此我将错误的波形数据轮流从训练样例中取出作为测试样例
for i=2:10
   tempData=sampleData;
   tempData(i,:)=[];
    svmStruct = svmtrain(tempData,groups);
    species(j) = svmclassify(svmStruct,sampleData(i,:));
    j=j+1;
end
species

评价模型

总结：

主观：模糊综合评价（评分依据表、隶属度、指标权重、得分）、层次分析法（评分依据表、两两比较得到判断矩阵、判断矩阵进行归一化求平均得到各个指标的权重、单层次得到每个方案对每个指标的权重，总层次通过指标权重*方案对各指标的权重算得方案总分）

客观：topsis综合评价（正向化后，找一个理想值和一个最坏值，他们的指标就是理想指标，计算各样本与理想值的相近度，其相近度可以看做样本的得分）、熵权法（每一列指标的每个样本与该样本总和占比当作概率，构成一个概率矩阵，然后跟据信息熵公式，用概率矩阵计算得出每个指标的信息熵，归一化后就是指标的权重）、主成分分析和因子分析差不多（主成分分析是计算出由协方差形成的相关系数矩阵，将其作为主成分与各个指标的线性组合的系数，有多少个指标就有多少个主成分，按累计贡献率选取前几个主成分，代指标数据算出前几个主成分的值，然后再按照主成分的贡献率加权得到样本总分）、数据包络法（将效率作为自变量构建线性规划问题，求解出该线性规划即可得到各个样本的效率数据）、灰色关联分析（利用子序列（自变量）与母系列（因变量）的关联度*各个指标权重，算出各个样本得分）

1.模糊综合评价模型

主观
把定性评价转化为定量评价，即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价
适用场景：无具体的评价标准，通过统计问卷等形式进行的评价问题

基本原理
模糊综合评价的指标都是模糊性的，例如帅、高、白等
所以利用隶属函数来判断隶属度
三种表示方法：

1.Zadeh（扎德表示法）

2.序偶表示法

3.向量表示法

集合分类：
偏小型（年轻，小）、中间型（中年，暖）、偏大型（年老，大，热）

隶属函数的确定方法
1.模糊统计法：找多个人对同一个模糊概念进行描述，用隶属频率去定义隶属度
2.借助已有的客观尺度：一般使用经常使用的公式来定义
3.指派法：根据问题的性质直接套用某些分布作为隶属函数

应用
1.确定有三个集合：因素集（评价指标集）、评语集（评价的结果）、权重集（指标的权重），确定权重的方法有：无数据：层次分析法，有数据：熵权法

2.确定模糊综合判断矩阵

3.综合评判：B = A · R

2.层次分析法（AHP）

主观
将于决策总是有关的元素分解成目标、准则、方案等层次，通过两两比较的形式来进行综合评价，擅长于求权重
适用场景：表叫适合于具有分层交错评价指标的目标系统，而且目标值又难于定量描述的决策问题，常用于计算指标的权重（和模糊综合评价共同使用）
要选好指标，确定权重表格，权重表格中的数据均按此表格填写判断矩阵

一致矩阵：各行（各列）之间成比例
一致性检验：在使用判断矩阵求权重之前，要先进行一致性检验，是检验判断矩阵与一致检验是否有太大区别

使用判断矩阵求权重：

1.算术平均法求权重

2.几何平均法求权重

3.特征值法求权重

3.Topsis综合评价模型

客观
根据有限个评价对象与理想化目标的接近程度进行排序的方法，是在现有的对象中进行相对优劣的评价，是多目标决策分析中一种常用的有效方法
适用场景：无具体的评价指标，大体系的综合评价，要有理想化指标数据，如环境质量评价、医疗质量综合评价等
步骤：

1.将原始矩阵正向化

所谓正向化就是将各种类型的指标都统一为极大型
极小型——》极大型：max-x
中间型——》极大型：

区间型——》极大型：

2.正向化矩阵标准化：每一个元素/所在列各元素平方和开根
3.计算得分并归一化

4.熵权法

是一种客观地赋权方法，利用数据本身来决定权重。指标的变异程度（波动程度）越小，所反映的信息量就越小，所占的权重也应该越小。

信息量
越有可能发生的事情，所含的信息量越小；越不可能发生的事情，所含的信息量就越大。这个可能性用概率来表示。
信息量用I(x)来表示： I(x) = -ln(p(x))
信息熵H(x)

从这个公式可以看出来，信息熵是对信息量的期望，所以信息量越大，我们所能期望得到的信息量就越少，相应的权重就小。

步骤
1.判断输入的矩阵是否存在负数，如果存在要重新标准化到非负区间
一般是在Topsis得到的正向化，标准化后的矩阵上进行判断。重新标椎化的公式为：

2.计算第j项指标下第i个样本所占的比重，并将其看做相对熵计算中用到的概率，得到概率矩阵P

3.计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权

信息效用值：dj = 1 - ej

我们也可以用指标的标准差来衡量变异程度，指标的标准差越大，信息熵越小

[n,m] = size(Z);
    D = zeros(1,m);  % 初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i);  % 取出第i列的指标
        p = x / sum(x);
        % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
        D(i) = 1- e; % 计算信息效用值
    end
    W = D ./ sum(D);  % 将信息效用值归一化，得到权重

5.主成分分析&因子分析

客观
研究一堆自变量之间的重要性
由于在前面已经讲过了主成分分析，所以这一部分主要讲因子分析

因子分析
因子分析法通过研究变量间的相关系数矩阵，把这些变量间错综复杂的关系归结成少数几个综合因子，这种方法比主成分分析更容易解释

因子分析需要构造一个因子模型，并伴随几个关键性的假定，可以有许多解

原理

满足的条件

6.数据包络分析模型（DEA）

链接：http://t.csdn.cn/rfr5l

客观
根据多项投入指标和多项产出指标，利用线性规划的方法，对具有可比性的同类型单位进行相对有效性评价的一种数量分析方法
适用场景：评价效率的问题

基本思想
DEA以决策单位各输入/输出的权重为变量，从最有利于决策单元的角度进行评价，从而避免了确定各指标在优先意义下的权重；
假定每个输入都关联到一个或者多个输出，而且输入/输出之间确实存在某种关系，使用DEA方法则不必确定这种关系的显示表达式。

基本原理
数据包络分析是评价多输入指标和多输出指标的较为有效的方法，将投入与产出进行比较。它的结果包含的意思有：

①θ=1，DEA有效，表示投入与产出比达到最优

②θ<1，非DEA有效，表示投入与产出比没有达到最优，一般来说，θ越大说明效果越好。

数据包络分析是通过对投入的指标和产出的指标做了一个线性规划，并且进行变换后，然后根据其线性规划的对偶问题（线性规划对偶问题具有经济学意义），求解这个对偶问题的最值就是θ。

代码实现

clc,clear
 
format long
 
load('data.txt');%把原始数据保存在纯文本文件data.txt中
 
X=data(:,[1:3]);%X为输入变量，3为输入变量的个数
 
X=X';
 
Y=data(:,[4:5]);%Y为输出变量，5（3+2），2为输出变量的个数
 
Y=Y';
n=size(X',1);m=size(X,1);s=size(Y,1);
 
A=[-X' Y'];
 
b=zeros(n,1);
 
LB=zeros(m+s,1);UB=[];
 
for i=1:n
   
    f=[zeros(1,m) -Y(:,i)'];
 
   Aeq=[X(:,i)',zeros(1,s)];beq=1;
 
   w(:,i)=linprog(f,A,b,Aeq,beq,LB,UB);
 
   E(i,i)=Y(:,i)'*w(m+1:m+s,i);
 
end
 
theta=diag(E)';
 
fprintf('用DEA方法对此的相对评价结果为：\n');
 
disp(theta);
 
omega=w(1:m,:)
 
mu=w(m+1:m+s,:)

7.灰色关联分析

客观
应用范围
当样本个数比较大的时候用标准化回归，当样本数比较小时，才用灰色关联分析。
可以进行系统分析和综合评价

基本思想

根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线越接近，相应序列之间的关联度越大，反之越小。

基本过程
1.要选取能够反映系统行为特征的数据序列，称为找系统行为的映射量，用映射量来间接地表征系统行为。例如用国民平均接受教育的年数来反映教育发达程度。
2.做出各个数据序列的图像，从直观上进行分析，在论文中要对图形中的各条曲线进行说明
3.确定分析数列
母序列：能反应系统行为特征的数据序列，类似于因变量Y，这里记为X0
子序列：影响系统行为的因素组成的数据序列，类似于自变量X，记为（X1，X2，…，Xm）
4.对变量进行预处理：去量纲，缩小变量范围便于计算，先正向化
先求出每个指标的均值，再用该指标中的每个元素除以均值
5.计算子序列中这个指标与母序列的关联系数

6.计算灰色关联度

当母序列有多个时，分别计算每个母序列与子序列的灰色关联度
在进行综合评价时，要计算各个指标的权重：用各个指标的灰色关联度除以所有灰色关联度的和，每个评价对象的得分：标准化后的矩阵乘以各个指标的权重，再进行归一化即可

你可能感兴趣的:(笔记,数学建模,算法,人工智能)

数据结构奇妙旅程之深入解析快速排序山间漫步人生路数据结构排序算法算法
快速排序（QuickSort）是一种高效的排序算法，它使用了分治法的策略来将一个数组排序。其基本思想是选择一个基准元素，通过一趟排序将待排序的数据分割成独立的两部分，其中一部分的所有数据都比基准元素小，另一部分的所有数据都比基准元素大，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。工作原理选择基准：从待排序的序列中选一个元素作为基准（pivo
新网师的精神肤色（幕布笔记）悦读书香
王子老师的《极简100小妙招》收到已经几天了，之前大概的浏览了全书，今天起给自己定了一个计划，必须每天学习极简小妙招里面的一个妙招，并加以运用。一、今天要打卡什么内容因有完成每天学习极简小妙招的计划，所以今天晚饭吃的比较简单，草草吃完以后带着小宝到广场溜达一圈，急忙赶回来学习极简小妙招。再重看的时候不知道自己要学点什么，打卡哪一招，感觉哪个都简单，就看这一环节像王子老师说的“一看就会”，但做这一环
php 把一个数组分成有n个元素的二维数组的算法风清扬-独孤九剑 php php 算法
一、第一种解法0){$columns_map[$position]++;//这个地方格外注意,$position与$columns比较$position=($position<$columns-1)?++$position:0;$array_length--;}foreach($columns_mapas$val){$newarray[]=array_splice($array,0,$val);}
【算法分析与设计】去除重复字母五敷有你算法分析与设计 java javascript 开发语言算法数据结构
个人主页：五敷有你系列专栏：算法分析与设计⛺️稳中求进，晒太阳题目给你一个字符串s，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例示例1：输入：s="bcabc"输出："abc"示例2：输入：s="cbacdcbc"输出："acdb"思路贪心+单调栈实现【字符串删除一个字符使其字典序最小的贪心策略】：对于两个长度相同的字符串，
C++学习笔记（lambda函数） __TAT__ C&C++c++学习笔记
C++learningnote1、lambda函数的语法2、lambda函数的几种用法1、lambda函数的语法lambda函数的一般语法如下：[capture_clause](parameters)->return_type{function_body}capture_clause：需要捕获的变量，但要求该变量必须在这个作用域中。通常的捕获方式有以下几种：[]：不捕获任何变量[&]：按引用捕获变
yarn的安装和使用全网最详细教程 zxj19880502 yarn npm
一、yarn的简介：Yarn是facebook发布的一款取代npm的包管理工具。二、yarn的特点：速度超快。Yarn缓存了每个下载过的包，所以再次使用时无需重复下载。同时利用并行下载以最大化资源利用率，因此安装速度更快。超级安全。在执行代码之前，Yarn会通过算法校验每个安装包的完整性。超级可靠。使用详细、简洁的锁文件格式和明确的安装算法，Yarn能够保证在不同系统上无差异的工作。三、yarn的
图论记录之最短路迪杰斯特拉 Just right 算法图论 java 开发语言
简述思想这个思想能用一句话来概括，精简到的极致:每次找到一个最短距离的点并更新起点到各个点的最短距离如果要可视化的话，B站搜索Dijksra算法，有视频讲解伪代码写到这里，其实是想整一个动画的，这样效果更好点，但由于种种原因所以就拖一下intdijkstr(){dist[1]=0;其余的点的距离全部初始化为真无穷，不要写成int的最大值迭代n次将不在s中的，且距离最近的点给tsj即先到t，再加上t
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
读书笔记《穿越寒冬》如雪般飞舞
各位好，我们今天来讲一本书，名字叫作《穿越寒冬》。看起来特别应景，大家觉得现在创业的状况不景气，大家都在忍受着寒冬的煎熬。但实际上，这本书的英文名字并不是这个意思，它的英文名叫作“如何创立一家新公司，并且能够活下来”。我在整个读完了以后，我发现这本书真正要翻译得好，它的名字应该叫作《创业生存手册》。这个书的作者，来自硅谷的霍夫曼船长。霍夫曼船长写过一本让创业者觉得特别贴心的书，叫作《让大象飞》它和
2018-11-18成长小组学习笔记实验中学45
因为嗓子“罢工”，我面对众人只能借“微笑”代言。在开始授课前，绣霞老师先反馈上次作业的情况，提到“接纳”需是真正发自内心的完全接纳，而不是口头上的接纳，内心却是排斥的。提到一个“问题”孩子恰恰对家爱的更加“深沉”，夫妻间的问题不能影响到孩子，对孩子更好的爱不是你为他做的更多，而是给他自由、健康成长的空间。图片发自App一、孩子：家庭的一面镜子夫妻成了彼此的“投射”，婚姻便“吵的不可开交”，婚姻便成
Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
【鸿蒙HarmonyOS开发笔记】ArkUI常用组件介绍汇总（更新中）温、鸿蒙HarmonyOS开发笔记学习记录 harmonyos 笔记华为
概述此文总结开发中用到的一些常用组件，便于查阅，此文持续更新，闲的没事就更线性布局（Row/Column）不多介绍了，最常用的布局组件，两者除了方向不一样，别的都一样方便起见下面只写Column常用属性排列方向上的间距：spaceColumn({space:20}){Row().width('90%').height(50).backgroundColor(0xF5DEB3)Row().width
过去一年，这16本好书不容错过 m0_54050778 perl
编者按：2023年在动荡与希望中收尾，2023年注定会被载入史册。疫情寒冬结束，ChatGPT横空出世，带动了人工智能技术的飞速发展；淄博烧烤、天津大爷、尔滨之旅等充满感动与幸福。但与此同时，2023年又是动荡与不安的一年，俄乌冲突的延宕，新一轮的巴以冲突，极端天气频发。在这个大环境下，有一些经典的书籍著作诞生。本文将分享2023年最值得一读的16本书籍，文章来自翻译，希望对你有所启示。关于202
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
【数据结构】实验一实现顺序表各种基本运算的算法张鱼·小丸子数据结构实验 c++数据结构
题目：实现顺序表各种基本运算的算法要求：1、建立一个顺序表，输入n个元素并输出；2、查找线性表中的最大元素并输出；3、在线性表的第i个元素前插入一个正整数x；4、删除线性表中的第j个元素；5、将线性表中的元素按升序排列；6、将线性表中的元素就地逆序（只允许用一个暂存单元）；#include#defineSIZE1000usingnamespacestd;typedefstruct{int*a;//
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
安卓笔记本 - Handler Message MessageQueue Looper SocialException
不爱写字，一张图解决。Handler,Message,MessageQueue,Looper工作原理
枚举使用笔记万变不离其宗_8 项目笔记笔记
1.java枚举怎么放在方法上面的注释里面/***保存*@paramuserId用户id*@paramtype见枚举{@linkcom.common.enums.TypeEnum}*@return*/voidsave(LonguserId,Stringtype);
ruoyi使用笔记万变不离其宗_8 项目笔记代码参考笔记笔记 java 前端
1.限流处理@RateLimiter@PostMapping("/createOrder")@ApiOperation("创建充值订单")@RateLimiter(key=CacheConstants.REPEAT_SUBMIT_KEY,time=10,count=1,limitType=LimitType.IP)publicRcreateOrder(@RequestBodyFormform){/
数据管理知识体系指南（第二版）-第五章——数据建模和设计-学习笔记键盘上的五花肉数据治理数据库数据仓库数据治理
目录5.1引言5.1.1业务驱动因素5.1.2目标和原则5.1.3基本概念5.2活动5.2.1规划数据建模5.2.2建立数据模型5.2.3审核数据模型5.2.4维护数据模型5.3工具5.3.1数据建模工具5.3.2数据血缘工具5.3.3数据分析工具5.3.4元数据资料库5.3.5数据模型模式5.3.6行业数据模型5.4方法5.4.1命名约定的最佳实践5.4.2数据库设计中的最佳实践5.5数据建模和
Java学习笔记01 .wsy. 日常 java 学习笔记
1.1Java简介Java的前身是Oak，詹姆斯·高斯林是java之父。1.2Java体系Java是一种与平台无关的语言，其源代码可以被编译成一种结构中立的中间文件（.class，字节码文件）于Java虚拟机上运行。1.2.3专有名词JDK提供编译、运行Java程序所需要的种种工具及资源。JRE是运行Java所依赖的环境的集合。JVM是一个虚构出来的计算机，通过在实际的计算机上仿真模拟各种计算机功
Java回溯知识点（含面试大厂题和源码）一成码农 java 面试开发语言
回溯算法是一种通过遍历所有可能的候选解来寻找所有解的算法，如果候选解被确认不是一个解（或至少不是最后一个解），回溯算法会通过在上一步进行一些变化来丢弃这个解，即“回溯”并尝试另一个候选解。回溯法通常用递归方法来实现，在解决排列、组合、选择问题时非常有效。回溯算法的核心要点：路径：也就是已经做出的选择。选择列表：也就是你当前可以做的选择。结束条件：也就是到达决策树底层，无法再做出选择的条件。回溯算法
《老子》笔记19 2018-10-28 海上明月共
第二十二章[原文]曲则全，枉则直，洼则盈，敝则新，少则得，多则惑。是以圣人抱一为天下式。不自见，故明；不自是，故彰，不自伐，故有功；不自矜，故长。夫唯不争，故天下莫能与之争。古之所谓"曲则全"者，岂虚言哉？诚全而归之。[译文]委曲便会保全，屈枉便会直伸；低洼便会充盈，陈旧便会更新；少取便会获得，贪多便会迷惑。所以有道的人坚守这一原则作为天下事理的范式，不自我表扬，反能显明；不自以为是，反能是非彰明
以客户为中心的企业设计（咨询执业笔记）觉者看世界
以客户为中心的企业设计（咨询执业笔记）——何伏全案咨询知名专家数字经济大行其道，过剩的风险资本自由流动，股权市场日益强势，这些力量综合在一起，产生出诸多不合理的企业设计。这些事实使得企业设计的再创造越来越需要一种约束力，许多公司和投资者未能熟谙这种约束力，或者未能将其基本原理运用于具体的商业行为中，因此付出了沉重的代价。无利润区的确存在，并且已在全球蔓延，有愈演愈烈之势。它席卷了数以千计的公司，涉
第七章索引及执行计划，存储引擎执笔为剑 #MySQL运维篇编辑器 mysql
第七章索引及执行计划，存储引擎1，索引及执行计划1，作用：提供类似书目录的作用，目的是优化查询2，所用的种类（根据算法）B树索引Hash索引R树FulltextGIS3，B树基于不同的查找算法分类介绍B-tree：在范围查询方面提供了更好的性能（>showengines;#存储引擎作用在表上，不同的表可能有不同的存储引擎mysql>select@@default_storage_engine;#查
Java面试题：解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用，Java中的多线程是如何实现的，Java垃圾回收机制的基本原理，并讨论常见的垃圾回收算法杰哥在此 Java系列 java jvm 算法面试
Java内存模型与多线程的深入探讨在Java的世界里，内存模型和多线程是开发者必须掌握的核心知识点。它们不仅关系到程序的性能和稳定性，还直接影响到系统的可扩展性和可靠性。下面，我将通过三个面试题，带领大家深入理解Java内存模型、多线程以及并发编程的相关原理和实践。面试题一：请解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用。关注点：JVM内存结构的基本组成堆、栈、方法区的功能和
【Git安装及使用学习笔记】可可西里啊零零散散的学习笔记 git 学习笔记 c++qt5
Git学习笔记Git安装Git创建本地版本库以及提交文件使用Git提交代码到码云使用Git从码云拉取代码参考博客Git安装这里参考Git详细安装教程（详解Git安装过程的每一个步骤）Git创建本地版本库以及提交文件1.查看git版本信息：git--version2.设置对应用户名与邮箱地址gitconfig--globaluser.name"your_usernamegitconfig--glob
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
ChatGPT：AI合作伙伴助你成为论文写作高手 2401_83550420 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达摘要：本文将介绍ChatGPT3.5Turbo（以下简称ChatGPT），一款强大的AI合作伙伴，能够助你成为一名论文写作高手。我们将深入探讨ChatGPT的特点、优势，并提供多个示例，展示ChatGPT在论文写作中的应用。无论是开展研究、撰写论文、还是与ChatGPT进行互动交流，都能够帮助你提升写作效率和质量。引言：随着人工智能的发展，聊天型语言模型在各个领域都
优化选址问题 | 基于和声搜索算法求解基站选址问题含Matlab源码天天酷科研优化选址问题（LP）matlab 和声搜索算法基站选址问题
目录问题代码问题和声搜索算法（HarmonySearch,HS）是一种模拟音乐创作过程中乐师们凭借自己的记忆，通过反复调整各乐器的音调，直至达到最美和声状态为启发，通过反复调整解向量的各分量来寻求全局最优解的智能优化算法。下面是一个基于和声搜索算法求解基站选址问题的Matlab伪代码框架。请注意，这个框架是一个基本的实现，你可能需要根据你的具体问题和约束条件进行调整和优化。代码%和声搜索算法求解基
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

数学建模算法总结

一.数据预处理模型

1.对于缺失值的补全处理：插值拟合

1.插值

2.拟合 总结：

拟合得到的是一条曲线 ，拟合得到的函数不一定过所有点

2.数据降维

主成分分析

3.数据异常值处查找与删除

聚类分析

4.数据整体描述性分析

二.优化模型

1.目标规划

1.多目标规划

2.线性规划

3.整数规划

3.1 0-1规划

4.非线性规划

4.1最大化最小模型

4.2蒙特卡洛法（随机取样法）

2.图论

0.动态规划（一种思想：把问题转为多个子阶段决策问题进行求解，递推思想，详细看看动态规划PPT）

0.0原理：

0.1方法：

0.2建立动态规划模型的步骤

1.最短路径模型

三.启发式算法优化模型

1.遗传算法：http://t.csdn.cn/a7MPl

2.蚁群算法

3.粒子群算法

3.1 matlab自带粒子群函数

4.模拟退火算法

5. 利用模拟退火求解n元函数最值

6.启发式算法的应用（具体）

预测模型

预测类解题技巧

微分方程模型

回归分析预测

1.线性、非线性回归与拟合

2.马尔科夫预测

3.神经网络预测

4.时间序列预测

时间序列分解

一些可引用的时序模型

1.指数平滑模型

2.AR模型（自回归模型）

3.MA模型

4.ARMA(p,q)模型

5.ARIMA(p,d,q)模型

SPSS解决时序问题步骤

5.模糊预测

聚类模型

1.K-means聚类

适用场景

算法流程

2.K-means++算法

步骤

3.层次聚类

用图形估计聚类的数量（系统聚类选取类别数目的方法）

4.密度聚类（DBSCAN）

5.模糊聚类

步骤

6.神经网络聚类

python实现som神经网络聚类

7.贝叶斯判别

基本概念

基本思路

8.支持向量机

评价模型

1.模糊综合评价模型

2.层次分析法（AHP）

3.Topsis综合评价模型

4.熵权法

5.主成分分析&因子分析

6.数据包络分析模型（DEA）

7.灰色关联分析

你可能感兴趣的:(笔记,数学建模,算法,人工智能)

2.拟合
总结：

拟合得到的是一条曲线，拟合得到的函数不一定过所有点