kgbkqLjm

机器学习学习笔记（吴恩达）（第三课第一周）（无监督算法，K-means、异常检测）

欢迎

聚类算法：

无监督学习：聚类、异常检测
推荐算法：

强化学习：

聚类（Clustering）

聚类算法：查看大量数据点并自动找到彼此相关或相似的数据点。是一种无监督学习算法

聚类与二院监督学习算法对比：

无监督：（聚类是无监督学习算法之一）

聚类算法应用：如相似的新闻文章组合，市场细分，DNA数据分析，天文数据分析（星系、天体结构）

K-means算法

是一种常用的聚类算法

原理概述

【K-means工作原理过程】（会重复执行一个过程）
1.随机猜测集群的中心（即簇质心）的位置，遍历每一个点，并看它是接近两个簇质心中的哪个（如上图中红叉还是蓝叉）将这些点分配给与它更接近的那个簇质心（如下图中为每个点标明颜色）
2.分别计算当前蓝色和红色所有点的平均值（即对应位置），将上一步的两个簇质心分别移动到计算后的两个平均值处，得到新的簇质心的位置。根据新的簇质心位置与各个点之间的距离，重新为每个点分配类别（即标记颜色）
3.重复步骤2
【注】实际可能有k个类别，并不只适用于二分类问题
簇（聚类簇、cluster）：由聚类所生成的一组样本的集合。同一簇内样本彼此相似，与其他簇中的样本相异
簇质心：即聚类中心、聚类质心，簇的中心

举例：有30个点

随机

先初步随机选两个点，分别作为两个集群的可能的中心

簇（聚类簇、cluster）：由聚类所生成的一组样本的集合。同一簇内样本彼此相似，与其他簇中的样本相异
簇质心：簇的中心

step1：

离红色簇质心近的点标记为红色，同理蓝色

step2：
查看所有红点并取他们的平均值，并将红叉（即该红色类的簇质心）移动到该平均值处的位置（同理蓝点和蓝叉）

然后继续这个查看所有点并看其是否更接近其对应的类别的新的簇质心的位置，此时原来标记为某类颜色的点可能会变为另一类（因为簇质心的位置发生了变化）

重复2的过程

直到

注：下个视频讲解如何计算某类所有点的平均值位置

K-means算法具体过程

mu_k：为第k个类别的示例点的聚类质心
如下例中，mu1和mu2是和所有训练示例一样维度的向量

mu1和mu2是和所有训练示例一样维度的向量

然后按照上一小节的过程开始执行

当共有m个训练示例、分类的类别为k时，c⁽ⁱ⁾为第i个训练示例xⁱ对应的类别索引（i=1 to m）。
如举的例子中有30个训练示例，则 m=30，每个训练示例是 x⁽¹⁾,…,x⁽³⁰⁾

计算每个训练示例xⁱ到各个类别（共k类，如此例中k=2）的聚类质心mu_k的距离，并对于每个训练示例，找到其到某个聚类质心距离最短的对应的那个类别，将该类别设为c⁽ⁱ⁾
实际计算过程中，用的好像是距离的平方（因为更好计算，本质是一样的）

n=2的意思是好像对于每个 x⁽ⁱ⁾特征向量中，都有两个元素如x⁽ⁱ⁾=（a，b）即下图中坐标轴的横纵轴



计算距离采用L2范数（欧几里得范数）

下一步：

计算每个类别示例的聚类质心（即分别计算每个训练示例每个维度上元素和的平均值（如下图中每个训练示例是二维的，即(a,b），如下图中就是计算每个属于1类（即红色）的示例的横坐标之和的平均值，同理另一个维度即纵轴）

同理计算其他类别，如蓝色的横纵轴

【极端情况下可能某个类别一个示例都没有，最后计算出的聚类质心在原点】则此时：
方式一（更常用）：取消该类别，此时是k-1个类别（簇），如下图中右上角的k=k-1

方式二：如果一定要保持k个类别，则重新随机初始化该集群的质心

对于不那么好分离的簇，K-means也适用
例子：设计师划分短袖的尺码标准SML（如下图中右边图）

K-means的成本函数（亦称失真函数distortion function）

【作用】通过成本函数是不是减小至保持不变，为我们提供判断 k-means收敛的依据

【背景】

【k-means的成本函数J】

【变量解释】
c⁽ⁱ⁾为第i个训练示例xⁱ对应的类别索引
muk是第k个类别的聚类质心
mu_c^(i)^是第i个训练示例所对应（或者说为其分配的）的类别的聚类质心（的位置）
m：共m个训练示例

下图中的成本函数J（在有些文献中也称为失真函数Distortion function）：所有样本点到它所属类的距离的平方的平均值
算法的执行过程中会更新c(1) … c(m) 和 mu1…muk 以降低J

【深入理解，及为什么要最小化上面的成本函数J】
J的参数中的第一部分（ c(1)…c(m)，即 “k-means中为示例点分配不同聚类质心”一步），定义不同的c(i) 即为示例取不同的类别，会影响该示例到类别聚类质心的距离，从而影响成本函数
J的参数中的第二部分（ mu1,…,muk，即 "不断计算同一类别示例的平均值以调整聚类质心位置"一步）

下图为了解释上图中参数的第二部分，即选择不同的聚类质心，当取平均值时计算距离最小

（博主）

下节讲述，将聚类质心随机初始化可以实现更好的k-means

K-means聚类质心初始化（μ）

【背景及目的】

以找到更好的k-means分类

【正文】
最终聚类的总数k < 训练示例数量m，才有意义。此处举例k=2，m=30
【选择聚类质心的常用方法】随机选择k个训练示例作为初始的聚类质心（如下图中红叉和蓝叉）（而不是选择某k个特定的训练示例）

当k=3时，举例：当进行多次随机初始化时，可能得到不同的聚类质心初始化位置，一旦质心选不好，可能陷入局部最小值（局部最优）（如下图中的右下角两个图）。
解决方式：分别计算出不同随机初始化聚类质心后对应的成本函数J,选择其中的min对应的那种

【结论】
经过一定次数的随机初始化后，选择成本函数最小对应的那种聚类质心方式

（博主）

选择聚类数量（k）

聚类数量：即最后要将数据分成多少类

如下图中，分成两类或四类都有道理

（博主）老师通常不用肘部法确定聚类数量k

确定聚类数量的常用方法：看你后续的任务或目的，结合实际需求和成本
例如基于k-means压缩图像时（有作业），综合考虑图像所占空间和图像质量以确定图像压缩的程度

作业链接：https://blog.csdn.net/m0_56607174/article/details/126512061

异常检测（Anomaly detection）

是一种无监督学习算法
【个人概述】就是通过概率密度估计方法（如高斯分布）计算一种情况（即一个特征，特征中可能含有n种具体特征）出现的概率，如果该概率

发现异常事件

density estimation：密度估计

【密度估计】异常检测中的密度估计是指根据已知数据集的分布情况，推测新的样本数据在该数据集中的概率分布，并利用这种概率分布来判断样本是否异常。

举例：
检测正在制造的飞机发动机存在的问题（此处为了方便仅以这两个特征为例）
计算发动机的不同特征
x1：发动机产生的热量
x2：震动强度
数据集共m台
roll off the assembly line：从流水线滚落（应该是装配完成）

数据集中每个元素都是一个二维向量（横坐标是产生的热量，纵坐标是振动强度）
anomaly：异常[əˈnɑːməli]

【实现异常检测的常用方法】密度估计

首先为特征x的概率建立一个算法模型（具体建立方法建后面几节的内容，暂时感觉就是概率论中学的概率密度函数）。该算法模型能划分出某个特征出现概率的高低，如画下图所示的椭圆，能最终判断或估计出某种特征出现的概率高低

不同椭圆圈中的概率不同。（某特征（此处就例如某种发动机对应的二维特征）出现的概率，具体解释可以看下节的p(x)解释）

密度估计模型：相当于设定了个很小的数或阈值epsilon，当新的特征向量（待检测的特征）xtest的概率p大于该阈值时，认为不会出现异常（为ok）

【异常检测的应用场景】
欺诈检测
互联网用户行为检测：如下图中 x(i)是用户i一些活动、行为的特征。根据这些可以对用户的典型行为进行建模
制造业：同理也可以应用于制造业（如判断某些制造的设备产品是否存在异常）
监视集群和数据中心的计算机：CPU运行情况、负载情况、流量等，被黑客入侵等
欺诈性金融交易

（博主）

下面将如何建立概率估计模型（暂时感觉就是概率论中学的概率密度函数）

（单个数字、特征）高斯分布（正态分布）（Gaussian （Normal） Distribution）

x是一个数字，如果x（为某值？）的概率可以由均值为mu、方差为sigma的平方的高斯分布给出（sigma为标准差，sigma的平方为方差），则其曲线如下


【p(x)的含义】
当你有少部分的示例时，获取得不到下图的曲线；当你有接近无限量的样本时，可以得到下图所示的曲线规律
看着像钟形，因此左边曲线也被称为钟形曲线

【下面看一下均值mu和标准差sigma是如何影响高斯分布的】

【高斯分布应用到异常检测】
此处只是举例数据集（共m个示例）中的每个示例x(i)是单个数字（即只对某一种特征进行异常检测），实际上可能有很多种特征，即x(i)是多维特征向量（具体见下节）

使用1/m或1/m-1作为系数没有本质区别

（补充）
高斯分布：

概率密度函数：

（博主）

异常检测算法公式及细节

上节讲的是训练集中的元素是单个数字（即只考虑单个特征），本节考虑多个特征（以飞机发动机为例，考虑两种特征，n=2）

尝试建立一个密度估计模型，判断任意一个给定的特征向量的概率

在统计学中，当给定的一个特征向量中的n种特征之间是相互独立时，可以写成下面
（但老师说，事实证明这些特征即便不是独立的，算法也能正常工作，即也可以写成概率乘积的形式）

对特征向量x的不同特征建模时的 mu和sigma不同
当对x1（例如是飞机发动机例子中的热量特征）进行概率建模时，mu1和sigma1对应于热量特征的均值和方差

对x2（例如是飞机发动机例子中的振动特征）建模时，mu和sigma对应于震动特征的均值和方差

如果特征向量有n维特征，对于x3,…,xn的概率 p(x3 ; mu3, sigma3^ 2),…, p(xn ; mun, sigma n^ 2)也是同理

【结论】如何构建异常检测系统
1.确定出可以用于异常检测的有指导意义的特征x_i
2.确定用于估计第j个特征的均值mu_j和方差sigma_j² （其中1<=j<=n）
注：如果是向量化实现的特征，也可以用下图中右下角红框公式计算mu（其中x和mu都是向量）
此时通过在未标记的训练集上估计这些mu和sigma，已经的得到了模型的所有参数
3.此时如果有一个新的示例x，计算x的概率p(x) 注：代入高斯分布公式
4.判断是否p(x)

【看一下在示例中的实际含义】

x1特征比x2特征取值范围大得多
（方差数值越大,说明这组数据的分散程度越大）

左下角图片中任一点的高度=p(x1)*p(x2) 即取到该点特征（x1, x2）的概率

对于两个样本x⁽¹⁾ _test和x⁽²⁾ _test

（博客）

开发与评估异常检测系统（如何选择ε）

实数评估：如果有一套评估系统通过返回一个实数来评估你的算法，一个系统即使在开发过程中，也可以做出决定和改进。
（感觉就是通过量化指标的方式来反映当前算法的效果）

举例：飞机发动机

假如10000个正常的发动机样本（表示为y=0），20个异常的发动机样本（表示为y=1）（通常异常样本很少）
下面拆分集合：
将6000个作为训练集，并假设全部为正常样本（因为极少数异常样本不会影响结果）。
2000个作为交叉验证集，其中要包含10个已知的异常样本（y=1）。
2000个作为测试集，其中要包含10个已知的异常样本（y=1）。

当准备好训练集、验证集和测试集后：
1.在训练集上训练模型。
2.在交叉验证集上优化参数 ε ，让算法更可靠；测试保留或去掉某个特征x_j时算法的效果。
3.将测试集的结果当做最终评估指标。
这仍然是无监督学习算法，因为训练集是无标签的（或者即便认为它是有标签的，标签也均为y=0，即尽管我们假设其都是正常的）

另一种异常检测算法（如下图中）：在已知的异常样本更少时，尤其是像如下图中的20变成2个，没有能力创建测试集，所以只有训练集和交叉验证集（优化参数），缺点是使用交叉验证集的结果作为评估结果是不客观的（因为你没有测试集）。（但这是当你仅有很少量的样本尤其是很少量的异常样本时的最佳方式）

【具体评估】
下面详细看一下如何实际评估一下在交叉验证集或测试集上的算法：
首先在训练集上拟合模型p(x) （如上面的例子训练集有6000个样本），
然后在任意的交叉验证集示例或测试集示例上计算p(x)，并根据下图的计算结果与该示例的实际类别进行比较，以查看算法的效果。

【当数据具有倾斜数据集的特点时】
方式一：类比之前的第二课第三周选修部分的衡量指标（Recall、Precision）、倾斜数据集部分，当此处的数据也是倾斜数据集时（即负例数远小于正例数，如下图的10<<2000），可以考虑用 TP、FP、FN、TN、Precision、Recall、F1-Score等指标来衡量算法的效果
metric：度量指标

方式二：也可以通过查看算法在交叉验证集上的效果来调整参数epsilon

异常检测与监督学习对比（没太看懂）

【个人总结】
当目标是检测出某些问题时，如果该问题的样本数量很少且可能很快就有新的类型出现、比较不固定、以一种全新的方式出现（如黑客攻击、飞机引擎的新类型缺陷），那么用异常检测；
如果有足够的正样本且类型相对固定，比如制造手机可能出现很多问题且异常类型相对固定（如天气预报，无非就那几种天气类型；或基于症状判断患者是否某种疾病）。
异常检测试图找到全新的正样本，这些正样本可能是之前没出现过的类型；监督学习会查看已有的正样本并尝试确定待测示例是否和之前的正样本相似

假如我们有带标签的数据，如果我们有已知的是异常的例子，还有一些已知正常的例子，如何选择使用异常检测方法还是监督学习的方法？

【正例样本数量少、负例样本很多时，用异常检测（此时正例就是异常，正例是你的目标，例如异常检测的正向目标就是检测异常）】正常例子数量很少（记住y=1时这些例子为异常样例），那么你可以考虑使用一个异常检测算法。典型情况下，我们有 0 到 20 个，可能最多到50 个正样本，通常情况下，我们只有非常少量的正样本，因此正样本仅用于 cv集和测试集中的参数调整了
【没有足够正样本时】未来可能出现的异常看起来可能会与已有的截然不同（没有足够的正样本用来学习），所以可能在正样本中，你可能已经了解 5 个或 10 个或 20个航空发动机发生故障的情况，但是可能到了明天，你需要检测一个全新的集合、一种新类型异常、一种全新的飞机发动机出现故障的情况，而且之前从来就没有见过。如果是这样的情况，那么我们就更应该对负样本用高斯分布模型
p(x) 来建模，而不是费尽心思对正样本建模，因为明天的异常可能与迄今为止见过的情况完全不同。
【足够多的正样本和负样本时（或即便只有20个正样本时），使用监督学习】有足够数量的正样本或是一个已经能识别正样本的算法，尤其是，假如你认为未来可能出现的正样本与你当前训练集中的正样本类似，那么这种情况下使用一个监督学习算法会更合理，它能够查看大量正样本和大量负样本来学到相应特征，并且能够尝试区分正样本和负样本（从正样本y=1中学习）。

【二者的应用】

总结：当遇到一个特定问题时，我们应该能够判断出是用异常检测算法还是监督学习算法。二者的关键不同在于，在异常检测中，我们通常只有很少量的正样本（异常检测中的正样本即出现异常的样本，y=1），因此对于一个学习算法而言，它是不可能从这些正样本这学习到足够的知识的，所以我们要做的是使用大量负样本，试图学出未出现过的全新正样本，从那些负样本中学习 p(x) 的值，比如说是飞机发动机故障的情况，我们保留小数量的正样本，用来评估我们的算法，这个算法用于交叉验证集或测试集。

选择使用什么特征

应用异常检测时，其中有一个因素对运行有很大影响，那就是使用什么特征，或者说选择什么特征来实现异常检测算法。

特征选择很重要，特征选择对于异常检测来说甚至比其对于监督学习方法更重要

选择呈高斯分布的特征（或能通过变换转变为高斯分布的特征）

通常来说，我们选择特征的方法是选择那些特别大或者特别小的特征（那些很可能异常的样本中）

【选择的特征是呈高斯分布的可有效帮助异常检测算法（如果不是，则将其通过各种转换变换的方式向高斯分布进行靠拢和转化）】确保选择的特征是或近似于高斯分布，或者转换数据使其近似于高斯分布。
【注意】如果要进行转换变换，对交叉验证集和测试集的数据要采用相同的变换方式
（用呈高斯分布的特征的异常检测模型时，有更大的概率去很好的拟合数据）
【举例】原特征非高斯分布但可以通过变换向高斯特征进行转化：
如对原特征取log（如下图x1 -> logx1）
或用新的特征替换它（如下图给定x2，则取 log(x2+C)）
或取几次方根（如下图x3 ^1/2、x4^1/3）

代码举例：（多尝试几种方式以找到最接近高斯分布的变换方式）
原输入特征：

尝试平方根：

尝试0.4次方，此时更接近高斯：

尝试用log：

还存在一些自动检测原始分布与高斯分布相似程度的算法，但是实践表明，上述方式已经足够了。

通过误差分析步骤来得到异常检测算法的特征

【概述】感觉和之前监督学习部分学的误差分析类似，重点关注算法做的不好的地方，即那些预测出错的样本（特征）
通过一个误差分析步骤，这跟之前讨论监督学习算法时误差分析步骤是类似的，先完整地训练出一个算法，然后在一组交叉验证集上运行算法，然后找出那些预测出错的样本，并看看我们能否找到一些不寻常的可能使预测出错的新特征来帮助学习算法，然后添加此特征，使该样本与其他样本区分开，提高算法的性能。

可能存在这种情况：某示例确实是异常情况，但是其和示例集中的其他示例相差不大，即该异常示例出现的概率也不是特别低（如下图虚线的点）
此时老师会详细查看一下该异常实例，并尝试分析并识别出一些有助于区分异常示例和正常示例的新特征，然后在算法模型中添加该新特征，以便提高性能



举例：进行欺诈行为检测，x1特征是交易数量，但是发现某个用户的交易数量没什么异常(仅凭x1特征很难区分出异常和正常)，但其打字速度却快的离谱，此时就可以将打字速度作为一个新的特征x2用于区分异常和正常，此时基于x1和x2特征绘制模型曲线就可以很明显的区分出异常和正常示例

还可以在原有特征的基础上将相关特征进行组合

【个人概述】直接看某些基本的特征并没觉得有异常，但是可以将这些特征组合起来得到新的特征，基于这些特征进行异常检测建模（如下图中x5= x3/x4）

举例：数据中心计算机的异常检测
选择发生异常时具有特别大的值或特别小的值对应的特征

数据中心的监控计算机的特征，包括占用内存x1，磁盘每秒访问次数x2，CPU 负载x3，网络流量x4。假如猜测正常计算机CPU 负载和网络流量应该互为线性关系，如我们运行了一组网络服务器，如果其中一个服务器正在服务很多个用户，那么CPU负载和网络流量都很大。但有一台计算机CPU负载升高，但网络流量没有升高，可能的出错情形是我们的计算机在执行一个任务或一段代码时，进入了一个死循环卡住了，因此CPU负载升高，但网络流量没有升高，因为只是CPU执行了较多的工作，所以负载较大，卡在了死循环里。

所以创造两个特征的比值作为用于监测的新特征：

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
2022-04-07 上善若水1979527
昨天苏阿姨来给我送普门品！和她一块来的还有另外一个阿姨！我下去拿时！那阿姨说你不是干房产的小赵！帮我租房的！我说你认识我？对啊！你帮我租的房子！我没印象了！我和保红一块！我说我想起来了阿姨！你这运动服一换！小电车一骑！一下年轻十岁我早记不得了！我只记得一九年五一带看了河滨美航还有德胜的好多套房子！你都不当意！你告诉我你每晚拜观音菩萨说快让小赵普萨帮我找套合适的房子吧！我把本子上记得半年内的德胜房源
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
2022-07-25走着走着就会发现真相既现实又残酷我傻我笨但我真
人是环境的产物，如果你不主动引导自己成为自己想成为的那种人，那么你就只能被动地被环境所塑造。做有心人，干困难事，做难事必有所得。先处理情绪，在处理问题。我们要支配习惯，而不是被习惯支配。只要你担心别人怎么看你，他们就能左右你的情绪。担心的越多，在意的越多，情绪就越不稳定，容易被情绪控制。当我们没有那么多的在意，只朝着自己最重要的那个目标去努力，去拼搏的时候，不仅有动力，而且情绪稳定。只有当你不从自
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
闭组进行时... 李亚青_强化班
今天是2019年12月1号距离开始三月学习的日子:2019年10月07,已经过去将近两个月，回顾这一阶段的学习，收获了什么?又学会了什么呢?图片发自App我想，收获最大的就是身边这一群人吧,有和蔼可亲的学姐，贴心的学长，嬉戏打闹，玩的不亦乐乎，但也同样认真踏实学习小伙伴图片发自App本以为在这样的时刻，有太多太多话，太多太多想法想要表达，可言到此处，又觉得似乎没有什么想要说的了还是那句话，幸运遇到
2021-10-23 赵甄文的幸福
秀荣感恩日记Day42[烟花]感恩语录感恩自己有能力有好身体，可以到处走动，做自己想做的事情10.23感恩日记今天做的事情瑜伽一小时户外散步一小时泡脚20分钟学习打卡和孩子沟通[爱心]感动的瞬间今天瑜伽回来，发现老公在厨房里做鱼。每次老公有时间休息的时候都会给我做硬菜。刘姐约我一起去公园散步晒太阳。虽然完美错过，但心里还是暖暖的。每天睁开眼打开手机，先去自己的群里逛一逛，每每发现有人点赞或者互动都
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号

机器学习学习笔记（吴恩达）（第三课第一周）（无监督算法，K-means、异常检测）

欢迎

聚类（Clustering）

K-means算法

原理概述

K-means算法具体过程

K-means的成本函数（亦称 失真函数distortion function）

K-means聚类质心初始化（μ）

选择聚类数量（k）

异常检测（Anomaly detection）

发现异常事件

（单个数字、特征）高斯分布（正态分布）（Gaussian （Normal） Distribution）

异常检测算法公式及细节

开发与评估异常检测系统（如何选择ε）

异常检测与监督学习对比（没太看懂）

选择使用什么特征

选择呈高斯分布的特征（或能通过变换 转变为高斯分布的特征）

通过误差分析步骤来得到异常检测算法的特征

还可以在原有特征的基础上将相关特征进行组合

你可能感兴趣的:(吴恩达机器学习2022,机器学习,算法,学习)

K-means的成本函数（亦称失真函数distortion function）

选择呈高斯分布的特征（或能通过变换转变为高斯分布的特征）