荡舟

初探NO.4—SVM_guide教你直接用支持向量机

写在前面：

之前学习向量机，理论太多，公式太多。我觉得我这水平不一定能搞明白，更别提写明白。所以我翻译了一片台湾大学的LIBSVM的guide，这个guide介绍了一下SVM，更加注重如何用LIBSVM去让初学者真正体会这个模型。这篇文章的地址是：http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf

大家可以参考这一篇文章去LIBSVM网站下载其中的代码包和数据集亲自去体验学习，我觉得效果会更好。

PS：英语水平有限，将就的看吧，哈哈~

支持向量机的实用初学指南

摘要

支持向量计算法（SVM）是一种流行的分类技术。然而，这一种技术对于一个初学者而言可能会感到陌生，进而忽略这个算法简单却至关重要的步骤以至于得不到满意的结果。在这个指南中，我们会介绍一种使用算法过程，利用这个过程希望能达到满意的结果。

1 介绍

支持向量机（SVMs）是一种优秀的数据分类技术。尽管人们认为支持向量机比神经网路（Neural Networks）要简单，但是初学者利用这一种技术往往一开始也是得不到满意的结果。在这里，我们网上po出一个利用这种技术得到和理解结果的使用之道。

请注意，这个使用指南是给SVM的初学者看的，资深SVM研究人员就不需要看了。并且，我们也不能保证你能用这个得到最理想的结果。因此，我们不准备在这一篇文章里解决一些学术上的问题，我们旨在让大家利用SVM得到问题合理的结果。

尽管读者没有必要了解SVM背后的复杂理论，但是我们会简要的说一下SVM中重要的知识作为介绍我们使用过程的铺垫。一个分类的任务一般来说分为训练过程和测试过程，每一个训练集合的实例都会包含一个“目标值”（分类的标签）和一些“属性”（特征）。而SVM的目标是创造一个基于训练集模型。这个模型可以当在测试集合只给出“属性”的时候也能计算出实例的“目标值”。

一旦给予我们“属性—类别”序列对（训练集）表示成（xi,yi）,i=1,2,3....n, x取值Rn，y取值为±1，这时支持向量机会以下面公式的形式给出问题的最佳解：

这里，我们的训练数据向量Xi会被一个函数 ϕ 映射到更高的维度空间。SVM会从高维度空间里找到一个线性的分离超平面将数据以最大的间隔中分离出来。

上述公式中提到的C>0是指一个纠正错误的惩罚因子。

另外呢，有一种叫做核函数的东西，表达式如下图：

我们可以从介绍有关SVM的书籍里找到4中基本的核函数：

1.1现实中的例子

上面的表格给出了一些应用到了现实世界的案例。这一些案例一开始新手可能得不出很好的分类结果。运用这一个指南，我们可以帮助他们得到更为合理且理想的结果，案例具体解决方案附录A中给出。

关于这一些数据也可以从以下网址获得

www.csie.ntu.edu.tw/~cjlin/papers/guide/data/

1.2流程介绍

很多的初学者用SVM技术的流程是这样的：

1 将数据转换成SVM计算包需的数据形式。

2 随机的运用几个核函数和参数

3 用测试集测试

然而我们希望初学者在运用SVM技术的时候采用以下的流程：

1 将数据转换成SVM计算包需的数据形式

2 简单的数据缩放

3 考虑用RBF核方法

4 用交叉验证去寻求最佳的参数C和γ

5 用步骤4中最佳的参数C和γ去训练整个训练集合

6 测试

我们接下来会讨论这个流程的详细信息。

2 数据预处理

2.1 分类的特征

SVM要求每一个数据实例由一组实数向量组成。因此，如果存在一些表示类别的特征，我们首先需要把他们转换成数字形式的数据。我们建议运用m 数字去表示m-类别的属性。只有m类别中的一种是1剩下的把他们归零。与一个例子，假设一个三属性的类别{红，绿，蓝}，这样的分类我们可以把他表示称（0,0,1），（0,1,0）,（1,0,0）.实验显示，属性值如果不是很大计算的代码可能会相对于单一的数字更加稳定。

2.2关于数据缩放

在运用SVM之前对数据进行合理的缩放是必要的

www.faqs.org/faqs/ai-faq/neural-nets

这一篇文章解释了其重要性和运用SVM时的一些考虑要点。对数据进行缩放最大的好处防止不同属性值在过大或者过小的数值域里。另外一个好处是为计算带来便利。因为核函数产生的值一般取决于特征向量的内部值，因为一般说来，线性核函数和多项式核函数对比较大的属性值会造成计算上的困扰。因此，我们推荐线性核函数的值域范围在[-1，+1]，或者[0,1]

当然我们需要用相同的方法去对训练集合数据集进行同等程度的缩放。比如，我们把训练集的数据从[-10,+10]缩放到了[-1,+1]。如果训练集的属性值域是[-11,+8]我们必须把他们所方法哦[-1.1,+0.8]。在附录B中会介绍一些真实的案例。

3 模型的选择

尽管在前面的章节中只介绍了4种常见的核方法，我们也要决定先选择一种去尝试。之后才能选择最佳的惩罚因子C

3.1 RBF核（径向基函数）

一般说来，RBF核实一种合理的首选。它可以把实例中的特征映射更高层的维度，从而，能解决一些线性核函数解决不了的非线性的问题。其实，当两者惩罚因子作用相同时线性的核是RBF核的特殊的形式。另外sigmoid核和RBF核在一定参数条件下也是类似的。

第二个原因，就是构成的超平面影响着模型选择的复杂程度。例如多项式核就比RBF核的超平面多。

最后，RBF核的计算困难相对小。当层次多的时候RBF核也许是0

不过呢，有一些场景下RBF和也并不是很适合。尤其是当特征数目比较多的时候。有的时候还真得用线性核函数，我们会在附录C中讨论这一些细节。

3.2交叉验证和网格搜索

对于RBF核来说，有两个参数：C和γ。在一开始的时候我们是不知道这个问题的最佳的参数的，但是这个模型还需要这两个参数。所以我们的目标就是找到一组合适的参数（C，γ）

让这个模型去更好的预测位置的信息。请注意，这并不是意味着对于训练集的数据并不是最高的预测正率（拿模型将训练集的数据重新预测一遍）。综上所述，一个常见的策略是将着一些数据分成两组，（虽然都知道标签）我们把一组看成测试集合。那么测试集合的预测正率就更加能反映这个分类器的分类能力。基于这个思想，它的延伸版本就被称作交叉验证。

在v折交叉验证中，我们首先把训练集等分成v份。然后我们用一份去作为真正的训练集去验证v-1份训练出来的分类器。这样在整个训练集中的每一个实例都可以被预测一次。所以交叉验证的结果基本上是测试集预测的结果了。

上面的图就是使用价差验证的原因。防止过拟合。

我们推荐在交叉验证中时使用网格搜索找寻参数C和γ。不同的（C，γ）组合将会被尝试然后最佳的交叉验证正确率就会被发现。我们发现指数增长的序列理论上寻找的最好。比如下图：

网格搜索看似笨拙却是直截了当。实际上，还有几种先进的方法。但是两个原因使我们选择网格搜索。一是心理上我们懒得用启发式的方法找一个本来就不是很精确地参数。第二，反正就两个参数网格搜索省时省力。而且，这两个参数之间互相独立，也好找。别的先进方法还要详尽细算太麻烦。

虽然网格搜索很方便，但它也很费时间。所以我们我们建议先粗略地画一个网格。然后从这个网格里找到表现比较良好的一块将它放大。例如下图的例子，在粗略地网隔里最佳的参数是（C，γ）=（）它的交叉验证正确率是77.5%，然后我们在最佳点的附近再找找到的点为（C，γ）=（）。当找到最佳的参数集合的时候，我们训练出来的模型会称为最佳的分类器。

上述的方法，在千条或者以上数量级时候表现良好。如果数据量大的时候可以进行随机抽取一个子集。然后做一个网格搜索，再用这个延伸到整个训练集合。

4额外的讨论

在一些场合下，这一套过程也不是很好。所以像特征选取之类的方法将会被应用。不过这一些问题的范畴已经超过了这个指南。我们通过实验证明这一套路在没有很多特征的时候还是不错的。如果特征数量级达到10^3我们就不得不在使用SVM上面抽取一部分子集了。

致谢：略 233333

附录 A 一个关于这一套流程的案例

在这一个附录里，我们对比了一下用推荐方法与新手利用SVM的正确率。这三个问题在上面的表格里已经有所体现。每一个问题，我们第一次会直接去训练和测试。之后，我们会po一些经过缩放或者为经过缩放的正确率。这印证了在2.2中讨论的缩放过程。在之后，我们把我们推荐方法的正确率作出记录。最后我们用LIBSVM这一套工具去进行证明。

请注意，下面讨论的参数寻找的工具grid.py会在R-LIBSVM 的接口里。

A.1 天体物理：

未经过任何的处理，用的缺省的参数：

PS：上面是LIBSVM工具包的参数命令，这个工具包在LINUX，WIN都能用。而且还给与python matlab等接口，是一个好东西，过后介绍给大家。

经过了缩放，仍沿用缺省的参数：

用grid.py进行参数&模型选择之后的结果：

用Python自动化脚本得出的结果：

A.2 生物信息学：

未经过任何的处理，用的缺省的参数：

经过了缩放，仍沿用缺省的参数：

用grid.py进行参数&模型选择之后的结果：

A.3 机动车辆：

未经过任何的处理，用的缺省的参数：

经过了缩放，仍沿用缺省的参数：

用grid.py进行参数&模型选择之后的结果：

附录B 缩放数据是经常犯的错误汇总

2.2章节解释了对数据进行缩放的重要性。我们在这一期附录中给出一个具体的交通信号灯的案例。大家可以在下面网址中找到其中的数据集

网址：http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/

如果将训练集合测试集数据分别缩放到[0,1]。正确率会低于70%，如图：

如果用将他们一起缩放，我们会得到更高的正确率（Leo看了半天没看懂，等着自己试验看一看）：

在正确的设置之后，在svmguide4.t.scale中的10和特征有以下的最大值：

可见，一开始的缩放技术会导致一个错误的结果。

附录C 什么时候使用线性核而不是RBF核

如果特征数目太大，也许不需要将特征映射高维。这样，非线性的映射也不会有太多的改善。

用线性核已经很好了，只需要找C就可以了。在讨论了3.1中的线性核之后，我们发现它的表现如果找到合适的参数之后也很不错。

之后，我们将分成三种情况进行讨论：

C.1 实例数目远小于特征数目

在生物信息学中什么情况上属于这一种类型，我们讨论Leukemia的数据。训练集合测试机分别是38条和34条。特征数目是7129个，符合实例数目远小于特征数目。我们将两个文件分开，对比了RBF核和线性核的准确率：

感觉，两者差别不大。不过特征数目很大时候，高维映射没有必要。

C.2 实例数目&特征数目都很大

这种情况是文件分类所常见的，LIBSVM对这种问题不是很擅长。所幸的是，liblinear对这一类的数据表现的很好我们这用两种工具进行了测试，实例数目和特征数目为20242和47236。结果如图：

在交叉验证环节，LIBSVM用了350秒，而liblinear用了3秒。此外，LIBSVM更加消耗内存当用核函数的时候，LIBLINEAR能用快又好的做到分类这一点。

而且，请注意读数据占据了大部分时间。

C.3实例数目远大于特征数目

当特生数目小的时候，一般来说需要进行高维度映射。我们给出一个拥有581k数据实例而只有54个特征的案例，分别运用了线性核和RBF核的结果：

参考文献：略

= = 终于翻译完了。

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
别再讲道理啦，对方听不进去的方所
我之前写过一篇叫做《你总妄想改变他人》，然后就有朋友跟我说，有一些方法可以改变他人之类的。嗯，是这样，但是任何具体的问题，都要限定好语境，描述清楚前提条件，然后再表达观点，我的这位朋友的说法就犯了一刀切的错误，这样并不能让讨论正常展开（这篇我得先给她看看，不然可能会挨揍）。好了，hhhh，谁让她不能写文章呢，我就来再说一说吧。我前面说过，我们在学到一个道理、学会一种方法之后，总是迫不及待地想要去与
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
《实际生活是我们的指南针》——教育中寻找曙光托克托126何芳
陶行知先生的文章相对《致青年教师》比较难理解，但是他热爱学生,在书中处处能感受到。在《实际生活是我们的指南针》文中他说道:“我虽觉得我有好多地方可以帮助诸位,但指志针确是有些不敢当。我和诸位同是在乡村里摸路的人。我们的真正指南针只是实际生活。”这些话不仅使人感到他非常谦虛,既不夸大自己的作用也不轻视自己的作用。图片发自App我们的真正指南针只是实际生活。实际生活向我们供给无穷的问题,要求不断的解决
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
【ARM】FPU,VFP,ASE,NEON,SVE...是什么意思？亿道电子Emdoor ARM arm开发 ARM
1、文档目标对执行浮点和SIMD操作的逻辑的各种名称的缩写词进行简要解释。2、问题场景Arm处理器内核中有用于执行浮点和SIMD操作的逻辑，有各种名称。它们通常是一系列的缩写形式，因此本文旨在对每一个缩写词进行简要解释。3、软硬件环境1、软件版本：不涉及2、电脑环境：不涉及4、相关缩写FPU(Floating-PointUnit)浮点单元浮点单元是处理器核心中的一个模块，用于使用浮点数执行算术运算
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
人物系列首篇｜总会有人陪你走一段路诗小蛮5786400
主题纲要：1.总会有人陪你走一段路2.不打扰也是一种幸福3.留在身边的，哪怕瞎逼逼一番也是珍贵一、总会有人陪你走一段路在综艺《向往的生活》，任嘉伦曾问过这样一个问题：“你们有没有过那样一种朋友：你们小时候关系很好，但因为你事业越来越好；他觉得你们之间的距离越来越远，然后他就自己疏远你的那种。”何炅说：我们要接受这是常态，我们每个人都有在乎的、喜欢的人，但我从来没有奢望，要把谁留在身边一辈子，因为这
读张萌萌姐《从受欢迎到被需要》第一章读书总结韩静_Han
我是@张萌-萌姐#从受欢迎到被需要#读书会10班的书记官韩静我们的领读者是@郝美-菱这是今天的读书总结通过第一章的阅读，对高情商和自我介绍有了新的认知。思考题复盘：“我是谁，我需要什么，我能提供什么”【我是谁】我叫韩静，在房地产行业工作5年，现担任行政经理一职，是一位个子小却很坚强很拼的女生。【我能提供什么】️用自己减重26斤的经验帮助需要的人健康减肥️能提供房地产购房等方面的知识和问题️早起陪伴
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
2022-07-25走着走着就会发现真相既现实又残酷我傻我笨但我真
人是环境的产物，如果你不主动引导自己成为自己想成为的那种人，那么你就只能被动地被环境所塑造。做有心人，干困难事，做难事必有所得。先处理情绪，在处理问题。我们要支配习惯，而不是被习惯支配。只要你担心别人怎么看你，他们就能左右你的情绪。担心的越多，在意的越多，情绪就越不稳定，容易被情绪控制。当我们没有那么多的在意，只朝着自己最重要的那个目标去努力，去拼搏的时候，不仅有动力，而且情绪稳定。只有当你不从自
Effective C++ 条款10：令operator=返回一个reference to *this 君鼎 C++c++
EffectiveC++条款10：令operator=返回一个referenceto*this核心思想：赋值操作符（operator=）应始终返回当前对象的引用（*this），以实现连锁赋值并保持与内置类型一致的语义。⚠️1.问题场景：违反连锁赋值语义classWidget{public:voidoperator=(constWidget&rhs){//错误：返回voidvalue=rhs.val
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
人性四条 37f656f2331b
第一条：你想给别人讲道理，你就要混的比他好，让别人闭嘴的从来都不是道理，而是身份。第二条：不花钱就想解决问题的人永远都离不开底层的囚笼，很多时候我们需要的不是一碗鸡汤，而是一个巴掌，巴掌越多，就越管用。第三条：所有的人脉都是假象，想与高层次的人建立人脉，只有三种方式，你具备同等的财富，你具备别人需要的能力和资源，你具备同频的智慧，除此之外，皆是假象。第四条：再好的朋友帮忙，都要记得送礼或是请客吃饭
鬼谷子智慧：怎样留人死心塌地跟你干；威逼利诱是最差劲的方法国学文化学者
随着社会经济发展的迅速提升，企业现代化的变更，更多的企业已经改变了固有的用人模式，更多的是需要专业对口，减少培训成本的员工，可同样现在人才也是如此，选择变多了，在一家企业的时间就变得不再持久了。无论是企业用人还是找工作，似乎变得都不再那么简单了。其实解决了如何留人的问题也就解决了不断更换工作的问题；一个企业各方面都不错，谁又想经常换工作呢？鬼谷子智谋鬼谷子有提到，量才而用，根据他自身的能力让他得到
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

初探NO.4—SVM_guide教你直接用支持向量机

你可能感兴趣的:(算法,机器学习,支持向量机,LIBSVM,分类问题)