王亦傲

调用sklearn实现支持向量机

线性支持向量机
一、需要使用的模块

import pandas as pd
from scipy.io import loadmat
import matplotlib.pyplot as plt
import numpy as np

这里pandas主要用于将数据处理成DataFrame格式，调用loadmat用于读取mat格式的数据，matplotlib.pyplot用于画图查看数据。

二、处理并查看数据
1、读取并处理数据

data=loadmat('F:\\MachineLearning\data\ex6data1.mat')
print(data['X'])

这里先读取数据data，并查看data训练集数据data['X'],得到：

[[1.9643   4.5957  ]
 [2.2753   3.8589  ]
 [2.9781   4.5651  ]
 [2.932    3.5519  ]
 [3.5772   2.856   ]
 [4.015    3.1937  ]
 [3.3814   3.4291  ]
 [3.9113   4.1761  ]
 [2.7822   4.0431  ]
 [2.5518   4.6162  ]
 [3.3698   3.9101  ]
 [3.1048   3.0709  ]
 [1.9182   4.0534  ]
 [2.2638   4.3706  ]
 [2.6555   3.5008  ]
 [3.1855   4.2888  ]
 [3.6579   3.8692  ]
 [3.9113   3.4291  ]
 [3.6002   3.1221  ]
 [3.0357   3.3165  ]
 [1.5841   3.3575  ]
 [2.0103   3.2039  ]
 [1.9527   2.7843  ]
 [2.2753   2.7127  ]
 [2.3099   2.9584  ]
 [2.8283   2.6309  ]
 [3.0473   2.2931  ]
 [2.4827   2.0373  ]
 [2.5057   2.3853  ]
 [1.8721   2.0577  ]
 [2.0103   2.3546  ]
 [1.2269   2.3239  ]
 [1.8951   2.9174  ]
 [1.561    3.0709  ]
 [1.5495   2.6923  ]
 [1.6878   2.4057  ]
 [1.4919   2.0271  ]
 [0.962    2.682   ]
 [1.1693   2.9276  ]
 [0.8122   2.9992  ]
 [0.9735   3.3881  ]
 [1.25     3.1937  ]
 [1.3191   3.5109  ]
 [2.2292   2.201   ]
 [2.4482   2.6411  ]
 [2.7938   1.9656  ]
 [2.091    1.6177  ]
 [2.5403   2.8867  ]
 [0.9044   3.0198  ]
 [0.76615  2.5899  ]
 [0.086405 4.1045  ]]

即我们的数据具有两个特征。接着，将data['x']转化为pd.DataFrame格式的数据，并将两个特征所在列命名为x1和x2，并加上一列y，用于存储训练集样本的标记：

pd1 = pd.DataFrame(data['X'],columns=['x1','x2'])
pd1['y'] = data['y']
print(pd1)

可以看到我们处理后的数据打印为：

          x1      x2  y
0   1.964300  4.5957  1
1   2.275300  3.8589  1
2   2.978100  4.5651  1
3   2.932000  3.5519  1
4   3.577200  2.8560  1
5   4.015000  3.1937  1
6   3.381400  3.4291  1
7   3.911300  4.1761  1
8   2.782200  4.0431  1
9   2.551800  4.6162  1
10  3.369800  3.9101  1
11  3.104800  3.0709  1
12  1.918200  4.0534  1
13  2.263800  4.3706  1
14  2.655500  3.5008  1
15  3.185500  4.2888  1
16  3.657900  3.8692  1
17  3.911300  3.4291  1
18  3.600200  3.1221  1
19  3.035700  3.3165  1
20  1.584100  3.3575  0
21  2.010300  3.2039  0
22  1.952700  2.7843  0
23  2.275300  2.7127  0
24  2.309900  2.9584  0
25  2.828300  2.6309  0
26  3.047300  2.2931  0
27  2.482700  2.0373  0
28  2.505700  2.3853  0
29  1.872100  2.0577  0
30  2.010300  2.3546  0
31  1.226900  2.3239  0
32  1.895100  2.9174  0
33  1.561000  3.0709  0
34  1.549500  2.6923  0
35  1.687800  2.4057  0
36  1.491900  2.0271  0
37  0.962000  2.6820  0
38  1.169300  2.9276  0
39  0.812200  2.9992  0
40  0.973500  3.3881  0
41  1.250000  3.1937  0
42  1.319100  3.5109  0
43  2.229200  2.2010  0
44  2.448200  2.6411  0
45  2.793800  1.9656  0
46  2.091000  1.6177  0
47  2.540300  2.8867  0
48  0.904400  3.0198  0
49  0.766150  2.5899  0
50  0.086405  4.1045  1

接着我们将标记为1的正例和标记为0的反例分开，分别存储在positive和negative中，并查看：

positive = pd1[pd1['y']==1]
print('\n')
negative = pd1[pd1['y']==0]
print(positive)

得到：

          x1      x2  y
0   1.964300  4.5957  1
1   2.275300  3.8589  1
2   2.978100  4.5651  1
3   2.932000  3.5519  1
4   3.577200  2.8560  1
5   4.015000  3.1937  1
6   3.381400  3.4291  1
7   3.911300  4.1761  1
8   2.782200  4.0431  1
9   2.551800  4.6162  1
10  3.369800  3.9101  1
11  3.104800  3.0709  1
12  1.918200  4.0534  1
13  2.263800  4.3706  1
14  2.655500  3.5008  1
15  3.185500  4.2888  1
16  3.657900  3.8692  1
17  3.911300  3.4291  1
18  3.600200  3.1221  1
19  3.035700  3.3165  1
50  0.086405  4.1045  1

即positive中存储的全为正例。下面画图查看正例和反例的分布，决定使用线性支持向量机还是非线性支持向量机：

plt.scatter(positive['x1'],positive['x2'],marker='o',label='positive',color='blue')
plt.scatter(negative['x1'],negative['x2'],marker='x',label='negative',color='red')
plt.legend()
plt.show()

查看图：

显然我们只需使用线性支持向量机即可解决这一问题。

3、调用sklearn中svm解决问题

from sklearn import svm
svc = svm.LinearSVC(C=1,loss='hinge',max_iter=1000)
#给定训练数据拟合SVM模型
svc.fit(pd1[['x1','x2']],pd1['y'])
#返回训练数据和标签的平均精度
score = svc.score(pd1[['x1','x2']],pd1['y'])
print(score)
#改变系数C
svc2 = svm.LinearSVC(C=100,loss='hinge',max_iter=1000)
fit2 = svc2.fit(pd1[['x1','x2']],pd1['y'])
score2 = svc2.score(pd1[['x1','x2']],pd1['y'])
print(score2)

首先在第一行调用了sklearn中的svm模块，第二行设置线性支持向量机svm.LinearSVC的参数：用于调和结构风险和经验风险的惩戒参数C我们设定为1，损失函数设定为hinge形，最大迭代次数设定为1000。第四行用我们现有的数据取拟合一个给定参数的支持向量机。第六行我们查看拟合模型在训练集上的平均精度。后面类似，只是改变了惩戒参数C，查看情况，得到结果：

0.9803921568627451
1.0

即C=1时为精度为0.9803921568627451，C=100时的精度为1.0,可以知道C=100时很可能发生了过拟合。
接下来，用svc.decision_function计算样本到决策边界的距离，并将每一个样本在C=1和C=100时的距离分别存储在pd1的'SVM Confidence和'SVM2 Confidence，并将每个样本点打印出来，用点的颜色深浅表示样本到决策边界的距离：

#decision_function为样本到决策边界的距离
fig,ax=plt.subplots(figsize=(12,8))
pd1['SVM Confidence'] = svc.decision_function(pd1[['x1','x2']])
ax.scatter(pd1['x1'],pd1['x2'],marker='o',c=pd1['SVM Confidence'],cmap='seismic')
ax.set_title('SVM Confidence(C=1)')
plt.show()

fig,ax = plt.subplots(figsize=(12,8))
pd1['SVM2 Confidence'] = svc2.decision_function(pd1[['x1','x2']])
ax.scatter(pd1['x1'],pd1['x2'],marker='o',c=pd1['SVM2 Confidence'],cmap='seismic')
ax.set_title('SVM Confidence(C=100)')
plt.show()

得到：

从图上我们可以进一步感受到C=100时的过拟合，在左上角一点我们可以清楚感受到他一定为反例，但是C=100时将这个样本划分为和决策边界距离很近，以至于颜色太浅我们看不到这一点。

非线性支持向量机
一、处理并查看数据
这与前面的线性支持向量机情况一样：

data2 = loadmat('F:\\MachineLearning\data\ex6data2.mat')
pd2 = pd.DataFrame(data2['X'],columns=['x1','x2'])
pd2['y'] = data2['y']

positive1 = pd2[pd2['y']==1]
negative1 = pd2[pd2['y']==0]

fig,ax = plt.subplots(figsize=(12,8))
ax.scatter(positive1['x1'],positive1['x2'],c='blue',marker='o',label='positive')
ax.scatter(negative1['x1'],negative1['x2'],c='red',marker='x',label='negative')
plt.show()

得到数据分布图：

很显然，不能在使用线性支持向量机去解决这一问题，必须使用带有核函数的支持向量机，即非线性支持向量机。
下面用非线性支持向量机svm.SVC去拟合，并查看拟合模型在训练集上的精度：

svc_nonlinear = svm.SVC(C=100,gamma=10,probability=True)
svc_nonlinear.fit(pd2[['x1','x2']],pd2['y'])
score_nonlinear=svc_nonlinear.score(pd2[['x1','x2']],pd2['y'])
print(score_nonlinear)

第一行，我们默认使用高斯函数作为核函数，所以我们需要定义 $σ^2$ 参数，代码中用gamma表示，这里我们定为10，这个 $σ^2$ 参数会影响我们的拟合情况，具体地说：太大的 $σ^2$ 会使高斯函数过于平坦，而导致高偏差、低方差：反之，还会导致高方差，低偏差。所以惩戒参数数C和参数 $σ^2$ 的选取都极为重要。probability表示是否用概率估计，此参数定义一定要在调用fit之后，设置为False之后会使训练过程的计算过程变慢。
接下来调用.predict_proba(),这个方法返回一个矩阵，矩阵第i行第j列表示第i个样本属于第j个类的概率：

probability_nonlinear = svc_nonlinear.predict_proba(pd2[['x1','x2']])
print(probability_nonlinear)

得到：

[[3.0000009e-14 1.0000000e+00]
 [3.0000009e-14 1.0000000e+00]
 [3.0000009e-14 1.0000000e+00]
 ...
 [3.0000009e-14 1.0000000e+00]
 [3.0000009e-14 1.0000000e+00]
 [3.0000009e-14 1.0000000e+00]]

然后取这个矩阵的第一列，即每个样本属于第0类（反例）的概率，用这一列的大小去定义颜色的深浅，颜色越深，越有可能属于第0类：

probability_nonlinear = svc_nonlinear.predict_proba(pd2[['x1','x2']])
print(probability_nonlinear)

pd2['probability'] = probability_nonlinear[:,0]
fig,ax = plt.subplots(figsize=(12,8))
ax.scatter(pd2['x1'],pd2['x2'],c=pd2['probability'],cmap='Reds',marker='o')
ax.set_title('SVM Probability')
plt.show()

得到图：

和原始的数据图相比基本一致。

参数选择问题
这里的分类问题涉及到参数 $σ^2$ 和 $C$ 的选取问题，若参数选取不当可能导致过拟合或欠拟合，所以参数选择影响到我们训练的好坏。这里我们主要是不同的参数对应着不同的模型，利用此模型取训练，然后选取在交叉验证集上表现最好的模型。
一、处理并查看数据

data3 = loadmat('F:\\MachineLearning\data\ex6data3.mat')
print(data3['X'])

pd3 = pd.DataFrame(data3['X'],columns=['x1','x2'])
pd3['y'] = data3['y']
pd4 = pd.DataFrame(data3['Xval'],columns=['x1','x2'])
pd4['y'] = data3['yval']

fig,ax = plt.subplots(figsize=(12,8))
positive3=pd3[pd3['y']==1]
negative3=pd3[pd3['y']==0]
ax.scatter(positive3['x1'],positive3['x2'],color='blue',marker='o',label='Positive')
ax.scatter(negative3['x1'],negative3['x2'],color='red',marker='x',label='Negative')
ax.set_title('Training_Set')
ax.legend()
plt.show()

fig,ax = plt.subplots(figsize=(12,8))
positive4=pd4[pd4['y']==1]
negative4=pd4[pd4['y']==0]
ax.scatter(positive4['x1'],positive4['x2'],color='blue',marker='o',label='Positive')
ax.scatter(negative4['x1'],negative4['x2'],color='red',marker='x',label='Negative')
ax.set_title('Val')
ax.legend()
plt.show()

这里我们将训练集数据和交叉验证集数据分别存在pd3和pd4中，分别查看，得到：

我们选择非线性支持向量机去将数据分类。

二、选择合适参数
这里我们将所有 $C$ 存在C_list列表中，所有 $σ^2$ 存于gamma_list列表中，遍历列表中所有元素，选取在交叉验证集上表现最好的参数，并打印此参数及此参数在交叉验证集上的精度：

best_score=0
gamma_list=[0.01,0.03,0.1,0.3,1,3,10,30,100]
C_list=[0.01,0.03,0.1,0.3,1,3,10,30,100]
for C_value in C_list:
    for gamma_value in gamma_list:
        svc = svm.SVC(C=C_value,gamma=gamma_value,probability=True)
        svc.fit(pd3[['x1','x2']],pd3['y'])
        score=svc.score(pd4[['x1','x2']],pd4['y'])
        if score>best_score:
            best_score=score
            best_C=C_value
            best_gamma=gamma_value
print(best_gamma,best_C,best_score)

得到：

100 0.3 0.965

即惩罚参数C选取为0.3， $σ^2$ 选为100，在交叉验证集上的精度为0。965。

利用支持向量机对邮件分类

下面我们用支持向量机对邮件进行分类，分为垃圾邮件和有用的邮件。
首先读取数据：

spam_data = loadmat('F:\\MachineLearning\data\spamTrain.mat')
X = spam_data['X']
y = spam_data['y']
spam_test = loadmat('F:\\MachineLearning\data\spamTest.mat')
Xtest = spam_test['Xtest']
ytest = spam_test['ytest']

查看训练集维度：

(4000, 1899)

即我们有4000条数据，每条数据有1899个特征。

我们如何将每个邮件处理为数字化的样本？
1、所有文字母转化为小写
2、所有HTML标记都从电子邮件中删除。
3、所有URL都替换为文本’httpaddr’。
4、所有电子邮件地址都替换为文本’emailaddr’。
5、所有数字都用文本’number’替换。
6、所有美元符号($)都替换为文本’dollars’。
7、所有单词处理为其原始形式。（如：discounting、discounted转化为discount）
8、删除非文本和标点符号。

然后创建一个word list，上面一共1899个单词，每个单词对应这一个数字，如：

将样本处理为维度为1899的数组形式，数组对应位置代表着对应单词的频数。这样我们就可以将数字化。

下面我们拟合训练集数据，并输出在训练集和验证集上的精度：

svc_spam = svm.SVC()
svc_spam.fit(X,y)
print('The  traininig accuracy is'+str(svc_spam.score(X,y))+'.')
print('The test accusracy is'+str(svc_spam.score(Xtest,ytest))+'.' )

得到：

The  traininig accuracy is 0.944.
The test accusracy is 0.953.

即训练集上精度为0.944，测试集上的精度为0.953。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
第28章汇编语言--- 异常处理 hummhumm 汇编算法开发语言程序设计高级语言异常处理汇编语言
在汇编语言中，异常处理是一个重要的概念，它涉及到处理器如何响应和处理程序运行时发生的非正常情况。异常可以是硬件错误（例如除零错误、非法指令）或者软件触发的中断（例如系统调用）。当发生异常时，处理器会暂停当前正在执行的程序，并转移到一个预先定义好的位置来处理这个异常。为了详细阐述第28章关于汇编语言中的异常处理，我们可以考虑一个简化的例子，展示异常处理的基本结构。请注意，实际的代码将取决于具体的处理
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
氧惠官方邀请码333777，氧惠邀请码怎么获得？氧惠邀请码有什么套路？知行导师
问：氧惠邀请码怎么获得？答：氧惠官方邀请码333777返点高佣金高真的高。问：氧惠邀请码有什么套路？答：氧惠官方邀请码333777返点高佣金高真的高。氧惠APP汇聚各大主流电商和生活服务平台优惠，展示全网全品类商品，满足网购爱好者对品质好货与极致性价比的追求，并同时享受大平台购物权益保障。满足用户日常吃喝玩乐衣食住行的聚合APP，独特的商业模式，响应国家号召，为实现全民共富而努力奋斗。氧惠邀请码3
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
大胆的宣传自己工匠良辰
#大胆的宣传自己原创：辉哥奇谭辉哥奇谭今天有朋友问：辉哥，发现你最近很多次宣传「知识星球」…我回答：对我自己用心做的东西有信心。我的观点是：我们每个人要把自己当成一件产品，精心的打磨，大胆的推销。如果我们一辈子都不敢面对自己这件产品，也不好意思去推销，怎样才能实现自己内心的梦想？怎样才能获得自由？怎样才能过上自己想过的生活？人生在世也许就是七八十年光景，我们最终都会败在「时光」脚下。每个人来到这世
京东家电年销售额是去年的1300%，主要来自于他.... Shanshan小课堂
经过大半个月角逐纠缠，时间终于来到6月18日，618全球年中购物节迎来最高潮。作为国内最大的家电零售平台，京东家电从18日0点开始，便开启了飞速狂奔的模式，仅8分钟销售额就突破20亿元!展现出强劲的增长势头与家电主场的王者霸气的同时，也让各家电品牌实现了爆发式增长，美的、海尔、格力、奥克斯均在3分钟内突破1亿元大关。在今年的618中，除了消费者已经熟悉的网购形式外，线上线下联动的融合模式、社交电商
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
Effective C++ 条款10：令operator=返回一个reference to *this 君鼎 C++c++
EffectiveC++条款10：令operator=返回一个referenceto*this核心思想：赋值操作符（operator=）应始终返回当前对象的引用（*this），以实现连锁赋值并保持与内置类型一致的语义。⚠️1.问题场景：违反连锁赋值语义classWidget{public:voidoperator=(constWidget&rhs){//错误：返回voidvalue=rhs.val
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

调用sklearn实现支持向量机

你可能感兴趣的:(调用sklearn实现支持向量机)