Rick_Restart

学习笔记：机器学习day2

一、sklearn数据集与估计器

1.sklearn数据集

1.数据集划分

一般划分两部分
训练集：用于训练，构建模型（70%，75%，80%）
测试集：在模型检验时使用，用于评估模型是否有效（30%，25%，20%）
一般划分75%，25%比较好

API
sklearn.model_selection.train_test_split

- sklearn.datasets
加载获取流行数据集

datasets.load_*()
获取小规模数据集，数据包含在datasets里
datasets.fetch_*(data_home=None)
获取大规模数据集，需要从网络上下载，函数第一个参数是data_home，表示数据集下载的目录，默认是~/scikit_learn_data/

获取数据集返回的类型
load和fetch返回的数据类型datasets.base.Bunch（字典格式）

data：特征数据数组，是[n_samples*n_features]的二维numpy.ndarray数据
target:标签数组，是n_samples的一维numpy.ndarray数组
DESCR：数据描述
feature_names：特征名，新闻数据、手写数字、回归数据集没有
target_names:标签名

from sklearn.datasets import load_iris
iris = load_iris()
print("获取特征值",iris.data)
print("获取目标值",iris.target)
print(iris.DESCR)

2.sklearn数据集的接口介绍

数据集进行分割
**sklearn.model_selection.train_test_split(*arrays,options)

x 数据集的特征值
y 数据集的标签值
test_size 测试集的大小，一般为float
random_state 随机数种子，不同的种子会造成不同的随机采样结果。相同的种子采样结果相同。
return 训练集特征值，测试集特征值，训练标签，测试标签（默认随机取）

示例：划分训练集与测试集

from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=0,test_size=0.25)

3.sklearn分类数据集

sklearn.datasets.fetch_20newsgroups(data_home=None,subset=‘train’)

subset：‘train’或者‘test’，‘all’，可选，选择要加载的数据集，训练集的‘训练’，测试集的‘测试’，两者的‘全部’
dataset.clear_data_home(data_home=None)
清除目录下的数据

4.sklearn回归数据集

sklearn.datasets.load_boston()
加载并返回波士顿房价数据集

sklearn.datasets_load_diabetes()
加载并返回糖尿病数据集

5.转换器与估计器

转换器类（transformer）

fit():输入数据（类似建立公式f(x),不同的数据调用fit()，会得到不同的公式）
transform(): 进行数据的转换 (类似运算）
fit_transform():输入数据直接转换

sklear机器学习算法的实现-估计器（estimator）
在sklearn中，估计器（estimator）是一个重要的角色，是一类实现了算法的API
1.用于分类的估计器：

sklean.neighbors k-近邻算法
sklearn.naive_bayes 贝叶斯
sklearn.linear_model.logistcRegression 逻辑回归
sklearn.tree 决策树

2.用于回归的估计器

sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归

1.y_predict= predict(x_test)
2.预测的准确率：score(x_test,y_test)

二、分类算法-K近邻算法（几乎不用）

定义：如果一个样本在特征空间中的k个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。
欧式距离公式：
$\sqrt {(a_1+b_1)^2+(a_2+b_2)^2+(a_3+b_3)^2}$
k-近邻算法需要做标准化处理

sklearn k-近邻算法API
sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto)

n_neighbors: int可选（默认=5），k_neighbors查询默认使用的邻居数
algorithm: {‘auto’,‘ball_tree’,‘kd_tree’,‘brute’},可选用于计算最近邻居的算法；‘ball_tree’将会使用BallTree，‘kd_tree’将使用KDTree，‘auto’将尝试根据传递给fit方法的值来决定最合适的算法。（不同实现方式影响效率）

以鸢尾花数据集示例：

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris_datasets = load_iris() #实例化数据集
print(iris_datasets.keys())
X_train, X_test, y_train, y_test = train_test_split(iris_datasets['data'], iris_datasets['target'],random_state=0)
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train,y_train)
prediction = knn.predict(X_test)
print(prediction)
print("Predicted target name: {}".format(iris_datasets['target_names'][prediction]))

问题：
1.K值取多大？有什么影响？
K值取很小：容易受异常点影响
K值取很大：容易受K值数量（类别）波动）

2.性能问题

**优点：**简单，易于理解，容易实现，无需估计参数，无需训练

缺点：
懒惰算法，对测试样本分类时的计算量大。内存开销大
必须指定K值，K值选择不当则分类精度不能保证

**使用场景：**小数据场景，几千~几万样本，具体场景具体业务去测试

三、分类算法-朴素贝叶斯算法（常用于文本分类，神经网络会比较好）

1.概率基础
所有特征之间是条件独立的

2.朴素贝叶斯介绍
特征独立
公式：
$\frac{P(W|C)P(C)}{P(W)}$
注：W为给定文档的特征值（频数统计，预测文档提供），C为文档类别
公式可以理解为：
$\frac{P(F1,F2,...|C)P(C)}{P(F1,F2...)}$
其中C可以是不同类别

公式分为三个部分：
P( C ):每个文档类别的概率（某文档类别数/总文档数量）
P(W|C):给定类别下特征（被预测文档中出现的词）的概率
计算方法：P(F1|C） = Ni/N （训练文档中去计算）
Ni为该F1词在C类别所有文档中出现的次数
N为所属类别C下的文档所有词出现的次数和
P(F1,F2，…)预测文档中每个词的概率

示例：
训练集统计结果（指定统计词频）：

特征\统计	科技（30篇）	娱乐（60篇）	汇总（90篇）
“商场”	9	51	60
“影院”	8	56	64
“支付宝”	20	15	35
“云计算”	63	0	63
“汇总（求和）”	100	121	221

现有一篇被预测文档：出现了影院，支付宝，云计算，计算属于科技/娱乐的类别概率？

P(科技|影院，支付宝，云计算）=P(影院，支付宝，云计算|科技）P（科技）
=8/10020/10063/100*30/90

P(娱乐|影院，支付宝，云计算）=P(影院，支付宝，云计算|娱乐）P（娱乐）
=56/12115/1210/121*60/90
=0
问题：从上面的例子我们得到娱乐概率为0，这是不合理的，如果词频列表里面有很多出现次数都为0，很可能计算结果都为零。

解决方法：拉普拉斯平滑系数
$\frac{N_I + α}{N+α_m}$
α为指定的系数一般为1，m为训练文档中统计出的特征词个数
以上式子变为：
=(56+1)/(121+1) * (15+1)/(121+1)*(0+1)/(121+1)*60/90

API
sklearn.naive_bayes.MultinomiaNB(alpha=1.0)

朴素贝叶斯分类
alpha:拉普拉斯平滑系数

注：朴素贝叶斯没有超参数，不能通过调参调优，所以对训练集要求比较高。

朴素贝叶斯算法优缺点：
优点：

朴素贝叶斯模型发源于古典教学理论，有稳定的分类效率。
对缺失数据不太敏感，算法也比较简单，常用于文本分类。
分类准确度高，速度块。

缺点：

由于使用了样本属性独立的假设，所以如果样本属性有关联时其效果不好

四、朴素贝叶斯算法实例

示例：

from sklearn.datasets import fetch_20newsgroups
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer

#实例化加载新闻数据，’all’加载全部数据
news = fetch_20newsgroups(subset="all")
#数据分割
x_train,x_test,y_train,y_test = train_test_split(news.data,news.target,random_state=0)
# Tfidf文本特征抽取
tf = TfidfVectorizer()
x_train=tf.fit_transform(x_train)

# print(tf.get_feature_names())
#出问题:MemoryError: Unable to allocate 14.9 GiB for an array with shape (14134, 141276) and data type float64
# print(x_train.toarray())

x_test = tf.transform(x_test)
# 实例化朴素贝叶斯算法
mlt = MultinomialNB(alpha=1.0)
mlt.fit(x_train,y_train)
#进行朴素贝叶斯算法预测
y_prediction = mlt.predict(x_test)
print('预测文章类别为',y_prediction)
print('训练集集准确率为：',mlt.score(x_test,y_test))
print('测试集准确率为：',mlt.score(x_test,y_test))

五、模型的选择与调优

分类模型的评估

1.estimator.score()

一般最常见使用的式准确率，即预测结果正确的百分比

2.混淆矩阵
在分类任务下，预测结果（Predicted Condition)与正确标记（True Condition）之间存在四种不同的组合，构成混淆矩阵（适合于多分类）

	正例	反例
正例	真正例TP（true positive）	伪反利FN（false negative）
反例	伪正例FP	真反利TN

评估标准：
精确率（Precision）和召回率（Recall）
精确率： 预测结果为正例样本中真实为正例的比例（查得准）
召回率： 真实为正例的样本中预测结果为正例的比例（查得全，对正样本得区分能力）

准确率(Accuracy) ＝ (TP + TN) / 总样本
精确率(Precision) ＝ TP / (TP + FP)
召回率(Recall) ＝ TP / (TP + FN)

准确率就是找得对，召回率就是找得全

其他分类标准：F1-score，反映了模型得稳健性
公式：
$F_1= \frac{2TP}{2TP+FN+FP} = \frac{2*Precision*Recall}{Precision+Recall}$

API
sklearn.metrics.classification_report

sklearn.metrics.classification_report(y_true,y_pred,target_names=None)

y_true: 真实目标值
y_prrd:估计器预测目标值n
target_names:目标类别名称
return：每个类别精确率与召回率

接上例朴素贝叶斯算法 - fetch_20newsgroups数据集为示例

from sklearn.metrics import classification_report
report=classification_report(y_test,y_prediction,target_names=news.target_names)
print(report)

结果输出：

模型的选择与调优

1.交叉验证

目的：为了让评估的模型更加准确可信
所有数据分为n等份，每份进行数据验证，最后求平均值得到结果。（常用10折）

2.网格搜索（超参数搜索）

作用：调参数
通常情况下，有很多参数是需要手动指定的（如k-近邻算法中的k值），这种叫超参数，但是手动过程繁杂，所以需要对模型预设几种超参数组合。每组超参数都是采用交叉验证来进行评估。最后选出最优参数组合建立模型。

K值	K=3	K=5	k=7
模型	模型1	模型2	模型3

API
sklearn.model_selection.GridSearchCV
sklearn.model_selection.GridSearchCV(estimator,param_grid=None,cv=None)

对估计器的指定参数值进行详尽搜索
param_grid:估计器参数（dict）{‘n_neighbors’:[1,3,5]}
cv:指定几折交叉验证
fit：输入训练数据
score：准确率
结果分析：
best_score_:在交叉验证中验证的最好结果
best_estimator_:最好的参数模型
cv_results_:每次交叉验证后的测试集准确率结果和训练集准确结果

示例：

from sklearn.datasets import load_iris
from sklearn.model_selection import GridSearchCV
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

iris = load_iris()
cv = GridSearchCV(KNeighborsClassifier(),param_grid={'n_neighbors':[5,7,10]},cv=2)
x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=0,test_size=0.25)
cv.fit(x_train,y_train)

print('在测试集上准确率',cv.score(x_test,y_test))
print('交叉验证最好的结果',cv.best_score_)
print('最好的模型是',cv.best_estimator_)
print('每个超参数每次交叉验证的结果',cv.cv_results_)

六、决策树与随机森林

决策树

认识决策树：
决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-then结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法。

信息的度量和作用：信息和消除不确定性是相联系的

决策树的划分依据之一：信息增益
特征A对训练数据集D的信息增益g(D,A)，定义为集合D的信息熵H(D)与特征A给定条件熵H(D|A)之差，即公式为：
$g (D, A) = H (D) - H (D ∣ A)$
注：信息增益表示得知特征X的信息而使得类Y的信息的不确定性减少的程度。

常见决策树使用的算法：
ID3
信息增益最大的准则
C4.5
信息增益比最大的准则
CART
回归树：平方误差最小
分类树：基尼系数最小的准则在sklearn中可以选择划分的默认原则

API
class sklearn,tree.DecisionTreeClasssifier(criterion=‘gini’,max_depth=None,random_state=None)

决策树分类器
criterion：默认是‘gini’系数，也可以选择信息增益的熵‘entropy’
max_depth：树的深度大小
random_state:随机数种子
method：
decision_path：返回决策树的路径

示例：泰坦尼克号生存预测数据集

import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.feature_extraction import DictVectorizer

train = pd.read_csv(r'C:\Desktop\titanic\train.csv')
test = pd.read_csv(r'C:\Desktop\titanic\test.csv')
y_test = pd.read_csv(r'C:\Desktop\titanic\gender_submission.csv')

print('训练集表头：',train.columns)
print('测试集表头：',test.columns)

x_train = train[['Pclass','Age','Sex']]
y_train = train['Survived']
x_train['Age'].fillna(x_train['Age'].mean(),inplace=True)

x_test = test[['Pclass','Age','Sex']]
x_test['Age'].fillna(x_test['Age'].mean(),inplace=True)
y_test = y_test['Survived']
#进行特征工程（one-hot）
dict =DictVectorizer(sparse=False)
#pd转换字典，x_train.to_dict('records')把每一行转换成字典
x_train=dict.fit_transform(x_train.to_dict('records'))
x_test = dict.transform(x_test.to_dict('records'))

tree = DecisionTreeClassifier()
tree.fit(x_train,y_train)
print(tree.score(x_test,y_test))

决策树的结构，本地保存

1.sklearn.tree.export_graphviz 该函数能够导出DOT格式
tree.export_graphviz（estimator，out_file=‘tree.dot,feature_names=[","]）

from sklearn.tree import export_graphviz
print(dict.get_feature_names())
export_graphviz(tree,out_file='tree.dot',feature_names=['Age', 'Pclass', 'Sex=female', 'Sex=male'])

2.工具：（能够将dot文件转换为pdf、pdg）
安装graphviz
Windows下载请参考https://www.cnblogs.com/onemorepoint/p/8310996.html

3.运行命令
先在命令窗口切换到dot文件所在目录再运行命令
$ dot-Tpng tree.dot -o tree.png

图片如下：

决策树的优缺点：
优点：

简单的了解和解释，树木可视化
需要很少的数据准备，其他技术通常需要数据归一化

缺点：

决策树学习者可以创建不能很好地推广数据的过于复杂的树，这被称为过拟合。

改进：

减少cart算法（决策树API当中已经实现，随机森林参数调优有关介绍）
随机森林

注：企业重要决策，由于决策树很好地分析能力，在决策过程应用较多。

随机森林

集成学习方法
集成学习通过建立几个模型组合来解决单一预测问题。它的工作原理是生产多个分类/模型，各自独立地学习和做出预测，这些预测最后结合成单预测，因此由于任何一个单分类的做出预测。

什么是随机森林
定义：在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。

单个决策树建立：
假设有N个样本，M个特征
1.在N个样本当中选择一个样本，重复N次，样本有可能重复
2.随机在M个特征当中选出m个特征，m< 采取bootstrap采样

为什么要随机抽样训练集？
如果不进行随机抽样，每棵树的训练集一样，那么最终训练出的树分类结果也是完全一样的

为什么要又放回抽样？
如果不是有放回的抽样，那么每棵树的训练样本都是不同的，都是没有交集的，这样每棵树都是“有偏的”，都是绝对“片面的”（当然这样说可能不对），也就是说每棵树训练出来都是有很大的差异的；而随机森林最后分类取决于多棵树（弱分类器）的投票表决。

API
class sklearn.ensemble.RandomForestClassfier(n_estimators=10,criterion=‘gini’,max_depth=None,bootstrap=True,random_state=None)

随机森林分类器
n_estimators:integer,optional(default=10)森林里的树木数量
criteria：string，可选（default=‘gini’）分割特征的测量方法
max_depth：integer或者None，可选（默认=无）数的最大深度
max_feature=‘auto’每个决策树的最大特征数量
auto： max_featues=sqrt(n_features)
sqrt:： max_featues=sqrt(n_features) （same as ‘auto’）
log2： max_featues=log2(n_features)
None：max_featues=n_features
bootstrp:boolean,optional(default=True)是否在构建树时使用放回抽样

调参：

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV

rf = RandomForestClassifier(random_state=0)
param = {'n_estimators':[50,100,150],'max_depth':[5,10,20]}
gc = GridSearchCV(rf,param_grid=param,cv=2)
gc.fit(x_train,y_train)
print(gc.score(x_test,y_test))
print(gc.best_params_)

随机森林的优缺点：

几乎没有缺点

优点：

在当前所有算法中，具有极好的准确率
能够有效运行在大数据集上
能够处理具有高维特征的输入样本，而且不需要降维
能够评估各个特征在分类问题上的重要性

Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
java学习笔记8 幸福，你等等我学习笔记 java
一、异常处理Error：错误，程序员无法处理，如OOM内存溢出错误、内存泄漏...会导出程序崩溃1.异常：程序中一些程序自身处理不了的特殊情况2.异常类Exception3.异常的分类:（1）.检查型异常(编译异常):在编译时就会抛出的异常(代码上会报错),需要在代码中编写处理方式(和程序之外的资源访问)直接继承Exception（2）.运行时异常:在代码运行阶段可能会出现的异常,可以不用明文处理
2025 最强 Agent 智能体学习笔记 (71) 一刀7段学习笔记人工智能
Agent智能体的系统学习与职业发展核心内容概览本集是《2025最强Agent智能体全套教程》的第72集，聚焦Agent智能体领域的系统学习方法与职业发展路径，系统梳理了从入门到专家的能力体系、关键学习资源、职业方向选择及行业发展机遇。内容结合技术趋势与职场需求，为不同背景的学习者（学生、开发者、转行人士）提供清晰的成长蓝图，帮助其在Agent智能体领域高效成长，实现职业目标。系统学习的能力体系与
【学习笔记】CBT工作坊第二天：动机驱动行为花团与芥末
什么叫动机?在认知行为疗法中，动机是引导我们行为的各种外在和内在的力量，唤起行为起始的力量，朝着一定目标与方向进行的力量，维持或停止的力量。也就是说，在我们的所有行为包括没有做的行为背后，都隐藏着某种动机。那么，动机一般有哪些呢?大家一般听说过的，是马斯洛的需求层次理论。在他的金字塔理论中，将动机需求分为了6个层次，从初级到高级分别是：生存(活着的必须条件)--安全(活下去)--爱--尊重--自我
图解系统的学习笔记--硬件结构什么蜜桃绵绵冰操作系统学习笔记
CPU是如何执行程序的？图灵机的工作方式图灵机的基本组成纸带：纸带由一个个连续的格子组成，每个格子可以写入字符，纸带就好比内存，而纸带上的格子的字符就好比内存中的数据或程序读写头：可以读取只带上任意格子的字符，也可以把字符写入到纸带的格子读写头上的部件-存储单元、控制单元、运算单元存储单元用于存放数据控制单元用于识别字符是数据还是指令、以及控制程序的流程等预算单元用于执行运算指令冯诺依曼模型计算机
Spring学习笔记07——SpringBoot中关于接口文档管理的注解 Shaoxi Zhang Java spring 学习笔记
一、Lombok注解@Data：生成所有字段的getter/setter、toString()、equals()和hashCode()。@Getter/@Setter：单独为所有字段或指定字段生成getter/setter。importlombok.Data;@DatapublicclassUser{privateLongid;privateStringname;}编译后，Lombok会为id和n
零基础入门uniapp Vue3组合式API版本鹤早早 uni-app
前言：小程序学习笔记，课程来源up主咸虾米_。仅记录笔记，大家想学习可以去关注他。1.已安装HBuiderX（目前是4.36版本），微信开发者工具（但还没注册小程序码），相关配置OK了。1.16相关架构学习1.pages-index-index.vuebox1box2.layout{border:1pxsolidred;.box1{border:1pxsolidgreen;}.box2{borde
JavaWeb（苍穹外卖）--学习笔记14 哈哈哈哈哈0627 学习笔记
前言终于开始学习做项目了，本篇文章是学习B站黑马程序员苍穹外卖的学习笔记。我的学习路线是Java基础语法-JavaWeb-做项目，管理端的功能学习完之后，就进入到了用户端微信小程序的开发，这篇文章是把我觉得JavaWeb的学习中比较重要的内容写一个总结（其实因为学到下单支付太难了我复习复习前面的）Controller层（这里只讲讲几个需要注意的注解）管理服务端的动态资源：SpringFramewo
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
Langchain学习笔记(十二)：Memory机制与对话管理 zhangsan0933 LangChain langchain 学习笔记
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建智能对话系统时，记忆功能是至关重要的。想象一下，如果每次与AI对话都像第一次见面一样，无法记住之前的交流内容，这样的体验将是多么糟糕。LangChain的Memory机制正是为了解决这个问题而设计的，它让AI能够"记住"对话历史，从而提供更加
OkHttp学习笔记5--Events 雪晨杰
EventsEventsallowyoutocapturemetricsonyourapplication’sHTTPcalls.Useeventstomonitor:事件允许您捕获应用程序HTTP调用的度量。使用事件来监控:ThesizeandfrequencyoftheHTTPcallsyourapplicationmakes.Ifyou’remakingtoomanycalls,oryour
CTF-Web学习笔记：SQL注入篇编程到天明 CTF sql 网络安全
目录引言一、SQL注入的基础概念1.什么是SQL注入？2.SQL注入的成因二、CTF中常见的SQL注入类型1.按参数类型分类2.按注入方式分类3.其他进阶类型三、CTF实战技巧：从找注入点到拿Flag1.如何判断是否存在注入？2.快速确定数据库类型3.常用工具辅助4.绕过WAF（Web应用防火墙）四、CTF题目示例：一道报错注入实战题目背景解题步骤五、总结与提升引言在CTF（CaptureTheF
Linux驱动开发学习笔记-设备树
1、设备树1)将描述板级硬件信息的内容都从Linux内中分离开来，用一个专属的文件格式来描述，这个专属的文件就叫做设备树，文件扩展名为.dts。一个SOC可以作出很多不同的板子，这些不同的板子肯定是有共同的信息，将这些共同的信息提取出来作为一个通用的文件，其他的.dts文件直接引用这个通用文件即可，这个通用文件就是.dtsi文件，类似于C语言中的头文件。.dts描述板级信息(也就是开发板上有哪些I
进阶向:基于Python的本地文件内容搜索工具超级小识 Python进阶有趣的项目 python 开发语言
概述大家好！今天我们将一起学习如何用Python创建一个简单但强大的本地文件内容搜索工具。这个工具特别适合处理大量文本文件时的快速检索需求。为什么要学习这个工具如果你刚接触编程，完全不用担心！我会从零开始讲解，确保每一步都清晰易懂。想象一下这个常见场景：你有一个装满各种文档的文件夹（可能是工作文档、学习笔记或项目文件），现在想快速找到所有包含"重要笔记"或"项目需求"等关键字的文件。手动逐个打开文
Freertos学习笔记（一）-----FreeRTOS基本知识努力搬砖的扁鱼嵌入式开发学习笔记
RTOS“realtime”（实时）指的是系统对外部事件能够在规定的、可预测的时间内作出响应。具体含义如下：确定性（Determinism）：FreeRTOS强调事件响应的可预测性。无论系统有多少任务，关键操作（比如任务切换、中断处理）都能在已知的最坏情况下完成。这意味着开发者可以预估任务的最大响应延迟。任务优先级与抢占：FreeRTOS支持任务优先级和抢占调度。高优先级任务可以在更低优先级任务运
# Linux学习笔记 - 4 Norvyn_7 Linux学习 linux 学习笔记
Linux学习笔记-4本篇将介绍Linux中root用户管理、用户与用户组操作、权限控制信息以及chmod/chown命令的使用。1.root用户（超级管理员）root用户拥有最大的系统操作权限，可执行所有操作。1.1su和exitsu命令：切换用户语法：su[-][用户名]-表示切换后加载目标用户的环境变量（建议添加）。不加用户名时默认切换到root用户。示例：su-root#切换到root用户
动态链接库(Dynamic Link Library)学习笔记 peixian2003 编程
经常忘记http://blog.csdn.net/yxin1322/article/details/638156动态链接库(DynamicLinkLibrary)学习笔记作者：yxin1322blog：http://blog.csdn.net/yxin1322转载请注明出处我对动态链接和动态链接库的概念并不陌，但一直以来就停留在概念的层面上，没有更深入的了解。今天抽空看了一下有关动态链接和动态链接
2022-10-28晨间日记明心279
今天是什么日子起床：6.00就寝：天气：多云心情：开心纪念日：任务清单昨日完成的任务，最重要的三件事：改进：习惯养成：周目标·完成进度学习·信息·阅读八字笔记整理紫微斗数学习笔记健康·饮食·锻炼耳功八法81站桩35早上小米醪糟汤圆荷包蛋中午馒头蔬菜汤晚上煮泡面人际·家人·朋友工作·思考最美好的三件事1.我是最善良，最可爱，最大度，最宽容，最仁慈，最宽厚，最有魅力的优雅知性女子。我每天都很开心，都很
java23种设计模式-外观模式千里码！设计模式设计模式外观模式
外观模式（FacadePattern）学习笔记定义外观模式属于结构型设计模式，提供一个统一的接口来访问子系统中的多个接口。它通过定义一个高层接口简化客户端与复杂子系统的交互。适用场景为复杂子系统提供简单入口解耦客户端与子系统分层构建系统（各层通过外观类交互）遗留系统重构（用外观类封装旧接口）模式结构类图ClientFacade-subsystemA:SubsystemA-subsystemB:Su
语言合成模型Spark-TTS-0.5B学习笔记 tutgxuzyj spark 学习笔记
语言合成模型Spark-TTS-0.5B学习笔记语言合成是通过计算机技术将文字信息转换为自然流畅的语音输出，模拟人类语音。一、下载Spark-TTS-0.5B项目下载链接：https://github.com/SparkAudio/Spark-TTS.git注：需要科学网络。进入Spark-TTS文件夹，启动命令行窗口。创建Conda环境：condacreate-nsparktts-ypython
编程与数学 03-002 计算机网络 10_应用层协议明月看潮生编程与数学第03阶段计算机网络编程与数学青少年编程
编程与数学03-002计算机网络10_应用层协议一、常见的网络应用（一）Web应用（二）电子邮件（三）文件传输二、Web应用协议（HTTP/HTTPS）（一）HTTP协议的请求与响应格式（二）HTTPS的安全机制三、电子邮件协议（SMTP、POP3、IMAP）（一）邮件发送与接收的协议工作原理（二）各协议的功能特点四、总结摘要：本文是计算机网络课程中关于应用层协议的学习笔记。应用层协议是计算机网络
泷羽sec专题课笔记-- Linux作业--开机自启动方法以及破解 grrrr_1 笔记 web安全网络
本笔记为泷羽sec《红队全栈课程》学习笔记，课程请可自行前往B站学习，课程/笔记主要涉及网络安全相关知识、系统以及工具的介绍等，请使用该课程、本笔记以及课程和笔记中提及工具的读者，遵守网络安全相关法律法规，切勿进行违法违规违纪的操作。写在最前面的话，我们为什么要学习网络安全这门技术：维护国家安全防范网络攻击：网络安全威胁已成为国家安全的重要挑战。学习网络安全有助于识别和防范来自国内外的网络攻击，防
编程与数学 03-002 计算机网络 07_路由算法明月看潮生编程与数学第03阶段计算机网络算法智能路由器青少年编程编程与数学
编程与数学03-002计算机网络07_路由算法一、静态路由算法（一）手工配置路由表的方法（二）静态路由的优缺点二、动态路由算法原理（一）距离矢量算法（如贝尔曼-福特算法）（二）链路状态算法（如迪杰斯特拉算法）三、路由算法的性能比较（一）收敛速度（二）开销（三）适用场景四、总结摘要：本文是计算机网络课程中关于路由算法的学习笔记。路由算法是网络层的重要组成部分，用于选择最佳路径将数据包从源节点传输到目
Vue 框架学习笔记
作为初学者对于Vue框架的学习笔记总结了Vue框架的核心知识点，包括：1.基础概念：渐进式框架、两种使用方式、Vue实例创建流程、模板语法和响应式特性。2.常用指令：详细介绍了v-html、v-show/v-if、v-for、v-on、v-bind、v-model等10个指令的功能和用法。3.组件开发：组件结构、注册方式（全局/局部）、数据传递（Props）、组件通信（自定义事件/插槽）、生命周期
JavaWeb（苍穹外卖）--学习笔记11（Filter（过滤器）和 Interceptor（拦截器））哈哈哈哈哈0627 JavaWeb（苍穹外卖）学习笔记
前言本篇文章是学习B站黑马程序员苍穹外卖的学习笔记。我的学习路线是Java基础语法-JavaWeb-做项目，管理端的功能学习完之后，又进入用户端的登陆界面的开发，我们可以看到在后续的请求当中，都会在请求头中携带能验证身份的凭证到服务端，而服务端需要统一拦截所有的请求，从而判断是否携带的有合法的JWT令牌，下面主要来说说负责拦截的Filter（过滤器）和Interceptor（拦截器）（感觉整个项目
编程与数学 03-002 计算机网络 08_网络层的IP地址
编程与数学03-002计算机网络08_网络层的IP地址一、IP地址的分类与特点（一）IPv4地址的分类（A、B、C、D、E类）（二）各类地址的范围与用途二、子网划分与超网划分（一）子网划分的方法与目的（二）超网划分的原理与应用三、特殊IP地址（一）广播地址（二）回环地址（三）网络地址（四）私有地址（五）多播地址四、总结摘要：本文是计算机网络课程中关于网络层IP地址的学习笔记。IP地址是网络层的核心
【前端学习笔记】CSS的两种盒子模型花上
CSS有两种盒子模型。一种是W3C的标准盒子模型。另一种是IE的盒子模型。W3C的标准盒子模型中width包括了width+padding+border。IE的盒子模型的width只有width，不包含padding和border。box-sizing的作用如果想要切换盒子模型，可以使用box-sizing属性。例：box-sizing:content-box是W3C盒子模型 box-sizin
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj