朴素贝叶斯(Bayes)分类器算法

朴素贝叶斯分类器是一个条件概率模型,是基于独立假设的,样本的各个属性特征是不相关的、相互独立的存在。显然朴素贝叶斯分类器假设各属性间彼此独立、并且服从某种概率分布(通常对连续属性等都假设服从高斯分布),这样就可以根据概率论和数理统计相关知识设计得到一贝叶斯分类器,然后根据训练数据来的特征分布来估计检验数据分类情况。我们假设属性集合F={F1,F2,......,Fn},类集合C={C1,C2,.....,Ck},根据贝叶斯定理(1):

朴素贝叶斯(Bayes)分类器算法_第1张图片............................(1)

分子的P(C)由训练集中每个类所拥有训练记录所占比例;P(F1....Fn)总是一个常量(比较中是不变量);又因为朴素贝叶斯假设每个特征Fi对于其他特征是条件独立的。即(2):

朴素贝叶斯(Bayes)分类器算法_第2张图片...............................................(2)

所以有:

朴素贝叶斯(Bayes)分类器算法_第3张图片............................(3)

所以要比较(3)式的大小实际上就是比较(4)式大小。

朴素贝叶斯(Bayes)分类器算法_第4张图片.............................................................(4)

由以上分析我们可总结朴素贝叶斯分类器原理如下:

(1) 计算每个属性Fi的均值^F和方差D;

(2) 计算条件概率:

朴素贝叶斯(Bayes)分类器算法_第5张图片

(3)计算上述的公式(4),并且比较其大小;

(4)根据(3)的计算结果,将测试记录分给结果最大的那个类;

你可能感兴趣的:(朴素贝叶斯,Bayes,分类算法,贝叶斯分类器,分类器)