Naive Bayesian文本分类器
最后更新于:2022-04-01 20:31:35
贝叶斯学习方法中实用性很高的一种为朴素贝叶斯学习期,常被称为朴素贝叶斯分类器。在某些领域中与神经网络和决策树学习相当。虽然朴素贝叶斯分类器忽略单词间的依赖关系,即假设所有单词是条件独立的,但朴素贝叶斯分类在实际应用中有很出色的表现。
朴素贝叶斯文本分类算法伪代码:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-04-21_57187d6f3e70e.jpg)
朴素贝叶斯文本分类算法流程:
![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2016-04-21_57187d6f5f2c7.jpg)
通过计算训练集中每个类别的概率与不同类别下每个单词的概率,然后利用朴素贝叶斯公式计算新文档被分类为各个类别的概率,最终输出概率最大的类别。
C++源码:
~~~
/*
Bayesian classifier for document classifiaction
15S103182
Ethan
2015.12.27
*/
#include
#include
#include
#include