贝叶斯与朴素贝叶斯

如题所述

第1个回答  2022-06-30

英国数学家。1702年出生于伦敦,贝叶斯在数学方面主要研究概率论.对于统计决策函数、统计推断、统计的估算等做出了贡献。他的统计学概率理论称为贝叶斯 Thomas Bayes。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有 N 个白球,M 个黑球,你伸手进去摸一把,摸出黑球的概率是M/(M+N)”。而一个自然而然的问题是反过来:“如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆向概率问题。贝叶斯就是为解决这种逆向概率而生。

P(An|B) = p(An) p(B|An)/p(B)
公式应用:
已知共有100封邮件,其中正常的邮件有70封,而垃圾邮件有30封。‘兼职’这个词在正常邮件中共出现了10次,在垃圾邮件中共出现了20次。
需要求解:包含‘兼职’这个词的邮件属于垃圾邮件的概率是多少
P(垃圾邮件|兼职)=p(垃圾邮件)
P(兼职|垃圾邮件)/p(兼职)
p(垃圾邮件) = 30/(70+30)=0.3
p(兼职) = (10+20)/100=0.3
P(兼职|垃圾邮件) = 20/30
P(垃圾邮件|兼职) =0.3*0.67/0.3=0.67

朴素贝叶斯是一种简单但极为强大的预测建模算法,之所以称为朴素贝叶斯,是因为他假设的每个特征都是独立的。
如:

简化为:

相似回答