En intuitiv (och kort) förklaring av Bayes sats
Spamfiltrering baserad på en svartlista är bristfällig – den är för restriktiv och falska positiva är för bra. Men Bayesian-filtrering ger oss en mellanväg – vi använder sannolikheter. När vi analyserar orden i ett meddelande kan vi beräkna chansen att det är skräppost (snarare än att fatta ett ja / nej-beslut). Om ett meddelande har 99,9% chans att bli skräppost är det förmodligen det. När filtret tränas med fler och fler meddelanden uppdaterar det sannolikheten att vissa ord leder till skräppostmeddelanden. Avancerade Bayesian-filter kan undersöka flera ord i rad, som en annan datapunkt.
Ytterligare läsning
Det sägs mycket om Bayes:
- Bayes teorem på Wikipedia
- Diskussion om kodande skräck
- Den stora uppsatsen om Bayes teorem
Ha kul!
Andra inlägg i denna serie
- En kort introduktion till sannolikhet & Statistik
- En intuitiv (och kort) förklaring av Bayes ”Sats
- Förstå Bayes sats med förhållanden
- Förstå Monty Hall-problemet
- Hur man analyserar data med hjälp av genomsnittet
- Förstå födelsedagen Paradox
admin
0