En intuitiv (och kort) förklaring av Bayes sats

juli 13, 2020

Spamfiltrering baserad på en svartlista är bristfällig – den är för restriktiv och falska positiva är för bra. Men Bayesian-filtrering ger oss en mellanväg – vi använder sannolikheter. När vi analyserar orden i ett meddelande kan vi beräkna chansen att det är skräppost (snarare än att fatta ett ja / nej-beslut). Om ett meddelande har 99,9% chans att bli skräppost är det förmodligen det. När filtret tränas med fler och fler meddelanden uppdaterar det sannolikheten att vissa ord leder till skräppostmeddelanden. Avancerade Bayesian-filter kan undersöka flera ord i rad, som en annan datapunkt.

Ytterligare läsning

Det sägs mycket om Bayes:

Bayes teorem på Wikipedia
Diskussion om kodande skräck
Den stora uppsatsen om Bayes teorem

Ha kul!

Andra inlägg i denna serie

En kort introduktion till sannolikhet & Statistik
En intuitiv (och kort) förklaring av Bayes ”Sats
Förstå Bayes sats med förhållanden
Förstå Monty Hall-problemet
Hur man analyserar data med hjälp av genomsnittet
Förstå födelsedagen Paradox

admin