En intuitiv (och kort) förklaring av Bayes sats

Spamfiltrering baserad på en svartlista är bristfällig – den är för restriktiv och falska positiva är för bra. Men Bayesian-filtrering ger oss en mellanväg – vi använder sannolikheter. När vi analyserar orden i ett meddelande kan vi beräkna chansen att det är skräppost (snarare än att fatta ett ja / nej-beslut). Om ett meddelande har 99,9% chans att bli skräppost är det förmodligen det. När filtret tränas med fler och fler meddelanden uppdaterar det sannolikheten att vissa ord leder till skräppostmeddelanden. Avancerade Bayesian-filter kan undersöka flera ord i rad, som en annan datapunkt.

Ytterligare läsning

Det sägs mycket om Bayes:

  • Bayes teorem på Wikipedia
  • Diskussion om kodande skräck
  • Den stora uppsatsen om Bayes teorem

Ha kul!

Andra inlägg i denna serie

  1. En kort introduktion till sannolikhet & Statistik
  2. En intuitiv (och kort) förklaring av Bayes ”Sats
  3. Förstå Bayes sats med förhållanden
  4. Förstå Monty Hall-problemet
  5. Hur man analyserar data med hjälp av genomsnittet
  6. Förstå födelsedagen Paradox

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *