En intuitiv (og kort) forklaring af Bayes sætning

Spamfiltrering baseret på en sort liste er mangelfuld – det er for restriktivt, og falske positive er for stor. Men Bayesian-filtrering giver os en mellemvej – vi bruger sandsynligheder. Når vi analyserer ordene i en meddelelse, kan vi beregne chancen for, at det er spam (snarere end at tage en ja / nej-beslutning). Hvis en meddelelse har en 99,9% chance for at blive spam, er det sandsynligvis. Da filteret trænes med flere og flere meddelelser, opdaterer det sandsynligheden for, at visse ord fører til spam-beskeder. Avancerede Bayesian-filtre kan undersøge flere ord i træk som et andet datapunkt.

Yderligere læsning

Der siges meget om Bayes:

  • Bayes sætning på Wikipedia
  • Diskussion om kodning af rædsel
  • Det store essay om Bayes sætning

Hav det sjovt!

Andre indlæg i denne serie

  1. En kort introduktion til sandsynlighed & Statistik
  2. En intuitiv (og kort) forklaring på Bayes “Sætning
  3. Forståelse af Bayes sætning med forhold
  4. Forståelse af Monty Hall-problemet
  5. Sådan analyseres data ved hjælp af gennemsnittet
  6. Forståelse af fødselsdagen Paradoks

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *