En intuitiv (og kort) forklaring af Bayes sætning
Spamfiltrering baseret på en sort liste er mangelfuld – det er for restriktivt, og falske positive er for stor. Men Bayesian-filtrering giver os en mellemvej – vi bruger sandsynligheder. Når vi analyserer ordene i en meddelelse, kan vi beregne chancen for, at det er spam (snarere end at tage en ja / nej-beslutning). Hvis en meddelelse har en 99,9% chance for at blive spam, er det sandsynligvis. Da filteret trænes med flere og flere meddelelser, opdaterer det sandsynligheden for, at visse ord fører til spam-beskeder. Avancerede Bayesian-filtre kan undersøge flere ord i træk som et andet datapunkt.
Yderligere læsning
Der siges meget om Bayes:
- Bayes sætning på Wikipedia
- Diskussion om kodning af rædsel
- Det store essay om Bayes sætning
Hav det sjovt!
Andre indlæg i denne serie
- En kort introduktion til sandsynlighed & Statistik
- En intuitiv (og kort) forklaring på Bayes “Sætning
- Forståelse af Bayes sætning med forhold
- Forståelse af Monty Hall-problemet
- Sådan analyseres data ved hjælp af gennemsnittet
- Forståelse af fødselsdagen Paradoks
admin
0