En intuitiv (og kort) forklaring på Bayes teorem
Spamfiltrering basert på en svarteliste er feil – det er for restriktivt og falske positive er for flott. Men Bayesian-filtrering gir oss en mellomvei – vi bruker sannsynligheter. Når vi analyserer ordene i en melding, kan vi beregne sjansen for at det er spam (i stedet for å ta en ja / nei-beslutning). Hvis en melding har 99,9% sjanse for å bli spam, er det sannsynligvis. Etter hvert som filteret blir trent med flere og flere meldinger, oppdaterer det sannsynligheten for at visse ord fører til spam-meldinger. Avanserte Bayesian-filtre kan undersøke flere ord på rad, som et annet datapunkt.
Videre lesing
Det blir sagt mye om Bayes:
- Bayes teorem på Wikipedia
- Diskusjon om kodende skrekk
- Det store essayet om Bayes teorem
Ha det gøy!
Andre innlegg i denne serien
- En kort introduksjon til sannsynlighet & Statistikk
- En intuitiv (og kort) forklaring på Bayes «Teorem
- Forstå Bayes teorem med forholdstall
- Forstå Monty Hall-problemet
- Hvordan analysere data ved hjelp av gjennomsnittet
- Forstå bursdagen Paradoks
admin
0