En intuitiv (og kort) forklaring på Bayes teorem

Spamfiltrering basert på en svarteliste er feil – det er for restriktivt og falske positive er for flott. Men Bayesian-filtrering gir oss en mellomvei – vi bruker sannsynligheter. Når vi analyserer ordene i en melding, kan vi beregne sjansen for at det er spam (i stedet for å ta en ja / nei-beslutning). Hvis en melding har 99,9% sjanse for å bli spam, er det sannsynligvis. Etter hvert som filteret blir trent med flere og flere meldinger, oppdaterer det sannsynligheten for at visse ord fører til spam-meldinger. Avanserte Bayesian-filtre kan undersøke flere ord på rad, som et annet datapunkt.

Videre lesing

Det blir sagt mye om Bayes:

  • Bayes teorem på Wikipedia
  • Diskusjon om kodende skrekk
  • Det store essayet om Bayes teorem

Ha det gøy!

Andre innlegg i denne serien

  1. En kort introduksjon til sannsynlighet & Statistikk
  2. En intuitiv (og kort) forklaring på Bayes «Teorem
  3. Forstå Bayes teorem med forholdstall
  4. Forstå Monty Hall-problemet
  5. Hvordan analysere data ved hjelp av gjennomsnittet
  6. Forstå bursdagen Paradoks

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *