Een intuïtieve (en korte) uitleg van de stelling van Bayes
Spamfiltering op basis van een zwarte lijst is gebrekkig – het is te beperkend en valse positieven zijn te geweldig. Maar Bayesiaanse filtering geeft ons een middenweg – we gebruiken waarschijnlijkheden. Terwijl we de woorden in een bericht analyseren, kunnen we de kans berekenen dat het spam is (in plaats van een ja / nee-beslissing te nemen). Als een bericht 99,9% kans heeft om spam te zijn, is dat waarschijnlijk het geval. Naarmate het filter met steeds meer berichten wordt getraind, wordt de kans bijgewerkt dat bepaalde woorden tot spamberichten leiden. Geavanceerde Bayesiaanse filters kunnen meerdere woorden achter elkaar onderzoeken, als een ander gegevenspunt.
Verder lezen
Er wordt veel gezegd over Bayes:
- De stelling van Bayes op Wikipedia
- Discussie over het coderen van horror
- Het grote essay over de stelling van Bayes
Veel plezier!
Andere berichten in deze serie
- Een korte inleiding tot waarschijnlijkheid & Statistieken
- Een intuïtieve (en korte) uitleg van Bayes “Stelling
- De stelling van Bayes begrijpen met verhoudingen
- Het Monty Hall-probleem begrijpen
- Gegevens analyseren met behulp van het gemiddelde
- De geboortedatum begrijpen Paradox
admin
0