Intuicyjne (i krótkie) wyjaśnienie twierdzenia Bayesa
Filtrowanie spamu na podstawie czarnej listy jest wadliwe – jest zbyt restrykcyjne, a fałszywe alarmy są za dobrze. Ale filtrowanie bayesowskie daje nam kompromis – używamy prawdopodobieństw. Analizując słowa w wiadomości, możemy obliczyć prawdopodobieństwo, że jest to spam (zamiast podejmować decyzję tak / nie). Jeśli wiadomość ma 99,9% szans na bycie spamem, prawdopodobnie tak jest. Gdy filtr jest szkolony z coraz większą liczbą wiadomości, aktualizuje on prawdopodobieństwo, że określone słowa prowadzą do wiadomości spamowych. Zaawansowane filtry bayesowskie mogą badać wiele słów z rzędu, jako kolejny punkt danych.
Dodatkowe informacje
Wiele się mówi o Bayesie:
- Twierdzenie Bayesa w Wikipedii
- Dyskusja o kodowaniu horroru
- Wielki esej o twierdzeniu Bayesa
Baw się dobrze!
Inne posty z tej serii
- Krótkie wprowadzenie do prawdopodobieństwa & Statystyka
- Intuicyjne (i krótkie) wyjaśnienie Bayesa „Twierdzenie
- Zrozumienie twierdzenia Bayesa ze współczynnikami
- Zrozumienie problemu Montyego Halla
- Jak analizować dane przy użyciu średniej
- Zrozumienie urodzin Paradoks
admin
0