Intuicyjne (i krótkie) wyjaśnienie twierdzenia Bayesa

13 lipca, 2020

Filtrowanie spamu na podstawie czarnej listy jest wadliwe – jest zbyt restrykcyjne, a fałszywe alarmy są za dobrze. Ale filtrowanie bayesowskie daje nam kompromis – używamy prawdopodobieństw. Analizując słowa w wiadomości, możemy obliczyć prawdopodobieństwo, że jest to spam (zamiast podejmować decyzję tak / nie). Jeśli wiadomość ma 99,9% szans na bycie spamem, prawdopodobnie tak jest. Gdy filtr jest szkolony z coraz większą liczbą wiadomości, aktualizuje on prawdopodobieństwo, że określone słowa prowadzą do wiadomości spamowych. Zaawansowane filtry bayesowskie mogą badać wiele słów z rzędu, jako kolejny punkt danych.

Dodatkowe informacje

Wiele się mówi o Bayesie:

Twierdzenie Bayesa w Wikipedii
Dyskusja o kodowaniu horroru
Wielki esej o twierdzeniu Bayesa

Baw się dobrze!

Inne posty z tej serii

Krótkie wprowadzenie do prawdopodobieństwa & Statystyka
Intuicyjne (i krótkie) wyjaśnienie Bayesa „Twierdzenie
Zrozumienie twierdzenia Bayesa ze współczynnikami
Zrozumienie problemu Montyego Halla
Jak analizować dane przy użyciu średniej
Zrozumienie urodzin Paradoks

admin