Intuicyjne (i krótkie) wyjaśnienie twierdzenia Bayesa

Filtrowanie spamu na podstawie czarnej listy jest wadliwe – jest zbyt restrykcyjne, a fałszywe alarmy są za dobrze. Ale filtrowanie bayesowskie daje nam kompromis – używamy prawdopodobieństw. Analizując słowa w wiadomości, możemy obliczyć prawdopodobieństwo, że jest to spam (zamiast podejmować decyzję tak / nie). Jeśli wiadomość ma 99,9% szans na bycie spamem, prawdopodobnie tak jest. Gdy filtr jest szkolony z coraz większą liczbą wiadomości, aktualizuje on prawdopodobieństwo, że określone słowa prowadzą do wiadomości spamowych. Zaawansowane filtry bayesowskie mogą badać wiele słów z rzędu, jako kolejny punkt danych.

Dodatkowe informacje

Wiele się mówi o Bayesie:

  • Twierdzenie Bayesa w Wikipedii
  • Dyskusja o kodowaniu horroru
  • Wielki esej o twierdzeniu Bayesa

Baw się dobrze!

Inne posty z tej serii

  1. Krótkie wprowadzenie do prawdopodobieństwa & Statystyka
  2. Intuicyjne (i krótkie) wyjaśnienie Bayesa „Twierdzenie
  3. Zrozumienie twierdzenia Bayesa ze współczynnikami
  4. Zrozumienie problemu Montyego Halla
  5. Jak analizować dane przy użyciu średniej
  6. Zrozumienie urodzin Paradoks

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *