Granica decyzji - Decision boundary

W problemie klasyfikacji statystycznej z dwiema klasami, granica decyzyjna lub powierzchnia decyzyjna jest hiperpowierzchnią, która dzieli bazową przestrzeń wektorową na dwa zbiory, po jednym dla każdej klasy. Klasyfikator sklasyfikuje wszystkie punkty po jednej stronie granicy decyzji jako należące do jednej klasy, a wszystkie po drugiej stronie jako należące do drugiej klasy.

Granicą decyzyjną jest obszar przestrzeni problemu, w którym etykieta wyjściowa klasyfikatora jest niejednoznaczna.

Jeśli powierzchnią decyzyjną jest hiperpłaszczyzna , to problem klasyfikacji jest liniowy, a klasy można rozdzielić liniowo .

Granice decyzyjne nie zawsze są jasno określone. Oznacza to, że przejście z jednej klasy w przestrzeni cech do innej nie jest przerywane, ale stopniowe. Efekt ten jest powszechny w algorytmach klasyfikacji opartych na logice rozmytej, w których przynależność do jednej lub drugiej klasy jest niejednoznaczna.

W sieciach neuronowych i modelach wektorowych wsparcia

W przypadku sztucznych sieci neuronowych lub perceptronów opartych na propagacji wstecznej rodzaj granicy decyzyjnej, której sieć może się nauczyć, zależy od liczby ukrytych warstw, które ma sieć. Jeśli nie ma ukrytych warstw, może uczyć się tylko problemów liniowych. Jeśli to ma jedną warstwę ukrytą, to może nauczyć każdą funkcję ciągłą na zwartych podzbiorów w R n , jak pokazano przez Universalu przybliżenie twierdzenie , co może mieć dowolną granicę decyzji.

W szczególności maszyny wektorów nośnych znajdują hiperpłaszczyznę, która oddziela przestrzeń cech na dwie klasy z maksymalnym marginesem . Jeśli problem nie jest pierwotnie rozłączalny liniowo, sztuczka jądra może zostać wykorzystana do przekształcenia go w problem, który można rozdzielić liniowo, zwiększając liczbę wymiarów. W ten sposób ogólna hiperpowierzchnia w małej przestrzeni wymiarowej zostaje zamieniona w hiperpłaszczyznę w przestrzeni o znacznie większych wymiarach.

Sieci neuronowe próbują poznać granicę decyzyjną, która minimalizuje błąd empiryczny, podczas gdy maszyny wektorów nośnych próbują poznać granicę decyzyjną, która maksymalizuje margines empiryczny między granicą decyzji a punktami danych.

Bibliografia