Analiza Procrustes - Procrustes analysis

Nakłania nałożenie. Rysunek pokazuje trzy etapy transformacji zwykłego Procrustes, pasującego do dwóch konfiguracji punktów orientacyjnych. (a) Skalowanie obu konfiguracji do tego samego rozmiaru; (b) przeniesienie do tego samego położenia środka ciężkości; (c) Obrót do orientacji, która zapewnia minimalną sumę kwadratów odległości między odpowiednimi punktami orientacyjnymi.

W statystykach , analiza prokrust jest formą analizy kształtu statystycznych stosowanych do analizy rozkładu zestawu kształtów . Imię Prokrustes ( greckie : Προκρούστης ) odnosi się do bandyty z mitologii greckiej, który zmuszał swoje ofiary do dopasowania do łóżka, albo poprzez rozciąganie kończyn, albo odcinanie ich.

W matematyce:

  • prostopadłe prokrust problemem jest sposób, który może być stosowany, aby znaleźć się optymalną rotację i / lub odbicia (to znaczy optymalny prostopadłe transformacji liniowej) dla prokrust superpozycji (PS) przedmiotu w stosunku do drugiego.
  • ograniczony ortogonalny problem Procrustesa, podlegający det ( R ) = 1 (gdzie R jest macierzą rotacji), jest metodą, którą można wykorzystać do wyznaczenia optymalnego obrotu dla PS obiektu względem innego (odbicie jest niedozwolone ). W niektórych kontekstach metoda ta nazywana jest algorytmem Kabscha .

Kiedy kształt jest porównywany z innym lub zestaw kształtów jest porównywany z dowolnie wybranym kształtem referencyjnym, analiza Procrustes jest czasami dalej kwalifikowana jako klasyczna lub zwykła , w przeciwieństwie do analizy Generalized Procrustes (GPA), która porównuje trzy lub więcej kształtów z optymalnie określony „średni kształt”.

Wprowadzenie

Aby porównać kształty dwóch lub więcej obiektów, należy je najpierw optymalnie „nałożyć”. Nakładanie Prokrustes (PS) jest realizowane poprzez optymalne przesuwanie , obracanie i równomierne skalowanie obiektów. Innymi słowy, zarówno rozmieszczenie w przestrzeni, jak i rozmiar obiektów można dowolnie dostosowywać. Celem jest uzyskanie podobnego położenia i rozmiaru poprzez zminimalizowanie miary różnicy kształtów zwanej odległością Prokrustesa między obiektami. Nazywa się to czasem pełnym , w przeciwieństwie do częściowego PS, w którym skalowanie nie jest wykonywane (tj. Zachowywany jest rozmiar obiektów). Zauważ, że po pełnym PS obiekty będą dokładnie pokrywać się, jeśli ich kształt będzie identyczny. Na przykład przy pełnym PS dwie kule o różnych promieniach zawsze będą się pokrywać, ponieważ mają dokładnie ten sam kształt. I odwrotnie, z częściowym PS nigdy się nie zbiegną. Oznacza to, że zgodnie ze ścisłą definicją terminu kształt w geometrii , analiza kształtu powinna być przeprowadzana przy użyciu pełnego PS. Analiza statystyczna oparta na częściowym PS nie jest czystą analizą kształtu, ponieważ jest wrażliwa nie tylko na różnice kształtu, ale także na różnice w wielkości. Zarówno pełne, jak i częściowe PS nigdy nie zdążą idealnie dopasować dwóch obiektów o różnym kształcie, takich jak sześcian i kula, czy prawa ręka i lewa ręka.

W niektórych przypadkach zarówno pełne, jak i częściowe PS mogą również obejmować odbicie . Refleksja pozwala na przykład na udane (możliwie doskonałe) nałożenie prawej ręki na lewą. Tak więc częściowy PS z włączonym odbiciem zachowuje rozmiar, ale umożliwia translację, obrót i odbicie, podczas gdy pełny PS z włączonym odbiciem umożliwia translację, obrót, skalowanie i odbicie.

Optymalne tłumaczenie i skalowanie są określane za pomocą znacznie prostszych operacji (patrz poniżej).

Analiza zwyczajnych prokurentów

Tutaj rozważymy tylko obiekty utworzone ze skończonej liczby k punktów w n wymiarach. Często punkty te są wybierane na ciągłej powierzchni złożonych obiektów, takich jak ludzka kość, iw tym przypadku nazywane są punktami orientacyjnymi .

Kształt obiektu można uznać za element klasy równoważności utworzonej przez usunięcie translacyjnych , obrotowych i jednorodnych komponentów skalowania .

Tłumaczenie

Na przykład, komponenty translacyjne można usunąć z obiektu poprzez przesunięcie obiektu tak, aby średnia wszystkich punktów obiektu (tj. Jego środka ciężkości ) znajdowała się na początku.

Matematycznie: powiedzmy, weź punkty w dwóch wymiarach

.

Średnia z tych punktów jest gdzie

Teraz przetłumacz te punkty, aby ich średnia została przetłumaczona na początek , podając punkt .

Jednolite skalowanie

Podobnie, składnik skali można usunąć przez skalowanie obiektu tak, aby średnia kwadratowa odległość ( RMSD ) z punktów do przesuniętego początku wynosiła 1. Ta RMSD jest statystyczną miarą skali lub rozmiaru obiektu :

Skala przyjmuje wartość 1, gdy współrzędne punktu są podzielone przez początkową skalę obiektu:

.

Zauważ, że w literaturze czasami używane są inne metody definiowania i usuwania skali.

Obrót

Usunięcie elementu obrotowego jest bardziej skomplikowane, ponieważ standardowa orientacja odniesienia nie zawsze jest dostępna. Rozważ dwa obiekty złożone z tej samej liczby punktów z usuniętą skalą i translacją. Niech punkty to być , . Jeden z tych obiektów może służyć jako orientacja odniesienia. Zamocuj obiekt odniesienia i obracaj drugi wokół punktu początkowego, aż znajdziesz optymalny kąt obrotu, tak aby suma kwadratów odległości ( SSD ) między odpowiednimi punktami była zminimalizowana (przykład techniki najmniejszych kwadratów ).

Daje obrót o kąt

.

gdzie (u, v) są współrzędnymi obróconego punktu. Biorąc pochodną w odniesieniu do i rozwiązując, gdy pochodna wynosi zero, daje

Gdy obiekt jest trójwymiarowy, optymalny obrót jest reprezentowany przez macierz obrotu 3 na 3 R zamiast prostego kąta, iw tym przypadku dekompozycja wartości osobliwych może być wykorzystana do znalezienia optymalnej wartości dla R (patrz: rozwiązanie ograniczonego problemu ortogonalnego Prokrustesa , z zastrzeżeniem det ( R ) = 1).

Porównanie kształtów

Różnicę między kształtem dwóch obiektów można ocenić dopiero po „nałożeniu” tych dwóch obiektów poprzez ich translację, skalowanie i optymalne obracanie, jak wyjaśniono powyżej. Pierwiastek kwadratowy z wyżej wymienionego dysku SSD między odpowiednimi punktami może być użyty jako statystyczna miara tej różnicy w kształcie:

Ta miara jest często nazywana odległością Prokrustes . Zauważ, że inne, bardziej złożone definicje odległości Prokrustesa i inne miary „różnicy kształtu” są czasami używane w literaturze.

Nakładanie zestawu kształtów

Pokazaliśmy, jak nałożyć dwa kształty. Tę samą metodę można zastosować do nałożenia zestawu trzech lub większej liczby kształtów, o ile wspomniana powyżej orientacja odniesienia jest używana dla wszystkich z nich. Jednak analiza Uogólnione Procrustes zapewnia lepszą metodę osiągnięcia tego celu.

Analiza uogólnionych Procrustes (GPA)

GPA stosuje metodę analizy Procrustes w celu optymalnego nałożenia zestawu obiektów, zamiast nakładania ich na dowolnie wybrany kształt.

Uogólniona i zwykła analiza Prokrustesa różni się jedynie określeniem orientacji odniesienia dla obiektów, która w pierwszej technice jest optymalnie określona, ​​aw drugiej dowolnie dobierana. Skalowanie i tłumaczenie są wykonywane w ten sam sposób w obu technikach. Kiedy porównuje się tylko dwa kształty, GPA jest odpowiednikiem zwykłej analizy Procrustes.

Zarys algorytmu jest następujący:

  1. dowolnie wybierz kształt odniesienia (zazwyczaj wybierając go spośród dostępnych wystąpień)
  2. nałóż wszystkie wystąpienia na bieżący kształt odniesienia
  3. obliczyć średni kształt bieżącego zestawu nałożonych kształtów
  4. jeśli odległość Procrustesa między średnią a kształtem odniesienia jest powyżej progu, ustaw odniesienie na średni kształt i przejdź do kroku 2.

Wariacje

Istnieje wiele sposobów przedstawiania kształtu przedmiotu. Kształt obiektu można traktować jako element klasy równoważności utworzonej przez wzięcie zbioru wszystkich zbiorów k punktów w n wymiarach, czyli R kn i wyodrębnienie zbioru wszystkich translacji, obrotów i skalowań. Określoną reprezentację kształtu można znaleźć, wybierając określoną reprezentację klasy równoważności. To da rozmaitość o wymiarze kn -4. Prokrustes to jedna z metod, która ma szczególne uzasadnienie statystyczne.

Bookstein uzyskuje odwzorowanie kształtu poprzez ustalenie położenia dwóch punktów zwanych linią podstaw. Jeden punkt zostanie ustalony na początku, a drugi na (1,0), pozostałe punkty tworzą współrzędne Booksteina .

Często bierze się pod uwagę kształt i skalę , w przypadku których usunięto komponenty translacyjne i obrotowe.

Przykłady

Analiza kształtu jest wykorzystywana w danych biologicznych do identyfikacji zmian cech anatomicznych charakteryzowanych przez dane charakterystyczne, na przykład przy rozważaniu kształtu kości szczęki.

W jednym z badań Davida George'a Kendalla zbadano trójkąty utworzone przez stojące kamienie, aby wywnioskować, czy często są one ułożone w linii prostej. Kształt trójkąta można przedstawić jako punkt na kuli, a rozkład wszystkich kształtów można traktować jako rozkład na kuli. Rozkład próbki ze stojących kamieni porównano z rozkładem teoretycznym, aby wykazać, że występowanie prostych było nie więcej niż przeciętne.

Zobacz też

Bibliografia

  • FL Bookstein, Morphometric tools for landmark data , Cambridge University Press, (1991).
  • JC Gower, GB Dijksterhuis, Procrustes Problems , Oxford University Press (2004).
  • ILDryden, KV Mardia, Statistical Shape Analysis , Wiley, Chichester, (1998).

Linki zewnętrzne