Filogenetyczne metody porównawcze - Phylogenetic comparative methods

Filogenetyczne metody porównawcze ( PCM ) wykorzystują informacje o historycznych związkach rodów ( filogenezy ) do testowania hipotez ewolucyjnych. Metoda porównawcza ma długą historię w biologii ewolucyjnej; rzeczywiście, Karol Darwin wykorzystał różnice i podobieństwa między gatunkami jako główne źródło dowodów w O powstawaniu gatunków . Jednak fakt, że blisko spokrewnione rody mają wiele cech i kombinacji cech w wyniku procesu pochodzenia z modyfikacją oznacza, że ​​rody nie są niezależne. Ta realizacja zainspirowała rozwój wyraźnie filogenetycznych metod porównawczych. Początkowo metody te zostały opracowane przede wszystkim w celu kontroli historii filogenetycznej podczas testowania adaptacji ; jednak w ostatnich latach użycie tego terminu rozszerzyło się na wszelkie użycie filogenezy w testach statystycznych. Chociaż większość badań wykorzystujących PCM koncentruje się na istniejących organizmach, wiele metod można również zastosować do wymarłych taksonów i mogą uwzględniać informacje z zapisu kopalnego .

PCM można ogólnie podzielić na dwa rodzaje podejść: te, które wnioskować o historii ewolucyjnej jakiegoś charakteru ( fenotypowego lub genetycznego ) w całej filogenezie i te, które wnioskować o samym procesie ewolucyjnego rozgałęzienia ( wskaźniki dywersyfikacji ), chociaż istnieją pewne podejścia, które oba jednocześnie. Zazwyczaj drzewo, które jest używane w połączeniu z PCM, zostało oszacowane niezależnie (patrz filogenetyka obliczeniowa ), tak że zakłada się, że znane są zarówno relacje między liniami, jak i długość gałęzi, które je oddzielają.

Aplikacje

Filogenetyczne podejścia porównawcze mogą uzupełniać inne sposoby badania adaptacji, takie jak badanie populacji naturalnych, badania eksperymentalne i modele matematyczne. Porównania międzygatunkowe pozwalają naukowcom ocenić ogólność zjawisk ewolucyjnych poprzez rozważenie niezależnych zdarzeń ewolucyjnych. Takie podejście jest szczególnie przydatne, gdy zmienność w obrębie gatunku jest niewielka lub nie ma jej wcale. A ponieważ można ich używać do jawnego modelowania procesów ewolucyjnych zachodzących w bardzo długich okresach czasu, mogą zapewnić wgląd w zagadnienia makroewolucyjne, niegdyś wyłączną domenę paleontologii .

Zasięg występowania 49 gatunków ssaków w zależności od wielkości ciała . Gatunki o większych ciałach mają zwykle większy zasięg występowania, ale przy dowolnej wielkości ciała przedstawiciele rzędu Carnivora ( mięsożercy i wszystkożercy ) mają zwykle większy zasięg występowania niż zwierzęta kopytne (z których wszystkie są roślinożercami ). To, czy ta różnica jest uważana za statystycznie istotną, zależy od rodzaju zastosowanej analizy
Masa jąder różnych gatunków naczelnych w zależności od wielkości ciała i systemu kojarzeń. Gatunki o większych ciałach mają zwykle większe jądra, ale przy dowolnej wielkości ciała gatunki, w których samice mają tendencję do kojarzenia się z wieloma samcami, mają samce z większymi jądrami.

Filogenetyczne metody porównawcze są powszechnie stosowane do takich pytań jak:

Przykład: jak masa mózgu zmienia się w stosunku do masy ciała ?

  • Czy różne klady organizmów różnią się pod względem jakiejś cechy fenotypowej ?

Przykład: czy psowate mają większe serca niż kotowate ?

Przykład: czy mięsożercy mają większy zasięg domowy niż roślinożercy?

Przykład: gdzie ewoluowała endotermia w linii, która doprowadziła do powstania ssaków?

Przykład: gdzie, kiedy i dlaczego ewoluowały łożyska i żywotność ?

  • Czy cecha wykazuje znaczący sygnał filogenetyczny w określonej grupie organizmów? Czy niektóre typy cech mają tendencję do „podążania za filogenezą” bardziej niż inne?

Przykład: czy cechy behawioralne są bardziej niestabilne podczas ewolucji?

Przykład: dlaczego gatunki o małych ciałach żyją krócej niż ich więksi krewni?

Filogenetycznie niezależne kontrasty

Standaryzowane kontrasty są używane w konwencjonalnych procedurach statystycznych, z ograniczeniem, że wszystkie regresje , korelacje , analiza kowariancji itp. muszą przejść przez źródło.

Felsenstein zaproponował w 1985 roku pierwszą ogólną metodę statystyczną do włączania informacji filogenetycznych, tj. pierwszą, która mogła wykorzystywać dowolną topologię (kolejność rozgałęzień) i określony zestaw długości rozgałęzień. Metoda jest obecnie uznawana za algorytm, który implementuje szczególny przypadek tak zwanych filogenetycznych uogólnionych modeli najmniejszych kwadratów . Logika metody jest użycie filogenicznej informacje (oraz zakładaną ruchy Browna podobnego modelu ewolucji cecha), aby przekształcić dane pierwotne końcówki (wartości średnie dla zestawu gatunków) do wartości, które są statystycznie niezależne i identycznie rozmieszczone .

Algorytm obejmuje obliczanie wartości w węzłach wewnętrznych jako krok pośredni, ale generalnie nie są one używane do samodzielnego wnioskowania . Wyjątkiem jest węzeł podstawowy (korzeniowy), który można interpretować jako oszacowanie wartości przodków dla całego drzewa (przy założeniu, że nie wystąpiły żadne kierunkowe trendy ewolucyjne [np . reguła Cope'a ]) lub jako filogenetycznie ważone oszacowanie średnia dla całego zestawu gatunków wierzchołkowych (taksony końcowe). Wartość pierwiastka jest równoważna tej otrzymanej z algorytmu „kwadratowej zmiany parsymonii” i jest również oszacowaniem największego prawdopodobieństwa w ruchu Browna. Algebry niezależnych kontrastów można również użyć do obliczenia błędu standardowego lub przedziału ufności .

Filogenetyczne uogólnione najmniejszych kwadratów (PGLS)

Prawdopodobnie najczęściej stosowanym PCM jest filogenetyczne uogólnione najmniejsze kwadraty (PGLS). To podejście służy do testowania, czy istnieje związek między dwiema (lub więcej) zmiennymi, biorąc pod uwagę fakt, że rodowód nie jest niezależny. Metoda jest szczególnym przypadkiem uogólnionych najmniejszych kwadratów (GLS) i jako taki estymator PGLS jest również bezstronny , spójny , wydajny i asymptotycznie normalny . W wielu sytuacjach statystycznych, w których stosuje się GLS (lub zwykłe najmniejszych kwadratów [OLS]) błędy resztowe ε są uważane za niezależne i identycznie rozłożone zmienne losowe, które przyjmuje się za normalne

natomiast w PGLS zakłada się rozkład błędów jako

gdzie V jest macierzą oczekiwanej wariancji i kowariancji reszt przy danym modelu ewolucyjnym i drzewie filogenetycznym. Dlatego to struktura reszt, a nie same zmienne, pokazują sygnał filogenetyczny . Od dawna jest to źródłem zamieszania w literaturze naukowej. Zaproponowano szereg modeli struktury V, takich jak ruchy Browna Ornsteina-Uhlenbecka i model λ Pagela. (Kiedy używany jest model ruchu Browna, PGLS jest identyczny z niezależnym estymatorem kontrastów). W PGLS parametry modelu ewolucyjnego są zazwyczaj współestymowane z parametrami regresji.

PGLS można zastosować tylko do pytań, w których zmienna zależna ma rozkład ciągły; jednak drzewo filogenetyczne można również włączyć do rozkładu rezydualnego uogólnionych modeli liniowych , umożliwiając uogólnienie podejścia do szerszego zestawu rozkładów odpowiedzi.

Symulacje komputerowe Monte Carlo oparte na informacjach filogenetycznych

Dane dla cechy o wartości ciągłej można symulować w taki sposób, że taksony znajdujące się na wierzchołkach hipotetycznego drzewa filogenetycznego będą wykazywać sygnał filogenetyczny, tj. blisko spokrewnione gatunki będą przypominać się nawzajem.

Martins i Garland zaproponowali w 1991 roku, że jednym ze sposobów wyjaśnienia relacji filogenetycznych podczas przeprowadzania analiz statystycznych jest wykorzystanie symulacji komputerowych do stworzenia wielu zestawów danych, które są zgodne z testowaną hipotezą zerową (np. brak korelacji między dwiema cechami, brak różnicy między dwoma ekologicznie zdefiniowane grupy gatunków), ale naśladują ewolucję wzdłuż odpowiedniego drzewa filogenetycznego. Jeśli takie zestawy danych (zwykle 1000 lub więcej) są analizowane za pomocą tej samej procedury statystycznej, która jest używana do analizy rzeczywistego zestawu danych, wyniki dla zestawów danych symulowanych mogą być użyte do stworzenia filogenetycznie poprawnego (lub „PC”) rozkładów zerowych statystyka testu (np. współczynnik korelacji, t, F). Takie podejścia symulacyjne można również łączyć z takimi metodami, jak filogenetycznie niezależne kontrasty lub PGLS (patrz wyżej).

Pseudoreplikacja filogenetyczna.jpg

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki

Czasopisma

Pakiety oprogramowania (lista niepełna)

Laboratoria