Wyznacznik - Determinant

W matematyce The determinantą jest wartością skalarną , która to funkcja z wpisów w macierzy kwadratowej . Pozwala scharakteryzować niektóre właściwości macierzy i odwzorowania liniowego reprezentowanego przez macierz. W szczególności wyznacznik jest niezerowy wtedy i tylko wtedy, gdy macierz jest odwracalna, a odwzorowanie liniowe reprezentowane przez macierz jest izomorfizmem . Wyznacznik iloczynu macierzy jest iloczynem ich wyznaczników (poprzednia własność jest następstwem tej). Wyznacznik macierzy A oznaczamy det( A ) , det A lub | | .

W przypadku macierzy 2 × 2 wyznacznik można zdefiniować jako

Podobnie, dla macierzy 3 × 3 A , jej wyznacznikiem jest

Każdy wyznacznik macierzy 2 × 2 w tym równaniu nazywa się podrzędną macierzy A . Ta procedura może zostać rozszerzona, aby dać rekurencyjną definicję wyznacznika macierzy n × n , znaną jako rozwinięcie Laplace'a .

Wyznaczniki występują w całej matematyce. Na przykład macierz jest często używana do reprezentowania współczynników w układzie równań liniowych , a wyznaczniki mogą być używane do rozwiązywania tych równań ( reguła Cramera ), chociaż inne metody rozwiązywania są znacznie bardziej wydajne obliczeniowo. Wyznaczniki służą do definiowania charakterystycznego wielomianu macierzy, którego pierwiastkami są wartości własne . W geometrii , podpisany n wymiarową objętość z n -wymiarowej równoległościanu wyraża determinantę. Jest to wykorzystywane w rachunku różniczkowym z zewnętrznymi formami różniczkowymi i wyznacznikiem jakobianu , w szczególności do zmian zmiennych w całkach wielokrotnych .

2 × 2 macierze

Wyznacznik matrycy 2 × 2 jest oznaczony jako „det” lub pionowymi paskami wokół matrycy i jest zdefiniowany jako

Na przykład,

Pierwsze właściwości

Wyznacznik ma kilka kluczowych właściwości, które można udowodnić przez bezpośrednią ocenę definicji macierzy -, i które nadal obowiązują dla wyznaczników większych macierzy. Są one następujące: po pierwsze, wyznacznikiem macierzy jednostkowej jest 1. Po drugie, wyznacznikiem jest zero, jeśli dwa wiersze są takie same:

Podobnie jest, jeśli dwie kolumny są takie same. Ponadto,

Wreszcie, jeśli jakakolwiek kolumna jest pomnożona przez pewną liczbę (tj. wszystkie wpisy w tej kolumnie są pomnożone przez tę liczbę), wyznacznik jest również mnożony przez tę liczbę:

Znaczenie geometryczne

Pole powierzchni równoległoboku jest wartością bezwzględną wyznacznika macierzy utworzonej przez wektory reprezentujące boki równoległoboku.

Jeśli wpisy macierzy są liczbami rzeczywistymi, macierz A może być użyta do reprezentowania dwóch odwzorowań liniowych : jednej, która odwzorowuje standardowe wektory bazowe na wiersze A , i drugiej, która odwzorowuje je na kolumny A . W obu przypadkach obrazy wektorów bazowych tworzą równoległobok, który reprezentuje obraz kwadratu jednostkowego pod mapowaniem. Równoległobok określone przez rzędy powyższej macierzy jest jednym z wierzchołków w (0, 0) , ( , b ) , ( + c , b + d ) , i ( c , d ) , jak pokazano na załączonym diagram.

Wartość bezwzględna adbc jest polem równoległoboku, a zatem reprezentuje współczynnik skali, o który pola są przekształcane przez A . (Równoległobok utworzony przez kolumny A jest ogólnie innym równoległobokiem, ale ponieważ wyznacznik jest symetryczny względem rzędów i kolumn, obszar będzie taki sam.)

Wartość bezwzględna wyznacznika wraz ze znakiem staje się zorientowanym obszarem równoległoboku. Obszar zorientowany jest taki sam jak obszar zwykły , z tym wyjątkiem, że jest ujemny, gdy kąt od pierwszego do drugiego wektora definiującego równoległobok obraca się w kierunku zgodnym z ruchem wskazówek zegara (który jest przeciwny do kierunku, jaki uzyskano by dla macierzy jednostkowej ).

Aby pokazać, że adbc jest polem ze znakiem , można rozważyć macierz zawierającą dwa wektory u ≡ ( a , b ) i v ≡ ( c , d ) reprezentujące boki równoległoboku. Podpisany obszar można wyrazić jako | ty | | v | sin  θ dla kąta θ między wektorami, który jest po prostu podstawą razy wysokość, długość jednego wektora razy prostopadła składowa drugiego. Ze względu na sinus jest to już obszar ze znakiem , ale wygodniej można go wyrazić za pomocą cosinusa kąta komplementarnego do wektora prostopadłego, np. u = (− b , a ) , tak że | ty | | v | cos  θ′ , który można określić wzorem iloczynu skalarnego równym adbc :

Objętość tego równoległościanu jest wartością bezwzględną wyznacznika macierzy utworzonej przez kolumny skonstruowane z wektorów r1, r2 i r3.

Zatem wyznacznik podaje współczynnik skalowania i orientację wywołaną przez odwzorowanie reprezentowane przez A . Gdy wyznacznik jest równy jeden, odwzorowanie liniowe zdefiniowane przez macierz jest równopowierzchniowe i zachowuje orientację.

Obiekt znany jako dwuwektor jest powiązany z tymi pomysłami. 2D, może być interpretowane jako zorientowany segmentu płaszczyzny utworzonej przez wyobrazić sobie dwa wektory każdy z pochodzenia (0, 0) , i współrzędne ( , b ) i ( c , d ) . Wielkość dwuwektorowa (oznaczona przez ( a , b ) ∧ ( c , d ) ) to obszar znaku , który jest również wyznacznikiem adbc .

Jeśli n × n rzeczywista macierz A jest zapisana w postaci jej wektorów kolumnowych , to

Oznacza to, że odwzorowuje jednostkę n- sześcianu na n- wymiarowy równoległotop zdefiniowany przez wektory regionu

Wyznacznik daje podpisany n wymiarową objętości tego parallelotope, a więc opisuje bardziej ogólnie, N -wymiarową współczynnika skalowania głośności na liniowej transformacji wytwarzanego przez A . (Znak pokazuje, czy transformacja zachowuje, czy odwraca orientację .) W szczególności, jeśli wyznacznikiem jest zero, to ten równoległobok ma objętość zero i nie jest w pełni n- wymiarowy, co wskazuje, że wymiar obrazu A jest mniejszy niż n . Oznacza to, że A wytwarza transformację liniową, która nie jest ani na, ani jeden do jednego , a więc nie jest odwracalna.

Definicja

W sequelu A jest kwadratową macierzą z n wierszami i n kolumnami, dzięki czemu można ją zapisać jako

Wpisy itp. są w wielu przypadkach liczbami rzeczywistymi lub zespolonymi. Jak omówiono poniżej, wyznacznik jest również zdefiniowany dla macierzy, których wpisy są elementami bardziej abstrakcyjnych struktur algebraicznych, znanych jako pierścienie przemienne .

Wyznacznik A jest oznaczany przez det( A ) lub może być oznaczony bezpośrednio w kategoriach wpisów macierzowych, pisząc zamknięte kreski zamiast nawiasów:

Istnieją różne równoważne sposoby definiowania wyznacznika macierzy kwadratowej A , tj. o tej samej liczbie wierszy i kolumn: wyznacznik można zdefiniować za pomocą formuły Leibniza , wyraźnej formuły zawierającej sumy iloczynów niektórych wpisów macierzy. Wyznacznik można również scharakteryzować jako unikalną funkcję zależną od wpisów macierzy spełniających określone właściwości. Podejście to można również wykorzystać do obliczenia wyznaczników poprzez uproszczenie danych macierzy.

Wzór Leibniza

Wzór Leibniza na wyznacznik macierzy 3 × 3 jest następujący:

Reguła sarrusa jest pamięciowy dla tego wzoru: suma produktów z trzech przekątnej północny-zachód do linii południowo-wschodniej części elementów macierzy, minus suma produktów z trzech przekątnej południowym zachodzie do północno-wschodniej linii pierwiastków , gdy obok niej napisane są kopie dwóch pierwszych kolumn matrycy, jak na ilustracji:

Schemat sarrus-regel.png

Ten schemat obliczania wyznacznika macierzy 3 × 3 nie przenosi się na wyższe wymiary.

n × n macierze

Formuła Leibniza na wyznacznik macierzy -jest bardziej złożonym , ale powiązanym wyrażeniem. Jest to wyrażenie obejmujące pojęcie permutacji i ich sygnaturę . Permutacja zbioru to funkcja, która zmienia kolejność tego zbioru liczb całkowitych. Wartość na -tej pozycji po zmianie kolejności jest oznaczona przez . Zbiór wszystkich takich permutacji, tzw. grupa symetryczna , jest oznaczony . Sygnaturę określa się, gdy zmiana kolejności podana przez σ może być osiągnięta przez sukcesywną zamianę dwóch wpisów parzystą liczbę razy, i zawsze, gdy można to osiągnąć przez nieparzystą liczbę takich wymian. Biorąc pod uwagę macierz i permutację , iloczyn

jest również napisane krócej za pomocą notacji Pi, jako

.

Używając tych pojęć, definicja wyznacznika za pomocą wzoru Leibniza to:

suma obejmująca wszystkie permutacje, gdzie każda suma jest iloczynem wpisów macierzy pomnożonych przez znak w zależności od permutacji.

Poniższa tabela rozwija te terminy w przypadku . W pierwszej kolumnie permutacja jest wymieniona zgodnie z jej wartościami. Na przykład w drugim rzędzie permutacja spełnia . Można go uzyskać ze zlecenia standardowego (1, 2, 3) przez pojedynczą giełdę (zamiana drugiego i trzeciego wpisu), tak aby jego podpis był .

Permutacje i ich wkład w wyznacznik
Permutacja
1, 2, 3
1, 3, 2
3, 1, 2
3, 2, 1
2, 3, 1
2, 1, 3

Suma sześciu warunków w trzeciej kolumnie brzmi

Daje to z powrotem wzór na -macierze powyżej. Dla ogólnej macierzy wzór Leibniza obejmuje ( n silni ) sumy, z których każda jest iloczynem n wpisów macierzy.

Wzór Leibniza można również wyrazić za pomocą sumowania, w którym występują nie tylko permutacje, ale wszystkie sekwencje indeksów w zakresie . W tym celu zamiast znaku permutacji używa się symbolu Levi-Civita

Daje to powyższy wzór, ponieważ symbol Levi-Civita wynosi zero, jeśli indeksy nie tworzą permutacji.

Właściwości wyznacznika

Charakterystyka wyznacznika

Wyznacznik można scharakteryzować za pomocą następujących trzech kluczowych właściwości. Aby to stwierdzić, wygodnie jest uznać macierz A jako złożoną z jej kolumn, tak oznaczoną jako

gdzie wektor kolumnowy (dla każdego i ) składa się z wpisów macierzy w i- tej kolumnie.

  1. , gdzie jest macierzą tożsamości .
  2. Wyznacznik jest wieloliniowy : jeśli j- ta kolumna macierzy jest zapisana jako liniowa kombinacja dwóch wektorów kolumnowych v i w oraz liczby r , to wyznacznik A można wyrazić jako podobną kombinację liniową:
  3. Wyznacznik jest naprzemienny : ilekroć dwie kolumny macierzy są identyczne, jej wyznacznikiem jest 0:

Jeśli wyznacznik jest zdefiniowany za pomocą wzoru Leibniza jak powyżej, te trzy właściwości można udowodnić przez bezpośrednią kontrolę tego wzoru. Niektórzy autorzy również podchodzą do wyznacznika bezpośrednio posługując się tymi trzema właściwościami: można wykazać, że istnieje dokładnie jedna funkcja, która przypisuje dowolnej -macierz A liczbę spełniającą te trzy właściwości. Pokazuje to również, że bardziej abstrakcyjne podejście do wyznacznika daje taką samą definicję, jak przy użyciu wzoru Leibniza.

Aby to zobaczyć, wystarczy rozszerzyć wyznacznik o wieloliniowość w kolumnach do (ogromnej) liniowej kombinacji wyznaczników macierzy, w której każda kolumna jest standardowym wektorem bazowym. Te wyznaczniki to albo 0 (według właściwości 9) albo ±1 (według właściwości 1 i 12 poniżej), więc kombinacja liniowa daje powyższe wyrażenie w postaci symbolu Levi-Civita. Choć z pozoru mniej technicznego, charakterystyka ta nie może całkowicie zastąpić formuły Leibniza w definiowaniu wyznacznika, ponieważ bez niej istnienie odpowiedniej funkcji nie jest jasne.

Natychmiastowe konsekwencje

Zasady te mają kilka dalszych konsekwencji:

(dla macierzy ).
  • Zamiana dowolnej pary kolumn macierzy mnoży jej wyznacznik przez -1. Wynika to z wyznacznika wieloliniowego i przemiennego (właściwości 2 i 3 powyżej):
Ta formuła może być stosowana iteracyjnie w przypadku zamiany kilku kolumn. Na przykład
Jeszcze bardziej ogólnie, każda permutacja kolumn mnoży wyznacznik przez znak permutacji.
  • Jeśli jakaś kolumna może być wyrażona jako liniowa kombinacja innych kolumn (tj. kolumny macierzy tworzą zbiór liniowo zależny ), wyznacznikiem jest 0. W szczególnym przypadku obejmuje to: jeśli jakaś kolumna jest taka, że ​​wszystkie jej wpisy są zerowe, to wyznacznikiem tej macierzy jest 0.
  • Dodanie skalarnej wielokrotności jednej kolumny do innej kolumny nie zmienia wartości wyznacznika. Jest to konsekwencja wieloliniowości i bycia alternatywnym: przez wieloliniowość wyznacznik zmienia się o wielokrotność wyznacznika macierzy o dwóch równych kolumnach, której wyznacznikiem jest 0, ponieważ wyznacznik jest naprzemienny.
  • Jeżeli jest macierzą trójkątną , czyli , kiedykolwiek lub alternatywnie, kiedykolwiek , to jej wyznacznik jest równy iloczynowi przekątnych:
Rzeczywiście, taką macierz można zredukować, odpowiednio dodając wielokrotności kolumn z mniejszą liczbą wpisów niezerowych do tych z większą liczbą wpisów, do macierzy diagonalnej (bez zmiany wyznacznika). Dla takiej macierzy, użycie liniowości w każdej kolumnie sprowadza się do macierzy identyczności, w którym to przypadku podany wzór jest zgodny z pierwszą cechą charakterystyczną wyznaczników. Alternatywnie ten wzór można również wywnioskować ze wzoru Leibniza, ponieważ jedyną permutacją, która daje niezerowy wkład, jest permutacja tożsamości.

Przykład

Wymienione powyżej właściwości charakteryzujące i ich konsekwencje są zarówno istotne teoretycznie, jak i mogą być również wykorzystywane do obliczania wyznaczników macierzy betonowych. W rzeczywistości eliminację Gaussa można zastosować do sprowadzenia dowolnej macierzy do postaci górnego trójkąta, a kroki tego algorytmu wpływają na wyznacznik w kontrolowany sposób. Poniższy konkretny przykład ilustruje obliczanie wyznacznika macierzy przy użyciu tej metody:

Tekst podpisu
Matryca

Zdobyty przez

dodaj drugą kolumnę do pierwszej

dodaj 3 razy trzecią kolumnę do drugiej

zamień pierwsze dwie kolumny

dodaj razy drugą kolumnę do pierwszej

Wyznacznik

Połączenie tych równości daje

Transponować

Wyznacznikiem Transpozycja o równy wyznacznik A :

.

Można to udowodnić, sprawdzając formułę Leibniza. Oznacza to, że we wszystkich właściwościach wymienionych powyżej słowo „kolumna” można w całym tekście zastąpić słowem „wiersz”. Na przykład, patrząc na macierz n × n jako złożoną z n wierszy, wyznacznikiem jest funkcja n- liniowa.

Multiplikatywność i grupy macierzowe

Zatem wyznacznikiem jest odwzorowanie multiplikatywne , tj. dla macierzy kwadratowych i równej wielkości wyznacznik iloczynu macierzy jest równy iloczynowi ich wyznaczników:

Ten kluczowy fakt można udowodnić, obserwując, że dla stałej macierzy , obie strony równania są przemienne i wieloliniowe jako funkcja w zależności od kolumn . Co więcej, oba przyjmują wartość, gdy jest macierzą tożsamości. Wspomniana powyżej unikalna charakterystyka przemiennych map wieloliniowych pokazuje zatem to twierdzenie.

Macierz jest odwracalna dokładnie, jeśli jej wyznacznik jest niezerowy. Wynika to z multiplikatywności i wzoru na odwrotność macierzy sprzężonej wymienionej poniżej. W tym przypadku wyznacznik macierzy odwrotnej jest podany przez

.

W szczególności iloczyny i odwrotności macierzy z niezerową determinantą (odpowiednio determinantą) nadal mają tę właściwość. Tak więc zbiór takich macierzy (o ustalonym rozmiarze ) tworzy grupę znaną jako ogólna grupa liniowa (odpowiednio podgrupa zwana specjalną grupą liniową . Bardziej ogólnie, słowo „specjalna” oznacza podgrupę innej grupy macierzy macierzy o wyznacznikiem 1. Przykładami są specjalna grupa ortogonalna (która, jeśli n wynosi 2 lub 3, to wszystkie macierze rotacji ) oraz specjalna grupa unitarna .

Wzór Cauchy'ego-Bineta jest uogólnieniem tego wzoru iloczynowego dla macierzy prostokątnych . Wzór ten można również przekształcić w wzór multiplikatywny dla macierzy złożonych, których wpisy są wyznacznikami wszystkich podmacierzy kwadratowych danej macierzy.

Ekspansja Laplace'a

Rozwinięcie Laplace'a wyraża wyznacznik macierzy w postaci wyznaczników mniejszych macierzy, zwanych jej podrzędnymi . Drugorzędna jest zdefiniowana jako wyznacznik macierzy, która wynika z usunięcia -tego wiersza i -tej kolumny. Wyrażenie jest znane jako kofaktor . Dla każdego ma się równość

co nazywa się ekspansją Laplace'a wzdłuż i- tego rzędu . Na przykład rozwinięcie Laplace'a wzdłuż pierwszego wiersza ( ) daje następującą formułę:

Rozwinięcie wyznaczników tych macierzy daje z powrotem wspomnianą wyżej formułę Leibniza. Podobnie rozwinięcie Laplace'a wzdłuż -tej kolumny to równość

Rozszerzenie Laplace'a może być używane iteracyjnie do obliczania wyznaczników, ale to podejście jest nieefektywne w przypadku dużych macierzy. Jest jednak przydatny do obliczania wyznaczników wysoce symetrycznej macierzy, takiej jak macierz Vandermonde

Wyznacznik ten został zastosowany np. w dowodzie twierdzenia Bakera w teorii liczb przestępnych .

Macierz sprzężenia

Matrycy adjugate jest transpozycję macierzy kofaktorów, to znaczy

Na każdą macierz przypada

Zatem macierz sprzężona może być użyta do wyrażenia odwrotności macierzy nieosobliwej :

Macierze blokowe

Powyższy wzór na wyznacznik a- macierzy nadal utrzymuje, przy odpowiednich dalszych założeniach, macierz blokową , tj. macierz złożoną z czterech podmacierzy o wymiarach odpowiednio , , i . Najłatwiejszą taką formułą, którą można udowodnić za pomocą formuły Leibniza lub faktoryzacji z udziałem dopełnienia Schura , jest

Jeśli jest odwracalny (i podobnie, jeśli jest odwracalny), trzeba:

Jeśli jest -macierzą, upraszcza się to do .

Jeśli bloki są macierzami kwadratowymi o tym samym rozmiarze, obowiązują dalsze formuły. Na przykład, jeśli i dojeżdżać (tj. ), to trzyma się

Wzór ten został uogólniony na macierze złożone z więcej niż bloków, ponownie w odpowiednich warunkach przemienności między poszczególnymi blokami.

Dla i obowiązuje następujący wzór (nawet jeśli i i B nie dojeżdżają)

Twierdzenie o wyznaczniku Sylwestra

Determinant twierdzenie Sylvester stwierdza się, że na A , w m x n matrycy i B , z n x m matrycy (tak i B mają wymiary umożliwiające ich mnoży się w dowolnej kolejności, tworząc macierz kwadratową)

gdzie I m i I n są odpowiednio macierzami tożsamości m × m i n × n .

Z tego ogólnego wyniku wynika kilka konsekwencji.

  1. Dla przypadku wektora kolumnowego c i wektora wierszowego r , każdy o m składowych, formuła pozwala na szybkie obliczenie wyznacznika macierzy różniącej się od macierzy jednostkowej macierzą rzędu 1:
  2. Bardziej ogólnie, dla dowolnej odwracalnej macierzy m × m X ,
  3. Dla wektora kolumnowego i wierszowego jak wyżej:
  4. Dla macierzy kwadratowych i tej samej wielkości, macierze i mają te same wielomiany charakterystyczne (stąd te same wartości własne).

Suma

Wyznacznik sumy dwóch macierzy kwadratowych o tym samym rozmiarze nie jest na ogół wyrażalny jako wyznaczniki A i B . Jednakże, w przypadku pozytywnych półokreśloną matryc , i jednakowej wielkości, na z następstwie

Własności wyznacznika w stosunku do innych pojęć

Wartości własne i wielomian charakterystyczny

Wyznacznik jest ściśle powiązany z dwoma innymi centralnymi pojęciami w algebrze liniowej, wartościami własnymi i charakterystycznym wielomianem macierzy. Niech będzie macierzą ze złożonymi wpisami z wartościami własnymi . (Tutaj rozumie się, że wartość własna z krotnością algebraiczną μ występuje na tej liście razy μ .) Wtedy wyznacznikiem A jest iloczyn wszystkich wartości własnych,

Iloczyn wszystkich niezerowych wartości własnych jest określany jako pseudodeterminant .

Wielomian charakterystyczny jest zdefiniowany jako

Tutaj jest nieokreślony wielomianu i jest macierzą jednostkową o takim samym rozmiarze jak . Za pomocą tego wielomianu wyznaczniki można wykorzystać do znalezienia wartości własnych macierzy : są to dokładnie pierwiastki tego wielomianu, tj. te liczby zespolone , które

Hermitowskie matryca jest pozytywny określony , jeżeli wszystkie jej wartości własne są dodatnie. Kryterium Sylwestra zakłada, że ​​jest to równoważne wyznacznikom podmacierzy

bycie pozytywnym, dla wszystkich pomiędzy i .

Namierzać

Ślad tr ( ) jest z definicji suma przekątnych wpisów A i również jest równa sumie wartości własnych. Tak więc dla złożonych macierzy A ,

lub dla rzeczywistych macierzy A ,

Tutaj exp ( ) oznacza macierz wykładniczy od A , ponieważ każda wartość własna λ od A odpowiada wartości własnej ważności ( λ ) exp ( ). W szczególności, mając dowolny logarytm z A , czyli dowolną macierz L spełniającą

wyznacznik A jest podany przez

Na przykład, odpowiednio dla n = 2 , n = 3 i n = 4 ,

por. Twierdzenie Cayleya-Hamiltona . Takie wyrażenia można wyprowadzić z argumentów kombinatorycznych, tożsamości Newtona lub algorytmu Faddeeva-LeVerriera . Oznacza to, że dla rodzaju n , det A = (−1) n c 0 człon stały ze znakiem charakterystycznego wielomianu , wyznaczony rekursywnie z

W ogólnym przypadku można to również uzyskać z

gdzie suma jest przejmowana przez zbiór wszystkich liczb całkowitych k l ≥ 0 spełniających równanie

Wzór może być wyrażony w postaci pełnego wykładniczego wielomianu Bella o n argumentach s l = −( l – 1)! tR ( l ), a

Wzór ten może być również użyty do znalezienia wyznacznika macierzy A I J o wielowymiarowych indeksach I = (i 1 , i 2 , ..., i r ) oraz J = (j 1 , j 2 , ..., j r ) . Iloczyn i ślad takich matryc określa się w sposób naturalny jako:

Ważny arbitralny wymiar n tożsamości można uzyskać z rozwinięcia logarytmu w szereg Mercatora, gdy rozwinięcie jest zbieżne. Jeśli każda wartość własna A jest mniejsza niż 1 w wartości bezwzględnej,

gdzie ja jest macierzą tożsamości. Bardziej ogólnie, jeśli

jest rozwinięty jako formalny szereg potęgowy w s wtedy wszystkie współczynniki s m dla m > n wynoszą zero, a pozostały wielomian to det( I + sA ) .

Granice górne i dolne

Dla dodatniej określonej macierzy A , operator śladu daje następujące ścisłe dolne i górne granice wyznacznika logarytmicznego

z równością wtedy i tylko wtedy, gdy A = I . Zależność tę można wyprowadzić ze wzoru na rozbieżność KL między dwoma wielowymiarowymi rozkładami normalnymi .

Także,

Nierówności te można udowodnić, sprowadzając macierz A do postaci diagonalnej. Jako takie reprezentują dobrze znany fakt, że średnia harmoniczna jest mniejsza niż średnia geometryczna , która jest mniejsza niż średnia arytmetyczna , która z kolei jest mniejsza niż średnia kwadratowa .

Pochodna

Ze wzoru Leibniza wynika, że ​​wyznacznikiem rzeczywistych (lub analogicznie dla złożonych) macierzy kwadratowych jest funkcja wielomianowa od do . W szczególności jest wszędzie różnicowa . Jego pochodną można wyrazić za pomocą wzoru Jacobiego :

gdzie oznacza adjugate się . W szczególności, jeśli jest odwracalny, mamy

Wyrażone w kategoriach wpisów , są to

Jeszcze innym równoważnym sformułowaniem jest

,

przy użyciu notacji duże O . Szczególny przypadek, w którym , macierz jednostkowa, daje

Ta tożsamość jest używana w opisie algebr Liego związanych z pewnymi macierzowymi grupami Liego . Na przykład specjalna grupa liniowa jest zdefiniowana równaniem . Powyższy wzór pokazuje, że jego algebra Liego jest specjalną algebrą liniową Liego składającą się z tych macierzy, które mają ślad zero.

Pisząc macierz - gdzie są wektory kolumnowe o długości 3, to gradient nad jednym z trzech wektorów można zapisać jako iloczyn krzyżowy dwóch pozostałych:

Historia

Historycznie wyznaczniki były używane na długo przed macierzami: wyznacznik był pierwotnie definiowany jako właściwość układu równań liniowych . Wyznacznik „określa”, czy system ma jednoznaczne rozwiązanie (które występuje właśnie wtedy, gdy wyznacznik jest niezerowy). W tym sensie wyznaczniki zostały po raz pierwszy użyte w chińskim podręczniku matematyki The Nine Chapters on the Mathematical Art (九章算術, chińscy uczeni, około III wieku p.n.e.). W Europie rozwiązania układów liniowych dwóch równań zostały wyrażone przez Cardano w 1545 r. przez podmiot podobny do wyznacznika.

Właściwe wyznaczniki wywodzą się z prac Seki Takakazu w 1683 w Japonii i równolegle Leibniza w 1693. Cramer (1750) podał bez dowodu rządy Cramera. Zarówno Cramer, jak i Bezout (1779) zostały sprowadzone do wyznaczników przez kwestię krzywych płaskich przechodzących przez dany zbiór punktów.

Vandermonde (1771) jako pierwszy rozpoznał determinanty jako funkcje niezależne. Laplace (1772) podał ogólną metodę rozszerzania wyznacznika w zakresie jego uzupełniających się nieletnich : Vandermonde podał już przypadek szczególny. Zaraz potem Lagrange (1773) potraktował wyznaczniki drugiego i trzeciego rzędu i zastosował je do zagadnień teorii eliminacji ; udowodnił wiele szczególnych przypadków tożsamości ogólnych.

Gauss (1801) dokonał kolejnego postępu. Podobnie jak Lagrange, często wykorzystywał wyznaczniki w teorii liczb . On wprowadził słowo „wyznacznik” (Laplace użył „wypadkowa”), choć nie w obecnym znaczeń, lecz raczej jako stosowane do wyróżnika z Quantic . Gauss doszedł również do pojęcia wyznaczników odwrotnych (odwrotnych) i bardzo zbliżył się do twierdzenia o mnożeniu.

Kolejnym ważnym kontrybutorem jest Binet (1811, 1812), który formalnie sformułował twierdzenie odnoszące się do iloczynu dwóch macierzy m kolumn i n wierszy, które dla szczególnego przypadku m = n sprowadza się do twierdzenia o mnożeniu. Tego samego dnia (30 listopada 1812), w którym Binet przedstawił swoją pracę w Akademii, Cauchy przedstawił również jeden na ten temat. (Patrz wzór Cauchy-Bineta .) W tym przypadku użył słowa „wyznacznik” w jego obecnym znaczeniu, podsumował i uprościł to, co było wówczas znane na ten temat, poprawił notację i dał twierdzenie o mnożeniu z dowodem bardziej zadowalającym niż Bineta. Wraz z nim zaczyna się teoria w jej ogólności.

( Jacobi 1841 ) użył wyznacznika funkcjonalnego , który Sylvester nazwał później jakobianem . W swoich pamiętnikach w Crelle's Journal z 1841 r. zajmuje się tym tematem, a także klasą funkcji alternatywnych, którą Sylvester nazwał alternantami . Mniej więcej w czasie ostatnich wspomnień Jacobiego Sylvester (1839) i Cayley rozpoczęli swoją pracę. Cayley 1841 wprowadził nowoczesną notację wyznacznika za pomocą pionowych kresek.

Naturalnym rezultatem dopełnienia teorii ogólnej jest badanie szczególnych form determinant. Wyznaczniki osiowosymetryczne badali Lebesgue , Hesse i Sylvester; persymetryczne wyznaczniki Sylwestra i Hankela ; circulants według katalońsku , Spottiswoode'a , Glaisher i Scott; determinanty skośne i Pfaffian , w związku z teorią transformacji ortogonalnej , Cayley; kontynuanty Sylwestra; Wrońscy (tak zwani przez Muira ) przez Christoffela i Frobeniusa ; złożone determinanty Sylwestra, Reissa i Picqueta; Jakobian i Hessians Sylwestra; oraz symetryczne wyznaczniki gauche autorstwa Trudi . Z podręczników na ten temat pierwszy był Spottiswoode. W Ameryce Hanus (1886), Weld (1893) i Muir/Metzler (1933) publikowali traktaty.

Aplikacje

Zasada Cramera

Wyznaczniki mogą służyć do opisu rozwiązań liniowego układu równań , zapisanego w postaci macierzowej jako . To równanie ma unikalne rozwiązanie wtedy i tylko wtedy, gdy jest niezerowe. W tym przypadku rozwiązanie podaje reguła Cramera :

gdzie jest macierzą utworzoną przez zastąpienie -tej kolumny wektorem kolumnowym . Wynika to bezpośrednio z rozszerzenia kolumny wyznacznika, tj.

gdzie wektory są kolumnami A . Zasada jest również implikowana przez tożsamość

Reguła Cramera może być zaimplementowana w czasie, co jest porównywalne z bardziej powszechnymi metodami rozwiązywania układów równań liniowych, takimi jak LU , QR , czy dekompozycja na wartości osobliwe .

Liniowa niezależność

Wyznaczników można użyć do scharakteryzowania wektorów zależnych liniowo : wynosi zero wtedy i tylko wtedy, gdy wektory kolumn (lub równoważnie wektory wierszy) macierzy są liniowo zależne. Na przykład, biorąc pod uwagę dwa liniowo niezależne wektory , trzeci wektor leży na płaszczyźnie rozpiętej przez dwa poprzednie wektory dokładnie wtedy, gdy wyznacznik macierzy -składającej się z trzech wektorów wynosi zero. Ta sama idea jest również używana w teorii równań różniczkowych : dane funkcje (ma być różniczkowalne razy ), wroński definiuje się jako

Jest niezerowa (dla niektórych ) w określonym przedziale wtedy i tylko wtedy, gdy dane funkcje i wszystkie ich pochodne aż do rzędu są liniowo niezależne. Jeżeli można wykazać, że Wrońskian jest wszędzie na przedziale zero, to w przypadku funkcji analitycznych oznacza to, że dane funkcje są liniowo zależne. Zobacz niezależność wrońską i linearną . Innym takim zastosowaniem wyznacznika jest wynikowa , która daje kryterium , gdy dwa wielomiany mają wspólny pierwiastek .

Orientacja podstawy

Wyznacznik mogą być traktowane jako przypisanie do każdego numeru sekwencji z n wektorów w R n , za pomocą macierzy kwadratowej których kolumny są podane wektory. Na przykład macierz ortogonalna z wpisami w R n reprezentuje bazę ortonormalną w przestrzeni euklidesowej . Wyznacznik takiej macierzy określa, czy orientacja bazy jest zgodna lub przeciwna do orientacji bazy standardowej . Jeśli wyznacznikiem jest +1, podstawa ma taką samą orientację. Jeśli wynosi -1, podstawa ma przeciwną orientację.

Mówiąc bardziej ogólnie, jeśli wyznacznik A jest dodatni, A reprezentuje transformację liniową zachowującą orientację (jeśli A jest macierzą ortogonalną 2 × 2 lub 3 × 3 , jest to obrót ), natomiast jeśli jest ujemna, A zmienia orientację podstawy.

Wyznacznik objętości i jakobianu

Jak wskazano powyżej, wartość bezwzględna wyznacznika wektorów rzeczywistych jest równa objętości równoległościanu, który obejmuje te wektory. W konsekwencji, jeśli mapa liniowa jest dana przez pomnożenie przez macierz , i jest dowolnym mierzalnym podzbiorem , to objętość dana jest krotnością objętości . Mówiąc ogólnie, jeśli liniowym jest przedstawiony -Matrix , a następnie - trójwymiarowy objętość jest równa:

Obliczając objętość czworościanu ograniczonego czterema punktami, można je wykorzystać do identyfikacji linii skośnych . Objętość dowolnego czworościanu z uwzględnieniem jego wierzchołków , lub dowolnej innej kombinacji par wierzchołków, które tworzą drzewo opinające nad wierzchołkami.

Mapa nieliniowa wysyła mały kwadrat (po lewej, na czerwono) do zniekształconego równoległoboku (po prawej, na czerwono). Jakobian w punkcie daje najlepsze przybliżenie liniowe zniekształconego równoległoboku w pobliżu tego punktu (po prawej, w półprzezroczystym kolorze białym), a wyznacznik jakobianu daje stosunek powierzchni przybliżonego równoległoboku do pierwotnego kwadratu.

Dla ogólnego funkcji różniczkowej , wiele z powyższych przenosi rozważając jakobian matrycy o f . Do

macierz Jakobian jest macierzą n × n , której wpisy są podane przez pochodne cząstkowe

Jej wyznacznik, wyznacznik Jakobian , pojawia się w wyżej-wymiarowej wersji całkowania przez podstawienie : dla odpowiednich funkcji f i otwartego podzbioru U z R n (dziedzina f ), całka przez f ( U ) jakiejś innej funkcji φ  : R nR m jest podane przez

Jakobian występuje również w twierdzeniu o funkcji odwrotnej .

Abstrakcyjne aspekty algebraiczne

Wyznacznik endomorfizmu

Powyższe tożsamości dotyczące wyznacznika iloczynów i odwrotności macierzy implikują, że macierze podobne mają ten sam wyznacznik: dwie macierze A i B są podobne, jeśli istnieje macierz odwracalna X taka, że A = X −1 BX . Rzeczywiście, wielokrotne stosowanie powyższych tożsamości daje

Wyznacznik nazywa się zatem również niezmiennikiem podobieństwa . Wyznacznik przekształcenia liniowego

dla pewnej skończenie wymiarowej przestrzeni wektorowej V jest zdefiniowana jako wyznacznik macierzy ją opisującej, ze względu na arbitralny wybór bazy w V . Przez niezmienność podobieństwa determinanta ta jest niezależna od wyboru bazy dla V, a zatem zależy tylko od endomorfizmu T .

Macierze kwadratowe nad pierścieniami przemiennymi

Powyższa definicja wyznacznika za pomocą reguły Leibniza sprawdza się ogólniej, gdy wpisy macierzy są elementami pierścienia przemiennego , takimi jak liczby całkowite , w przeciwieństwie do pola liczb rzeczywistych lub zespolonych. Co więcej, charakterystyka wyznacznika jako unikalnej przemiennej mapy wieloliniowej, która spełnia, nadal obowiązuje, podobnie jak wszystkie właściwości wynikające z tej charakterystyki.

Macierz jest odwracalna (w tym sensie, że istnieje odwrotna macierz, której wpisy znajdują się w ) wtedy i tylko wtedy, gdy jej wyznacznikiem jest element odwracalny w . Dla , oznacza to, że wyznacznikiem jest +1 lub -1. Taka macierz nazywana jest unimodularną .

Wyznacznik będący multiplikatywnym określa homomorfizm grupowy

między ogólną grupą liniową (grupą macierzy odwracalnych z wpisami w ) a multiplikatywną grupą jednostek w . Ponieważ uwzględnia mnożenie w obu grupach, ta mapa jest homomorfizmem grup .

Wyznacznikiem jest naturalna transformacja.

Biorąc pod uwagę homomorfizm pierścienia , otrzymujemy mapę przez zastąpienie wszystkich wpisów w ich obrazami pod . Wyznacznik szanuje te mapy, tj. tożsamość

trzyma. Innymi słowy, wyświetlany wykres przemienny przejeżdża.

Na przykład wyznacznikiem sprzężenia zespolonego macierzy zespolonej (która jest jednocześnie wyznacznikiem jej sprzężonej transpozycji) jest sprzężenie zespolone jej wyznacznika, a dla macierzy liczb całkowitych: moduł redukcji wyznacznika takiej macierzy jest równy wyznacznik macierzy zredukowany modulo (ten ostatni wyznacznik jest obliczany za pomocą arytmetyki modularnej ). W języku teorii kategorii wyznacznikiem jest naturalna transformacja między dwoma funktorami i . Dodając jeszcze jedną warstwę abstrakcji, jest to uchwycone przez stwierdzenie, że wyznacznikiem jest morfizm grup algebraicznych , od ogólnej grupy liniowej do grupy multiplikatywnej ,

Algebra zewnętrzna

Wyznacznik liniowej transformacji wystąpienia wymiarowej przestrzeni wektorowej , lub, bardziej ogólnie wolne moduł z (Finite) stopnia na pierścienia przemiennego może być formułowany w sposób wolny od współrzędnych rozważając -tym zewnątrz siłę na . Mapa indukuje mapę liniową

Podobnie jak jednowymiarowa, mapa jest dana przez pomnożenie przez pewien skalar, tj. element w . Niektórzy autorzy, tacy jak ( Bourbaki 1998 ) wykorzystują ten fakt do zdefiniowania wyznacznika jako elementu spełniającego następującą tożsamość (dla wszystkich ):

Ta definicja jest zgodna z bardziej konkretną definicją zależną od współrzędnych. Można to pokazać za pomocą jedności wieloliniowej formy przemiennej na -krotkach wektorów w . Z tego powodu najwyższa niezerowa moc zewnętrzna (w przeciwieństwie do wyznacznika związanego z endomorfizmem) jest czasami nazywana wyznacznikiem i podobnie dla bardziej zaangażowanych obiektów, takich jak wiązki wektorowe lub kompleksy łańcuchowe przestrzeni wektorowych. W tym ustawieniu można również oddać elementy drugorzędne macierzy, biorąc pod uwagę niższe formy naprzemienne z .

Uogólnienia i pojęcia pokrewne

Omówione powyżej determinanty dopuszczają kilka wariantów: jako wyznacznik definiuje się permanent macierzy, z tym że pomija się czynniki występujące w regule Leibniza. Immanant uogólnia zarówno poprzez wprowadzenie znaku z grupy symetrycznej w regule Leibniza.

Wyznaczniki algebr skończenie wymiarowych

Dla każdej algebry asocjacyjnej, która jest skończenie wymiarowa jako przestrzeń wektorowa nad ciałem , istnieje mapa determinantowa

Definicja ta przebiega przez ustalenie wielomianu charakterystycznego niezależnie od wyznacznika i zdefiniowanie wyznacznika jako najniższego rzędu tego wielomianu. Ta ogólna definicja odzyskuje wyznacznik algebry macierzy , ale obejmuje również kilka innych przypadków , w tym wyznacznik kwaternion ,

,

norma o rozszerzenie ciała , jak również Pfaffian o macierz antysymetryczna i zmniejszona norma o Algebra centralna prosta , powstają również szczególnych przypadkach tej konstrukcji.

Nieskończone macierze

W przypadku macierzy o nieskończonej liczbie wierszy i kolumn powyższe definicje wyznacznika nie są przenoszone bezpośrednio. Na przykład we wzorze Leibniza należałoby obliczyć nieskończoną sumę (której wszystkie wyrazy są iloczynami nieskończonymi). Analiza funkcjonalna dostarcza różnych rozszerzeń wyznacznika dla takich nieskończenie wymiarowych sytuacji, które jednak działają tylko dla określonych rodzajów operatorów.

Fredholm determinantą określa wyznacznik dla operatorów zwanych operatorów klasy ślad za pomocą odpowiedniego uogólnienie wzoru

Innym nieskończenie wymiarowym pojęciem wyznacznika jest wyznacznik funkcjonalny .

Operatory w algebrach von Neumanna

Dla operatorów w czynniku skończonym , można zdefiniować dodatni wyznacznik o wartościach rzeczywistych, zwany wyznacznikiem Fuglede-Kadisona, używając śladu kanonicznego. W rzeczywistości, każdemu stanowi śladowemu w algebrze von Neumanna odpowiada pojęcie wyznacznika Fuglede-Kadisona.

Pokrewne pojęcia dla nieprzemiennych pierścieni

W przypadku macierzy nad nieprzemiennymi pierścieniami właściwości wieloliniowości i przemienne są niekompatybilne dla n ≥ 2 , więc nie ma dobrej definicji wyznacznika w tym ustawieniu.

W przypadku macierzy kwadratowych z wpisami w pierścieniu nieprzemiennym występują różne trudności w definiowaniu wyznaczników analogicznie jak dla pierścieni przemiennych. Formuła Leibniza może mieć znaczenie pod warunkiem, że zostanie określona kolejność iloczynu i podobnie dla innych definicji wyznacznika, ale nieprzemienność prowadzi wówczas do utraty wielu podstawowych właściwości wyznacznika, takich jak własność multiplikatywna lub że wyznacznik pozostaje niezmieniony przy transpozycji macierzy. Nad non-pierścień przemienny, nie ma rozsądne pojęcie multilinear postaci (istnienie niezerową bilinear postaci z regularnym elementem z R jako wartości na jakiejś pary argumentów wynika, że R jest przemienne). Niemniej jednak sformułowano różne pojęcia wyznacznika nieprzemiennego, które zachowują niektóre właściwości wyznaczników, zwłaszcza quasideterminant i wyznacznik Dieudonné . Dla niektórych klas macierzy z elementami nieprzemiennymi można zdefiniować wyznacznik i udowodnić twierdzenia algebry liniowej, które są bardzo podobne do ich przemiennych analogów. Przykłady obejmują q -determinant na grupy kwantowej determinantę Capelli na macierzach Capellego i Berezinian na supermatrices (to znaczy macierzy, których prace są elementy - stopniowanych palników ). Macierze Manina tworzą klasę najbliższą macierzy z elementami przemiennymi.

Obliczenie

Determinanty są wykorzystywane głównie jako narzędzie teoretyczne. Rzadko są obliczane wprost w numerycznej algebrze liniowej , gdzie w zastosowaniach takich jak sprawdzanie odwracalności i znajdowanie wartości własnych wyznacznik został w dużej mierze wyparty przez inne techniki. Geometria obliczeniowa często jednak korzysta z obliczeń związanych z wyznacznikami.

Podczas wyznacznik można wyznaczyć bezpośrednio z Leibniz wyklucza to podejście jest bardzo nieskuteczne dla dużej macierzy, ponieważ wzór wymaga obliczenia ( czynnikowe ) produktów na -Matrix. W ten sposób liczba wymaganych operacji rośnie bardzo szybko: to jest w porządku . Rozszerzenie Laplace'a jest podobnie nieefektywne. Dlatego opracowano bardziej zaangażowane techniki obliczania wyznaczników.

Metody dekompozycji

Niektóre metody obliczają , zapisując macierz jako iloczyn macierzy, których wyznaczniki można łatwiej obliczyć. Takie techniki określane są jako metody dekompozycji. Przykłady obejmują metoda lu , w QR rozkładowi lub rozpadowi Cholesky'iego (na dodatnio określonych macierzy ). Metody te są uporządkowane , co stanowi znaczną poprawę .

Na przykład dekompozycja LU wyraża się jako produkt

z matrycy permutacji (który ma dokładnie jeden w każdej kolumnie, a inaczej zera), dolną matrycę trójkątnym i górnej trójkątnej matrycy . Wyznaczniki dwóch trójkątnych macierzy i można szybko oblicza, gdyż są produktami odpowiednimi wpisami przekątnej. Wyznacznikiem jest tylko znak odpowiedniej permutacji (co dotyczy parzystej liczby permutacji i nieparzystej liczby permutacji). Gdy znany jest taki rozkład LU dla , jego wyznacznik jest łatwo obliczany jako

Dalsze metody

Porządek osiągnięty metodami dekompozycji został poprawiony różnymi metodami. Jeśli dwie macierze porządku można pomnożyć w czasie , gdzie dla niektórych , to istnieje algorytm obliczający wyznacznik w czasie . Oznacza to na przykład, że istnieje algorytm oparty na algorytmie Coppersmitha–Winograda . Wykładnik ten został dodatkowo obniżony, począwszy od 2016 r., do 2,373.

Oprócz złożoności algorytmu, do porównywania algorytmów można zastosować dalsze kryteria. Zwłaszcza w przypadku aplikacji dotyczących macierzy nad pierścieniami istnieją algorytmy obliczające wyznacznik bez żadnych dzieleń. (Z kolei eliminacja Gaussa wymaga podziałów.) Jeden z takich algorytmów, mający złożoność, opiera się na następującej idei: zastępujemy permutacje (jak w regule Leibniza) tzw. zamkniętymi spacerami uporządkowanymi , w których kilka pozycji może się powtarzać. Otrzymana suma ma więcej wyrazów niż w regule Leibniza, ale w tym procesie kilka z tych iloczynów może być ponownie użytych, co czyni ją bardziej wydajną niż naiwne obliczenia z regułą Leibniza. Algorytmy można również oceniać na podstawie ich złożoności bitowej , tj. ile bitów dokładności jest potrzebnych do przechowywania wartości pośrednich występujących w obliczeniach. Na przykład metoda eliminacji Gaussa (lub dekompozycji LU) jest uporządkowana , ale długość bitowa wartości pośrednich może stać się wykładniczo długa. Dla porównania, algorytm Bareiss jest metodą dokładnego dzielenia (więc używa dzielenia, ale tylko w przypadkach, gdy te podziały mogą być wykonane bez reszty) jest tej samej kolejności, ale złożoność bitowa jest z grubsza wielkością bitu oryginalne wpisy w czasach macierzy .

Jeśli wyznacznik A i odwrotność A zostały już obliczone, lemat o wyznaczniku macierzy pozwala na szybkie obliczenie wyznacznika A + uv T , gdzie u i v są wektorami kolumnowymi.

Charles Dodgson (tj. Lewis Carroll z Alicji w Krainie Czarów ) wynalazł metodę obliczania wyznaczników zwaną kondensacją Dodgsona . Niestety ta ciekawa metoda nie zawsze działa w swojej pierwotnej formie.

Zobacz też

Uwagi

Bibliografia

odniesienia historyczne

Zewnętrzne linki