Macierz (matematyka) - Matrix (mathematics)

M x n matrix się m rzędy są poziome i n kolumn są pionowe. Każdy element macierzy jest często oznaczany przez zmienną z dwoma indeksami . Na przykład, 2,1 przedstawia element w drugim rzędzie i pierwszej kolumnie w matrycy.

W matematyce , A macierz (mnogiej matryce ) jest prostokątny tablica lub spis numerów , symboli lub wyrażenia , ułożone w rzędach i kolumnach, która służy do reprezentowania matematycznego obiektu lub właściwość takiego przedmiotu. Na przykład,

to macierz z dwoma wierszami i trzema kolumnami; często mówi się „macierz dwa na trzy”, „macierz 2×3 ” lub macierz o wymiarze 2×3 .

Bez dalszych specyfikacji macierze reprezentują mapy liniowe i umożliwiają jawne obliczenia w algebrze liniowej . Dlatego też badanie macierzy jest dużą częścią algebry liniowej, a większość własności i działań abstrakcyjnej algebry liniowej można wyrazić w postaci macierzy. Na przykład mnożenie macierzy reprezentuje kompozycję map liniowych.

Nie wszystkie macierze są powiązane z algebrą liniową. Dotyczy to w szczególności teorii grafów , macierzy incydencji i macierzy sąsiedztwa . Ten artykuł koncentruje się na macierzach związanych z algebrą liniową i, o ile nie określono inaczej, wszystkie macierze reprezentują mapy liniowe lub mogą być postrzegane jako takie.

Macierze kwadratowe , macierze o tej samej liczbie wierszy i kolumn, odgrywają główną rolę w teorii macierzy. Macierze kwadratowe danego wymiaru tworzą nieprzemienny pierścień , który jest jednym z najczęstszych przykładów nieprzemiennego pierścienia. Wyznacznikiem macierzy kwadratowej szereg związany do matrycy, która ma zasadnicze znaczenie dla badania kwadratowej macierzy; na przykład macierz kwadratowa jest odwracalna wtedy i tylko wtedy, gdy ma wyznacznik niezerowy, a wartości własne macierzy kwadratowej są pierwiastkami wyznacznika wielomianowego .

W geometrii macierze są szeroko stosowane do określania i przedstawiania transformacji geometrycznych (na przykład obrotów ) i zmian współrzędnych . W analizie numerycznej wiele problemów obliczeniowych rozwiązuje się, sprowadzając je do obliczeń macierzowych, a to często wiąże się z obliczeniami z macierzami o ogromnych wymiarach. Macierze są używane w większości dziedzin matematyki i większości dziedzin naukowych, albo bezpośrednio, albo poprzez ich zastosowanie w geometrii i analizie numerycznej.

Definicja

Matryca jest prostokątny tablica numerów (lub innych obiektów matematycznych), dla którego operacje, takie jak dodanie i mnożenia są określone. Najczęściej macierz nad ciałem F jest prostokątną tablicą skalarów, z których każdy należy do F . Rzeczywistym macierzy i kompleks macierzy są macierzami, których prace są, odpowiednio, liczbami rzeczywistymi lub liczbami zespolonymi . Poniżej omówiono bardziej ogólne typy wpisów . Na przykład to jest prawdziwa macierz:

Liczby, symbole lub wyrażenia w macierzy nazywane są jej wpisami lub jej elementami . Poziome i pionowe wiersze wpisów w macierzy nazywane są odpowiednio wierszami i kolumnami .

Rozmiar

Rozmiar macierzy jest określony przez liczbę wierszy i kolumn, które zawiera. Nie ma ograniczeń co do liczby wierszy i kolumn, jakie może mieć macierz (w zwykłym sensie), o ile są to dodatnie liczby całkowite. Macierz z m wierszami i n kolumnami nazywana jest macierzą m  × n lub macierzą m -by- n , podczas gdy m i n to jej wymiary . Na przykład powyższa macierz A to macierz 3 × 2.    

Macierze z pojedynczym wierszem nazywane są wektorami wierszowymi , a te z pojedynczą kolumną — wektorami kolumnowymi . Macierz z taką samą liczbą wierszy i kolumn nazywana jest macierzą kwadratową . Macierz z nieskończoną liczbą wierszy lub kolumn (lub obu) nazywana jest macierzą nieskończoną . W niektórych kontekstach, takich jak programy do algebry komputerowej , przydatne jest rozważenie macierzy bez wierszy lub kolumn, zwanej macierzą pustą .

Przegląd wielkości matrycy
Nazwa Rozmiar Przykład Opis
Wektor wiersza 1  × n  Macierz z jednym wierszem, czasami używana do reprezentowania wektora
Wektor kolumnowy n  ×  1 Macierz z jedną kolumną, czasami używana do reprezentowania wektora
Macierz kwadratowa n  × n  Macierz z taką samą liczbą wierszy i kolumn, czasami używana do reprezentowania transformacji liniowej z przestrzeni wektorowej do samej siebie, takiej jak odbicie , obrót lub ścinanie .

Notacja

Macierze są zwykle pisane w nawiasach kwadratowych lub nawiasach :

Specyfika symbolicznego zapisu macierzowego jest bardzo zróżnicowana, z pewnymi dominującymi trendami. Matryce są zwykle symbolizowany za pomocą wielkich liter liter (na przykład A, w powyższych przykładach), podczas gdy odpowiadający mu małych liter liter z indeksami indeksu dolnego (np 11 lub 1,1 ) stanowią dane. Oprócz używania wielkich liter do symbolizowania macierzy, wielu autorów używa specjalnego stylu typograficznego , zwykle pogrubioną czcionką do góry (nie kursywą), aby jeszcze bardziej odróżnić macierze od innych obiektów matematycznych. Alternatywny zapis polega na użyciu podwójnego podkreślenia z nazwą zmiennej, z pogrubieniem lub bez (jak w przypadku ).

Wpis w i-tym wierszu i j- tej kolumnie macierzy A jest czasami określany jako i , j , ( i , j ) lub ( i , j )-ty wpis macierzy i najczęściej oznaczany jako a i , j lub a ij . Alternatywne zapisy dla tego wpisu to A [ i, j ] lub A i, j . Na przykład, (1,3), wejście poniższej macierzy A oznacza 5 (również oznaczony 13 , 1,3 , [ 1,3 ] lub 1,3 )

Czasami wpisy macierzy można zdefiniować za pomocą formuły, takiej jak a i , j = f ( i , j ). Na przykład każdy z wpisów poniższej macierzy A jest określony wzorem a ij = ij .

W tym przypadku sama macierz jest czasami definiowana przez ten wzór, w nawiasach kwadratowych lub podwójnych nawiasach. Na przykład powyższa macierz jest zdefiniowana jako A = [ i - j ] lub A = (( i - j )). Jeżeli rozmiar macierzy wynosi m × n , wyżej wspomniany wzór f ( i , j ) jest ważny dla każdego i = 1, ..., mi każdego j = 1, ..., n . Może to być określone oddzielnie lub wskazane za pomocą m × n jako indeksu dolnego. Na przykład powyższa macierz A wynosi 3 × 4 i może być zdefiniowana jako A = [ i - j ] ( i = 1, 2, 3; j = 1, ..., 4) lub A = [ i - j ] 3×4 .

Niektóre języki programowania używają podwójnie indeksowanych tablic (lub tablic tablic) do reprezentowania macierzy m -×- n . Niektóre języki programowania rozpoczynają numerację indeksów tablicy od zera, w którym to przypadku wpisy macierzy m -by- n są indeksowane przez 0 ≤ im -1 i 0 ≤ jn -1 . Ten artykuł jest zgodny z bardziej powszechną konwencją w pisaniu matematycznym, w której wyliczanie zaczyna się od 1.

Gwiazdka jest czasami używana w odniesieniu do całych wierszy lub kolumn w macierzy. Na przykład, I * odnosi się do gniazda i -tego rzędu A i * j oznacza j- th kolumny A .

Zestaw wszystkich m -by- n rzeczywistym macierzy jest często oznaczany lub zbiór wszystkich m -by- n matryce matryce nad drugim polu , albo w pierścieniu B , jest podobnie oznaczone lub Jeśli m = n , to znaczy w przypadku z macierzy kwadratowych , jeden nie powtarza wymiar: lub Często jest używany w miejscu

Podstawowe operacje

Wideo zewnętrzne
ikona wideo Jak organizować, dodawać i mnożyć macierze - Bill Shillito , TED ED

Istnieje szereg podstawowych operacji, które można zastosować do modyfikacji macierzy, zwanych dodawaniem macierzy , mnożeniem przez skalar , transpozycją , mnożeniem macierzy , operacjami na wierszach i podmacierzami .

Dodawanie, mnożenie przez skalar i transpozycja

Operacje wykonywane na macierzach
Operacja Definicja Przykład
Dodatek Suma + B z dwóch m -by- n matryce i B jest obliczana entrywise:
( +
B ) i , J = i , j + B i , j , gdzie 1 ≤ im i 1 ≤ jn .

Mnożenie przez skalar Iloczyn c A liczby c (zwanej również skalarem w żargonie algebry abstrakcyjnej ) i macierz A jest obliczany przez pomnożenie każdego wpisu A przez c :
( c A ) i , j = c · A i , j .

Operacja ta nazywana jest mnożenie przez skalar , ale jego wynik nie jest nazwany „skalarne produkt”, aby uniknąć nieporozumień, ponieważ „skalarne produkt” jest czasami używane jako synonim „ wewnętrznej wyrobu ”.

Transpozycja Transpozycji z danej m -by- n macierzy A jest na n -by- m matrycy T (określane również TR lub t ) utworzona przez obrót wiersze, kolumny i odwrotnie:
(
T ), i , j = A J , i .

Znane własności liczb rozciągają się na te operacje na macierzach: na przykład dodawanie jest przemienne , to znaczy suma macierzy nie zależy od kolejności sum: A  + B = B + A . Transpozycja jest zgodna z dodawaniem i mnożeniem przez skalar, wyrażonymi przez ( c A ) T = c ( A T ) i ( A + B ) T = A T + B T . Na koniec, ( T ) T = .              

Mnożenie macierzy

Schematyczne przedstawienie iloczynu macierzy AB dwóch macierzy A i B .

Mnożenie dwóch macierzy jest definiowane wtedy i tylko wtedy, gdy liczba kolumn lewej macierzy jest taka sama jak liczba wierszy prawej macierzy. Jeśli A jest macierzą m -by- n , a B jest macierzą n -by- p , to ich iloczyn macierzy AB jest macierzą m -by- p , której wpisy są podane przez iloczyn skalarny odpowiedniego wiersza A i odpowiedniego kolumna B :

gdzie 1 ≤ im i 1 ≤ jp . Na przykład podkreślony wpis 2340 w produkcie jest obliczany jako (2 × 1000) + (3 × 100) + (4 × 10) = 2340:

Mnożenie macierzy spełnia reguły ( AB ) C = A ( BC ) ( łączność ) i ( A + B ) C = AC + BC oraz C ( A + B ) = CA + CB ( rozdzielczość lewa i prawa ), ilekroć wielkość matryc jest taka, że ​​określone są różne produkty. Iloczyn AB może być zdefiniowany bez definiowania BA , a mianowicie, jeśli A i B są odpowiednio macierzami m -by- n i n -by- k , a mk . Nawet jeśli oba produkty są zdefiniowane, na ogół nie muszą być równe, to znaczy:

ABBA ,

Innymi słowy, mnożenie macierzy nie jest przemienne , w przeciwieństwie do liczb (wymiernych, rzeczywistych lub zespolonych), których iloczyn jest niezależny od kolejności czynników. Przykładem dwóch macierzy nie dojeżdżających ze sobą jest:

natomiast

Oprócz właśnie opisanego zwykłego mnożenia macierzy, istnieją również inne, rzadziej stosowane operacje na macierzach, które można uznać za formy mnożenia, takie jak iloczyn Hadamarda i iloczyn Kroneckera . Powstają przy rozwiązywaniu równań macierzowych, takich jak równanie Sylwestra .

Operacje na wierszach

Istnieją trzy rodzaje operacji na wierszach:

  1. dodawanie wiersza, czyli dodawanie jednego wiersza do drugiego.
  2. mnożenie wierszy, czyli mnożenie wszystkich wpisów wiersza przez niezerową stałą;
  3. przełączanie wierszy, czyli zamiana dwóch wierszy macierzy;

Te operacje są używane na kilka sposobów, w tym rozwiązywanie równań liniowych i znajdowanie odwrotności macierzy .

Podmacierz

Podmatryca z matrycy uzyskuje się przez usunięcie każdego zbioru rzędach oraz / albo kolumnach. Na przykład z poniższej macierzy 3 na 4 możemy skonstruować podmacierz 2 na 3, usuwając wiersz 3 i kolumnę 2:

W nieletni i kofaktorów w matrycy znajduje się poprzez obliczenie determinantę niektórych podmatryc.

Główny podmacierz jest kwadratem podmacierz uzyskany przez usunięcie niektórych wierszy i kolumn. Definicja różni się w zależności od autora. Według niektórych autorów główna podmacierz to podmacierz, w której zbiór pozostałych indeksów wierszowych jest taki sam, jak zbiór pozostałych indeksów kolumnowych. Inni autorzy definiują główną podmacierz jako taką, w której pierwsze k wierszy i kolumn, dla pewnej liczby k , to te, które pozostały; ten typ podmacierzy został również nazwany wiodącą podmacierzą główną .

Równania liniowe

Macierze mogą służyć do zwięzłego pisania i pracy z wieloma równaniami liniowymi, czyli układami równań liniowych. Na przykład, jeśli A jest macierzą m -by- n , x oznacza wektor kolumnowy (czyli macierz n ×1) n zmiennych x 1 , x 2 , ..., x n , a b jest m ×wektor 1-kolumnowy, to równanie macierzowe

jest równoważny układowi równań liniowych

Korzystając z macierzy, można to rozwiązać bardziej zwięźle, niż byłoby to możliwe, wypisując wszystkie równania osobno. Jeśli n = m i równania są niezależne , to można to zrobić pisząc

gdzie -1 jest macierz odwrotna od A . Jeśli A nie ma odwrotności, rozwiązania — jeśli istnieją — można znaleźć za pomocą jego uogólnionej odwrotności .

Transformacje liniowe

Wektory reprezentowane przez macierz 2x2 odpowiadają bokom kwadratu jednostkowego przekształconego w równoległobok.

Macierze i mnożenie macierzy ujawniają swoje istotne cechy w odniesieniu do przekształceń liniowych , znanych również jako odwzorowania liniowe . Rzeczywista macierz A m -by- n daje początek liniowej transformacji R nR m mapującej każdy wektor x w R n na (macierz) iloczyn Ax , który jest wektorem w R m . Z drugiej strony, każdy przekształcenie liniowe f : R nR m wynika z unikalnym m -by- n macierzy A : Ściślej, ( i , j ) -entry z A jest I th współrzędna f ( e j ), gdzie E j = (0,...,0,1,0,...,0) to wektor jednostkowy z 1 na j- tej pozycji i 0 w innym miejscu. Matryca mówi się, stanowią liniową mapę F i nazywa się macierz transformacji z F .

Na przykład macierz 2×2

można postrzegać jako przekształcenie kwadratu jednostkowego w równoległobok z wierzchołkami w (0, 0) , ( a , b ) , ( a + c , b + d ) i ( c , d ) . Przedstawiony po prawej równoległobok uzyskuje się przez pomnożenie A przez każdy z wektorów kolumnowych i kolejno. Te wektory definiują wierzchołki kwadratu jednostkowego.

Poniższa tabela pokazuje kilka rzeczywistych macierzy 2×2 z powiązanymi liniowymi mapami R 2 . Niebieski oryginał jest odwzorowany na zieloną siatkę i kształty. Początek (0,0) zaznaczono czarną kropką.

Ścinanie poziome
przy m = 1,25.
Odbicie przez oś pionową Mapowanie ściśnięcia
z r = 3/2
Skalowanie
o współczynnik 3/2
Obrót
o π /6 = 30°
Ścinanie pionowe m=1.25.svg Odwróć mapę.svg Ściśnij r=1.5.svg Skalowanie przez 1.5.svg Obrót o pi ponad 6.svg

Zgodnie z zależnością 1 do 1 między macierzami a odwzorowaniami liniowymi, mnożenie macierzy odpowiada składaniu odwzorowań: jeśli k -by- m macierz B reprezentuje inne odwzorowanie liniowe g : R mR k , to złożenie gf jest reprezentowana przez BA od

( gf ) ( x ) = g ( f ( x )) = g ( Ax ) = B ( Ax ) = ( BA ) x .

Ostatnia równość wynika ze wspomnianej wyżej asocjatywności mnożenia macierzy.

Rząd macierzy A to maksymalna liczba liniowo niezależnych wektorów wierszowych macierzy, która jest równa maksymalnej liczbie liniowo niezależnych wektorów kolumnowych. Równoważnie jest to wymiar w obrazie mapy liniowy reprezentowany przez A . Twierdzenie rang-nullity mówi, że wymiar jądra macierzy plus ranga równa się liczbie kolumn macierzy.

Macierz kwadratowa

Kwadratowy matrycy jest matryca o takiej samej liczby wierszy i kolumn. An n -by- n macierzy jest znana jako kwadratowej macierzy rzędu N. Można dodawać i mnożyć dowolne dwie macierze kwadratowe tego samego rzędu. Wpisy a ii tworzą główną przekątną macierzy kwadratowej. Leżą na wyimaginowanej linii biegnącej od lewego górnego rogu do prawego dolnego rogu matrycy.

Główne rodzaje

Nazwa Przykład z n = 3
Macierz przekątna
Dolna trójkątna matryca
Górna trójkątna matryca

Macierz ukośna i trójkątna

Jeśli wszystkie wpisy A poniżej głównej przekątnej wynoszą zero, A nazywamy górną macierzą trójkątną . Podobnie, jeśli wszystkie wpisy A powyżej głównej przekątnej wynoszą zero, A nazywamy dolną macierzą trójkątną . Jeśli wszystkie wpisy poza główną przekątną wynoszą zero, A nazywamy macierzą diagonalną .

Macierz jednostkowa

Macierz identyczności I n o rozmiarze n jest w n -by- n macierzy, w którym wszystkie elementy na głównej przekątnej są równe 1, a wszystkie inne elementy są równe 0, na przykład

Jest to macierz kwadratowa rzędu n , a także specjalny rodzaj macierzy diagonalnej . Nazywa się to macierzą jednostkową, ponieważ mnożenie z nią pozostawia niezmienioną macierz:

AI n = I m A = A dla dowolnejmacierzy m -by- n A .

Niezerowa skalarna wielokrotność macierzy jednostkowej nazywana jest macierzą skalarną . Jeśli wpisy macierzy pochodzą z ciała, macierze skalarne tworzą grupę, przy mnożeniu macierzy, czyli izomorficzną z grupą multiplikatywną niezerowych elementów ciała.

Symetryczna lub skośno-symetryczna macierz

Macierzą kwadratową która jest równa jego transpozycji Oznacza to, że A = A , T , jest symetryczną matrycą . Jeśli zamiast jest równa ujemny jej transpozycji Oznacza to, że A = - T , następnie jest macierz antysymetryczna . W próbkach, symetria jest często zastępowane przez pojęcie hermitowskich matryc , które spełniają A * = A , gdzie gwiazdki lub gwiazdka oznacza sprzężoną transpozycję macierzy, to znaczy transpozycja z zespoloną sprzężoną z A .

Według twierdzenia spektralnego rzeczywiste macierze symetryczne i złożone macierze hermitowskie mają własną podstawę ; oznacza to, że każdy wektor można wyrazić jako liniową kombinację wektorów własnych. W obu przypadkach wszystkie wartości własne są rzeczywiste. Twierdzenie to można uogólnić na sytuacje nieskończenie wymiarowe związane z macierzami o nieskończenie wielu wierszach i kolumnach, patrz poniżej .

Macierz odwracalna i jej odwrotność

Macierz kwadratowa A nazywana jest odwracalną lub nieosobliwą, jeśli istnieje macierz B taka, że

AB = BA = I n ,

gdzie I n jest macierzą jednostkową n × n z jedynkami na głównej przekątnej i zerami w innych miejscach. Jeżeli B nie istnieje, jest unikalny i jest nazywany macierz odwrotna z A , oznaczoną A -1 .

Określona macierz

Dodatnia określona macierz Nieokreślona macierz
Q ( x , y ) = 1/4 x 2 + r 2 Q ( x , y ) =1/4 x 2 − 1/4 y 2
Elipsa w układzie współrzędnych z półosiami labelled.svg
Punkty takie, że Q ( x , y )=1
( Elipsa ).
Hiperbola2 SVG.svg
Punkty takie, że Q ( x , y )=1
( Hiperbola ).

Symetryczną macierz rzeczywistą A nazywamy dodatnio określoną, jeśli skojarzona forma kwadratowa

f ( x ) = x T A  x

ma wartość dodatnią dla każdego niezerowego wektora x w R n . Jeśli f ( x ) daje tylko wartości ujemne, to A jest ujemnie określone ; jeśli f wytwarza zarówno wartości ujemne, jak i dodatnie, to A jest nieokreślone . Jeśli kwadratowa forma f daje tylko wartości nieujemne (dodatnie lub zero), macierz symetryczna nazywa się dodatnio-półokreśloną (lub jeśli tylko wartości niedodatnie, to ujemnie-półokreślona); stąd macierz jest nieokreślona właśnie wtedy, gdy nie jest ani dodatnio-półokreślona, ​​ani ujemna-półokreślona.

Symetryczna macierz jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie jej wartości własne są dodatnie, to znaczy macierz jest dodatnio-półokreślona i jest odwracalna. Tabela po prawej pokazuje dwie możliwości macierzy 2x2.

Dopuszczenie dwóch różnych wektorów jako danych wejściowych zamiast tego daje dwuliniową formę związaną z A :

B A ( x , y ) = x T Ay .

W przypadku złożonych macierzy, te same terminologia i wyniki zastosowania z symetryczną matrycą , postaci kwadratowej , forma dwuliniowa i transponowania x T zastąpiono odpowiednio hermitowskiego matrycy , postaci hermitowskiego , forma półtoraliniowa i koniugatu transponowania x H .

Macierz ortogonalna

Prostopadłe macierz jest macierzą kwadratową z rzeczywistych pozycji których kolumny i rzędy są ortogonalne wektor jednostkowy (czyli ortonormalne wektory). Równoważnie macierz A jest ortogonalna, jeśli jej transpozycja jest równa jej odwrotności :

co pociąga za sobą

gdzie I n jest macierzą jednostkową o rozmiarze n .

Macierzą ortogonalną jest zawsze odwracalna (z odwrotną A -1 = T ) jednostkowy ( -1 = * ), a normalne ( * = AA * ). Determinantą każdej prostopadłym matrycy jest albo +1 lub -1 . Specjalny macierzy ortogonalnych jest macierzą ortogonalną, z determinantą +1. Jako transformacja liniowa każda macierz ortogonalna z wyznacznikiem +1 jest czystym obrotem bez odbicia, tzn. transformacja zachowuje orientację transformowanej struktury, natomiast każda macierz ortogonalna z wyznacznikiem -1 odwraca orientację, czyli jest złożeniem czyste odbicie i (ewentualnie zerowy) obrót. Macierze tożsamościowe mają wyznacznik 1 i są czystymi rotacjami o kąt zero.

Kompleks analogu prostopadłym matrycy jest macierzą jednostkową .

Główne operacje

Namierzać

Śladowych , TR ( ) macierzy kwadratowej A jest sumą przekątnej pozycji. Chociaż mnożenie macierzy nie jest przemienne, jak wspomniano powyżej , ślad iloczynu dwóch macierzy jest niezależny od kolejności czynników:

tr( AB ) = tr( BA ).

Wynika to bezpośrednio z definicji mnożenia macierzy:

Wynika z tego, że ślad iloczynu więcej niż dwóch macierzy jest niezależny od cyklicznych permutacji macierzy, jednak generalnie nie dotyczy to dowolnych permutacji (na przykład tr( ABC ) ≠ tr( BAC ) w ogólności). Również ślad macierzy jest równy śladowi jej transpozycji, czyli

tR ( ) = tR ( T ) .

Wyznacznik

Przekształcenie liniowe na R 2 podane przez wskazaną macierz. Wyznacznikiem tej macierzy jest -1, ponieważ powierzchnia zielonego równoległoboku po prawej stronie wynosi 1, ale mapa odwraca orientację , ponieważ zmienia orientację wektorów w kierunku przeciwnym do ruchu wskazówek zegara.

Wyznacznikiem macierzy kwadratowej A (oznaczona det ( A ) lub | A |) jest liczbą kodujący określone właściwości matrycy. Macierz jest odwracalna wtedy i tylko wtedy, gdy jej wyznacznik jest niezerowy. Jego wartość bezwzględna jest równa powierzchni (w R 2 ) lub objętości (w R 3 ) obrazu jednostkowego kwadratu (lub sześcianu), natomiast jego znak odpowiada orientacji odpowiedniej mapy liniowej: wyznacznik jest dodatni wtedy i tylko jeśli orientacja jest zachowana.

Wyznacznikiem macierzy 2x2 jest

Wyznacznik macierzy 3 na 3 obejmuje 6 wyrazów ( reguła Sarrusa ). Im dłuższa wzór Leibniza upowszechnia te dwa wzory do wszystkich wymiarach.

Wyznacznik iloczynu macierzy kwadratowych jest równy iloczynowi ich wyznaczników:

det( AB ) = det( A ) · det( B ).

Dodanie wielokrotności dowolnego wiersza do innego wiersza lub wielokrotności dowolnej kolumny do innej kolumny nie zmienia wyznacznika. Zamiana dwóch wierszy lub dwóch kolumn wpływa na wyznacznik, mnożąc go przez -1. Za pomocą tych operacji dowolną macierz można przekształcić w dolną (lub górną) macierz trójkątną, a dla takich macierzy wyznacznik jest równy iloczynowi wpisów na głównej przekątnej; zapewnia to metodę obliczania wyznacznika dowolnej macierzy. Wreszcie rozszerzenie Laplace'a wyraża wyznacznik w kategoriach minorów , czyli wyznaczniki mniejszych macierzy. To rozwinięcie może być użyte do rekurencyjnej definicji wyznaczników (przyjmując jako przypadek początkowy wyznacznik macierzy 1 na 1, która jest jej unikalnym wpisem, lub nawet wyznacznik macierzy 0 na 0, czyli 1) , który można uznać za odpowiednik formuły Leibniza. Wyznaczników można używać do rozwiązywania układów liniowych za pomocą reguły Cramera , gdzie podział wyznaczników dwóch powiązanych macierzy kwadratowych równa się wartości każdej ze zmiennych układu.

Wartości własne i wektory własne

Liczba λ i niezerowy wektor v spełniające

są nazywane wartości własnych oraz wektorem własnym z A , odpowiednio. Liczba λ jest wartością własną się z n x n -Matrix A , wtedy i tylko wtedy, gdy -A I n jest odwracalne, co jest równoznaczne z

Wielomian P w nieokreślony X podanym przez ocenę wyznacznika det ( X I N - ) nazywa się wielomian charakterystyczny z A . Jest monic wielomian od stopnia n . Dlatego równanie wielomianowe p A (λ) = 0 ma co najwyżej n różnych rozwiązań, czyli wartości własnych macierzy. Mogą być złożone, nawet jeśli wpisy A są prawdziwe. Zgodnie z twierdzeniem Cayleya-Hamiltona , p A ( A ) = 0 , czyli wynik podstawienia samej macierzy w jej własny wielomian charakterystyczny daje macierz zerową .   

Aspekty obliczeniowe

Obliczenia macierzowe można często wykonywać różnymi technikami. Wiele problemów można rozwiązać zarówno za pomocą algorytmów bezpośrednich, jak i podejść iteracyjnych. Na przykład wektory własne macierzy kwadratowej można uzyskać, znajdując sekwencję wektorów x n zbieżnych do wektora własnego, gdy n dąży do nieskończoności .

Aby wybrać najbardziej odpowiedni algorytm dla każdego konkretnego problemu, ważne jest określenie zarówno skuteczności, jak i precyzji wszystkich dostępnych algorytmów. Dziedzinę badającą te zagadnienia nazywamy numeryczną algebrą liniową . Podobnie jak w przypadku innych sytuacji liczbowych, dwa główne aspekty to złożoność algorytmów i ich stabilność numeryczna .

Określenie złożoności algorytmu oznacza znalezienie górnych granic lub oszacowanie, ile operacji elementarnych, takich jak dodawanie i mnożenie skalarów, jest niezbędnych do wykonania jakiegoś algorytmu, na przykład mnożenia macierzy . Obliczenie iloczynu macierzowego dwóch macierzy n -by- n przy użyciu definicji podanej powyżej wymaga n 3 mnożeń, ponieważ dla każdego z n 2 wpisów iloczynu konieczne jest n mnożeń. Algorytm strassena przewyższa ten „naiwny” algorytmu; potrzebuje tylko n 2.807 mnożenia. Wyrafinowane podejście obejmuje również specyficzne cechy urządzeń obliczeniowych.

W wielu praktycznych sytuacjach znane są dodatkowe informacje o zaangażowanych matrycach. Ważnym przypadkiem są macierze rzadkie , czyli macierze , których większość wpisów ma wartość zero. Istnieją specjalnie przystosowane algorytmy do, powiedzmy, rozwiązywania układów liniowych Ax = b dla macierzy rzadkich A , takie jak metoda gradientu sprzężonego .

Algorytm jest z grubsza stabilny numerycznie, jeśli niewielkie odchylenia wartości wejściowych nie prowadzą do dużych odchyleń wyniku. Na przykład, obliczenie odwrotności macierzy poprzez Laplace'a rozprężania (adj ( A ) oznacza matrycę adjugate z A )

A -1 = adj( A ) / det( A )

może prowadzić do znacznych błędów zaokrągleń, jeśli wyznacznik macierzy jest bardzo mały. Normą matrycy mogą być wykorzystywane do uchwycenia kondycjonowania liniowych algebraicznych problemów, takich jak przetwarzanie odwrotne w matrycę.

Większość języków programowania komputerów obsługuje tablice, ale nie ma wbudowanych poleceń dla macierzy. Zamiast tego dostępne biblioteki zewnętrzne udostępniają operacje macierzowe na tablicach, w prawie wszystkich obecnie używanych językach programowania. Manipulacja macierzami należała do najwcześniejszych zastosowań numerycznych komputerów. Oryginalny Dartmouth BASIC miał wbudowane polecenia arytmetyki macierzowej na macierzach z implementacji drugiej edycji w 1964 roku. Już w latach 70. niektóre komputery inżynierskie, takie jak HP 9830, miały kasety ROM do dodawania poleceń BASIC dla macierzy . Niektóre języki komputerowe, takie jak APL, zostały zaprojektowane do manipulowania macierzami, a różne programy matematyczne mogą być używane do wspomagania obliczeń na macierzach.

Rozkład

Istnieje kilka metod renderowania macierzy do postaci łatwiej dostępnej. Są one ogólnie określane jako techniki dekompozycji macierzy lub faktoryzacji macierzy . W interesie wszystkich tych technik jest to, aby zachowały pewne właściwości danych macierzy, takie jak wyznacznik, rząd lub odwrotność, aby te wielkości można było obliczyć po zastosowaniu przekształcenia, lub aby pewne operacje na macierzach były algorytmicznie łatwiejsze do wykonania dla niektórych typów macierzy.

Do rozkładu LU matryce czynniki jako produktu dolnego ( L ) i górną trójkątne matryce ( U ). Po obliczeniu tej dekompozycji układy liniowe można rozwiązywać wydajniej za pomocą prostej techniki zwanej substytucją w przód i w tył . Podobnie odwrotności macierzy trójkątnych są algorytmicznie łatwiejsze do obliczenia. Eliminacja Gaussa jest podobnym algorytmem; przekształca dowolną macierz do postaci schodkowej wierszy . Obie metody polegają na pomnożeniu macierzy przez odpowiednie macierze elementarne , które odpowiadają permutacji wierszy lub kolumn i dodaniu wielokrotności jednego wiersza do drugiego. Rozkład na wartości osobliwe wyraża dowolną macierz A jako iloczyn UDV , gdzie U i Vmacierzami unitarnymi, a D jest macierzą diagonalną.

Przykład macierzy w postaci normalnej Jordana. Szare klocki to klocki Jordana.

Rozkład własny lub diagonalizacja wyraża A jako iloczyn VDV- 1 , gdzie D jest macierzą diagonalną, a V jest odpowiednią macierzą odwracalną. Jeśli A można zapisać w tej formie, nazywa się to diagonalizowalnym . Bardziej ogólnie, i mają zastosowanie do wszystkich matrycy, Jordan rozkładu przekształca matrycę do Jordan postaci normalnej , to znaczy macierzy których tylko niezerowe wartości to wartości własne X 1 do X n z A umieszczony na głównych przekątnej i ewentualnie pozycji równej jeden bezpośrednio nad główną przekątną, jak pokazano po prawej stronie. Biorąc pod uwagę rozkład własnych, n- potęgę A (czyli n- krotne mnożenie macierzy iterowanej) można obliczyć za pomocą

A n = ( VDV -1 ) n = VDV -1 VDV -1 ... VDV -1 = VD n V -1

a potęgę macierzy diagonalnej można obliczyć, biorąc odpowiednie potęgi wpisów diagonalnych, co jest znacznie łatwiejsze niż wykonanie potęgowania dla A zamiast tego. Można to wykorzystać do obliczenia macierzy wykładniczej e A , co często pojawia się przy rozwiązywaniu liniowych równań różniczkowych , logarytmów macierzowych i pierwiastków kwadratowych macierzy . Aby uniknąć sytuacji liczbowo źle uwarunkowanych , można zastosować dalsze algorytmy, takie jak dekompozycja Schura .

Abstrakcyjne aspekty algebraiczne i uogólnienia

Macierze można uogólniać na różne sposoby. Algebra abstrakcyjna wykorzystuje macierze z wpisami w bardziej ogólnych polach lub nawet pierścieniach , podczas gdy algebra liniowa koduje własności macierzy w pojęciu map liniowych. Możliwe jest rozważenie macierzy o nieskończenie wielu kolumnach i wierszach. Innym rozszerzeniem są tensory , które można postrzegać jako wysokowymiarowe tablice liczb, w przeciwieństwie do wektorów, które często mogą być realizowane jako ciągi liczb, podczas gdy macierze są prostokątnymi lub dwuwymiarowymi tablicami liczb. Macierze, z zastrzeżeniem pewnych wymagań, mają tendencję do tworzenia grup znanych jako grupy macierzowe. Podobnie w pewnych warunkach matryce tworzą pierścienie zwane pierścieniami matrycowymi . Chociaż iloczyn macierzy nie jest na ogół przemienny, to jednak pewne macierze tworzą pola zwane polami macierzowymi .

Macierze z bardziej ogólnymi wpisami

Ten artykuł skupia się na macierzach, których wpisy są liczbami rzeczywistymi lub zespolonymi. Jednak macierze mogą być rozpatrywane z dużo bardziej ogólnymi typami wpisów niż liczby rzeczywiste lub zespolone. Jako pierwszy krok uogólnienia, zamiast R lub C można użyć dowolnego pola , czyli zbioru, w którym operacje dodawania , odejmowania , mnożenia i dzielenia są zdefiniowane i dobrze zachowane , na przykład liczby wymierne lub pola skończone . Na przykład teoria kodowania wykorzystuje macierze nad ciałami skończonymi. Wszędzie tam, gdzie brane są pod uwagę wartości własne , ponieważ są to pierwiastki wielomianu, mogą istnieć tylko w większym polu niż wpisy macierzy; na przykład mogą być złożone w przypadku macierzy z rzeczywistymi wpisami. Możliwość reinterpretacji wpisów macierzy jako elementów większego pola (na przykład, aby zobaczyć rzeczywistą macierz jako złożoną macierz, której wpisy są prawdziwe) pozwala na uznanie, że każda macierz kwadratowa posiada pełny zestaw wartości własnych. Alternatywnie można od początku rozważać tylko macierze z wpisami w algebraicznie domkniętym ciele , takim jak C .

Bardziej ogólnie, macierze z wpisami w pierścieniu R są szeroko stosowane w matematyce. Pierścienie są pojęciem bardziej ogólnym niż pola, ponieważ operacja podziału nie musi istnieć. Te same operacje dodawania i mnożenia macierzy dotyczą również tego ustawienia. Zestaw M ( n , R ) (również oznaczanej M N (R)) wszystkich kwadratowych n -by- n macierzy ponad R oznacza pierścień zwany pierścieniem matrycy , izomorficzne z pierścieniem endomorfizm lewej R - moduł R n . Jeśli pierścień R jest przemienny , to znaczy jego mnożenie jest przemienne , to M( n , R ) jest unitarną nieprzemienną (chyba że n = 1) algebrą asocjacyjną nad R . Determinantą kwadratowych macierzy powyżej pierścienia przemiennego R może być jeszcze określono według wzoru Leibniza ; taka macierz jest odwracalna wtedy i tylko wtedy, gdy jej wyznacznik jest odwracalny w R , uogólniając sytuację nad ciałem F , gdzie każdy niezerowy element jest odwracalny. Macierze ponad superrings nazywane są supermatrices .

Macierze nie zawsze mają wszystkie swoje wpisy w tym samym pierścieniu  – lub w ogóle w dowolnym pierścieniu. Jednym szczególnym, ale powszechnym przypadkiem są macierze blokowe , które można uznać za macierze, których wpisy same w sobie są macierzami. Wpisy nie muszą być macierzami kwadratowymi, a zatem nie muszą być członkami żadnego pierścienia ; ale ich rozmiary muszą spełniać określone warunki kompatybilności.

Związek z mapami liniowymi

Mapy liniowe R nR m są równoważne macierzom m - by - n , jak opisano powyżej . Mówiąc bardziej ogólnie, dowolne liniowe odwzorowanie f : VW pomiędzy skończenie wymiarowymi przestrzeniami wektorowymi można opisać macierzą A = ( a ij ), po wybraniu baz v 1 , ..., v n z V , oraz w 1 , . .., w m w w (a więc brak jest wymiar V i m ma wymiar w ), która jest taka, że

Innymi słowy, kolumna J z A wyraża obraz v j w odniesieniu do wektorów bazowych w I o W ; zatem ta relacja jednoznacznie determinuje wpisy macierzy A . Macierz zależy od wyboru zasad: różne wybory zasad dają różne, ale równoważne macierze . Wiele z powyższych pojęć, beton może być postrzegane w tym kontekście na przykład transpozycji matrycy T opisuje transpozycję liniowej mapie podane przez A , w odniesieniu do podwójnych zasad .

Własności te można odtworzyć w bardziej naturalny sposób: kategoria wszystkich macierzy z wpisami w polu z mnożeniem jako złożeniem jest równoważna kategorii skończenie wymiarowych przestrzeni wektorowych i liniowych map nad tym ciałem.

Bardziej ogólnie, zbiór m x n matryce można stosować w celu reprezentowania R -linear mapuje między wolnym moduły R m i R n dla dowolnego pierścienia R z jedności. Gdy n  = m skład tych map jest to możliwe, co prowadzi do pierścienia matrycy z n x n matrycami reprezentujące pierścień endomorfizm z R n .  

Grupy macierzowe

Grupa jest strukturą składającą się z matematycznej zestawu przedmiotów wraz z operacji binarnej , to znaczy operacja łączenia dwóch dowolnych przedmiotów w trzecim, pod pewnymi wymaganiami. Grupa, w której obiektami są macierze, a operacjami grupowymi jest mnożenie macierzy, nazywana jest grupą macierzową . Ponieważ w grupie każdy element musi być odwracalny, najbardziej ogólnymi grupami macierzowymi są grupy wszystkich macierzy odwracalnych danej wielkości, zwane ogólnymi grupami liniowymi .

Dowolna właściwość macierzy, która jest zachowana pod iloczynami macierzy i odwrotnościami, może być wykorzystana do zdefiniowania dalszych grup macierzy. Na przykład macierze o danej wielkości i wyznaczniku 1 tworzą podgrupę (czyli mniejszą grupę zawartą w) swojej ogólnej grupie liniowej, zwanej specjalną grupą liniową . Macierze ortogonalne , określone przez warunek

M T M = Ja ,

tworzą grupę ortogonalną . Każda macierz ortogonalna ma wyznacznik 1 lub -1. Macierze ortogonalne z wyznacznikiem 1 tworzą podgrupę zwaną specjalną grupą ortogonalną .

Każda skończona grupa jest izomorficzna do grupy macierzy, jak widać rozważając regularne reprezentacji z grupy symetrycznej . Grupy ogólne można badać za pomocą grup macierzowych, które są stosunkowo dobrze poznane, za pomocą teorii reprezentacji .

Nieskończone macierze

Możliwe jest również uwzględnienie macierzy o nieskończenie wielu wierszach i/lub kolumnach, nawet jeśli będąc nieskończonymi obiektami, nie da się takich macierzy jednoznacznie zapisać. Liczy się tylko to, że dla każdego elementu w zbiorze wierszy indeksowania i każdego elementu w zbiorze kolumn indeksowania istnieje dobrze zdefiniowany wpis (te zbiory indeksów nie muszą nawet być podzbiorami liczb naturalnych). Podstawowe operacje dodawania, odejmowania, mnożenia przez skalar i transpozycji można nadal bez problemu definiować; jednak mnożenie macierzy może obejmować nieskończone sumowania w celu zdefiniowania wynikowych wpisów, a nie są one ogólnie zdefiniowane.

Jeśli R jest dowolnym pierścieniem z jednością, to pierścień endomorfizmów jako prawego modułu R jest izomorficzny z pierścieniem kolumnowych macierzy skończonych, których wpisy są indeksowane przez , a każda z kolumn zawiera tylko skończenie wiele niezerowych wpisów. Endomorfizmy M rozpatrywane jako lewy moduł R dają w wyniku analogiczny obiekt, rzędowe macierze skończone, których każdy z wierszy ma tylko skończenie wiele niezerowych wpisów.

Jeśli do opisu odwzorowań liniowych używa się macierzy nieskończonych, to można używać tylko tych macierzy, których kolumny mają tylko skończoną liczbę wpisów niezerowych, z następującego powodu. Aby macierz A opisała odwzorowanie liniowe f : VW , muszą być wybrane bazy dla obu przestrzeni; Przypomnijmy, że z definicji oznacza to, że każdy wektor w przestrzeni może być zapisane jako wyjątkowo (Finite) liniowe połączenie wektorów bazowych, aby zapisać jako a (kolumna) wektor v do współczynników tylko skończoną wiele wpisów v I są niezerowe. Teraz kolumny A opisują obrazy przez f poszczególnych wektorów bazy V w bazie W , co ma sens tylko wtedy, gdy te kolumny mają tylko skończenie wiele niezerowych wpisów. Nie ma jednak ograniczeń co do wierszy A : w iloczynie A · v występuje tylko skończenie wiele niezerowych współczynników v , więc każdy z jego wpisów, nawet jeśli jest podany jako nieskończona suma iloczynów, obejmuje tylko skończenie wiele niezerowych terminów i dlatego jest dobrze zdefiniowany. Co więcej, sprowadza się to do utworzenia liniowej kombinacji kolumn A, która efektywnie obejmuje tylko skończenie wiele z nich, a wynik ma tylko skończenie wiele niezerowych wpisów, ponieważ każda z tych kolumn ma. Iloczyny dwóch macierzy danego typu są dobrze zdefiniowane (pod warunkiem, że zestawy indeksu kolumn i indeksu wiersza są zgodne), są tego samego typu i odpowiadają kompozycji map liniowych.  

Jeśli R jest pierścieniem unormowanym , warunek skończoności rzędu lub kolumny może być złagodzony. Przy obowiązującej normie zamiast sum skończonych można stosować szeregi absolutnie zbieżne . Na przykład macierze, których sumy kolumn są ciągami absolutnie zbieżnymi, tworzą pierścień. Analogicznie macierze, których sumy wierszy są szeregami absolutnie zbieżnymi, również tworzą pierścień.

Macierze nieskończone mogą być również używane do opisu operatorów na przestrzeniach Hilberta , gdzie pojawiają się pytania o zbieżność i ciągłość , co ponownie skutkuje pewnymi ograniczeniami, które muszą zostać nałożone. Jednak jednoznaczny punkt widzenia macierzy ma tendencję do zaciemniania sprawy, a zamiast tego można użyć abstrakcyjnych i potężniejszych narzędzi analizy funkcjonalnej .

Pusta macierz

Pusty matryca stanowi matrycę, w której liczba rzędów lub kolumn (lub obu) wynosi zero. Puste macierze pomagają radzić sobie z mapami zawierającymi zerową przestrzeń wektorową . Na przykład, jeśli A jest macierzą 3 na 0, a B jest macierzą 0 na 3, to AB jest macierzą zerową 3 na 3 odpowiadającą odwzorowaniu zerowemu z trójwymiarowej przestrzeni V na siebie, podczas gdy BA jest macierzą 0 na 0. Nie ma wspólnej notacji dla pustych macierzy, ale większość systemów algebry komputerowej pozwala na ich tworzenie i obliczanie. Wyznacznik macierzy 0-na-0 wynosi 1 w odniesieniu do iloczynu pustego występującego we wzorze Leibniza dla wyznacznika jako 1. Wartość ta jest również zgodna z faktem, że mapa tożsamości z dowolnej przestrzeni skończenie wymiarowej ma do siebie wyznacznik  1, fakt, który jest często używany jako część charakterystyki wyznaczników.

Aplikacje

Istnieje wiele zastosowań macierzy, zarówno w matematyce, jak i innych naukach. Niektóre z nich wykorzystują jedynie zwartą reprezentację zbioru liczb w macierzy. Na przykład w teorii gier i ekonomii The macierz wypłat koduje wypłat dla dwóch graczy, w zależności które z danym (skończonej) zbiór alternatyw gracze wybierają. Eksploracja tekstu i automatyczna kompilacja tezaurusów wykorzystuje macierze terminów dokumentowych, takie jak tf-idf, do śledzenia częstotliwości występowania określonych słów w kilku dokumentach.

Liczby zespolone mogą być reprezentowane przez konkretne macierze rzeczywiste 2x2 za pomocą

w którym dodawanie i mnożenie liczb zespolonych i macierzy odpowiadają sobie. Na przykład macierze rotacji 2 na 2 reprezentują mnożenie z pewną liczbą zespoloną o wartości bezwzględnej 1, jak powyżej . Podobna interpretacja jest możliwa dla kwaternionów i algebr Clifforda w ogóle.

Wczesne techniki szyfrowania , takie jak szyfr Hilla, również wykorzystywały macierze. Jednak ze względu na liniowy charakter macierzy, kody te są stosunkowo łatwe do złamania. Grafika komputerowa wykorzystuje macierze zarówno do reprezentowania obiektów, jak i do obliczania przekształceń obiektów przy użyciu macierzy rotacji afinicznej w celu realizacji zadań, takich jak rzutowanie trójwymiarowego obiektu na dwuwymiarowy ekran, co odpowiada teoretycznej obserwacji z kamery. Macierze nad pierścieniem wielomianowym są ważne w badaniu teorii sterowania .

Chemia wykorzystuje macierze na różne sposoby, zwłaszcza od czasu zastosowania teorii kwantowej do omówienia wiązań molekularnych i spektroskopii . Przykładami są: matryca nakładania i matryca Focka stosowane w rozwiązywaniu równania Roothaana celu uzyskania orbitali molekularnych o Hartree-Focka .

Teoria grafów

Nieskierowany graf z macierzą sąsiedztwa:

Matryca przylegania z ograniczonym wykresie to podstawowa idea teorii wykresu . Rejestruje, które wierzchołki wykresu są połączone krawędzią. Macierze zawierające tylko dwie różne wartości (1 i 0 oznaczają na przykład odpowiednio „tak” i „nie”) nazywane są macierzami logicznymi . Odległości (lub koszt) matryca zawiera informacje dotyczące długości krawędzi. Koncepcje te można zastosować do stron internetowych połączonych hiperłączami lub miast połączonych drogami itp., w którym to przypadku (chyba że sieć połączeń jest bardzo gęsta) macierze bywają rzadkie , czyli zawierają niewiele niezerowych wpisów. W związku z tym w teorii sieci można zastosować specjalnie dostosowane algorytmy macierzowe .

Analiza i geometria

Heskie matrycy z różniczkowej funkcji ƒ : R nR składa się z drugiej pochodnej o ƒ w odniesieniu do poszczególnych współrzędnych kierunkach, to jest

W punkcie siodłowym ( x  =  0, y  =  0) (czerwony) funkcji f ( x ,− y ) = x 2y 2 , macierz Hesja jest nieokreślona .   

Koduje informację o lokalnym przebieg wzrostu funkcji: dali punkt krytyczny x  =  ( x 1 ,  ..., x n ), to jest punkt, w którym pierwsze pochodne cząstkowe z ƒ znikają funkcja ma lokalne minimum jeśli macierz Hess jest dodatnio określona . Programowanie kwadratowe może być użyte do znalezienia globalnych minimów lub maksimów funkcji kwadratowych ściśle powiązanych z tymi dołączonymi do macierzy (patrz wyżej ).  

Inną macierzą często używaną w sytuacjach geometrycznych jest macierz Jacobiego odwzorowania różniczkowalnego f : R nR m . Jeśli f 1 , ..., f m oznaczają składowe f , to macierz Jacobiego jest zdefiniowana jako

Jeśli n > m , a rząd macierzy Jacobiego osiąga maksymalną wartość m , f jest w tym punkcie lokalnie odwracalne, zgodnie z twierdzeniem o funkcji uwikłanej .

Równania różniczkowe cząstkowe można sklasyfikować, biorąc pod uwagę macierz współczynników operatorów różniczkowych najwyższego rzędu równania. Dla eliptycznych równań różniczkowych cząstkowych macierz ta jest dodatnio określona, ​​co ma decydujący wpływ na zbiór możliwych rozwiązań omawianego równania.

Metoda elementów skończonych jest ważną metodą numeryczną do rozwiązywania równań różniczkowych cząstkowych, szeroko stosowaną w symulacji złożonych układów fizycznych. Próbuje przybliżyć rozwiązanie pewnego równania za pomocą odcinkowych funkcji liniowych, w których elementy są wybierane z uwzględnieniem wystarczająco drobnej siatki, która z kolei może zostać przekształcona w równanie macierzowe.

Teoria prawdopodobieństwa i statystyka

Dwa różne łańcuchy Markowa. Wykres przedstawia liczbę cząstek (w sumie 1000) w stanie „2”. Obie wartości graniczne można wyznaczyć z macierzy przejścia, które są podane przez (czerwony) i (czarny).

Macierze stochastyczne to macierze kwadratowe, których wiersze są wektorami prawdopodobieństwa , czyli których wpisy są nieujemne i sumują się do jednego. Macierze stochastyczne służą do definiowania łańcuchów Markowa o skończenie wielu stanach. Wiersz macierzy stochastycznej podaje rozkład prawdopodobieństwa dla następnej pozycji jakiejś cząstki znajdującej się obecnie w stanie, który odpowiada rzędowi. Z wektorów własnych macierzy przejściowych można odczytać własności łańcuchowych stanów absorbujących Markowa , czyli stanów, które w końcu osiągnie dowolna cząstka.

Statystyka wykorzystuje również macierze w wielu różnych formach. Statystyka opisowa dotyczy opisywania zbiorów danych, które często mogą być reprezentowane jako macierze danych , które następnie mogą być poddane technikom redukcji wymiarowości . Kowariancji koduje wzajemnego wariancji kilku zmiennych losowych . Inną techniką wykorzystującą macierze są liniowe najmniejszych kwadratów , metoda aproksymująca skończony zbiór par ( x 1 , y 1 ), ( x 2 , y 2 ), ..., ( x N , y N ) przez funkcję liniową

y iax i + b , i = 1, ..., N

które można sformułować w kategoriach macierzy, związanych z rozkładem macierzy na wartości osobliwe .

Macierze losowe to macierze, których wpisy są liczbami losowymi, podlegającymi odpowiednim rozkładom prawdopodobieństwa , takim jak macierzowy rozkład normalny . Poza teorią prawdopodobieństwa są one stosowane w dziedzinach od teorii liczb po fizykę .

Symetrie i przekształcenia w fizyce

Transformacje liniowe i związane z nimi symetrie odgrywają kluczową rolę we współczesnej fizyce. Na przykład cząstki elementarne w kwantowej teorii pola są klasyfikowane jako reprezentacje szczególnej teorii względności Lorentza , a dokładniej przez ich zachowanie w grupie spinowej . Konkretne reprezentacje obejmujące macierze Pauliego i bardziej ogólne macierze gamma są integralną częścią fizycznego opisu fermionów , które zachowują się jak spinory . Dla trzech najlżejszych kwarków istnieje teoretyczna reprezentacja grupy obejmująca specjalną grupę unitarną SU(3); do swoich obliczeń fizycy używają wygodnej reprezentacji macierzowej znanej jako macierze Gell-Manna , które są również używane dla grupy cechowania SU(3) , która stanowi podstawę współczesnego opisu silnych oddziaływań jądrowych, chromodynamiki kwantowej . Z kolei macierz Cabibbo-Kobayashi-Maskawa wyraża fakt, że podstawowe stany kwarków, które są ważne dla oddziaływań słabych, nie są takie same, ale są liniowo powiązane z podstawowymi stanami kwarków, które definiują cząstki o określonych i odrębnych masach .

Liniowe kombinacje stanów kwantowych

Pierwszy model mechaniki kwantowej ( Heisenberg , 1925) reprezentował operatory teorii przez nieskończenie wymiarowe macierze działające na stany kwantowe. Nazywa się to również mechaniką macierzową . Jednym szczególnym przykładem jest macierz gęstości, która charakteryzuje „mieszany” stan układu kwantowego jako liniową kombinację elementarnych, „czystych” stanów własnych .

Inna macierz służy jako kluczowe narzędzie do opisywania eksperymentów rozpraszania, które stanowią podstawę eksperymentalnej fizyki cząstek: Reakcje zderzeń, takie jak zachodzące w akceleratorach cząstek , w których nieoddziałujące cząstki kierują się ku sobie i zderzają się w małej strefie interakcji, z nowym W rezultacie zbiór cząstek nieoddziałujących można opisać jako iloczyn skalarny stanów cząstek wychodzących i liniowej kombinacji stanów cząstek wchodzących. Kombinacja liniowa jest podana przez macierz znaną jako macierz S , która koduje wszystkie informacje o możliwych interakcjach między cząstkami.

Tryby normalne

Ogólnym zastosowaniem macierzy w fizyce jest opis liniowo sprzężonych układów harmonicznych. Do równania ruchu tych systemów może być opisane w postaci matrycy, z matrycą masy mnożący uogólniony prędkość otrzymując termin kinetyczne i siły matrycy przemnożenia wektora przemieszczenia charakteryzowania oddziaływań. Najlepszym sposobem uzyskania rozwiązań jest wyznaczenie wektorów własnych układu , jego modów normalnych , poprzez diagonalizację równania macierzowego. Techniki takie jak ta są kluczowe, jeśli chodzi o wewnętrzną dynamikę cząsteczek : wewnętrzne wibracje układów składających się z wzajemnie powiązanych atomów składowych. Są one również potrzebne do opisu drgań mechanicznych i oscylacji w obwodach elektrycznych.

Optyka geometryczna

Optyka geometryczna zapewnia dalsze zastosowania matryc. W tej przybliżonej teorii pomija się falową naturę światła. Rezultatem jest model, w którym promienie świetlne są rzeczywiście promieniami geometrycznymi . Jeśli ugięcie promieni świetlnych przez elementy optyczne jest małe, działanie soczewki lub elementu odbijającego na dany promień świetlny można wyrazić jako pomnożenie wektora dwuskładnikowego z macierzą dwa na dwa, zwaną analizą macierzy przenoszenia promieni : składowymi wektora są nachylenie promienia świetlnego i jego odległość od osi optycznej, natomiast macierz koduje właściwości elementu optycznego. W rzeczywistości istnieją dwa rodzaje macierzy, mianowicie. matrycy refrakcji opisujący załamanie w powierzchni szkła, a matryca tłumaczenie opisujący translację płaszczyzny odniesienia do drugiej powierzchni załamujących, w których stosuje się inną osnową refrakcji. Układ optyczny składający się z kombinacji soczewek i/lub elementów odblaskowych jest po prostu opisany przez matrycę wynikającą z produktu matryc komponentów.

Elektronika

Tradycyjna analiza siatki i analiza węzłów w elektronice prowadzą do układu równań liniowych, który można opisać za pomocą macierzy.

Zachowanie wielu elementów elektronicznych można opisać za pomocą macierzy. Niech A będzie wektorem dwuwymiarowym z napięciem wejściowym v 1 i prądem wejściowym i 1 jako jego elementami, a B będzie wektorem dwuwymiarowym z napięciem wyjściowym v 2 i prądem wyjściowym i 2 jako jej elementami. Wtedy zachowanie elementu elektronicznego można opisać przez B = H · A , gdzie H jest macierzą 2 x 2 zawierającą jeden element impedancji ( h 12 ), jeden element admitancji ( h 21 ) i dwa elementy bezwymiarowe ( h 11 i h 22 ). Obliczanie obwodu ogranicza się teraz do mnożenia macierzy.

Historia

Macierze mają długą historię zastosowań w rozwiązywaniu równań liniowych, ale do XIX wieku były znane jako tablice. Te chińskie tekst rozdziałach Dziewięć na sztuce Matematycznego napisany w 10-2 wieku pne jest pierwszym przykładem zastosowania metod tablicowych do rozwiązywania równań , w tym koncepcji uwarunkowań . W 1545 włoski matematyk Gerolamo Cardano wprowadził tę metodę do Europy, publikując Ars Magna . Japoński matematyk Seki stosować tych samych metod tablicowych do rozwiązywania równań w 1683 roku holenderski matematyk Jan de Witt reprezentowane transformacji przy użyciu tablic w jego 1659 książce Elements krzywych (1659). W latach 1700-1710 Gottfried Wilhelm Leibniz nagłośnił użycie tablic do zapisywania informacji lub rozwiązań i eksperymentował z ponad 50 różnymi systemami tablic. Cramer przedstawił swoje rządy w 1750 roku.

Termin „matryca” (łac. „łono”, wywodzący się od mater — matka) został ukuty przez Jamesa Josepha Sylwestra w 1850 roku, który rozumiał macierz jako obiekt dający początek kilku wyznacznikom, zwanych dziś nieletnimi , czyli wyznacznikami mniejsze macierze, które pochodzą od oryginalnej, usuwając kolumny i wiersze. W artykule z 1851 roku Sylvester wyjaśnia:

W poprzednich artykułach zdefiniowałem „Macierz” jako prostokątny układ terminów, z którego mogą powstać różne systemy wyznaczników, jak z łona wspólnego rodzica.

Arthur Cayley opublikował traktat o przekształceniach geometrycznych przy użyciu macierzy, które nie były obróconą wersją badanych współczynników, jak to miało miejsce wcześniej. Zamiast tego zdefiniował operacje takie jak dodawanie, odejmowanie, mnożenie i dzielenie jako przekształcenia tych macierzy i pokazał, że własności asocjacyjne i rozdzielcze są prawdziwe. Cayley zbadał i zademonstrował nieprzemienną właściwość mnożenia macierzy oraz przemienną właściwość dodawania macierzy. Wczesna teoria macierzowa ograniczała użycie tablic prawie wyłącznie do wyznaczników, a abstrakcyjne operacje na macierzach Arthura Cayleya były rewolucyjne. Odegrał kluczową rolę w zaproponowaniu koncepcji macierzy niezależnej od układów równań. W 1858 Cayley opublikował swoje pamiętnik na temat teorii macierzy, w którym zaproponował i zademonstrował twierdzenie Cayleya-Hamiltona .

Angielski matematyk Cuthbert Edmund Cullis jako pierwszy użył nowoczesnej notacji nawiasów dla macierzy w 1913 roku i jednocześnie zademonstrował pierwsze znaczące użycie notacji A = [ a i , j ] do przedstawienia macierzy, w której a i , j odnosi się do i wiersz i j kolumna.

Współczesne studium uwarunkowań wywodzi się z kilku źródeł. Problemy teorii liczb doprowadziły Gaussa do powiązania współczynników form kwadratowych , czyli wyrażeń takich jak x 2 + xy − 2 y 2 , oraz map liniowych w trzech wymiarach z macierzami. Eisenstein rozwinął te pojęcia, włączając w to uwagę, że we współczesnym języku produkty macierzowenieprzemienne . Cauchy jako pierwszy udowodnił ogólne twierdzenia o wyznacznikach, używając jako definicji wyznacznika macierzy A = [ a i , j ] następującego: zamień potęgi a j k na a jk w wielomianu

,

gdzie Π oznacza iloczyn wskazanych terminów. Wykazał również w 1829 roku, że wartości własne macierzy symetrycznych są rzeczywiste. Jacobi studiował „wyznaczniki funkcjonalne” – później nazwane przez Sylvester wyznacznikami Jacobiego – które mogą być użyte do opisania przekształceń geometrycznych na poziomie lokalnym (lub nieskończenie małym ), patrz wyżej ; Kronecker jest Vorlesungen über die Theorie der Determinanten i Weierstrassa " Zur Determinantentheorie , jak opublikowana w 1903 roku, najpierw traktuje determinanty aksjomatycznie , w przeciwieństwie do poprzedniego więcej betonu podejścia takie jak opisane wcześniej wzoru Cauchy'ego. W tym momencie determinanty były mocno ugruntowane.

Wiele twierdzeń zostało po raz pierwszy ustalonych tylko dla małych macierzy, np. twierdzenie Cayleya–Hamiltona dla macierzy 2×2 zostało udowodnione przez Cayleya we wspomnianym pamiętniku, a przez Hamiltona dla macierzy 4×4. Frobenius , pracując nad formami dwuliniowymi , uogólnił twierdzenie na wszystkie wymiary (1898). Również pod koniec 19. wieku, eliminacji Gaussa-Jordana (uogólniając szczególny przypadek teraz znany jako eliminacja Gaussa ) został ustanowiony przez Jordan . Na początku XX wieku macierze osiągnęły centralną rolę w algebrze liniowej, częściowo ze względu na ich zastosowanie w klasyfikacji hiperzłożonych systemów liczbowych poprzedniego stulecia.

Powstanie mechaniki macierzowej przez Heisenberga , Borna i Jordana doprowadziło do badania macierzy o nieskończenie wielu wierszach i kolumnach. Później von Neumann przeprowadził matematyczne sformułowanie mechaniki kwantowej , dalej rozwijając funkcjonalne pojęcia analityczne, takie jak operatory liniowe na przestrzeniach Hilberta , które, mówiąc z grubsza, odpowiadają przestrzeni euklidesowej , ale z nieskończonością niezależnych kierunków .

Inne historyczne zastosowania słowa „matryca” w matematyce

Słowo to zostało użyte w niezwykły sposób przez co najmniej dwóch autorów o znaczeniu historycznym.

Bertrand Russell i Alfred North Whitehead w swoich Principia Mathematica (1910-1913) używają słowa „macierz” w kontekście ich aksjomatu redukowalności . Zaproponowali ten aksjomat jako sposób na sprowadzenie dowolnej funkcji do funkcji niższego typu, sukcesywnie, tak aby na „dolnym” (rzędu 0) funkcja była identyczna z jej rozszerzeniem :

„Nadajmy nazwę macierzy dowolnej funkcji, niezależnie od wielu zmiennych, która nie obejmuje żadnych widocznych zmiennych . Następnie każda możliwa funkcja inna niż macierz wywodzi się z macierzy za pomocą uogólnienia, to znaczy przez rozważenie zdania że dana funkcja jest prawdziwa ze wszystkimi możliwymi wartościami lub z pewną wartością jednego z argumentów, drugi argument lub argumenty pozostają nieokreślone”.

Na przykład funkcję Φ( x, y ) dwóch zmiennych x i y można zredukować do zbioru funkcji jednej zmiennej, na przykład y , „rozważając” funkcję dla wszystkich możliwych wartości „jednostek” a i podstawiłem w miejsce zmiennej x . A następnie otrzymany zbiór funkcji pojedynczej zmiennej y , czyli ∀a i : Φ( a i , y ), można zredukować do „macierzy” wartości, „rozważając” funkcję dla wszystkich możliwych wartości „ osobniki" b i podstawione w miejsce zmiennej y :

∀b j ∀a i : Φ( a i , b j ).

Alfred Tarski we Wstępie do logiki z 1946 r. użył słowa „macierz” jako synonim pojęcia tablicy prawdy używanego w logice matematycznej.

Zobacz też

Uwagi

Bibliografia

Odniesienia do fizyki

  • Bohm, Arno (2001), Mechanika kwantowa: podstawy i zastosowania , Springer, ISBN 0-387-95330-2
  • Burgess, Klif; Moore, Guy (2007), Model standardowy. Elementarz , Cambridge University Press, ISBN 978-0-521-86036-9
  • Guenther, Robert D. (1990), Nowoczesna optyka , John Wiley, ISBN 0-471-60538-7
  • Itzykson, Claude; Zuber, Jean-Bernard (1980), Kwantowa teoria pola , McGraw-Hill, ISBN 0-07-032071-3
  • Riley, Kenneth F.; Hobson, Michael P.; Bence, Stephen J. (1997), Metody matematyczne dla fizyki i inżynierii , Cambridge University Press, ISBN 0-521-55506-X
  • Schiff, Leonard I. (1968), Mechanika kwantowa (3rd ed.), McGraw-Hill
  • Weinberg, Steven (1995), Kwantowa teoria pól. Tom I: Fundacje , Cambridge University Press, ISBN 0-521-55001-7
  • Wherrett, Brian S. (1987), Teoria grup dla atomów, cząsteczek i ciał stałych , Prentice-Hall International, ISBN 0-13-365461-3
  • Zabrodin, Anton; Brezin, Edouard; Kazakow, Władimir; serbski, Didina; Wiegmann, Paul (2006), Zastosowania macierzy losowych w fizyce (NATO Science Series II: Matematyka, Fizyka i Chemia) , Berlin, DE; Nowy Jork, NY: Springer-Verlag , ISBN 978-1-4020-4530-1

odniesienia historyczne

Dalsza lektura

Zewnętrzne linki