Czas, przestrzeń -Spacetime

W fizyce czasoprzestrzeń to model matematyczny, który łączy trzy wymiary przestrzeni i jeden wymiar czasu w pojedynczą czterowymiarową rozmaitość . Diagramy czasoprzestrzenne mogą być używane do wizualizacji efektów relatywistycznych , takich jak dlaczego różni obserwatorzy postrzegają inaczej, gdzie i kiedy zachodzą zdarzenia.

Do XX wieku zakładano, że trójwymiarowa geometria wszechświata (jego przestrzenna ekspresja w postaci współrzędnych, odległości i kierunków) jest niezależna od czasu jednowymiarowego. Fizyk Albert Einstein pomógł rozwinąć ideę czasoprzestrzeni jako część swojej teorii względności . Przed swoją pionierską pracą naukowcy mieli dwie oddzielne teorie wyjaśniające zjawiska fizyczne: prawa fizyki Isaaca Newtona opisywały ruch masywnych obiektów, podczas gdy modele elektromagnetyczne Jamesa Clerka Maxwella wyjaśniały właściwości światła. Jednak w 1905 roku Einstein oparł pracę o szczególnej teorii względności na dwóch postulatach:

  • Prawa fizyki są niezmienne (tj. identyczne) we wszystkich układach inercjalnych (tj. nieprzyspieszających układach odniesienia)
  • Prędkość światła w próżni jest taka sama dla wszystkich obserwatorów, niezależnie od ruchu źródła światła.

Logiczną konsekwencją połączenia tych postulatów jest nierozerwalne połączenie czterech wymiarów – dotychczas uznawanych za niezależne – przestrzeni i czasu. Pojawia się wiele sprzecznych z intuicją konsekwencji: oprócz bycia niezależną od ruchu źródła światła, prędkość światła jest stała niezależnie od układu odniesienia, w którym jest mierzona; odległości, a nawet czasowe uporządkowanie par zdarzeń zmieniają się przy pomiarze w różnych inercjalnych układach odniesienia (jest to względność jednoczesności ); a addytywność liniowa prędkości nie jest już prawdziwa.

Einstein sformułował swoją teorię w kategoriach kinematyki (badanie ciał w ruchu). Jego teoria była postępem w stosunku do teorii zjawisk elektromagnetycznych Lorentza z 1904 r . i teorii elektrodynamiki Poincarégo . Chociaż teorie te zawierały równania identyczne z tymi, które wprowadził Einstein (tj. transformacja Lorentza ), były one zasadniczo modelami ad hoc proponowanymi do wyjaśnienia wyników różnych eksperymentów — w tym słynnego eksperymentu z interferometrem Michelsona-Morleya — które były niezwykle trudne do dopasowania istniejące paradygmaty.

W 1908 r. Hermann Minkowski — niegdyś jeden z profesorów matematyki młodego Einsteina w Zurychu — przedstawił geometryczną interpretację szczególnej teorii względności, która połączyła czas i trzy przestrzenne wymiary przestrzeni w jedno czterowymiarowe kontinuum znane obecnie jako przestrzeń Minkowskiego . Kluczową cechą tej interpretacji jest formalna definicja interwału czasoprzestrzeni. Chociaż pomiary odległości i czasu między zdarzeniami różnią się w przypadku pomiarów wykonanych w różnych układach odniesienia, interwał czasoprzestrzenny jest niezależny od bezwładnościowego układu odniesienia, w którym są rejestrowane.

Geometryczna interpretacja względności Minkowskiego miała okazać się kluczowa dla rozwoju jego ogólnej teorii względności z 1915 roku, w której Einstein pokazał, jak masa i energia zakrzywiają płaską czasoprzestrzeń w rozmaitość pseudo-Riemanna .

Wstęp

Definicje

Nierelatywistyczna mechanika klasyczna traktuje czas jako uniwersalną wielkość pomiaru, która jest jednolita w przestrzeni i oddzielona od przestrzeni. Mechanika klasyczna zakłada, że ​​czas ma stałą prędkość upływu, niezależnie od stanu ruchu obserwatora , czy czegokolwiek zewnętrznego. Ponadto zakłada, że ​​przestrzeń jest euklidesowa ; zakłada, że ​​przestrzeń podąża za geometrią zdrowego rozsądku.

W kontekście szczególnej teorii względności czas nie może być oddzielony od trzech wymiarów przestrzeni, ponieważ obserwowana szybkość upływu czasu dla obiektu zależy od prędkości obiektu względem obserwatora. Ogólna teoria względności wyjaśnia również, w jaki sposób pola grawitacyjne mogą spowolnić upływ czasu dla obiektu widzianego przez obserwatora poza polem.

W zwykłej przestrzeni pozycję określają trzy liczby, zwane wymiarami . W kartezjańskim układzie współrzędnych są one nazywane x, y i z. Pozycja w czasoprzestrzeni nazywana jest zdarzeniem i wymaga podania czterech liczb: trójwymiarowego położenia w przestrzeni oraz położenia w czasie (rys. 1). Zdarzenie jest reprezentowane przez zbiór współrzędnych x , y , z i t . Czasoprzestrzeń jest więc czterowymiarowa . Zdarzenia matematyczne mają zerowy czas trwania i reprezentują pojedynczy punkt w czasoprzestrzeni.

Drogę cząstki przez czasoprzestrzeń można uznać za ciąg zdarzeń. Serię zdarzeń można połączyć, tworząc linię, która reprezentuje postęp cząstki w czasoprzestrzeni. Linia ta nazywana jest linią świata cząstki .

Matematycznie czasoprzestrzeń jest rozmaitością , co oznacza, że ​​wydaje się lokalnie „płaska” w pobliżu każdego punktu w taki sam sposób, w jaki w wystarczająco małych skalach globus wydaje się płaski. Współczynnik skali (konwencjonalnie nazywany prędkością światła ) wiąże odległości mierzone w przestrzeni z odległościami mierzonymi w czasie. Wielkość tego współczynnika skali (prawie 300 000 kilometrów lub 190 000 mil w przestrzeni odpowiada jednej sekundzie w czasie) wraz z faktem, że czasoprzestrzeń jest wielorakie, implikuje, że przy zwykłych, nierelatywistycznych prędkościach i w zwykłej, ludzkiej skali odległości, niewiele rzeczy, które ludzie mogliby zaobserwować, różniłoby się wyraźnie od tego, co mogliby zaobserwować, gdyby świat był euklidesowy. Dopiero wraz z pojawieniem się czułych pomiarów naukowych w połowie XIX wieku, takich jak eksperyment Fizeau i eksperyment Michelsona-Morleya , zaczęto zauważać zagadkowe rozbieżności między obserwacjami a przewidywaniami opartymi na domniemanym założeniu przestrzeni euklidesowej.

Rysunek 1-1. Każde miejsce w czasoprzestrzeni jest oznaczone czterema liczbami zdefiniowanymi przez układ odniesienia : położenie w przestrzeni i czas (co można zobrazować jako odczyt zegara znajdującego się w każdej pozycji w przestrzeni). „Obserwator” synchronizuje zegary zgodnie z ich własną ramką odniesienia.

W szczególnej teorii względności obserwator będzie w większości przypadków oznaczał układ odniesienia, na podstawie którego mierzony jest zbiór obiektów lub zdarzeń. To użycie różni się znacznie od zwykłego angielskiego znaczenia tego terminu. Ramy odniesienia są z natury konstrukcjami nielokalnymi i zgodnie z tym użyciem tego terminu nie ma sensu mówić o obserwatorze jako posiadającym lokalizację. Na rys. 1-1 wyobraźmy sobie, że rozważana ramka jest wyposażona w gęstą siatkę zegarów, zsynchronizowanych w tej ramce odniesienia, która rozciąga się w nieskończoność w trzech wymiarach przestrzeni. Dowolna konkretna lokalizacja w obrębie sieci nie jest ważna. Siatka zegarów służy do wyznaczania czasu i położenia zdarzeń zachodzących w całym kadrze. Termin obserwator odnosi się do całego zespołu zegarów związanego z jednym inercyjnym układem odniesienia. W tym wyidealizowanym przypadku każdy punkt w przestrzeni ma skojarzony z nim zegar, a zatem zegary rejestrują każde zdarzenie natychmiast, bez opóźnienia czasowego między zdarzeniem a jego zapisem. Prawdziwy obserwator dostrzeże jednak opóźnienie między emisją sygnału a jego wykryciem ze względu na prędkość światła. Aby zsynchronizować zegary, podczas redukcji danych następującej po eksperymencie, czas, w którym sygnał jest odbierany, zostanie skorygowany, aby odzwierciedlić jego rzeczywisty czas, gdyby został zarejestrowany przez idealną sieć zegarów.

W wielu książkach o szczególnej teorii względności, zwłaszcza starszych, słowo „obserwator” jest używane w bardziej zwyczajnym znaczeniu tego słowa. Z kontekstu zwykle wynika, jakie znaczenie zostało przyjęte.

Fizycy rozróżniają między tym, co mierzymy lub obserwujemy (po rozliczeniu opóźnień propagacji sygnału), a tym, co widzimy bez takich poprawek. Niezrozumienie różnicy między tym, co się mierzy / obserwuje, a tym, co widzi , jest źródłem wielu błędów wśród początkujących badaczy teorii względności.

Historia

Rysunek 1-2. Michelson i Morley spodziewali się, że ruch w eterze spowoduje różnicowe przesunięcie fazowe między światłem przechodzącym przez dwa ramiona ich aparatu. Najbardziej logiczne wytłumaczenie ich negatywnego wyniku, przeciągania eteru, kłóciło się z obserwacją aberracji gwiazdowej.

W połowie XIX wieku różne eksperymenty, takie jak obserwacja plamki Arago i pomiary różnicowe prędkości światła w powietrzu w stosunku do wody , były uważane za udowodnienie falowej natury światła, w przeciwieństwie do teorii korpuskularnej . Założono wówczas, że propagacja fal wymaga istnienia ośrodka falującego ; w przypadku fal świetlnych uznano to za hipotetyczny świecący eter . Jednak różne próby ustalenia właściwości tego hipotetycznego ośrodka przyniosły sprzeczne wyniki. Na przykład eksperyment Fizeau z 1851 roku, przeprowadzony przez francuskiego fizyka Hippolyte Fizeau , wykazał, że prędkość światła w płynącej wodzie była mniejsza niż suma prędkości światła w powietrzu plus prędkość wody o wartość zależną od prędkości wody. współczynnik załamania światła. Między innymi zależność częściowego zaciągania eteru wynikającego z tego eksperymentu od współczynnika załamania światła (który jest zależny od długości fali) doprowadziła do nieprzyjemnego wniosku, że eter jednocześnie płynie z różnymi prędkościami dla różnych kolorów światła. Słynny eksperyment Michelsona-Morleya z 1887 r. (ryc. 1-2) nie wykazał różnicowego wpływu ruchów Ziemi poprzez hipotetyczny eter na prędkość światła, a najbardziej prawdopodobne wyjaśnienie, całkowite wleczenie eteru, było sprzeczne z obserwacją gwiazdy . aberracja .

George Francis FitzGerald w 1889 i Hendrik Lorentz w 1892 niezależnie zaproponowali, że ciała materialne podróżujące przez nieruchomy eter podlegają fizycznemu wpływowi ich przejścia, kurcząc się w kierunku ruchu o tyle, ile było konieczne do wyjaśnienia negatywnych skutków eksperyment Michelsona-Morleya. (W kierunkach poprzecznych do kierunku ruchu nie występują zmiany długości).

W 1904 Lorentz rozszerzył swoją teorię tak, że doszedł do równań formalnie identycznych z tymi, które miał później wyprowadzić Einstein (tj. transformacja Lorentza ), ale z fundamentalnie inną interpretacją. Jako teoria dynamiki (badanie sił i momentów oraz ich wpływu na ruch) jego teoria zakładała rzeczywiste odkształcenia fizyczne fizycznych składników materii. Równania Lorentza przewidziały wielkość, którą nazwał czasem lokalnym , za pomocą którego mógł wyjaśnić aberrację światła , eksperyment Fizeau i inne zjawiska. Jednak Lorentz uważał, że czas lokalny jest tylko pomocniczym narzędziem matematycznym, niejako sztuczką mającą na celu uproszczenie transformacji z jednego systemu w drugi.

Inni fizycy i matematycy na przełomie wieków byli bliscy osiągnięcia tego, co obecnie nazywamy czasoprzestrzenią. Sam Einstein zauważył, że przy tak wielu ludziach rozwiązujących poszczególne elementy układanki, „szczególna teoria względności, jeśli spojrzymy na jej rozwój z perspektywy czasu, dojrzała do odkrycia w 1905 roku”.

Hendrik Lorentz
Henri Poincaré
Alberta Einsteina
Hermanna Minkowskiego
Rysunek 1-3.

Ważnym przykładem jest Henri Poincaré , który w 1898 r. twierdził, że równoczesność dwóch wydarzeń jest kwestią umowną. W 1900 roku uznał, że „czas lokalny” Lorentza jest w rzeczywistości tym, na co wskazują poruszające się zegary, stosując wyraźnie operacyjną definicję synchronizacji zegarów, zakładając stałą prędkość światła. W latach 1900 i 1904 zasugerował wrodzoną niewykrywalność eteru, podkreślając słuszność tego, co nazwał zasadą względności , a w latach 1905/1906 udoskonalił matematycznie teorię elektronów Lorentza, aby dostosować ją do postulatu względności. . Omawiając różne hipotezy dotyczące niezmiennej grawitacji Lorentza, wprowadził innowacyjną koncepcję 4-wymiarowej czasoprzestrzeni, definiując różne cztery wektory , a mianowicie cztery pozycje , cztery prędkości i cztery siły . Nie kontynuował jednak 4-wymiarowego formalizmu w kolejnych pracach, stwierdzając jednak, że ten kierunek badań wydaje się „pociągać za sobą wielki ból dla ograniczonego zysku”, ostatecznie stwierdzając, „że język trójwymiarowy wydaje się najlepiej pasować do opisu naszego świata ”. Co więcej, nawet w 1909 Poincaré nadal wierzył w dynamiczną interpretację transformacji Lorentza. Z tych i innych powodów większość historyków nauki twierdzi, że Poincaré nie wynalazł tego, co obecnie nazywa się szczególną teorią względności.

W 1905 Einstein wprowadził szczególną teorię względności (choć bez użycia technik formalizmu czasoprzestrzennego) we współczesnym rozumieniu jako teoria przestrzeni i czasu. Chociaż jego wyniki są matematycznie równoważne z wynikami Lorentza i Poincarégo, Einstein wykazał, że transformacje Lorentza nie są wynikiem interakcji między materią a eterem, ale dotyczą samej natury przestrzeni i czasu. Uzyskał wszystkie swoje wyniki, uznając, że całą teorię można zbudować na dwóch postulatach: zasadzie względności i zasadzie stałości prędkości światła.

Einstein przeprowadził swoją analizę w kategoriach kinematyki (badanie poruszających się ciał bez odniesienia do sił), a nie dynamiki. Jego praca wprowadzająca w temat była wypełniona żywymi obrazami obejmującymi wymianę sygnałów świetlnych między zegarami w ruchu, dokładne pomiary długości poruszających się prętów i inne tego typu przykłady.

Ponadto Einstein w 1905 zastąpił poprzednie próby relacji elektromagnetycznej masy i energii, wprowadzając ogólną równoważność masy i energii , co było kluczowe dla jego późniejszego sformułowania zasady równoważności w 1907, która deklaruje równoważność masy bezwładności i grawitacji. Wykorzystując równoważność masy i energii, Einstein wykazał ponadto, że masa grawitacyjna ciała jest proporcjonalna do jego zawartości energii, co było jednym z pierwszych wyników w rozwoju ogólnej teorii względności . Choć wydawałoby się, że początkowo nie myślał geometrycznie o czasoprzestrzeni, w dalszym rozwoju ogólnej teorii względności Einstein w pełni włączył formalizm czasoprzestrzeni.

Kiedy Einstein opublikował w 1905 roku, inny z jego konkurentów, jego były profesor matematyki Hermann Minkowski , również doszedł do większości podstawowych elementów szczególnej teorii względności. Max Born opisał spotkanie, które odbył z Minkowskim, starając się zostać jego uczniem/współpracownikiem:

Pojechałem do Kolonii, spotkałem Minkowskiego i wysłuchałem jego słynnego wykładu „Przestrzeń i czas” wygłoszonego 2 września 1908 roku. […] Powiedział mi później, że był dla niego wielkim szokiem, gdy Einstein opublikował swój artykuł, w którym ekwiwalencja o różnych lokalnych czasach obserwatorów poruszających się względem siebie; bo doszedł do tych samych wniosków niezależnie, ale nie opublikował ich, ponieważ chciał najpierw opracować strukturę matematyczną w całej jej okazałości. Nigdy nie zgłosił zastrzeżenia pierwszeństwa i zawsze dawał Einsteinowi swój pełny udział w wielkim odkryciu.

Minkowski był zaniepokojony stanem elektrodynamiki po destrukcyjnych eksperymentach Michelsona co najmniej od lata 1905, kiedy Minkowski i David Hilbert poprowadzili zaawansowane seminarium, w którym uczestniczyli wybitni ówcześni fizycy, aby przestudiować prace Lorentza, Poincaré i in. Nie jest jednak wcale jasne, kiedy Minkowski zaczął formułować geometryczne sformułowanie szczególnej teorii względności, które miało nosić jego imię, ani w jakim stopniu był pod wpływem czterowymiarowej interpretacji transformacji Lorentza przez Poincarégo. Nie jest też jasne, czy kiedykolwiek w pełni docenił krytyczny wkład Einsteina w zrozumienie transformacji Lorentza, myśląc o pracy Einsteina jako o rozszerzeniu pracy Lorentza.

Rysunek 1–4. Ręcznie kolorowana przezroczystość prezentowana przez Minkowskiego w jego wykładzie Raum und Zeit z 1908 r.

5 listopada 1907 (nieco ponad rok przed śmiercią) Minkowski przedstawił swoją geometryczną interpretację czasoprzestrzeni w wykładzie dla społeczeństwa matematycznego w Getyndze pod tytułem Zasada względności ( Das Relativitätsprinzip ). 21 września 1908 r. Minkowski wygłosił swój słynny wykład Przestrzeń i czas ( Raum und Zeit ) Niemieckiemu Towarzystwu Naukowców i Lekarzy. W pierwszych słowach „ Przestrzeni i czasu ” znajduje się słynne stwierdzenie Minkowskiego, że „Odtąd przestrzeń dla siebie i czas dla siebie sprowadzą się całkowicie do cienia i tylko jakaś ich jedność zachowa niezależność”. Przestrzeń i czas obejmowały pierwszą publiczną prezentację diagramów czasoprzestrzennych (ryc. 1-4) i zawierały niezwykłą demonstrację, że koncepcja niezmiennika ( omówione poniżej ) wraz z empiryczną obserwacją, że prędkość światła jest skończona, pozwala wyprowadzenie całości szczególnej teorii względności.

Pojęcie czasoprzestrzeni i grupa Lorentza są ściśle związane z pewnymi typami geometrii sferycznych , hiperbolicznych lub konforemnych i ich grupami przekształceń rozwiniętymi już w XIX wieku, w których stosuje się niezmienne interwały analogiczne do interwału czasoprzestrzennego .

Einstein ze swojej strony początkowo lekceważył geometryczną interpretację szczególnej teorii względności Minkowskiego, uznając ją za überflüssige Gelehrsamkeit (zbędną wiedzę). Jednak w celu dokończenia poszukiwań ogólnej teorii względności, rozpoczętych w 1907 r., niezbędna okazała się geometryczna interpretacja teorii względności, a w 1916 r. Einstein w pełni uznał swoje zobowiązania wobec Minkowskiego, którego interpretacja znacznie ułatwiła przejście do ogólnej teorii względności. Ponieważ istnieją inne rodzaje czasoprzestrzeni, takie jak zakrzywiona czasoprzestrzeń ogólnej teorii względności, czasoprzestrzeni szczególnej teorii względności jest dziś znana jako czasoprzestrzeń Minkowskiego.

Czasoprzestrzeń w szczególnej teorii względności

Interwał czasoprzestrzeni

W trzech wymiarach odległość między dwoma punktami można określić za pomocą twierdzenia Pitagorasa :

Chociaż dwie osoby przeglądające mogą mierzyć pozycje x , y i z dwóch punktów przy użyciu różnych układów współrzędnych, odległość między punktami będzie taka sama dla obu (przy założeniu, że mierzą przy użyciu tych samych jednostek). Odległość jest „niezmienna”.

Jednak w szczególnej teorii względności odległość między dwoma punktami nie jest już taka sama, jeśli jest mierzona przez dwóch różnych obserwatorów, gdy jeden z nich się porusza, z powodu skrócenia Lorentza . Sytuacja jest jeszcze bardziej skomplikowana, jeśli te dwa punkty są rozdzielone zarówno w czasie, jak iw przestrzeni. Na przykład, jeśli jeden obserwator widzi dwa zdarzenia zachodzące w tym samym miejscu, ale w różnym czasie, osoba poruszająca się względem pierwszego obserwatora zobaczy dwa zdarzenia zachodzące w różnych miejscach, ponieważ (z jej punktu widzenia) są one nieruchome , a pozycja zdarzenia oddala się lub zbliża. Zatem do pomiaru efektywnej „odległości” między dwoma zdarzeniami należy użyć innej miary.

W czterowymiarowej czasoprzestrzeni analogiem do odległości jest interwał. Chociaż czas pojawia się jako czwarty wymiar, jest traktowany inaczej niż wymiary przestrzenne. Przestrzeń Minkowskiego różni się więc pod istotnymi względami od czterowymiarowej przestrzeni euklidesowej . Podstawowym powodem łączenia przestrzeni i czasu w czasoprzestrzeń jest to, że przestrzeń i czas osobno nie są niezmienne, co oznacza, że ​​w odpowiednich warunkach różni obserwatorzy nie będą się zgadzać co do długości czasu między dwoma zdarzeniami (z powodu dylatacji czasu ) lub odległość między dwoma zdarzeniami (z powodu skrócenia długości ). Ale szczególna teoria względności zapewnia nowy niezmiennik, zwany interwałem czasoprzestrzeni , który łączy odległości w przestrzeni i w czasie. Wszyscy obserwatorzy, którzy mierzą czas i odległość między dowolnymi dwoma zdarzeniami, wyliczą ten sam przedział czasoprzestrzenny. Załóżmy, że obserwator mierzy dwa zdarzenia jako oddzielone w czasie i odległością przestrzenną . Wtedy odstęp czasoprzestrzenny między dwoma zdarzeniami, które są oddzielone odległością w przestrzeni i współrzędną - wynosi:

lub dla trzech wymiarów przestrzeni,

Stała prędkość światła zamienia jednostki czasu (takie jak sekundy) na jednostki przestrzenne (takie jak metry). Przedział do kwadratu jest miarą odległości między zdarzeniami A i B, które są oddzielone czasowo i dodatkowo przestrzenią, ponieważ istnieją dwa oddzielne obiekty podlegające zdarzeniom lub ponieważ pojedynczy obiekt w przestrzeni porusza się bezwładnie między swoimi zdarzeniami. Przedział separacji uzyskuje się przez podniesienie do kwadratu odległości przestrzennej oddzielającej zdarzenie B od zdarzenia A i odjęcie go od kwadratu odległości przestrzennej przebytej przez sygnał świetlny w tym samym przedziale czasowym . Jeśli separacja zdarzeń jest spowodowana sygnałem świetlnym, to różnica ta znika i .

Gdy rozważane zdarzenie jest nieskończenie blisko siebie, możemy napisać

W innym układzie inercjalnym, powiedzmy ze współrzędnymi , przedział czasoprzestrzenny można zapisać w takiej samej postaci jak powyżej. Ze względu na stałość prędkości światła, zdarzenia świetlne we wszystkich inercjalnych układach należą do przedziału zerowego, . Dla każdego innego nieskończenie małego zdarzenia, w którym można udowodnić to, co z kolei po integracji prowadzi do . Niezmienność interwału dowolnego zdarzenia między wszystkimi intertialnymi układami odniesienia jest jednym z podstawowych wyników szczególnej teorii względności.

Chociaż, dla zwięzłości, często spotyka się wyrażenia interwałowe wyrażone bez delt, w tym w większości poniższych rozważań, należy rozumieć, że ogólnie oznacza , itp. Zawsze chodzi nam o różnice wartości współrzędnych przestrzennych lub czasowych należących do dwóch zdarzeń, a ponieważ nie ma preferowanego początku, wartości pojedynczych współrzędnych nie mają istotnego znaczenia.

Rysunek 2–1. Diagram czasoprzestrzenny ilustrujący dwa fotony, A i B, pochodzące z tego samego zdarzenia i obiekt o prędkości mniejszej niż światło, C

Powyższe równanie jest podobne do twierdzenia Pitagorasa, z wyjątkiem znaku minus między wyrazami i . Interwał czasoprzestrzenny jest wielkością , a nie samą w sobie. Powodem jest to, że w przeciwieństwie do odległości w geometrii euklidesowej, interwały w czasoprzestrzeni Minkowskiego mogą być ujemne. Zamiast zajmować się pierwiastkami kwadratowymi liczb ujemnych, fizycy zwyczajowo uważają za odrębny symbol sam w sobie, a nie za kwadrat czegoś.

Ogólnie można przyjąć dowolne wartości liczby rzeczywistej. Jeśli jest dodatnia, interwał czasoprzestrzenny jest określany jako timelike . Ponieważ odległość przestrzenna pokonywana przez jakikolwiek masywny obiekt jest zawsze mniejsza niż odległość pokonywana przez światło w tym samym przedziale czasu, rzeczywiste interwały są zawsze podobne do czasu. Jeśli jest ujemna, mówi się, że przedział czasoprzestrzeni jest podobny do przestrzeni , gdzie przedział czasoprzestrzeni jest urojony. Odstępy czasoprzestrzeni są równe zeru, gdy Innymi słowy, odstęp czasoprzestrzeni między dwoma zdarzeniami na linii świata czegoś poruszającego się z prędkością światła wynosi zero. Taki przedział jest określany jako lightlike lub null . Foton docierający do naszego oka z odległej gwiazdy nie zestarzeje się, mimo że (z naszej perspektywy) spędził lata w jego przejściu.

Diagram czasoprzestrzeni jest zazwyczaj rysowany tylko z pojedynczą przestrzenią i jedną współrzędną czasową. Rys. 2-1 przedstawia diagram czasoprzestrzenny ilustrujący linie świata (tj. ścieżki w czasoprzestrzeni) dwóch fotonów, A i B, pochodzących z tego samego zdarzenia i idących w przeciwnych kierunkach. Ponadto C ilustruje linię świata obiektu wolniejszego niż światło. Pionowa współrzędna czasu jest skalowana w taki sposób, że ma takie same jednostki (metry) jak pozioma współrzędna przestrzenna. Ponieważ fotony poruszają się z prędkością światła, ich linie świata mają nachylenie ±1. Innymi słowy, każdy metr, który foton przemieszcza się w lewo lub w prawo, wymaga około 3,3 nanosekundy czasu.

W literaturze względności stosowane są dwie konwencje znaków:

oraz

Te konwencje znaków są powiązane z sygnaturami metryk (+−−−) i (−+++). Niewielką zmianą jest umieszczenie współrzędnej czasu na końcu, a nie na pierwszym. Obie konwencje są szeroko stosowane w dziedzinie studiów.

Ramki referencyjne

Rysunek 2-2. Diagram Galileusza dwóch układów odniesienia w standardowej konfiguracji
Rysunek 2-3. (a) diagram Galileusza dwóch ramek odniesienia w konfiguracji standardowej, (b) diagram czasoprzestrzenny dwóch ramek odniesienia, (c) diagram czasoprzestrzenny przedstawiający drogę odbitego impulsu światła

Aby uzyskać wgląd w to, jak współrzędne czasoprzestrzeni mierzone przez obserwatorów w różnych układach odniesienia porównują się ze sobą, warto pracować z uproszczoną konfiguracją z ramkami w konfiguracji standardowej. Ostrożnie pozwala to na uproszczenie matematyki bez utraty ogólności wyciąganych wniosków. Na rys. 2-2, dwie ramki referencyjne Galileusza (tj. konwencjonalne ramki 3-przestrzenne) są wyświetlane w ruchu względnym. Ramka S należy do pierwszego obserwatora O, a ramka S′ (wymawiane „S prim”) należy do drugiego obserwatora O′.

  • Osie x , y , z ramy S są zorientowane równolegle do odpowiednich primowanych osi ramy S'.
  • Ramka S′ porusza się w kierunku x ramki S ze stałą prędkością v mierzoną w ramce S.
  • Początki ramek S i S′ są zbieżne, gdy czas t = 0 dla ramki S i t ′ = 0 dla ramki S′.

Rys. 2-3a rysuje rys. 2-2 w innej orientacji. Rys. 2-3b ilustruje diagram czasoprzestrzeni z punktu widzenia obserwatora O. Ponieważ S i S′ są w konfiguracji standardowej, ich początki pokrywają się w czasach t  = 0 w ramce S i t ′ = 0 w ramce S′. Oś ct ′ przechodzi przez zdarzenia w klatce S′, które mają x ′ = 0. Ale punkty z x ′ = 0 poruszają się w kierunku x klatki S z prędkością v , tak że nie pokrywają się z ct oś w dowolnym momencie innym niż zero. Dlatego oś ct ′ jest nachylona względem osi ct o kąt θ podany przez

x ′ jest również nachylona względem osi x . Aby określić kąt tego nachylenia, pamiętamy, że nachylenie linii świata impulsu świetlnego wynosi zawsze ±1. Rys. 2-3c przedstawia diagram czasoprzestrzenny z punktu widzenia obserwatora O′. Zdarzenie P reprezentuje emisję impulsu świetlnego przy x ′ = 0, ct ′ = − a . Impuls odbija się od lustra znajdującego się w odległości a od źródła światła (zdarzenie Q) i powraca do źródła światła przy x = 0,  ct ′ =  a (zdarzenie R).

Te same zdarzenia P, Q, R są wykreślone na ryc. 2-3b w układzie obserwatora O. Ścieżki światła mają nachylenia = 1 i -1, tak że △PQR tworzy trójkąt prostokątny z PQ i QR oba pod kątem 45 stopni do osi x i ct . Ponieważ OP = OQ = OR, kąt między x ′ i x również musi wynosić θ .

Podczas gdy rama spoczynkowa ma osie czasu i przestrzeni, które spotykają się pod kątem prostym, rama ruchoma jest rysowana z osiami, które spotykają się pod kątem ostrym. Ramki są właściwie równoważne. Asymetria wynika z nieuniknionych zniekształceń w sposobie, w jaki współrzędne czasoprzestrzeni mogą mapować się na płaszczyźnie kartezjańskiej , i nie należy jej uważać za dziwniejszy niż sposób, w jaki, na rzucie Mercatora na Ziemię, względne rozmiary mas lądowych w pobliżu biegunów (Grenlandia i Antarktyda) są mocno przesadzone w stosunku do mas lądowych w pobliżu równika.

Stożek światła

Rysunek 2–4. Stożek świetlny skupiony na zdarzeniu dzieli resztę czasoprzestrzeni na przyszłość, przeszłość i „gdzie indziej”

Na rys. 2-4 zdarzenie O znajduje się na początku diagramu czasoprzestrzennego, a dwie ukośne linie reprezentują wszystkie zdarzenia, które mają zerowy odstęp czasoprzestrzenny względem zdarzenia początkowego. Te dwie linie tworzą tak zwany stożek świetlny zdarzenia O, ponieważ dodanie drugiego wymiaru przestrzennego (ryc. 2-5) sprawia, że ​​pojawiają się dwa prawe okrągłe stożki spotykające się z ich wierzchołkami w punkcie O. Jeden stożek rozciąga się w przyszłość (t>0), druga w przeszłość (t<0).

Rysunek 2–5. Stożek świetlny w przestrzeni 2D plus wymiar czasu

Lekki (podwójny) stożek dzieli czasoprzestrzeń na oddzielne regiony w odniesieniu do jej wierzchołka. Wnętrze przyszłego stożka światła składa się ze wszystkich zdarzeń, które są oddzielone od wierzchołka o więcej czasu (odległość czasowa), niż jest to konieczne do pokonania ich odległości przestrzennej z prędkością światła; wydarzenia te składają się na podobną do czasu przyszłość wydarzenia O. Podobnie, podobna do czasu przeszłość obejmuje wewnętrzne wydarzenia przeszłego stożka światła. Zatem w przedziałach czasopodobnych Δ ct jest większe niż Δ x , co sprawia, że ​​przedziały czasopodobne są dodatnie. Obszar na zewnątrz stożka świetlnego składa się ze zdarzeń, które są oddzielone od zdarzenia O większą przestrzenią, niż można przebyć z prędkością światła w danym czasie . Zdarzenia te obejmują tak zwany obszar podobny do przestrzeni zdarzenia O, oznaczony jako „Gdzie indziej” na ryc. 2-4. O zdarzeniach na samym stożku świetlnym mówi się, że są podobne do światła (lub oddzielone zerem ) od O. Ze względu na niezmienność interwału czasoprzestrzeni, wszyscy obserwatorzy przypiszą ten sam stożek świetlny do każdego zdarzenia, a tym samym uzgodnią ten podział czasoprzestrzeni .

Stożek świetlny odgrywa zasadniczą rolę w pojęciu przyczynowości . Możliwe jest, aby sygnał prędkości nie szybszy niż światło przebył drogę od pozycji i czasu O do pozycji i czasu D (rys. 2-4). Możliwe jest zatem, że zdarzenie O ma wpływ przyczynowy na zdarzenie D. Przyszły stożek światła zawiera wszystkie zdarzenia, na które może mieć wpływ przyczynowy O. podróży od pozycji i czasu A do pozycji i czasu O. Przeszły stożek światła zawiera wszystkie zdarzenia, które mogą mieć przyczynowy wpływ na O. W przeciwieństwie do tego, zakładając, że sygnały nie mogą podróżować szybciej niż prędkość światła, wszelkie zdarzenie, takie jak np. B lub C, w obszarze podobnym do przestrzeni (Gdzie indziej), nie może ani wpływać na zdarzenie O, ani nie może na nie wpływać zdarzenie O wykorzystujące taką sygnalizację. Przy takim założeniu wyklucza się jakikolwiek związek przyczynowy między zdarzeniem O a wszelkimi zdarzeniami w przestrzennym obszarze stożka świetlnego.

Względność równoczesności

Rysunek 2–6. Animacja ilustrująca względność równoczesności

Wszyscy obserwatorzy zgodzą się, że dla każdego zdarzenia zdarzenie w przyszłym stożku świetlnym danego zdarzenia nastąpi po danym zdarzeniu. Podobnie, w przypadku dowolnego zdarzenia, zdarzenie w obrębie stożka światła przeszłego danego zdarzenia ma miejsce przed danym zdarzeniem. Relacja przed-po obserwowana dla zdarzeń oddzielonych w czasie pozostaje niezmieniona bez względu na układ odniesienia obserwatora, tj. bez względu na to, jak obserwator się porusza. Zupełnie inaczej wygląda sytuacja w przypadku wydarzeń rozdzielonych przestrzennie. Rys. 2-4 został zaczerpnięty z ramki odniesienia obserwatora poruszającego się przy v = 0. Z tej ramki odniesienia obserwuje się, że zdarzenie C występuje po zdarzeniu O, a zdarzenie B występuje przed zdarzeniem O. Z innego odniesienia ramki, porządki tych niezwiązanych przyczynowo zdarzeń można odwrócić. W szczególności zauważa się, że jeśli dwa zdarzenia są równoczesne w określonym układzie odniesienia, to z konieczności są one oddzielone odstępem przestrzennym, a zatem są nieprzyczynowo powiązane. Obserwacja, że ​​jednoczesność nie jest absolutna, ale zależy od układu odniesienia obserwatora, nazywana jest względnością jednoczesności .

Rys. 2-6 ilustruje wykorzystanie diagramów czasoprzestrzennych w analizie względności symultaniczności. Zdarzenia w czasoprzestrzeni są niezmienne, ale układy współrzędnych przekształcają się, jak omówiono powyżej dla ryc. 2-3. Trzy zdarzenia (A, B, C) są równoczesne z układu odniesienia obserwatora poruszającego się z v = 0. Z układu odniesienia obserwatora poruszającego się z v = 0,3 c zdarzenia wydają się zachodzić w kolejności C, B , A. Z układu odniesienia obserwatora poruszającego się przy v = -0,5 c , zdarzenia wydają się zachodzić w kolejności A, B, C . Biała linia reprezentuje płaszczyznę jednoczesności , przenoszącą się z przeszłości obserwatora do przyszłości obserwatora, podkreślając zachodzące na niej wydarzenia. Szara strefa to stożek świetlny obserwatora, który pozostaje niezmienny.

Przestrzenny interwał czasoprzestrzenny daje taką samą odległość, jaką obserwator zmierzyłby, gdyby mierzone zdarzenia były równoczesne z obserwatorem. Przestrzeń czasopodobny stanowi zatem miarę właściwej odległości , tj. odległość rzeczywista = Podobnie, czasoprzestrzenny przedział czasoprzestrzenny daje taką samą miarę czasu, jaka byłaby przedstawiana przez skumulowane tykanie zegara poruszającego się wzdłuż danej linii świata. Interwał czasoprzestrzenny podobny do czasu zapewnia zatem miarę właściwego czasu =

Niezmienna hiperbola

Rysunek 2–7. (a) Rodziny niezmiennych hiperboli, (b) Hiperboloidy dwóch arkuszy i jednego arkusza

W przestrzeni euklidesowej (mającej tylko wymiary przestrzenne) zbiór punktów równoodległych (przy użyciu metryki euklidesowej) od jakiegoś punktu tworzy okrąg (w dwóch wymiarach) lub sferę (w trzech wymiarach). W (1+1)-wymiarowej czasoprzestrzeni Minkowskiego (mająca jeden wymiar czasowy i jeden wymiar przestrzenny) punkty znajdujące się w pewnym stałym odstępie czasoprzestrzennym od początku (przy użyciu metryki Minkowskiego) tworzą krzywe podane przez dwa równania

z pewną dodatnią rzeczywistą stałą. Równania te opisują dwie rodziny hiperboli na diagramie czasoprzestrzeni xct , które są nazywane hiperbolami niezmienniczymi .

Na ryc. 2-7a każda hiperbola w kolorze magenta łączy wszystkie zdarzenia mające pewną stałą separację przestrzenną od początku, podczas gdy hiperbola zielona łączy zdarzenia o jednakowej separacji czasowej.

Hiperbole w kolorze magenta, które przecinają oś x , są krzywymi podobnymi do czasu, co oznacza, że ​​te hiperbole reprezentują rzeczywiste ścieżki, które mogą przemierzać (stale przyspieszające) cząstki w czasoprzestrzeni: między dowolnymi dwoma zdarzeniami na jednej hiperboli jest możliwa relacja przyczynowości, ponieważ odwrotność nachylenia — reprezentująca niezbędną prędkość — dla wszystkich siecznych jest mniejsza niż . Z drugiej strony, zielone hiperbole, które przecinają oś ct , są krzywymi podobnymi do przestrzeni, ponieważ wszystkie odstępy wzdłuż tych hiperboli są odstępami przestrzennymi: żadna przyczynowość nie jest możliwa między dowolnymi dwoma punktami na jednej z tych hiperboli, ponieważ wszystkie sieczne reprezentują prędkości większe niż .

Rys. 2-7b przedstawia sytuację w (1+2)-wymiarowej czasoprzestrzeni Minkowskiego (jeden wymiar czasowy i dwa wymiary przestrzenne) z odpowiednimi hiperboloidami. Niezmienne hiperbole przesunięte o podobne do przestrzeni interwały od początku generują hiperboloidy jednego arkusza, podczas gdy niezmienne hiperbole przesunięte o podobne do czasu interwały od początku generują hiperboloidy dwóch arkuszy.

Granica (1+2)-wymiarowa między hiperboloidami czasoprzestrzennymi, ustalona przez zdarzenia tworzące zerowy odstęp czasoprzestrzenny od początku, jest tworzona przez degenerację hiperboloidów do stożka świetlnego. W wymiarach (1+1) hiperbole degenerują się do dwóch szarych linii 45° przedstawionych na rys. 2-7a.

Dylatacja czasu i skrócenie długości

Rysunek 2–8. Hiperbola niezmienna obejmuje punkty, do których można dotrzeć od początku w określonym czasie przez zegary poruszające się z różnymi prędkościami

Rys. 2-8 ilustruje niezmienną hiperbolę dla wszystkich zdarzeń, do których można dotrzeć od początku w odpowiednim czasie 5 metrów (w przybliżeniu1,67 x 10-8 s  ) . Różne linie świata reprezentują zegary poruszające się z różnymi prędkościami. Zegar, który jest nieruchomy względem obserwatora, ma pionową linię świata, a upływający czas mierzony przez obserwatora jest taki sam, jak czas właściwy. Dla zegara poruszającego się z prędkością 0,3  c , upływający czas mierzony przez obserwatora wynosi 5,24 metra (1,75 × 10 -8  s ), podczas gdy dla zegara poruszającego się z prędkością 0,7  c , upływający czas mierzony przez obserwatora wynosi 7,00 metrów (2,34 x 10-8 s  ) . Ilustruje to zjawisko znane jako dylatacja czasu . Zegary, które poruszają się szybciej, potrzebują więcej czasu (w ramce obserwatora) na odmierzenie tego samego właściwego czasu i przemieszczają się dalej wzdłuż osi x w tym właściwym czasie, niż miałyby bez dylatacji czasu. Pomiar dylatacji czasu przez dwóch obserwatorów w różnych inercjalnych układach odniesienia jest wzajemny. Jeśli obserwator O mierzy zegary obserwatora O′ jako wolniej poruszające się w jego układzie, obserwator O′ z kolei zmierzy zegary obserwatora O jako wolniej działające.

Rysunek 2-9. Na tym diagramie czasoprzestrzennym, 1 m długość ruchomego pręta, mierzona w uzbrojonej ramie, jest skróconą odległością OC przy rzutowaniu na nie uzbrojoną ramę.

Skrócenie długości , podobnie jak dylatacja czasu, jest przejawem względności jednoczesności. Pomiar długości wymaga pomiaru odstępu czasoprzestrzennego między dwoma zdarzeniami, które są równoczesne w układzie odniesienia. Ale zdarzenia, które są symultaniczne w jednym układzie odniesienia, na ogół nie są symultaniczne w innych układach odniesienia.

Rys. 2-9 ilustruje ruchy pręta o długości 1 m poruszającego się z prędkością 0,5  c wzdłuż osi x . Krawędzie niebieskiego paska reprezentują linie świata dwóch końcówek pręta. Hiperbola niezmienna ilustruje zdarzenia oddzielone od początku przestrzenią o długości 1 m. Punkty końcowe O i B zmierzone, gdy t  = 0 są jednoczesnymi zdarzeniami w ramce S′. Ale dla obserwatora w klatce S zdarzenia O i B nie są równoczesne. Aby zmierzyć długość, obserwator w ramce S mierzy punkty końcowe pręta rzutowane na oś x wzdłuż ich linii świata. Rzut arkusza świata pręta na oś x daje skróconą długość OC.

(nie pokazano) Narysowanie linii pionowej przechodzącej przez A tak, aby przecinała oś x ′, pokazuje, że nawet jeśli OB jest skrócony z punktu widzenia obserwatora O, to OA jest podobnie skrócony z punktu widzenia obserwatora O′. W ten sam sposób, w jaki każdy obserwator mierzy zegary drugiego jako działające wolno, każdy obserwator mierzy, czy zegary drugiego są skrócone.

W odniesieniu do wzajemnego skrócenia długości, Rys. 2-9 ilustruje, że ramy primowane i nieprimowane są wzajemnie obrócone o kąt hiperboliczny (analogicznie do zwykłych kątów w geometrii euklidesowej). Z powodu tego obrotu rzut zagruntowanej sztyftu na niezagruntowaną oś x jest skrócony, podczas gdy rzut niezagruntowanej sztyftu na zagruntowaną oś x′ jest podobnie skrócony.

Wzajemna dylatacja czasu i paradoks bliźniaków

Wzajemna dylatacja czasu

Wzajemne wydłużenie czasu i skrócenie długości wydają się uderzać początkującym jako z natury sprzeczne koncepcje. Jeśli obserwator w ramce S mierzy zegar w spoczynku w ramce S', jako działający wolniej niż jego', podczas gdy S' porusza się z prędkością vw S, to zasada względności wymaga, aby obserwator w ramce S' również mierzył zegar w klatce S, poruszający się z prędkością - v w S', jako działający wolniej niż jej. Jak dwa zegary mogą działać wolniej od drugiego, jest ważnym pytaniem, które „dociera do sedna zrozumienia szczególnej teorii względności”.

Ta pozorna sprzeczność wynika z nieprawidłowego uwzględnienia różnych ustawień niezbędnych, powiązanych pomiarów. Te ustawienia pozwalają na spójne wyjaśnienie jedynej pozornej sprzeczności. Nie chodzi o abstrakcyjne tykanie dwóch identycznych zegarów, ale o to, jak zmierzyć w jednej klatce czasową odległość dwóch tyknięć poruszającego się zegara. Okazuje się, że we wzajemnym obserwowaniu czasu trwania pomiędzy taktami zegarów, poruszających się w odpowiedniej klatce, muszą być zaangażowane różne zestawy zegarów. Aby zmierzyć w ramce S czas tyknięcia poruszającego się zegara W′ (w spoczynku w S′), używa się dwóch dodatkowych, zsynchronizowanych zegarów W 1 i W 2 w spoczynku w dwóch arbitralnie ustalonych punktach w S o odległości przestrzennej d .

Dwa zdarzenia można zdefiniować za pomocą warunku „dwa zegary są jednocześnie w jednym miejscu”, tj. kiedy W′ mija każdy W 1 i W 2 . W przypadku obu zdarzeń rejestrowane są dwa odczyty kolokowanych zegarów. Różnica dwóch odczytów W 1 i W 2 jest odległością czasową dwóch zdarzeń w S, a ich odległość przestrzenna wynosi d . Różnica dwóch odczytów W′ jest odległością czasową dwóch zdarzeń w S′. W S′ zdarzenia te są tylko rozdzielone w czasie, występują w tym samym miejscu w S′. Ze względu na niezmienność interwału czasoprzestrzeni obejmującego te dwa zdarzenia oraz niezerową separację przestrzenną d w S, odległość czasowa w S′ musi być mniejsza niż ta w S: mniejsza odległość czasowa między tymi dwoma zdarzeniami, wynikająca z odczyty zegara ruchomego W′ należy do wolniej pracującego zegara W′.

Odwrotnie, aby ocenić w ramce S′ odległość czasową dwóch zdarzeń na poruszającym się zegarze W (w spoczynku w S), potrzebne są dwa zegary w spoczynku w S′.

W tym porównaniu zegar W porusza się z prędkością − v . Ponowne zarejestrowanie czterech odczytów dla wydarzeń, określonych przez „dwa zegary jednocześnie w jednym miejscu”, skutkuje analogicznymi odległościami czasowymi tych dwóch wydarzeń, teraz czasowo i przestrzennie rozdzielonymi w S′ i tylko czasowo rozdzielonymi, ale skolokowanymi w S. To zachowaj niezmiennik przedziału czasoprzestrzennego, odległość czasowa w S musi być mniejsza niż w S′, ze względu na przestrzenną separację zdarzeń w S′: teraz zegar W działa wolniej.

Niezbędne nagrania dla dwóch sądów, z „jednym ruchomym zegarem” i „dwoma zegarami w spoczynku” odpowiednio w S lub S′, obejmują dwa różne zestawy, każdy z trzema zegarami. Ponieważ w pomiarach zaangażowane są różne zestawy zegarów, nie ma nieodłącznej konieczności, aby pomiary były „spójne”, tak że jeśli jeden obserwator mierzy powolny zegar, drugi obserwator mierzy szybki zegar tego samego.

Rysunek 2-10. Wzajemna dylatacja czasu

Rys. 2-10 ilustruje poprzednie omówienie wzajemnej dylatacji czasu z wykresami Minkowskiego. Górny rysunek przedstawia pomiary widziane z klatki S „w spoczynku” z niezagruntowanymi, prostokątnymi osiami i klatki S′ „poruszającej się z v  > 0”, skoordynowanych przez zagruntowane, ukośne osie, nachylone w prawo; dolny rysunek przedstawia ramkę S′ „w spoczynku” z zagruntowanymi, prostokątnymi współrzędnymi oraz ramkę S „poruszającą się z − v  < 0”, z niepodstawionymi, ukośnymi osiami, nachylonymi w lewo.

Każda linia narysowana równolegle do osi przestrzennej ( x , x ′) reprezentuje linię równoczesności. Wszystkie zdarzenia na takiej linii mają tę samą wartość czasu ( ct , ct ′). Podobnie każda linia narysowana równolegle do osi czasowej ( ct , ct′ ) reprezentuje linię o równych wartościach współrzędnych przestrzennych ( x , x ′).

Na obu obrazach można wskazać początek O (= O ) jako zdarzenie, w którym odpowiedni „ruchomy zegar” jest powiązany z „pierwszym zegarem w spoczynku” w obu porównaniach. Oczywiście dla tego zdarzenia odczyty na obu zegarach w obu porównaniach wynoszą zero. W konsekwencji, linie świata poruszających się zegarów to pochylona w prawo oś ′ ct (obrazki górne, zegar W′) i pochylona w lewo oś ct (zdjęcia dolne, zegar W). Linie świata W 1 i W′ 1 są odpowiednimi pionowymi osiami czasu ( ct na górnych rysunkach i ct ′ na dolnych rysunkach).
Na górnym rysunku miejsce dla W 2 przyjmuje A x > 0, a zatem linia świata (nie pokazana na rysunkach) tego zegara przecina linię świata poruszającego się zegara ( oś ct ct ) w zdarzeniu oznaczonym A , gdzie „dwa zegary są jednocześnie w jednym miejscu”. Na dolnym obrazku przyjmuje się, że miejsce dla W′ 2 to C x  < 0, a więc w tym pomiarze poruszający się zegar W mija W′ 2 w przypadku C .
Na górnym rysunku współrzędna ct At zdarzenia A ( odczyt W 2 ) jest oznaczona jako B , co daje czas, jaki upłynął między dwoma zdarzeniami, mierzony za pomocą W 1 i W 2 , jako OB . Dla porównania długość przedziału czasu OA , mierzoną za pomocą W′, należy przekształcić do skali osi ct . Odbywa się to przez niezmienną hiperbolę (patrz także Rys. 2-8) przez A , łączącą wszystkie zdarzenia o tym samym odstępie czasoprzestrzeni od początku jako A . Daje to zdarzenie C na osi ct i oczywiście: OC  <  OB , „ruchomy” zegar W′ działa wolniej.

Aby pokazać wzajemną dylatację czasu bezpośrednio na górnym obrazku, zdarzenie D można skonstruować jako zdarzenie przy x ′ = 0 (położenie zegara W′ w S′), czyli równoczesne z C ( OC ma taki sam odstęp czasoprzestrzenny jak OA ) w S′. To pokazuje, że przedział czasu OD jest dłuższy niż OA , co pokazuje, że „ruchomy” zegar działa wolniej.

Na dolnym rysunku klatka S porusza się z prędkością − v w klatce S′ w spoczynku. Linia świata zegara W jest osią ct (pochylona w lewo), linia świata W′ 1 jest pionową osią ct ′ , a linia świata W′ 2 jest pionem przechodzącym przez zdarzenie C , ze współrzędną ct D . Niezmienna hiperbola przez zdarzenie C skaluje przedział czasu OC do OA , który jest krótszy niż OD ; również, B jest skonstruowane (podobnie do D na górnych rysunkach) jako równoczesne z A w S, przy x  = 0. Wynik OB  >  OC ponownie odpowiada powyższemu.

Słowo „miara” jest ważne. W fizyce klasycznej obserwator nie może wpływać na obserwowany obiekt, ale stan ruchu obiektu może wpływać na obserwacje obiektu przez obserwatora.

Paradoks bliźniaków

Wiele wstępów do szczególnej teorii względności ilustruje różnice między teologią Galileusza a szczególną teorią względności, przedstawiając serię „paradoksów”. Te paradoksy są w rzeczywistości źle postawionymi problemami, wynikającymi z naszej nieznajomości prędkości porównywalnych z prędkością światła. Lekarstwem jest rozwiązanie wielu problemów w szczególnej teorii względności i zapoznanie się z jej tak zwanymi przewidywaniami sprzecznymi z intuicją. Geometryczne podejście do badania czasoprzestrzeni uważane jest za jedną z najlepszych metod rozwijania nowoczesnej intuicji.

Paradoks bliźniąt to eksperyment myślowy z udziałem identycznych bliźniąt, z których jeden odbywa podróż w kosmos szybką rakietą, wracając do domu i odkrywając, że bliźniak, który pozostał na Ziemi, postarzał się bardziej. Ten wynik wydaje się zagadkowy, ponieważ każdy z bliźniaków obserwuje, jak drugi bliźniak się porusza, więc na pierwszy rzut oka wydaje się, że każdy z nich powinien uznać, że drugi postarzał się mniej. Paradoks bliźniaków omija przedstawione powyżej uzasadnienie wzajemnej dylatacji czasu, unikając wymogu trzeciego zegara. Niemniej jednak paradoks bliźniąt nie jest prawdziwym paradoksem, ponieważ łatwo go zrozumieć w kontekście szczególnej teorii względności.

Wrażenie istnienia paradoksu wynika z niezrozumienia tego, co stwierdza szczególna teoria względności. Szczególna teoria względności nie deklaruje, że wszystkie układy odniesienia są równoważne, tylko układy inercjalne. Rama podróżującego bliźniaka nie jest bezwładna w okresach, gdy przyspiesza. Co więcej, różnica między bliźniętami jest możliwa do wykrycia przez obserwacje: podróżująca bliźniaczka musi wystrzelić rakiety, aby móc wrócić do domu, podczas gdy bliźniak przebywający w domu nie.

Rysunek 2-11. Wyjaśnienie paradoksu bliźniaków w czasoprzestrzeni

Te różnice powinny skutkować różnicą w wieku bliźniąt. Diagram czasoprzestrzenny na rys. 2-11 przedstawia prosty przypadek bliźniaka, który wychodzi prosto wzdłuż osi x i natychmiast zawraca. Z punktu widzenia bliźniaka, który przebywa w domu, nie ma nic zaskakującego w paradoksie bliźniaków. Właściwy czas mierzony wzdłuż linii świata podróżującego bliźniaka od O do C, plus właściwy czas mierzony od C do B, jest krótszy niż właściwy czas bliźniaka przebywającego w domu mierzony od O do A do B. Bardziej złożone trajektorie wymagają integracji właściwy czas między odpowiednimi zdarzeniami wzdłuż krzywej (tj. całka po ścieżce ), aby obliczyć całkowitą ilość właściwego czasu doświadczanego przez podróżującego bliźniaka.

Komplikacje powstają, gdy paradoks bliźniąt jest analizowany z punktu widzenia podróżującego bliźniaka.

Nomenklatura Weissa, określająca bliźniaka przebywającego w domu jako Terence i podróżującego bliźniaka jako Stellę, jest dalej używana.

Stella nie jest w kadrze inercjalnym. Biorąc pod uwagę ten fakt, czasami błędnie stwierdza się, że pełne rozwiązanie paradoksu bliźniąt wymaga ogólnej teorii względności:

Czysta analiza SR byłaby następująca: Analizowana w spoczynku Stelli jest nieruchoma przez całą podróż. Kiedy wystrzeliwuje swoje rakiety na zwrot, doświadcza pseudosiły, która przypomina siłę grawitacji. Figi. 2-6 i 2-11 ilustrują koncepcję linii (płaszczyzn) jednoczesności: Linie równoległe do osi x obserwatora ( płaszczyzna xy ) reprezentują zbiory zdarzeń, które są symultaniczne w układzie obserwatora. Na rys. 2-11 niebieskie linie łączą wydarzenia na linii świata Terence'a, które z punktu widzenia Stelli są równoczesne ze zdarzeniami na jej linii świata. (Terence z kolei obserwował zestaw poziomych linii jednoczesności.) W trakcie podróży Stelli, zarówno wychodzącej, jak i przychodzącej, ocenia, że ​​zegary Terence'a działają wolniej niż jej własny. Ale podczas zwrotu (tj. między pogrubionymi niebieskimi liniami na rysunku) następuje zmiana kąta jej linii jednoczesności, odpowiadająca szybkiemu przeskoczeniu wydarzeń w linii świata Terence'a, które Stella uważa za równoczesne z jej własny. Dlatego pod koniec swojej podróży Stella odkrywa, że ​​Terence postarzał się bardziej niż ona.

Chociaż ogólna teoria względności nie jest wymagana do analizy paradoksu bliźniąt, zastosowanie zasady równoważności ogólnej teorii względności zapewnia pewien dodatkowy wgląd w ten temat. Stella nie jest nieruchoma w układzie inercjalnym. Analizowana w spoczynku Stelli, jest nieruchoma przez całą podróż. Kiedy płynie, jej układ spoczynkowy jest bezwładny, a zegar Terence'a wydaje się działać wolno. Ale kiedy wystrzeliwuje swoje rakiety na zwrot, jej klatka spoczynkowa to klatka przyspieszona i doświadcza siły, która popycha ją, jakby była w polu grawitacyjnym. Terence będzie wydawał się być wysoko na tym polu, a z powodu grawitacyjnej dylatacji czasu jego zegar będzie biegł szybko, tak że końcowy wynik będzie taki, że Terence postarzał się bardziej niż Stella, kiedy wrócili do siebie. Argumenty teoretyczne przewidujące grawitacyjne dylatacje czasu nie ograniczają się wyłącznie do ogólnej teorii względności. Każda teoria grawitacji będzie przewidywać grawitacyjne dylatacje czasu, jeśli będzie przestrzegać zasady równoważności, w tym teorii Newtona.

Grawitacja

Ta część wprowadzająca koncentruje się na czasoprzestrzeni szczególnej teorii względności, ponieważ jest najłatwiejsza do opisania. Czasoprzestrzeń Minkowskiego jest płaska, nie uwzględnia grawitacji, jest jednolita w całym tekście i służy jedynie jako statyczne tło dla zachodzących w niej wydarzeń. Obecność grawitacji bardzo komplikuje opis czasoprzestrzeni. W ogólnej teorii względności czasoprzestrzeń nie jest już statycznym tłem, ale aktywnie oddziałuje z systemami fizycznymi, które zawiera. Krzywe czasoprzestrzeni w obecności materii mogą rozchodzić się fale, zaginać światło i wykazują wiele innych zjawisk. Kilka z tych zjawisk opisano w dalszej części tego artykułu.

Podstawowa matematyka czasoprzestrzeni

Transformacje Galileusza

Podstawowym celem jest możliwość porównania pomiarów wykonanych przez obserwatorów w ruchu względnym. Jeśli w ramce S znajduje się obserwator O, który zmierzył współrzędne czasowe i przestrzenne zdarzenia, przypisując temu zdarzeniu trzy współrzędne kartezjańskie i czas mierzony na jego siatce zsynchronizowanych zegarów ( x , y , z , t ) (patrz rys . 1-1 ). Drugi obserwator O′ w innym układzie S′ mierzy to samo zdarzenie w swoim układzie współrzędnych i swojej sieci zsynchronizowanych zegarów ( x , y , z , t ) . W przypadku układów inercjalnych żaden z obserwatorów nie podlega przyspieszeniu, a prosty zestaw równań pozwala nam powiązać współrzędne ( x , y , z , t ) z ( x , y , z , t ) . Biorąc pod uwagę, że dwa układy współrzędnych są w konfiguracji standardowej, co oznacza, że ​​są wyrównane z równoległymi współrzędnymi ( x , y , z ) i że t = 0 gdy t = 0 , transformacja współrzędnych wygląda następująco:

Rysunek 3–1. Czasoprzestrzeń Galileusza i skład prędkości

Rys. 3-1 pokazuje, że w teorii Newtona czas jest uniwersalny, a nie prędkość światła. Rozważ następujący eksperyment myślowy: Czerwona strzałka ilustruje pociąg poruszający się z prędkością 0,4 c względem peronu. W pociągu pasażer wystrzeliwuje pocisk z prędkością 0,4c w ramę pociągu. Niebieska strzałka pokazuje, że osoba stojąca na torach kolejowych mierzy pocisk jako podróżujący w tempie 0,8 c. Jest to zgodne z naszymi naiwnymi oczekiwaniami.

Mówiąc bardziej ogólnie, zakładając, że klatka S′ porusza się z prędkością v względem klatki S, to w obrębie klatki S′ obserwator O′ mierzy obiekt poruszający się z prędkością u . Prędkość u względem klatki S, ponieważ x = ut , x = xvt , i t = t , można zapisać jako x = utvt = ( uv ) t = ( uv ) t . _ Prowadzi to do u = x / t i ostatecznie

  lub  

co jest zdroworozsądkowym prawem Galileusza dotyczącym dodawania prędkości .

Relatywistyczny skład prędkości

Rysunek 3–2. Relatywistyczny skład prędkości

Skład prędkości jest zupełnie inny w relatywistycznej czasoprzestrzeni. Aby nieco zmniejszyć złożoność równań, wprowadzamy powszechny skrót dotyczący stosunku prędkości obiektu do światła,

Rys. 3-2a ilustruje czerwony pociąg jadący do przodu z prędkością podaną przez v / c = β = s / a . Z zagruntowanej ramy pociągu pasażer wystrzeliwuje pocisk z prędkością podaną przez u / c = β = n / m , gdzie odległość jest mierzona wzdłuż linii równoległej do czerwonej osi x , a nie równolegle do czarna oś x . Jaka jest złożona prędkość u pocisku względem platformy, reprezentowana przez niebieską strzałkę? Odnosząc się do rys. 3-2b:

  1. Z platformy prędkość złożona pocisku jest dana wzorem u = c ( s + r )/( a + b ) .
  2. Dwa żółte trójkąty są podobne, ponieważ są trójkątami prostokątnymi, które mają wspólny kąt α . W dużym żółtym trójkącie stosunek s / a = v / c = β .
  3. Stosunki odpowiednich boków dwóch żółtych trójkątów są stałe, więc r / a = b / s = n / m = β . Więc b = u s / c i r = u a / c .
  4. Podstaw wyrażenia na b i r do wyrażenia na u w kroku 1, aby otrzymać wzór Einsteina na dodawanie prędkości:

Przedstawiony powyżej relatywistyczny wzór sumowania prędkości wykazuje kilka istotnych cech:

  • Jeśli u i v są oba bardzo małe w porównaniu z prędkością światła, to iloczyn vu / c 2 staje się znikomo mały, a ogólny wynik staje się nieodróżnialny od wzoru Galileusza (wzór Newtona) na sumowanie prędkości: u  =  u  +  v . Formuła Galileusza jest szczególnym przypadkiem formuły relatywistycznej mającej zastosowanie do małych prędkości.
  • Jeśli u jest ustawione na c , to formuła daje u  =  c niezależnie od wartości początkowej v . Prędkość światła jest taka sama dla wszystkich obserwatorów, niezależnie od ich ruchów względem emitującego źródła.

Powrót do dylatacji czasu i skrócenia długości

Rysunek 3-3. Diagramy czasoprzestrzenne ilustrujące dylatację czasu i skrócenie długości

Łatwo jest uzyskać ilościowe wyrażenia na dylatację czasu i skrócenie długości. Rys. 3-3 jest złożonym obrazem zawierającym pojedyncze klatki z dwóch poprzednich animacji, uproszczonym i ponownie oznaczonym na potrzeby tej sekcji.

Aby nieco zmniejszyć złożoność równań, istnieje wiele różnych notacji skróconych dla ct :

i są powszechne.
Bardzo często widuje się też użycie konwencji
Rysunek 3-4. Współczynnik Lorentza w funkcji prędkości

Na rys. 3-3a segmenty OA i OK reprezentują równe odstępy czasoprzestrzenne. Dylatację czasu przedstawia stosunek OB / OK . Hiperbola niezmiennicza ma równanie w = x 2 + k 2 gdzie k  =  OK , a czerwona linia reprezentująca linię świata cząstki w ruchu ma równanie w  =  x / β  =  xc / v . Trochę manipulacji algebraicznych daje

Wyrażenie zawierające symbol pierwiastka kwadratowego pojawia się bardzo często w teorii względności, a jedno ponad wyrażeniem nazywa się współczynnikiem Lorentza, oznaczanym grecką literą gamma :

Jeśli v jest większe lub równe c , wyrażenie for staje się fizycznie pozbawione sensu, co oznacza, że ​​c jest maksymalną możliwą prędkością w przyrodzie. Dla każdego v większego niż zero współczynnik Lorentza będzie większy niż jeden, chociaż kształt krzywej jest taki, że dla małych prędkości współczynnik Lorentza jest bardzo bliski jedności.

Na rys. 3-3b segmenty OA i OK reprezentują równe odstępy czasoprzestrzenne. Skrócenie długości jest reprezentowane przez stosunek OB / OK . Hiperbola niezmiennicza ma równanie x = w 2 + k 2 , gdzie k  =  OK , a krawędzie niebieskiego pasma reprezentującego linie świata punktów końcowych pręta w ruchu mają nachylenie 1/ β  =  c / v . Zdarzenie A ma współrzędne ( xw ) = ( γkγβk ). Ponieważ styczna przechodząca przez A i B ma równanie w  = ( x  −  OB )/ β , mamy γβk  = ( γk  −  OB )/ β i

Transformacje Lorentza

Transformacje Galileusza i wynikające z nich zdroworozsądkowe prawo dodawania prędkości sprawdza się dobrze w naszym zwykłym, wolnoobrotowym świecie samolotów, samochodów i piłek. Jednak począwszy od połowy XIX wieku czułe oprzyrządowanie naukowe zaczęło znajdować anomalie, które nie pasowały do ​​zwykłego dodawania prędkości.

Transformacje Lorentza są używane do przekształcania współrzędnych zdarzenia z jednej klatki na drugą w szczególnej teorii względności.

Współczynnik Lorentza pojawia się w przekształceniach Lorentza:

Odwrotne transformacje Lorentza to:

Gdy v  ≪  c i x są wystarczająco małe, składniki v 2 / c 2 i vx / c 2 zbliżają się do zera, a transformacje Lorentza zbliżają się do transformacji Galileusza.

itd., najczęściej naprawdę oznaczają itd. Chociaż dla zwięzłości równania transformacji Lorentza są napisane bez delt, x oznacza x , itd. Ogólnie rzecz biorąc, zawsze zajmujemy się różnicami przestrzennymi i czasowymi między zdarzeniami.

Nazywanie jednego zestawu transformacji normalnymi transformacjami Lorentza, a drugiego transformacjami odwrotnymi jest mylące, ponieważ nie ma wewnętrznej różnicy między ramkami. Różni autorzy nazywają jeden lub drugi zbiór przekształceń zbiorem „odwrotnym”. Transformacje w przód i w tył są ze sobą trywialnie powiązane, ponieważ ramka S może poruszać się tylko do przodu lub do tyłu względem S . Tak więc odwracanie równań polega po prostu na zamianie zmiennych pierwotnych i niepierwotnych i zastąpieniu v na − v .

Przykład: Terence i Stella biorą udział w wyścigu kosmicznym Ziemia-Mars. Terence jest urzędnikiem na starcie, a Stella jest uczestnikiem. W czasie t = t = 0 statek kosmiczny Stelli natychmiast przyspiesza do prędkości 0,5  c . Odległość od Ziemi do Marsa wynosi 300 sekund świetlnych (około90,0 × 106 km  ) . Terence obserwuje, jak Stella przekracza zegar mety w czasie t  = 600,00 s . Ale Stella obserwuje czas na swoim chronometrze statku , gdy mija linię mety, i oblicza odległość między startem a metą, mierzoną w jej kadrze, na 259,81 sekundy świetlnej (około77,9 × 106 km  ) . 1).

Wyprowadzanie transformacji Lorentza

Rysunek 3–5. Wyprowadzenie transformacji Lorentza

Od czasu oryginalnej pracy Einsteina z 1905 roku powstało wiele dziesiątek wyprowadzeń transformacji Lorentza , z których każda miała szczególny nacisk. Chociaż wyprowadzenie Einsteina opierało się na niezmienności prędkości światła, istnieją inne fizyczne zasady, które mogą służyć jako punkty wyjścia. Ostatecznie te alternatywne punkty wyjścia można uznać za różne wyrazy podstawowej zasady lokalności , która stanowi, że wpływ, jaki jedna cząstka wywiera na inną, nie może być przekazywany natychmiast.

Wyprowadzenie podane tutaj i zilustrowane na rys. 3-5 jest oparte na wyprowadzeniu zaprezentowanym przez Baisa i wykorzystuje wcześniejsze wyniki z sekcji relatywistycznej kompozycji prędkości, dylatacji czasu i skrócenia długości. Zdarzenie P ma współrzędne ( wx ) w czarnym „układzie spoczynkowym” i współrzędne ( w x ) w czerwonej ramce, która porusza się z parametrem prędkości β  =  v / c . Aby wyznaczyć w i x w kategoriach w i x (lub odwrotnie) łatwiej jest na początku wyprowadzić odwrotną transformację Lorentza.

  1. Nie może być czegoś takiego jak wydłużanie/skrócenie długości w kierunkach poprzecznych. y ' musi być równe y i z musi być równe z , w przeciwnym razie to, czy szybko poruszająca się kula o długości 1 m zmieści się w okrągłym otworze o długości 1 m, zależałoby od obserwatora. Pierwszy postulat względności stwierdza, że ​​wszystkie układy inercjalne są równoważne, a poprzeczne rozszerzanie/skurczanie naruszałoby to prawo.
  2. Z rysunku w = a + b i x  =  r  +  s
  3. Z poprzednich wyników wykorzystujących podobne trójkąty wiemy, że s / a  =  b / r = v / c  =  β .
  4. Z powodu dylatacji czasu a  =  γw
  5. Podstawiając równanie (4) do s / a  =  β , otrzymujemy s  =  γw β .
  6. Skrócenie długości i podobne trójkąty dają nam r  =  γx i b  =  βr = βγx
  7. Podstawiając wyrażenia dla s , a , r i b do równań w kroku 2 natychmiast otrzymujemy

Powyższe równania są alternatywnymi wyrażeniami dla równań t i x odwrotnej transformacji Lorentza, co można zobaczyć, zastępując ct za w , ct za w i v / c za β . Z przekształcenia odwrotnego można wyprowadzić równania przekształcenia w przód, rozwiązując t i x .

Liniowość przekształceń Lorentza

Transformacje Lorentza mają matematyczną właściwość zwaną liniowością, ponieważ x i t są otrzymywane jako liniowe kombinacje x i t , bez większych potęg. Liniowość przekształcenia odzwierciedla fundamentalną właściwość czasoprzestrzeni, która została milcząco założona w wyprowadzeniu, a mianowicie, że właściwości inercjalnych układów odniesienia są niezależne od położenia i czasu. Przy braku grawitacji czasoprzestrzeń wygląda wszędzie tak samo. Wszyscy obserwatorzy inercyjni zgodzą się, co stanowi ruch przyspieszający i nieprzyspieszający. Każdy obserwator może wykorzystać własne pomiary przestrzeni i czasu, ale nie ma w nich nic absolutnego. Równie dobrze sprawdzą się konwencje innego obserwatora.

Wynikiem liniowości jest to, że jeśli dwie transformacje Lorentza są stosowane sekwencyjnie, wynikiem jest również transformacja Lorentza.

Przykład: Terence obserwuje Stellę oddalającą się od niego w 0,500  c , i może użyć transformacji Lorentza z β  = 0,500 , aby powiązać pomiary Stelli z własnymi. Stella, w swojej ramce, obserwuje Ursulę oddalającą się od niej w 0,250  c , i może użyć transformacji Lorentza z β  = 0,250 , aby powiązać pomiary Ursuli z jej własnymi. Ze względu na liniowość transformacji i relatywistyczny skład prędkości, Terence może użyć transformacji Lorentza z β  = 0,666 do powiązania pomiarów Ursuli z własnymi.

efekt Dopplera

Efekt Dopplera to zmiana częstotliwości lub długości fali dla odbiornika i źródła we względnym ruchu. Dla uproszczenia rozważymy tutaj dwa podstawowe scenariusze: (1) ruchy źródła i/lub odbiornika przebiegają dokładnie wzdłuż łączącej je linii (wzdłużny efekt Dopplera) oraz (2) ruchy są prostopadłe do tej linii ( poprzeczny efekt Dopplera ). Ignorujemy scenariusze, w których poruszają się pod pośrednimi kątami.

Efekt Dopplera wzdłużnego

Klasyczna analiza dopplerowska dotyczy fal rozchodzących się w ośrodku, takich jak fale dźwiękowe lub fale wody, które są przesyłane między źródłami i odbiornikami, które zbliżają się lub oddalają od siebie. Analiza takich fal zależy od tego, czy źródło, odbiornik, czy oba poruszają się względem ośrodka. Biorąc pod uwagę scenariusz, w którym odbiornik jest nieruchomy względem medium, a źródło oddala się bezpośrednio od odbiornika z prędkością v s dla parametru prędkości β s , długość fali jest zwiększana i podana jest obserwowana częstotliwość f za pomocą

Z drugiej strony, biorąc pod uwagę scenariusz, w którym źródło jest nieruchome, a odbiornik oddala się bezpośrednio od źródła z prędkością v r dla parametru prędkości β r , nie zmienia się długość fali , ale prędkość transmisji fal względem odbiornika maleje, a obserwowana częstotliwość f jest dana przez

Rysunek 3–6. Diagram czasoprzestrzenny relatywistycznego efektu Dopplera

Światło, w przeciwieństwie do fal dźwiękowych lub wody, nie rozchodzi się przez ośrodek i nie ma rozróżnienia między źródłem oddalającym się od odbiornika a odbiornikiem oddalającym się od źródła. Fig. 3-6 ilustruje relatywistyczny wykres czasoprzestrzeni pokazujący źródło oddzielające się od odbiornika za pomocą parametru prędkości β tak, że separacja między źródłem a odbiornikiem w czasie w wynosi βw . Z powodu dylatacji czasu, . Ponieważ nachylenie zielonego promienia światła wynosi -1, . Stąd relatywistyczny efekt Dopplera jest podany przez

Poprzeczny efekt Dopplera

Rysunek 3–7. Scenariusze z poprzecznym efektem Dopplera

Załóżmy, że źródło i odbiornik zbliżają się do siebie jednostajnym ruchem bezwładnościowym wzdłuż nieprzecinających się linii i zbliżają się do siebie najbardziej. Wydaje się, że klasyczna analiza przewiduje, że odbiornik nie wykrywa przesunięcia Dopplera. Ze względu na subtelności w analizie to oczekiwanie niekoniecznie jest prawdziwe. Niemniej jednak, odpowiednio zdefiniowane, poprzeczne przesunięcie Dopplera jest efektem relatywistycznym, który nie ma klasycznego analogu. Subtelności są następujące:

W scenariuszu (a) punkt najbliższego zbliżenia jest niezależny od ramki i reprezentuje moment, w którym nie ma zmiany odległości w funkcji czasu (tj. dr/dt = 0, gdzie r jest odległością między odbiornikiem a źródłem), a zatem nie ma podłużnego Dopplera Zmiana. Źródło obserwuje odbiornik jako oświetlony światłem o częstotliwości f , ale obserwuje również odbiornik jako posiadający zegar z rozszerzonym czasem. W ramce S odbiornik jest zatem oświetlony przesuniętym ku niebu światło o częstotliwości

W scenariuszu (b) ilustracja pokazuje, że odbiornik jest oświetlony światłem z momentu, gdy źródło znajdowało się najbliżej odbiornika, nawet jeśli źródło przesunęło się. Ponieważ zegary źródła są rozciągnięte w czasie mierzone w klatce S, a dr/dt było w tym momencie równe zero, światło ze źródła emitowane z tego najbliższego punktu jest przesunięte ku czerwieni z częstotliwością

Scenariusze (c) i (d) można analizować za pomocą prostych argumentów dylatacji czasu. W (c) odbiornik obserwuje światło ze źródła jako przesunięte ku czerwieni o współczynnik , aw (d) światło jest przesunięte ku czerwieni. Jedyną pozorną komplikacją jest to, że orbitujące obiekty są w ruchu przyspieszonym. Jeśli jednak obserwator inercyjny patrzy na przyspieszający zegar, podczas obliczania dylatacji czasu ważna jest tylko chwilowa prędkość zegara. (Jednak odwrotność nie jest prawdą.) Większość raportów o poprzecznym przesunięciu Dopplera odnosi się do efektu jako przesunięcia ku czerwieni i analizuje efekt w kategoriach scenariuszy (b) lub (d).

Energia i pęd

Rozciągnięcie pędu do czterech wymiarów

Rysunek 3–8. Relatywistyczny wektor pędu czasoprzestrzeni

W mechanice klasycznej stan ruchu cząstki charakteryzuje jej masa i prędkość. Pęd liniowy , iloczyn masy i prędkości cząstki, jest wielkością wektorową , mającą ten sam kierunek co prędkość: p  =  m v . Jest to wielkość zachowana , co oznacza, że ​​jeśli na układ zamknięty nie działają siły zewnętrzne, jego całkowity liniowy pęd nie może się zmienić.

W mechanice relatywistycznej wektor pędu jest rozszerzony do czterech wymiarów. Do wektora pędu dodano składnik czasu, który pozwala wektorowi pędu czasoprzestrzeni przekształcić się jak wektor pozycji czasoprzestrzeni . W badaniu właściwości pędu czasoprzestrzeni zaczynamy, na rys. 3-8a, od zbadania, jak cząsteczka wygląda w spoczynku. W ramce spoczynkowej składowa przestrzenna pędu wynosi zero, tj. p  = 0 , ale składnik czasowy jest równy mc .

Możemy uzyskać transformowane składowe tego wektora w ruchomej klatce, używając transformacji Lorentza, lub możemy odczytać go bezpośrednio z rysunku, ponieważ wiemy, że i , ponieważ czerwone osie są przeskalowane przez gamma. Rys. 3-8b ilustruje sytuację, jaka pojawia się w ruchomej ramce. Oczywiste jest, że składowe czasowe i przestrzenne czteropędu dążą do nieskończoności, gdy prędkość poruszającego się układu zbliża się do c .

Niedługo wykorzystamy te informacje, aby uzyskać wyrażenie na czteropęd .

Pęd światła

Rysunek 3-9. Energia i pęd światła w różnych układach inercyjnych

Cząsteczki światła, czyli fotony, poruszają się z prędkością c , stałą, która jest konwencjonalnie nazywana prędkością światła . To stwierdzenie nie jest tautologią, ponieważ wiele współczesnych sformułowań teorii względności nie zaczyna się od postulatu stałej prędkości światła. Fotony zatem rozchodzą się wzdłuż linii świata podobnej do światła iw odpowiednich jednostkach mają równe składowe czasowe i przestrzenne dla każdego obserwatora.

Konsekwencją teorii elektromagnetyzmu Maxwella jest to, że światło przenosi energię i pęd, a ich stosunek jest stały: . Przegrupowanie, a ponieważ dla fotonów składowe czasoprzestrzenne są równe, E/c musi być zatem utożsamiane ze składową czasową wektora pędu czasoprzestrzeni.

Fotony poruszają się z prędkością światła, ale mają skończony pęd i energię. Aby tak się stało, składnik masy w γmc musi wynosić zero, co oznacza, że ​​fotony są cząstkami bezmasowymi . Nieskończoność razy zero jest źle określoną wielkością, ale E/c jest dobrze zdefiniowana.

Według tej analizy, jeśli energia fotonu jest równa E w ramce spoczynkowej, to jest ona równa w ramce ruchomej. Wynik ten może być uzyskany na podstawie ryc. 3-9 lub przez zastosowanie transformacji Lorentza i jest zgodny z podaną wcześniej analizą efektu Dopplera.

Relacja masa-energia

Analiza wzajemnych relacji między różnymi składnikami relatywistycznego wektora pędu doprowadziła Einsteina do kilku słynnych wniosków.

  • W dolnym limicie prędkości, gdy β  =  v/c zbliża się do zera, γ zbliża się do 1, więc przestrzenna składowa relatywistycznego pędu zbliża się do mv , klasycznego terminu pędu. Zgodnie z tą perspektywą γm można interpretować jako relatywistyczne uogólnienie m . Einstein zaproponował, że relatywistyczna masa obiektu wzrasta wraz z prędkością zgodnie ze wzorem .
  • Podobnie porównując składową czasową pędu relatywistycznego ze składową fotonu , tak aby Einstein doszedł do zależności . Uproszczone do przypadku prędkości zerowej, jest to słynne równanie Einsteina dotyczące energii i masy.

Innym sposobem spojrzenia na związek między masą a energią jest rozważenie rozszerzenia szeregowego γmc 2 przy małej prędkości:

Drugi termin jest tylko wyrażeniem energii kinetycznej cząstki. Masa rzeczywiście wydaje się być inną formą energii.

Koncepcja masy relatywistycznej, którą Einstein wprowadził w 1905 r., m rel , choć powszechnie sprawdzana codziennie w akceleratorach cząstek na całym świecie (lub w każdym oprzyrządowaniu, którego użycie zależy od cząstek o dużej prędkości, takich jak mikroskopy elektronowe, staromodne telewizory kolorowe itd.), nie okazała się jednak płodną koncepcją w fizyce w tym sensie, że nie jest koncepcją, która służyła jako podstawa do innego rozwoju teoretycznego. Na przykład masa relatywistyczna nie odgrywa żadnej roli w ogólnej teorii względności.

Z tego powodu, a także ze względów pedagogicznych, większość fizyków preferuje obecnie inną terminologię w odniesieniu do relacji między masą a energią. „Msza relatywistyczna” to termin przestarzały. Sam termin „masa” odnosi się do masy spoczynkowej lub masy niezmiennej i jest równy niezmiennej długości wektora pędu relatywistycznego. Wyrażony jako formuła,

Ta formuła dotyczy wszystkich cząstek, zarówno bezmasowych, jak i masywnych. Dla fotonów, gdzie m reszta jest równa zeru, otrzymujemy .

Czteropędowy

Ze względu na bliski związek między masą a energią czteropęd (zwany również czteropędem) jest również nazywany czterowektorem energia-pęd. Używając wielkiej litery P do reprezentowania czteropędu i małej litery p do oznaczenia pędu przestrzennego, czteropęd można zapisać jako

lub alternatywnie,
używając konwencji, że

Prawa konserwatorskie

W fizyce prawa zachowania mówią, że pewne szczególne mierzalne właściwości izolowanego systemu fizycznego nie zmieniają się wraz z rozwojem systemu w czasie. W 1915 roku Emmy Noether odkryła, że ​​u podstaw każdego prawa ochrony leży fundamentalna symetria natury. Fakt , że procesy fizyczne nie dbają o to , gdzie w przestrzeni zachodzą ( symetria translacji przestrzennej ) daje zachowanie pędu , fakt , że takie procesy nie dbają o to , kiedy zachodzą ( symetria translacji w czasie ) daje zachowanie energii , a więc na. W tej części przyjrzymy się newtonowskim poglądom na zachowanie masy, pędu i energii z perspektywy relatywistycznej.

Całkowity pęd

Rysunek 3-10. Relatywistyczna zasada zachowania pędu

Aby zrozumieć, w jaki sposób newtonowski pogląd na zachowanie pędu musi zostać zmodyfikowany w kontekście relatywistycznym, zbadamy problem dwóch zderzających się ciał ograniczonych do jednego wymiaru.

W mechanice newtonowskiej można wyróżnić dwa skrajne przypadki tego problemu, dając matematykę o minimalnej złożoności:

(1) Dwa ciała odbijają się od siebie w całkowicie elastycznej kolizji.
(2) Dwa ciała sklejają się i kontynuują ruch jako pojedyncza cząstka. Ten drugi przypadek to przypadek całkowicie niesprężystego zderzenia.

W obu przypadkach (1) i (2) zachowane są pęd, masa i całkowita energia. Jednak energia kinetyczna nie jest zachowana w przypadku zderzenia niesprężystego. Pewna część początkowej energii kinetycznej jest zamieniana na ciepło.

W przypadku (2), dwie masy z pędami zderzają się, tworząc pojedynczą cząstkę zachowanej masy poruszającą się w środku prędkości masy pierwotnego układu, . Całkowity pęd jest zachowany.

Rys. 3-10 ilustruje niesprężyste zderzenie dwóch cząstek z perspektywy relatywistycznej. Składowe czasu i sumują się do całkowitego E/c wypadkowego wektora, co oznacza, że ​​energia jest zachowana. Podobnie, komponenty przestrzeni i dodają się do postaci p otrzymanego wektora. Czteropęd jest, jak można się spodziewać, ilością zachowaną. Jednak niezmienna masa skondensowanej cząstki, wyrażona przez punkt, w którym niezmienna hiperbola całkowitego pędu przecina oś energii, nie jest równa sumie niezmiennych mas poszczególnych cząstek, które zderzyły się. Rzeczywiście, jest większa niż suma poszczególnych mas: .

Patrząc na wydarzenia w tym scenariuszu w odwrotnej kolejności, widzimy, że brak zachowania masy jest częstym zjawiskiem: kiedy niestabilna cząstka elementarna spontanicznie rozpada się na dwie lżejsze cząstki, całkowita energia jest zachowywana, ale masa nie. Część masy zamieniana jest na energię kinetyczną.

Wybór ramek odniesienia

Rysunek 3-11.
(powyżej) Rama laboratorium .
(po prawej) Środek ramy pędu .

Swoboda wyboru dowolnego kadru, w którym przeprowadzamy analizę, pozwala nam wybrać taki, który może być szczególnie wygodny. Do analizy problemów z pędem i energią najwygodniejszą ramką jest zwykle „ramka środka pędu ” (zwana również ramką zerowego pędu lub ramką COM). Jest to rama, w której składowa przestrzenna całkowitego pędu układu wynosi zero. Rys. 3-11 ilustruje rozpad cząstki o dużej prędkości na dwie cząstki potomne. W ramach laboratorium cząstki potomne są emitowane preferencyjnie w kierunku zorientowanym wzdłuż trajektorii pierwotnej cząstki. Jednak w ramce COM dwie cząstki potomne są emitowane w przeciwnych kierunkach, chociaż ich masy i wielkość ich prędkości zasadniczo nie są takie same.

Zachowanie energii i pędu

W newtonowskiej analizie oddziałujących cząstek transformacja między klatkami jest prosta, ponieważ wystarczy zastosować transformację Galileusza do wszystkich prędkości. Ponieważ pęd . Jeśli obserwuje się, że całkowity pęd oddziałującego układu cząstek jest zachowany w jednym układzie, będzie on również zachowany w każdym innym układzie.

Zachowanie pędu w ramce COM sprowadza się do wymogu, aby p  = 0 zarówno przed, jak i po zderzeniu. W analizie newtonowskiej zachowanie masy dyktuje, że . W uproszczonych, jednowymiarowych scenariuszach, które rozważaliśmy, konieczne jest tylko jedno dodatkowe ograniczenie, aby można było określić wychodzące pędy cząstek — warunek energetyczny. W jednowymiarowym przypadku zderzenia całkowicie sprężystego bez utraty energii kinetycznej, prędkości odlatujących cząstek w ramce COM będą dokładnie równe i przeciwne do ich prędkości przychodzących. W przypadku zderzenia całkowicie niesprężystego z całkowitą utratą energii kinetycznej, prędkości wylatujących cząstek będą wynosić zero.

W transformacji Lorentza pędy Newtona, obliczone jako , nie zachowują się prawidłowo. Transformacja liniowa prędkości została zastąpiona przez wysoce nieliniową , tak że obliczenia wykazujące zachowanie pędu w jednym układzie będą nieważne w innych układach. Einstein musiał albo zrezygnować z zachowania pędu, albo zmienić definicję pędu. Wybrał tę drugą opcję.

Rysunek 3-12a. Wykres energia-pęd dla rozpadu naładowanego pionu.
Rysunek 3-12b. Kalkulator graficzny analiza rozpadu naładowanego pionu.

Relatywistyczne prawo zachowania energii i pędu zastępuje trzy klasyczne prawa zachowania energii, pędu i masy. Masa nie jest już dłużej zachowywana niezależnie, ponieważ została włączona do całkowitej energii relatywistycznej. To sprawia, że ​​relatywistyczna zasada zachowania energii jest prostsza niż w mechanice nierelatywistycznej, ponieważ całkowita energia jest zachowywana bez żadnych zastrzeżeń. Energia kinetyczna zamieniona na ciepło lub wewnętrzną energię potencjalną objawia się wzrostem masy.

Przykład: Ze względu na równoważność masy i energii masy cząstek elementarnych są zwyczajowo podawane w jednostkach energii, gdzie 1 MeV = 106 elektronowoltów . Naładowany pion to cząstka o masie 139,57 MeV (około 273 razy większej od masy elektronu). Jest niestabilny i rozpada się na mion o masie 105,66 MeV (około 207 razy większej od masy elektronu) oraz antyneutrino, którego masa jest prawie pomijalna. Różnica między masą pionu a masą mionu wynosi 33,91 MeV.

π

μ
+
ν
μ

Rys. 3-12a ilustruje wykres energia-pęd dla tej reakcji rozpadu w układzie spoczynkowym pionu. Ze względu na swoją znikomą masę neutrino porusza się z prędkością bliską prędkości światła. Relatywistyczny wyraz jego energii, podobnie jak fotonu, jest również wartością składowej przestrzennej jego pędu. Aby zachować pęd, mion ma taką samą wartość składowej przestrzeni pędu neutrina, ale w przeciwnym kierunku.

Analizy algebraiczne energetyki tej reakcji rozpadu są dostępne online, więc rys. 3-12b przedstawia zamiast tego rozwiązanie kalkulatora graficznego. Energia neutrina wynosi 29,79 MeV, a mionu 33,91 MeV − 29,79 MeV = 4,12 MeV . Większość energii jest odprowadzana przez neutrino o masie bliskiej zeru.

Poza podstawami

Tematy w tej sekcji mają znacznie większą trudność techniczną niż te w poprzednich sekcjach i nie są niezbędne do zrozumienia Wprowadzenie do zakrzywionej czasoprzestrzeni.

Szybkość

Rysunek 4-1a. Promień przechodzący przez okrąg jednostkowy x 2 + y 2 = 1 w punkcie (cos a , sin a ) , gdzie a jest dwukrotnością pola pomiędzy promieniem, okręgiem i osią x .
Rysunek 4-1b. Promień przechodzący przez jednostkę hiperbolę x 2y 2 = 1 w punkcie (cosh a , sinh a ) , gdzie a jest dwukrotną powierzchnią między promieniem, hiperbolą i osią x .
Rysunek 4–2. Wykres trzech podstawowych funkcji hiperbolicznych: sinus hiperboliczny ( sinh ), cosinus hiperboliczny ( cosh ) i tangens hiperboliczny ( tanh ). Sinh jest czerwony, cosh jest niebieski, a tanh jest zielony.

Transformacje Lorentza wiążą współrzędne zdarzeń w jednej ramce odniesienia z tymi w innej ramce. Relatywistyczny skład prędkości służy do sumowania dwóch prędkości. Wzory do wykonywania tych ostatnich obliczeń są nieliniowe, co czyni je bardziej złożonymi niż odpowiadające im formuły Galileusza.

Ta nieliniowość jest artefaktem naszego doboru parametrów. Zauważyliśmy wcześniej, że na diagramie czasoprzestrzeni x-ct punkty w pewnym stałym odstępie czasoprzestrzeni od początku tworzą niezmienną hiperbolę. Zauważyliśmy również, że układy współrzędnych dwóch układów odniesienia czasoprzestrzeni w standardowej konfiguracji są hiperbolicznie obrócone względem siebie.

Naturalnymi funkcjami wyrażania tych zależności są hiperboliczne analogi funkcji trygonometrycznych . Rys. 4-1a pokazuje okrąg jednostkowy z sin( a ) i cos( a ), jedyną różnicą między tym diagramem a znanym okręgiem jednostkowym elementarnej trygonometrii jest to, że a jest interpretowane, a nie jako kąt między promieniem a x -axis , ale dwukrotnie większy obszar sektora omiatany przez promień z osi x . (Numerycznie kąt i 2 × miary pola dla okręgu jednostkowego są identyczne.) Rys. 4-1b przedstawia hiperbolę jednostkową z sinh( a ) i cosh( a ), gdzie a jest podobnie interpretowane jako dwukrotność zabarwionego pola. Rys. 4-2 przedstawia wykresy funkcji sinh, cosh i tanh.

Dla okręgu jednostkowego nachylenie promienia jest podane przez

W płaszczyźnie kartezjańskiej obrót punktu ( x , y ) w punkt ( x ' , y ' ) o kąt θ jest wyrażony przez

Na diagramie czasoprzestrzeni parametr prędkości jest analogiem nachylenia. Szybkość , φ , jest określona przez

gdzie

Zdefiniowana powyżej szybkość jest bardzo przydatna w szczególnej teorii względności, ponieważ wiele wyrażeń przybiera znacznie prostszą formę, gdy są wyrażane w jej kategoriach. Na przykład szybkość jest po prostu addytywna we wzorze współliniowej szybkości dodawania;

lub innymi słowy,

Transformacje Lorentza przybierają prostą formę, gdy są wyrażone w kategoriach szybkości. Współczynnik γ można zapisać jako

Transformacje opisujące ruch względny z jednostajną prędkością i bez obrotu osi współrzędnych przestrzennych nazywamy doładowaniami .

Podstawiając γ i γβ do przekształceń przedstawionych wcześniej i przepisując w postaci macierzowej, wzmocnienie Lorentza w kierunku x można zapisać jako

a odwrotny wzrost Lorentza w kierunku x można zapisać jako

Innymi słowy, wzmocnienia Lorentza reprezentują hiperboliczne rotacje w czasoprzestrzeni Minkowskiego.

Zalety korzystania z funkcji hiperbolicznych są takie, że niektóre podręczniki, takie jak klasyczne podręczniki Taylora i Wheelera, wprowadzają ich zastosowanie na bardzo wczesnym etapie.

4-wektory

Cztery wektory zostały wymienione powyżej w kontekście 4-wektora energia-pęd , ale bez większego nacisku. Rzeczywiście, żadne z elementarnych wyprowadzeń szczególnej teorii względności ich nie wymaga. Ale raz zrozumiane, 4-wektory , a ogólniej tensory , znacznie upraszczają matematykę i pojęciowe rozumienie szczególnej teorii względności. Praca wyłącznie z takimi obiektami prowadzi do formuł, które są ewidentnie relatywistycznie niezmiennicze, co jest znaczną zaletą w nietrywialnych kontekstach. Na przykład wykazanie relatywistycznej niezmienności równań Maxwella w ich zwykłej postaci nie jest trywialne, podczas gdy jest to jedynie rutynowe obliczenie (w rzeczywistości nie więcej niż obserwacja) przy użyciu sformułowania tensora natężenia pola . Z drugiej strony, ogólna teoria względności od samego początku w dużej mierze opiera się na 4-wektorach , a bardziej ogólnie na tensorach, reprezentujących fizycznie istotne byty. Powiązanie ich za pomocą równań, które nie opierają się na konkretnych współrzędnych, wymaga tensorów, zdolnych do łączenia takich 4-wektorów nawet w zakrzywionej czasoprzestrzeni, a nie tylko w płaskiej , jak w szczególnej teorii względności. Badanie tensorów wykracza poza zakres tego artykułu, który zawiera jedynie podstawowe omówienie czasoprzestrzeni.

Definicja 4-wektorów

Czterokrotka jest "4-wektorem", jeśli jej składnik A i przekształca się między klatkami zgodnie z transformacją Lorentza.

Jeśli używasz współrzędnych, A jest 4-wektorem , jeśli przekształca się (w kierunku x ) zgodnie z

co pochodzi z prostego zastąpienia ct przez A 0 i x przez A 1 we wcześniejszej prezentacji transformacji Lorentza.

Jak zwykle, kiedy piszemy x , t , itd., ogólnie mamy na myśli Δx , Δt itd.

Ostatnie trzy składowe 4-wektora muszą być wektorem standardowym w przestrzeni trójwymiarowej. Dlatego 4–wektor musi przekształcić się tak, jak w transformacji Lorentza, a także w obrotach.

Własności 4-wektorów

  • Zamknięcie w kombinacji liniowej: Jeśli A i B4-wektorami , to również jest 4-wektorem .
  • Niezmienniczość iloczynu skalarnego: Jeśli A i B4-wektorami , to ich iloczyn skalarny jest niezmienniczy, tzn. ich iloczyn skalarny jest niezależny od układu, w którym jest obliczany. Zwróć uwagę, jak obliczanie iloczynu skalarnego różni się od obliczania iloczynu skalarnego 3-wektora . Poniżej i są 3-wektorami :
Oprócz tego, że jest niezmienny w transformacji Lorentza, powyższy iloczyn skalarny jest również niezmienny w rotacji w przestrzeni 3 .
Mówi się, że dwa wektory są ortogonalne , jeśli W przeciwieństwie do przypadku z 3-wektorami, ortogonalne 4-wektory niekoniecznie są względem siebie pod kątem prostym. Zasadą jest, że dwa 4-wektory są ortogonalne, jeśli są odsunięte o równe i przeciwne kąty od linii 45°, która jest linią świata promienia świetlnego. Oznacza to, że światłopodobny 4-wektor jest ze sobą prostopadły .
  • Niezmienność wielkości wektora: Wielkość wektora jest iloczynem wewnętrznym 4-wektora z samym sobą i jest właściwością niezależną od ramki. Podobnie jak w przypadku interwałów, wielkość może być dodatnia, ujemna lub zerowa, tak że wektory są określane jako czasopodobne, przestrzenne lub zerowe (podobne do światła). Zauważ, że wektor zerowy to nie to samo co wektor zerowy. Wektor zerowy to taki, dla którego wektor zerowy to taki, którego składowe są równe zero. Szczególne przypadki ilustrujące niezmienność normy obejmują niezmienny przedział i niezmienną długość relatywistycznego wektora pędu

Przykłady 4-wektorów

  • Przemieszczenie 4-wektorowe: Inaczej znane jako separacja czasoprzestrzenna , jest to ( Δt, Δx, Δy, Δz ) lub dla nieskończenie małych separacji ( dt, dx, dy, dz ) .
  • Prędkość 4-wektorowa: Wynika to, gdy 4-wektor przemieszczenia jest dzielony przez , gdzie jest prawidłowym czasem między dwoma zdarzeniami, które dają dt, dx, dy i dz .
Rysunek 4-3a. Chwilowo poruszające się klatki odniesienia przyspieszającej cząstki obserwowane z klatki nieruchomej.
Rysunek 4-3b. Chwilowo poruszające się ramki odniesienia wzdłuż trajektorii obserwatora przyspieszającego (w środku).
Prędkość 4 jest styczna do linii świata cząstki i ma długość równą jednej jednostce czasu w ramie cząstki.
Cząstka przyspieszona nie ma układu inercjalnego, w którym zawsze pozostaje w spoczynku. Jednak zawsze można znaleźć układ inercyjny, który chwilowo porusza się wraz z cząstką. Rama ta, chwilowo poruszająca się ramka odniesienia (MCRF), umożliwia zastosowanie szczególnej teorii względności do analizy przyspieszonych cząstek.
Ponieważ fotony poruszają się po liniach zerowych, dla fotonu nie można zdefiniować 4-prędkości . Nie ma ramki, w której foton jest w spoczynku i nie można ustalić MCRF wzdłuż ścieżki fotonu.
  • Energia-pęd 4-wektor:
Jak wskazano wcześniej, istnieją różne sposoby traktowania 4-wektora energii-pędu tak, że można go również zobaczyć jako lub Pierwszym składnikiem jest całkowita energia (w tym masa) cząstki (lub układu cząstek) w danym układzie , a pozostałe składowe to jego pęd przestrzenny. 4-wektor energii pędu jest wielkością zachowaną.
  • Przyspieszenie 4-wektorowe: Wynika z pochodnej 4-wektorowej prędkości względem
  • Siła 4-wektorowa: Jest to pochodna 4-wektorowego pędu względem

Zgodnie z oczekiwaniami, końcowe składniki powyższych 4-wektorów są standardowymi 3-wektorami odpowiadającymi przestrzennemu 3-pędowi , 3-siły itp.

4-wektory i prawo fizyczne

Pierwszy postulat szczególnej teorii względności deklaruje równoważność wszystkich układów inercjalnych. We wszystkich ramkach musi obowiązywać prawo fizyczne, które obowiązuje w jednej ramce, gdyż w przeciwnym razie możliwe byłoby rozróżnienie ramek. Pędy newtonowskie nie zachowują się właściwie w transformacji Lorentza, a Einstein wolał zmienić definicję pędu na 4 wektory , niż zrezygnować z zachowania pędu.

Prawa fizyczne muszą opierać się na konstrukcjach niezależnych od ram. Oznacza to, że prawa fizyczne mogą przybierać postać równań łączących skalary, które zawsze są niezależne od ramki. Jednak równania obejmujące 4-wektory wymagają użycia tensorów o odpowiedniej randze, które same w sobie można uznać za zbudowane z 4-wektorów .

Przyśpieszenie

Powszechnym błędem jest przekonanie, że szczególna teoria względności ma zastosowanie tylko do układów inercjalnych i że nie jest w stanie poradzić sobie z przyspieszającymi obiektami lub przyspieszającymi układami odniesienia. W rzeczywistości przyspieszające obiekty można ogólnie analizować bez konieczności zajmowania się przyspieszaniem klatek. Tylko wtedy, gdy grawitacja jest znacząca, wymagana jest ogólna teoria względności.

Prawidłowe obchodzenie się z przyspieszającymi ramkami wymaga jednak pewnej ostrożności. Różnica między szczególną a ogólną teorią względności polega na tym, że (1) W szczególnej teorii względności wszystkie prędkości są względne, ale przyspieszenie jest bezwzględne. (2) W ogólnej teorii względności każdy ruch jest względny, niezależnie od tego, czy jest bezwładny, przyspieszający, czy obracający się. Aby uwzględnić tę różnicę, ogólna teoria względności wykorzystuje zakrzywioną czasoprzestrzeń.

W tej sekcji przeanalizujemy kilka scenariuszy dotyczących przyspieszonych ramek odniesienia.

Paradoks statku kosmicznego Dewana-Berana-Bella

Paradoks statku kosmicznego Dewana-Beran-Bella (paradoks statku kosmicznego Bella ) jest dobrym przykładem problemu, w którym intuicyjne rozumowanie bez pomocy geometrycznego wglądu w podejście do czasoprzestrzeni może prowadzić do problemów.

Rysunek 4-4. Paradoks statku kosmicznego Dewana-Berana-Bella

Na rys. 4-4 dwa identyczne statki kosmiczne unoszą się w przestrzeni i pozostają w spoczynku względem siebie. Są one połączone sznurkiem, który przed zerwaniem jest w stanie tylko w ograniczonym stopniu naciągnąć. W danej chwili w naszym układzie, układzie obserwatora, oba statki kosmiczne przyspieszają w tym samym kierunku wzdłuż linii między nimi z tym samym stałym właściwym przyspieszeniem. Czy sznurek się zerwie?

Kiedy paradoks był nowy i stosunkowo nieznany, nawet zawodowi fizycy mieli trudności ze znalezieniem rozwiązania. Dwie linie rozumowania prowadzą do przeciwnych wniosków. Oba argumenty przedstawione poniżej są błędne, mimo że jeden z nich daje poprawną odpowiedź.

  1. Dla obserwatorów w ramce spoczynkowej statki kosmiczne zaczynają się w odległości L od siebie i pozostają w tej samej odległości podczas przyspieszania. Podczas przyspieszania L jest skróconą długością odległości L ' = γL w ramie przyspieszających statków kosmicznych. Po wystarczająco długim czasie γ wzrośnie do na tyle dużego współczynnika, że ​​struna musi pęknąć.
  2. Niech A i B będą tylnymi i przednimi statkami kosmicznymi. W kadrze statków kosmicznych każdy statek kosmiczny widzi, jak inny statek kosmiczny robi to samo, co robi. A mówi, że B ma takie samo przyspieszenie jak on, a B widzi, że A dopasowuje się do niej w każdym ruchu. Więc statki kosmiczne pozostają w tej samej odległości od siebie, a struna nie pęka.

Problem z pierwszym argumentem polega na tym, że nie ma „ramy statków kosmicznych”. Nie może być, ponieważ oba statki kosmiczne mierzą rosnącą odległość między nimi. Ponieważ nie ma wspólnej ramy statków kosmicznych, długość struny jest źle określona. Niemniej jednak wniosek jest słuszny, a argument jest w większości słuszny. Drugi argument jednak całkowicie ignoruje względność jednoczesności.

Rysunek 4–5. Zakrzywione linie reprezentują linie świata dwóch obserwatorów A i B, którzy przyspieszają w tym samym kierunku z tym samym stałym przyspieszeniem wielkości. W punktach A' i B' obserwatorzy przestają przyspieszać. Linie przerywane to linie jednoczesności dla obu obserwatorów przed rozpoczęciem przyspieszania i po zatrzymaniu przyspieszania.

Diagram czasoprzestrzenny (rys. 4-5) sprawia, że ​​prawidłowe rozwiązanie tego paradoksu jest niemal natychmiast widoczne. Dwaj obserwatorzy w czasoprzestrzeni Minkowskiego przyspieszają ze stałym przyspieszeniem wielkościowym przez odpowiedni czas (przyspieszenie i upływ czasu mierzone przez samych obserwatorów, a nie jakiś obserwator inercyjny). Poruszają się i są bezwładne przed i po tej fazie. W geometrii Minkowskiego długość wzdłuż linii równoczesności okazuje się większa niż długość wzdłuż linii równoczesności .

Wzrost długości można obliczyć za pomocą transformacji Lorentza. Jeśli, jak pokazano na rys. 4-5, przyspieszenie jest zakończone, statki pozostaną w pewnym przesunięciu w stałym przesunięciu Jeśli i są pozycje statków w pozycjach w ramce :

Niejako „paradoks” pochodzi ze sposobu, w jaki Bell skonstruował swój przykład. W zwykłej dyskusji o skróceniu Lorentza długość spoczynku jest stała, a długość ruchu skraca się mierząc w frame . Jak pokazano na rys. 4-5, przykład Bella potwierdza długości ruchu i pomiary w ramie , które mają być ustalone, zmuszając w ten sposób do zwiększenia długości ramy spoczynkowej w ramie .

Przyspieszony obserwator z horyzontem

Pewne konfiguracje specjalnych problemów względności mogą prowadzić do wglądu w zjawiska zwykle związane z ogólną teorią względności, takie jak horyzonty zdarzeń . W tekście towarzyszącym rys. 2-7 , hiperbole magenta reprezentowały rzeczywiste ścieżki, które są śledzone przez stale przyspieszającego podróżnika w czasoprzestrzeni. W okresach dodatniego przyspieszenia prędkość podróżnika zbliża się do prędkości światła, podczas gdy mierzone w naszym ujęciu przyspieszenie podróżnika stale maleje.

Rysunek 4–6. Przyspieszony obserwator relatywistyczny z horyzontem. Inną dobrze narysowaną ilustrację tego samego tematu można obejrzeć tutaj .

Rys. 4-6 szczegółowo przedstawia różne cechy ruchów podróżnika. W dowolnym momencie jej oś przestrzeni jest utworzona przez linię przechodzącą przez początek i jej aktualną pozycję na hiperboli, podczas gdy jej oś czasu jest styczną do hiperboli w jej położeniu. Parametr prędkości zbliża się do granicy jedności wraz ze wzrostem. Podobnie zbliża się do nieskończoności.

Kształt niezmiennej hiperboli odpowiada ścieżce stałego prawidłowego przyspieszenia. Można to zademonstrować w następujący sposób:

  1. Pamiętamy, że
  2. Ponieważ dochodzimy do wniosku, że
  3. Z relatywistycznego prawa siły,
  4. Podstawienie z kroku 2 i wyrażenie z kroku 3 daje w wyniku wyrażenie stałe.

Rys. 4-6 ilustruje konkretny wyliczony scenariusz. Terence (A) i Stella (B) początkowo stoją razem 100 godzin świetlnych od źródła. Stella startuje w czasie 0, a jej statek kosmiczny przyspiesza z prędkością 0,01 c na godzinę. Co dwadzieścia godzin Terence wysyła do Stelli informacje o sytuacji w domu (ciągłe zielone linie). Stella odbiera te regularne transmisje, ale rosnąca odległość (częściowo skompensowana przez dylatację czasu) powoduje, że otrzymuje komunikaty Terence'a coraz później, jak zmierzono na jej zegarze, i nigdy nie otrzymuje żadnych komunikatów od Terence'a po 100 godzinach na jego zegarze (przerywana na zielono linie).

Po 100 godzinach według zegara Terence'a Stella wkracza w mroczny region. Wyjechała poza czasową przyszłość Terence'a. Z drugiej strony Terence może nadal otrzymywać wiadomości od Stelli do niego w nieskończoność. Musi po prostu wystarczająco długo czekać. Czasoprzestrzeń została podzielona na odrębne regiony oddzielone wyraźnym horyzontem zdarzeń. Dopóki Stella nadal przyspiesza, nigdy nie może wiedzieć, co dzieje się za tym horyzontem.

Wprowadzenie do zakrzywionej czasoprzestrzeni

Podstawowe propozycje

Teorie Newtona zakładały, że ruch odbywa się na tle sztywnej euklidesowej ramy odniesienia, która rozciąga się na całą przestrzeń i cały czas. W grawitacji pośredniczy tajemnicza siła, działająca natychmiastowo na odległość, której działania są niezależne od przestrzeni interweniującej. W przeciwieństwie do tego, Einstein zaprzeczył istnieniu jakiegokolwiek tła euklidesowego układu odniesienia, który rozciągałby się w przestrzeni. Nie ma też czegoś takiego jak siła grawitacji, tylko sama struktura czasoprzestrzeni.

Rysunek 5–1. Efekty pływowe.

W terminologii czasoprzestrzeni ścieżka satelity krążącego wokół Ziemi nie jest podyktowana odległymi wpływami Ziemi, Księżyca i Słońca. Zamiast tego satelita porusza się w przestrzeni tylko w odpowiedzi na lokalne warunki. Ponieważ czasoprzestrzeń jest wszędzie lokalnie płaska, gdy rozpatruje się ją w wystarczająco małej skali, satelita zawsze podąża po linii prostej w swoim lokalnym układzie bezwładności. Mówimy, że satelita zawsze podąża po ścieżce geodezyjnej . Nie można znaleźć dowodów grawitacji podążających za ruchami pojedynczej cząstki.

W każdej analizie czasoprzestrzeni dowód grawitacji wymaga obserwowania przyspieszeń względnych dwóch ciał lub dwóch oddzielonych cząstek. Na rys. 5-1 dwie oddzielone cząstki, swobodnie spadające w polu grawitacyjnym Ziemi, wykazują przyspieszenia pływowe z powodu lokalnych niejednorodności w polu grawitacyjnym, tak że każda cząstka podąża inną ścieżką w czasoprzestrzeni. Przyspieszenia pływowe, jakie te cząstki wykazują względem siebie, nie wymagają do wyjaśnienia sił. Einstein opisał je raczej w kategoriach geometrii czasoprzestrzeni, czyli krzywizny czasoprzestrzeni. Te przyspieszenia pływowe są ściśle lokalne. Jest to skumulowany całkowity efekt wielu lokalnych przejawów krzywizny, które skutkują pojawieniem się siły grawitacyjnej działającej w dużej odległości od Ziemi.

Dwie główne tezy leżą u podstaw ogólnej teorii względności.

  • Pierwszym kluczowym pojęciem jest niezależność od współrzędnych: prawa fizyki nie mogą zależeć od używanego układu współrzędnych. Jest to główne rozszerzenie zasady względności z wersji stosowanej w szczególnej teorii względności, która stanowi, że prawa fizyki muszą być takie same dla każdego obserwatora poruszającego się w nieprzyspieszonych (inercjalnych) układach odniesienia. W ogólnej teorii względności, używając własnych (przetłumaczonych) słów Einsteina, „prawa fizyki muszą mieć taką naturę, że mają zastosowanie do układów odniesienia w dowolnym ruchu”. Prowadzi to do natychmiastowego problemu: w przyspieszonych klatkach odczuwa się siły, które pozornie umożliwiłyby ocenę stanu przyspieszenia w sensie absolutnym. Einstein rozwiązał ten problem za pomocą zasady równoważności.
Rysunek 5–2. Zasada równoważności
  • Zasada równoważności mówi, że w każdym dostatecznie małym obszarze przestrzeni efekty grawitacji są takie same jak te wywołane przyspieszeniem.
Na rys. 5-2 osoba A znajduje się w statku kosmicznym, z dala od jakichkolwiek masywnych obiektów, które podlegają równomiernemu przyspieszeniu g . Osoba B znajduje się w pudle spoczywającym na Ziemi. Zakładając, że statek kosmiczny jest dostatecznie mały, aby efekty pływowe były niemierzalne (biorąc pod uwagę czułość aktualnego oprzyrządowania do pomiaru grawitacji, A i B prawdopodobnie powinni być liliputami ), nie ma eksperymentów, które A i B mogą przeprowadzić, które umożliwią im określenie w którym się znajdują.
Alternatywnym wyrazem zasady równoważności jest zauważenie, że w uniwersalnym prawie ciążenia Newtona F = GMm g /r 2 = mg g oraz w drugim prawie Newtona F = m i a , nie ma a priori powodu, dla którego grawitacja masa m g powinna być równa masie bezwładności m i . Zasada równoważności mówi, że te dwie masy są identyczne.

Przejście od elementarnego opisu zakrzywionej czasoprzestrzeni do pełnego opisu grawitacji wymaga rachunku tensorowego i geometrii różniczkowej, a oba te zagadnienia wymagają wielu badań. Bez tych matematycznych narzędzi można pisać o ogólnej teorii względności, ale nie da się wykazać żadnych nietrywialnych wyprowadzeń.

Krzywizna czasu

Rysunek 5–3. Argument Einsteina sugerujący grawitacyjne przesunięcie ku czerwieni

W dyskusji o szczególnej teorii względności siły odgrywały jedynie rolę drugoplanową. Szczególna teoria względności zakłada możliwość definiowania ramek inercyjnych, które wypełniają całą czasoprzestrzeń, których zegary działają z taką samą szybkością jak zegar w punkcie początkowym. Czy to naprawdę możliwe? W niejednorodnym polu grawitacyjnym eksperyment podpowiada, że ​​odpowiedź brzmi nie. Pola grawitacyjne uniemożliwiają skonstruowanie globalnego układu inercjalnego. W wystarczająco małych regionach czasoprzestrzeni nadal możliwe są lokalne układy inercyjne. Ogólna teoria względności polega na systematycznym łączeniu tych lokalnych klatek w bardziej ogólny obraz czasoprzestrzeni.

Lata przed opublikowaniem ogólnej teorii w 1916 roku Einstein zastosował zasadę równoważności do przewidzenia istnienia grawitacyjnego przesunięcia ku czerwieni w następującym eksperymencie myślowym : (i) Załóżmy, że zbudowano wieżę o wysokości h (rys. 5-3). (ii) Upuść cząstkę masy spoczynkowej m ze szczytu wieży. Opada swobodnie z przyspieszeniem g , docierając do ziemi z prędkością v = (2 gh ) 1/2 , tak że jego całkowita energia E , mierzona przez obserwatora na ziemi, wynosi (iii) energię cząstki w pojedynczy foton o wysokiej energii, który kieruje w górę. (iv) Na szczycie wieży konwerter energii i masy przekształca energię fotonu E ' z powrotem w cząstkę masy spoczynkowej m ' .

Musi być tak, że m = m ' , bo inaczej można by skonstruować perpetum mobile . Dlatego przewidujemy, że E ' = m , więc

Foton wspinający się w polu grawitacyjnym Ziemi traci energię i jest przesunięty ku czerwieni. Wczesne próby zmierzenia tego przesunięcia ku czerwieni poprzez obserwacje astronomiczne były nieco niejednoznaczne, ale ostateczne obserwacje laboratoryjne zostały przeprowadzone przez Pounda i Rebkę (1959) , a później przez Pounda i Snidera (1964).

Światło ma powiązaną częstotliwość, która może być wykorzystana do napędzania działania zegara. Grawitacyjne przesunięcie ku czerwieni prowadzi do ważnego wniosku dotyczącego samego czasu: grawitacja sprawia, że ​​czas biegnie wolniej. Załóżmy, że budujemy dwa identyczne zegary, których szybkości są kontrolowane przez pewną stabilną przemianę atomową. Umieść jeden zegar na szczycie wieży, podczas gdy drugi zegar pozostanie na ziemi. Eksperymentator na szczycie wieży zauważa, że ​​sygnały z zegara naziemnego mają niższą częstotliwość niż z zegara znajdującego się obok niego na wieży. Światło wznoszące się na wieżę to tylko fala, a grzbiety fal nie mogą zniknąć po drodze. Na szczyt wieży dociera dokładnie tyle oscylacji światła, ile zostało wyemitowanych na dole. Eksperymentator dochodzi do wniosku, że zegar naziemny działa wolno i może to potwierdzić, obniżając zegar na wieży, aby porównać go z zegarem naziemnym. W przypadku wieży o długości 1 km rozbieżność wynosiłaby około 9,4 nanosekundy dziennie, co można łatwo zmierzyć za pomocą nowoczesnego oprzyrządowania.

Nie wszystkie zegary w polu grawitacyjnym działają w tym samym tempie. Eksperymenty takie jak eksperyment Pounda-Rebki mocno ustaliły krzywiznę składnika czasoprzestrzeni. Eksperyment Pounda-Rebki nie mówi nic o krzywiźnie składowej przestrzennej czasoprzestrzeni. Ale teoretyczne argumenty przewidujące grawitacyjne dylatacje czasu wcale nie zależą od szczegółów ogólnej teorii względności. Każda teoria grawitacji przewiduje grawitacyjne dylatacje czasu, jeśli przestrzega zasady równoważności. Obejmuje to grawitację newtonowską. Standardową demonstracją w ogólnej teorii względności jest pokazanie, jak w „ granice Newtona ” (tj. cząstki poruszają się powoli, pole grawitacyjne jest słabe, a pole jest statyczne) sama krzywizna czasu wystarcza do wyprowadzenia prawa grawitacji Newtona .

Grawitacja Newtona to teoria zakrzywionego czasu. Ogólna teoria względności to teoria zakrzywionego czasu i zakrzywionej przestrzeni. Biorąc pod uwagę G jako stałą grawitacyjną, M jako masę newtonowskiej gwiazdy i ciała krążące o nieznacznej masie w odległości r od gwiazdy, przedział czasoprzestrzenny dla grawitacji Newtona jest taki, dla którego zmienny jest tylko współczynnik czasowy:

Krzywizna przestrzeni

Współczynnik przed opisem opisuje krzywiznę czasu w grawitacji newtonowskiej, a ta krzywizna całkowicie odpowiada za wszystkie efekty grawitacji newtonowskiej. Zgodnie z oczekiwaniami, ten współczynnik korekcji jest wprost proporcjonalny do i , a ze względu na w mianowniku współczynnik korekcji wzrasta w miarę zbliżania się do ciała grawitacyjnego, co oznacza, że ​​czas jest zakrzywiony.

Ale ogólna teoria względności jest teorią zakrzywionej przestrzeni i zakrzywionego czasu, więc jeśli istnieją terminy modyfikujące składowe przestrzenne interwału czasoprzestrzeni przedstawionego powyżej, czy ich wpływ nie powinien być widoczny, powiedzmy, na orbitach planet i satelitów ze względu na zastosowane współczynniki korekcji krzywizny do warunków przestrzennych?

Odpowiedź brzmi, że widoczne, ale efekty są niewielkie. Powodem jest to, że prędkości planetarne są niezwykle małe w porównaniu z prędkością światła, tak że w przypadku planet i satelitów Układu Słonecznego termin ten przewyższa terminy przestrzenne.

Pomimo znikomości terminów przestrzennych, pierwsze oznaki, że coś jest nie tak z grawitacją newtonowską, odkryto ponad półtora wieku temu. W 1859 Urbain Le Verrier , w analizie dostępnych czasowych obserwacji tranzytów Merkurego przez tarczę Słońca w latach 1697-1848, poinformował, że znana fizyka nie może wyjaśnić orbity Merkurego, chyba że w obrębie planety lub pasa planetoid istnieje orbita Merkurego. Peryhelium orbity Merkurego wykazywało nadmierne tempo precesji w stosunku do tego, co można wytłumaczyć szarpnięciami innych planet. Zdolność do wykrycia i dokładnego pomiaru minimalnej wartości tej anomalnej precesji (tylko 43 sekundy kątowe na stulecie tropikalne ) jest świadectwem wyrafinowania XIX-wiecznej astrometrii .

Rysunek 5–4. Ogólna teoria względności to teoria zakrzywionego czasu i zakrzywionej przestrzeni. Kliknij tutaj, aby animować.

Jako słynny astronom, który wcześniej odkrył istnienie Neptuna „na czubku pióra”, analizując chybotanie orbity Urana, oświadczenie Le Verriera wywołało dwudziesięcioletni okres „wolkamanii” jako profesjonalisty i amatora. astronomowie podobnie polowali na hipotetyczną nową planetę. Poszukiwania obejmowały kilka fałszywych obserwacji Wulkana. Ostatecznie ustalono, że taka planeta lub pas asteroid nie istnieje.

W 1916 Einstein miał wykazać, że tę anomalną precesję Merkurego można wyjaśnić terminami przestrzennymi w krzywiźnie czasoprzestrzeni. Krzywizna w ujęciu czasowym, będąca po prostu wyrazem grawitacji newtonowskiej, nie ma żadnego udziału w wyjaśnianiu tej anomalnej precesji. Sukces jego obliczeń był mocną wskazówką dla kolegów Einsteina, że ​​ogólna teoria względności może być poprawna.

Najbardziej spektakularną z przewidywań Einsteina było jego obliczenie, że warunki krzywizny w składowych przestrzennych interwału czasoprzestrzeni można zmierzyć w zakrzywieniu światła wokół masywnego ciała. Światło ma nachylenie ±1 na diagramie czasoprzestrzeni. Jego ruch w przestrzeni jest równy ruchowi w czasie. Dla wyrażenia słabego pola przedziału niezmiennego, Einstein obliczył dokładnie równą, ale przeciwną krzywiznę znaku w jego składowych przestrzennych.

W grawitacji Newtona współczynnik przed przewidywaniem odchylenia światła wokół gwiazdy. W ogólnej teorii względności współczynnik przed przewiduje podwojenie całkowitego zgięcia.

Historia wyprawy na zaćmienie Eddingtona z 1919 roku i dojście do sławy Einsteina jest dobrze opowiedziana gdzie indziej.

Źródła krzywizny czasoprzestrzeni

Rysunek 5-5. Kontrawariantne składowe tensora naprężenie–energia

W teorii grawitacji Newtona jedynym źródłem siły grawitacji jest masa .

Natomiast ogólna teoria względności identyfikuje kilka źródeł krzywizny czasoprzestrzeni oprócz masy. W równaniach pola Einsteina źródła grawitacji przedstawiono po prawej stronie w tensorze naprężenie-energia .

Rys. 5-5 klasyfikuje różne źródła grawitacji w tensorze naprężenie-energia:

  • (czerwony): Całkowita gęstość masowo-energetyczna, w tym wszelkie udziały w energii potencjalnej sił między cząstkami, a także energia kinetyczna przypadkowych ruchów termicznych.
  • i (pomarańczowy): Są to terminy gęstości pędu. Nawet jeśli nie ma ruchu masowego, energia może być przekazywana przez przewodnictwo cieplne, a przewodząca energia będzie przenosić pęd.
  • są szybkościami przepływu i- komponentu pędu na jednostkę powierzchni w kierunku j . Nawet jeśli nie ma ruchu masowego, losowe ruchy termiczne cząstek spowodują przepływ pędu, więc składniki i = j (zielony) reprezentują ciśnienie izotropowe, a składniki ij (niebieskie) reprezentują naprężenia ścinające.

Jednym z ważnych wniosków, jakie można wyciągnąć z równań, jest to, że, mówiąc potocznie, sama grawitacja tworzy grawitację . Energia ma masę. Nawet w grawitacji newtonowskiej pole grawitacyjne jest związane z energią, zwaną energią potencjalną grawitacji . W ogólnej teorii względności energia pola grawitacyjnego jest sprzężona z powrotem w tworzenie pola grawitacyjnego. To sprawia, że ​​równania są nieliniowe i trudne do rozwiązania w czymkolwiek innym niż przypadki słabego pola. Teoria względności numeryczna to gałąź ogólnej teorii względności wykorzystująca metody numeryczne do rozwiązywania i analizy problemów, często wykorzystująca superkomputery do badania czarnych dziur , fal grawitacyjnych , gwiazd neutronowych i innych zjawisk w reżimie silnego pola.

Energia-pęd

Rysunek 5-6. (po lewej) Energia masowa wypacza czasoprzestrzeń. (po prawej) Obracający się rozkład masy i energii z momentem pędu J generuje pola grawitomagnetyczne H .

W szczególnej teorii względności masa-energia jest ściśle powiązana z pędem . Tak jak przestrzeń i czas są różnymi aspektami bardziej wszechstronnego bytu zwanego czasoprzestrzenią, masa-energia i pęd są jedynie różnymi aspektami zunifikowanej, czterowymiarowej wielkości zwanej czteropędem . W konsekwencji, jeśli masa-energia jest źródłem grawitacji, to źródłem musi być również pęd. Uwzględnienie pędu jako źródła grawitacji prowadzi do przewidywania, że ​​poruszające się lub wirujące masy mogą generować pola analogiczne do pól magnetycznych generowanych przez poruszające się ładunki, zjawisko znane jako grawitomagnetyzm .

Rysunek 5–7. Pochodzenie grawitomagnetyzmu

Powszechnie wiadomo, że siłę magnetyzmu można wywnioskować, stosując zasady szczególnej teorii względności do poruszających się ładunków. (Wymowną demonstrację tego przedstawił Feynman w tomie II, rozdział 13–6 jego Wykładów z fizyki , dostępnych w Internecie). Analogiczną logikę można wykorzystać do wykazania pochodzenia grawitomagnetyzmu. Na rys. 5-7a dwa równoległe, nieskończenie długie strumienie masywnych cząstek mają równe i przeciwne prędkości − v i + v względem badanej cząstki w spoczynku i wyśrodkowane między nimi. Ze względu na symetrię układu siła wypadkowa na cząstce centralnej wynosi zero. Załóżmy , że prędkości są po prostu addytywne. Rys. 5-7b pokazuje dokładnie to samo ustawienie, ale w ramach górnego strumienia. Cząstka testowa ma prędkość + v , a strumień dolny ma prędkość +2 v . Ponieważ sytuacja fizyczna się nie zmieniła, a jedynie kadr, w którym obserwuje się rzeczy, cząstka testowa nie powinna być przyciągana w kierunku żadnego strumienia. Ale wcale nie jest jasne, czy siły wywierane na badaną cząstkę są równe. (1) Ponieważ dolny strumień porusza się szybciej niż górny, każda cząstka w dolnym strumieniu ma większą energię masy niż cząstka na górze. (2) Ze względu na skurcz Lorentza, w dolnym strumieniu jest więcej cząstek na jednostkę długości niż w górnym strumieniu. (3) Inny wkład w aktywną masę grawitacyjną strumienia dennego pochodzi z dodatkowego składnika ciśnienia, którego w tym momencie nie mamy wystarczającego tła do omówienia. Wszystkie te efekty łącznie pozornie wymagałyby, aby badana cząstka została przyciągnięta w kierunku dolnego strumienia.

Cząstka testowa nie jest przyciągana do strumienia dolnego z powodu siły zależnej od prędkości, która służy do odpychania cząstki poruszającej się w tym samym kierunku co strumień dolny. Ten zależny od prędkości efekt grawitacyjny to grawitomagnetyzm.

Materia poruszająca się w polu grawitomagnetycznym podlega zatem tak zwanym efektom przeciągania ramek , analogicznym do indukcji elektromagnetycznej . Zaproponowano, że takie siły grawitomagnetyczne leżą u podstaw generacji relatywistycznych dżetów (rys. 5-8) wyrzucanych przez niektóre obracające się supermasywne czarne dziury .

Presja i stres

Źródłem grawitacji powinny być również wielkości bezpośrednio związane z energią i pędem, czyli ciśnienie wewnętrzne i naprężenie . Wzięte razem, masa-energia , pęd, ciśnienie i naprężenie służą jako źródła grawitacji. Razem to one mówią czasoprzestrzeni, jak się zakrzywiać.

Ogólna teoria względności przewiduje, że ciśnienie działa jak źródło grawitacji o dokładnie takiej samej sile jak gęstość masy i energii. Włączenie ciśnienia jako źródła grawitacji prowadzi do dramatycznych różnic między przewidywaniami ogólnej teorii względności a przewidywaniami grawitacji newtonowskiej. Na przykład składnik ciśnienia wyznacza maksymalny limit masy gwiazdy neutronowej . Im masywniejsza gwiazda neutronowa, tym większe ciśnienie jest wymagane, aby przeciwstawić się grawitacji. Jednak zwiększone ciśnienie zwiększa grawitację działającą na masę gwiazdy. Powyżej pewnej masy określonej przez granicę Tolmana-Oppenheimera-Volkoffa proces staje się niekontrolowany, a gwiazda neutronowa zapada się w czarną dziurę .

Warunki stresu stają się bardzo istotne podczas wykonywania obliczeń, takich jak symulacje hydrodynamiczne supernowych zapadających się jądra.

Te przewidywania dotyczące roli ciśnienia, pędu i naprężenia jako źródeł krzywizny czasoprzestrzeni są eleganckie i odgrywają ważną rolę w teorii. Jeśli chodzi o ciśnienie, we wczesnym Wszechświecie dominowało promieniowanie i jest wysoce nieprawdopodobne, aby jakiekolwiek istotne dane kosmologiczne (np . obfitość nukleosyntezy itp.) mogły zostać odtworzone, gdyby ciśnienie nie wpływało na grawitację lub nie miało ta sama siła jako źródło grawitacji, co masa-energia. Podobnie matematyczna spójność równań pola Einsteina zostałaby zakłócona, gdyby warunki naprężenia nie stanowiły źródła grawitacji.

Eksperymentalny test źródeł krzywizny czasoprzestrzeni

Definicje: masa czynna, bierna i bezwładna

Bondi rozróżnia różne możliwe typy mas: (1) masa czynna ( ) to masa, która działa jako źródło pola grawitacyjnego; (2) masa bierna ( ) to masa reagująca na pole grawitacyjne; (3) masa bezwładna ( ) to masa reagująca na przyspieszenie.

W teorii Newtona

  • Nakazuje to trzecie prawo akcji i reakcji i musi być takie samo.
  • Z drugiej strony, czy i są równe jest wynikiem empirycznym.

W ogólnej teorii względności

  • Równość i jest podyktowana zasadą równoważności.
  • Nie istnieje zasada „działania i reakcji” dyktująca jakikolwiek konieczny związek między i .

Ciśnienie jako źródło grawitacji

Rysunek 5–9. (A) Eksperyment Cavendisha, (B) Eksperyment Kreuzera

Klasyczny eksperyment pomiaru siły źródła grawitacyjnego (tj. jego masy czynnej) po raz pierwszy przeprowadził w 1797 r. Henry Cavendish (ryc. 5-9a). Dwie małe, ale gęste kulki zawieszone są na cienkim drucie, co zapewnia równowagę skrętną . Zbliżenie dwóch dużych mas testowych do kulek wprowadza wykrywalny moment obrotowy. Biorąc pod uwagę wymiary aparatu i mierzalną stałą sprężystości drutu skrętnego, można wyznaczyć stałą grawitacji G.

Badanie wpływu ciśnienia poprzez ściskanie mas testowych jest beznadziejne, ponieważ osiągalne ciśnienia laboratoryjne są nieistotne w porównaniu z masowo-energetyczną kulą metalową.

Jednak odpychające ciśnienia elektromagnetyczne wynikające z ciasnego ściśnięcia protonów w jądrach atomowych są zazwyczaj rzędu 10 28  atm 10 33  Pa ≈ 10 33  kg·s -2 m -1 . Odpowiada to około 1% gęstości masy jądrowej około 10 18 kg/m 3 (po uwzględnieniu c 2 ≈ 9×10 16 m 2 s - 2 ).

Rysunek 5-10. Eksperyment laserowy na Księżycu. (po lewej) Ten retroreflektor został pozostawiony na Księżycu przez astronautów podczas misji Apollo 11 . (po prawej) Astronomowie na całym świecie odbijają światło lasera od retroreflektorów pozostawionych przez astronautów Apollo i rosyjskie łaziki księżycowe, aby dokładnie zmierzyć odległość Ziemia-Księżyc.

Jeżeli ciśnienie nie działa jako źródło grawitacji, to stosunek ten powinien być niższy dla jąder o większej liczbie atomowej Z , w których ciśnienie elektrostatyczne jest wyższe. LB Kreuzer (1968) przeprowadził eksperyment Cavendisha z użyciem masy teflonowej zawieszonej w mieszaninie cieczy trichloroetylenu i dibromoetanu o tej samej gęstości pławnej co teflon (ryc. 5-9b). Fluor ma liczbę atomową Z = 9 , a brom Z = 35 . Kreuzer stwierdził, że zmiana położenia masy teflonowej nie powodowała różnicowego ugięcia drążka skrętnego, stąd ustalenie masy czynnej i masy biernej jako równoważne z dokładnością 5× 10-5 .

Chociaż Kreuzer początkowo uważał ten eksperyment jedynie za test stosunku masy czynnej do masy biernej, Clifford Will (1976) zinterpretował eksperyment jako fundamentalny test sprzężenia źródeł z polami grawitacyjnymi.

W 1986 roku Bartlett i Van Buren zauważyli, że pomiar laserem księżycowym wykrył przesunięcie o 2 km między środkiem figury Księżyca a jego środkiem masy. Wskazuje to na asymetrię w rozkładzie Fe (obfite w jądrze Księżyca) i Al (obfite w jego skorupie i płaszczu). Gdyby ciśnienie nie wpływało w równym stopniu na krzywiznę czasoprzestrzeni, jak masa-energia, Księżyc nie znajdowałby się na orbicie przewidzianej przez mechanikę klasyczną. Wykorzystali swoje pomiary, aby zawęzić granice wszelkich rozbieżności między masą czynną i pasywną do około 10-12 .

Grawitomagnetyzm

Rysunek 5-11. Sonda grawitacyjna B potwierdziła istnienie grawitomagnetyzmu

Istnienie grawitomagnetyzmu zostało potwierdzone przez misję Gravity Probe B (GP-B) , która wystartowała 20 kwietnia 2004 roku. Faza lotu kosmicznego trwała do. Celem misji był pomiar krzywizny czasoprzestrzeni w pobliżu Ziemi, ze szczególnym uwzględnieniem grawitomagnetyzmu .

Wstępne wyniki potwierdziły stosunkowo duży efekt geodezyjny (wynikający z prostej krzywizny czasoprzestrzeni, znany również jako precesja de Sittera) z dokładnością do około 1%. Znacznie mniejszy efekt przeciągania ramki (który jest spowodowany grawitomagnetyzmem i jest również znany jako precesja Lense-Thirring ) był trudny do zmierzenia z powodu nieoczekiwanych efektów ładowania powodujących zmienny dryf żyroskopów. Niemniej jednak, przez, efekt przeciągania ramy został potwierdzony w zakresie 15% oczekiwanego wyniku, podczas gdy efekt geodezyjny został potwierdzony w stopniu lepszym niż 0,5%.

Kolejne pomiary przeciągania kadru poprzez obserwacje laserowe satelitów LARES , LAGEOS -1 i LAGEOS-2 poprawiły się w stosunku do pomiaru GP-B , a wyniki (stan na 2016 r.) wykazują efekt w granicach 5% jego wartości teoretycznej, chociaż istnieje pewna różnica zdań co do dokładności tego wyniku.

Inny wysiłek, eksperyment Gyroscopes in General Relativity (GINGER), ma na celu użycie trzech 6- metrowych laserów pierścieniowych zamontowanych pod kątem prostym do siebie 1400 m pod powierzchnią Ziemi, aby zmierzyć ten efekt.

Tematy techniczne

Czy czasoprzestrzeń naprawdę jest zakrzywiona?

W konwencjonalistycznych poglądach Poincarégo podstawowymi kryteriami, według których powinno się wybierać geometrię euklidesową i nieeuklidesową, byłyby oszczędność i prostota. Realista powiedziałby, że Einstein odkrył, że czasoprzestrzeń jest nieeuklidesowa. Konwencjonista powiedziałby, że Einstein po prostu uznał, że wygodniejsze jest użycie geometrii nieeuklidesowej. Konwencjonalista twierdziłby, że analiza Einsteina nie mówi nic o tym, czym naprawdę jest geometria czasoprzestrzeni.

Takie powiedzenie,

1. Czy można przedstawić ogólną teorię względności w postaci płaskiej czasoprzestrzeni?
2. Czy są sytuacje, w których płaska czasoprzestrzenna interpretacja ogólnej teorii względności może być wygodniejsza niż zwykła zakrzywiona czasoprzestrzeń?

W odpowiedzi na pierwsze pytanie wielu autorów, m.in. Deser, Grishchuk, Rosen, Weinberg itp., przedstawiło różne sformułowania grawitacji jako pola w płaskiej rozmaitości. Teorie te są różnie nazywane „ grawitacją bimetryczną ”, „podejściem teorii pola do ogólnej teorii względności” i tak dalej. Kip Thorne przedstawił popularny przegląd tych teorii.

Paradygmat płaskiej czasoprzestrzeni zakłada, że ​​materia wytwarza pole grawitacyjne, które powoduje kurczenie się linijek, gdy są one zmieniane z orientacji obwodowej na radialną, co powoduje rozszerzanie się częstotliwości tykania zegarów. Paradygmat płaskiej czasoprzestrzeni jest w pełni równoważny paradygmatowi zakrzywionej czasoprzestrzeni, ponieważ oba reprezentują te same zjawiska fizyczne. Jednak ich sformułowania matematyczne są zupełnie inne. Pracujący fizycy rutynowo przełączają się między stosowaniem zakrzywionych i płaskich technik czasoprzestrzeni w zależności od wymagań problemu. Paradygmat płaskiej czasoprzestrzeni okazuje się szczególnie wygodny przy wykonywaniu przybliżonych obliczeń w słabych polach. Stąd techniki płaskiej czasoprzestrzeni będą wykorzystywane do rozwiązywania problemów z falami grawitacyjnymi, natomiast zakrzywione techniki czasoprzestrzeni będą wykorzystywane do analizy czarnych dziur.

Symetrie asymptotyczne

Grupa symetrii czasoprzestrzeni dla Szczególnej Teorii Względności to grupa Poincaré , która jest dziesięciowymiarową grupą trzech wzmocnień Lorentza, trzech obrotów i czterech translacji czasoprzestrzeni. Logiczne jest pytanie, jakie symetrie mogą mieć zastosowanie w ogólnej teorii względności . Praktycznym przypadkiem może być rozważenie symetrii czasoprzestrzeni widzianej przez obserwatorów znajdujących się daleko od wszystkich źródeł pola grawitacyjnego. Naiwnym oczekiwaniem na asymptotycznie płaskie symetrie czasoprzestrzeni może być po prostu rozszerzenie i odtworzenie symetrii płaskiej czasoprzestrzeni szczególnej teorii względności, mianowicie. , grupa Poincaré.

W 1962 Hermann Bondi , MG van der Burg, AW Metzner i Rainer K. Sachs zajęli się tym asymptotycznym problemem symetrii w celu zbadania przepływu energii w nieskończoności z powodu rozchodzenia się fal grawitacyjnych . Ich pierwszym krokiem było określenie pewnych fizycznie sensownych warunków brzegowych, które należy umieścić w polu grawitacyjnym w nieskończoności podobnej do światła, aby scharakteryzować, co to znaczy, że metryka jest asymptotycznie płaska, nie czyniąc żadnych założeń a priori co do natury asymptotycznej grupy symetrii — nawet założenie, że taka grupa istnieje. Następnie, po zaprojektowaniu tego, co uznali za najbardziej sensowne warunki brzegowe, zbadali naturę wynikowych asymptotycznych przekształceń symetrii, które pozostawiają niezmienną postać warunków brzegowych odpowiednich dla asymptotycznie płaskich pól grawitacyjnych. Odkryli, że asymptotyczne przekształcenia symetrii faktycznie tworzą grupę, a struktura tej grupy nie zależy od konkretnego pola grawitacyjnego, które akurat występuje. Oznacza to, że zgodnie z oczekiwaniami można oddzielić kinematykę czasoprzestrzeni od dynamiki pola grawitacyjnego przynajmniej w nieskończoności przestrzennej. Zaskakującą niespodzianką w 1962 roku było odkrycie przez nich bogatej nieskończenie wymiarowej grupy (tak zwanej grupy BMS) jako asymptotycznej grupy symetrii, zamiast skończenie wymiarowej grupy Poincarégo, która jest podgrupą grupy BMS. Transformacje Lorentza to nie tylko asymptotyczne przekształcenia symetrii, istnieją również dodatkowe przekształcenia, które nie są przekształceniami Lorentza, ale są asymptotycznymi przekształceniami symetrii. W rzeczywistości znaleźli dodatkową nieskończoność generatorów transformacji zwanych supertranslacjami . To implikuje wniosek, że ogólna teoria względności (GR) nie sprowadza się do szczególnej teorii względności w przypadku słabych pól na dużych odległościach.

Geometria Riemanna

Geometria riemannowska jest gałęzią geometrii różniczkowej , która bada rozmaitości riemannowskie , gładkie rozmaitości z metryką riemannowską , tj. z iloczynem wewnętrznym w przestrzeni stycznej w każdym punkcie, który zmienia się płynnie od punktu do punktu. Daje to w szczególności lokalne pojęcia kąta , długości krzywych , pola powierzchni i objętości . Z tych danych można wyprowadzić inne globalne wielkości, integrując wkłady lokalne.

Geometria riemannowska zrodziła się z wizji Bernharda Riemanna wyrażonej w jego wykładzie inauguracyjnym „ Ueber die Hypothesen, welche der Geometrie zu Grunde liegen ” („O hipotezach, na których opiera się geometria”). Jest to bardzo szerokie i abstrakcyjne uogólnienie różniczki geometria powierzchni w R 3 . Rozwój geometrii riemannowskiej zaowocował syntezą różnorodnych wyników dotyczących geometrii powierzchni i zachowania się na nich geodezyjnych technik, które można zastosować do badania rozmaitości różniczkowalnych wyższych wymiarów. Umożliwiło sformułowanie ogólnej teorii względności Einsteina , wywarło głęboki wpływ na teorię grup i teorię reprezentacji , a także na analizę oraz pobudziło rozwój topologii algebraicznej i różniczkowej .

Zakrzywione kolektory

Z przyczyn fizycznych kontinuum czasoprzestrzeni jest matematycznie zdefiniowane jako czterowymiarowa, gładka, połączona rozmaitość Lorentza . Oznacza to, że gładka metryka Lorentza ma sygnaturę . Miara określa geometria czasoprzestrzeni , a także wyznaczaniegeodezjicząstek i wiązek światła. W odniesieniu do każdego punktu (zdarzenia) na tej rozmaitościwykresy współrzędnychsą używane do reprezentowania obserwatorów w układach odniesienia. Zwykle używane sąwspółrzędne kartezjańskiePonadto, dla uproszczenia, jednostki miary są zwykle wybierane tak, aby prędkość światłabyła równa 1.

Ramkę odniesienia (obserwatora) można zidentyfikować za pomocą jednej z tych map współrzędnych; każdy taki obserwator może opisać każde wydarzenie . Inna ramka odniesienia może być identyfikowana przez drugi wykres współrzędnych około . Dwóch obserwatorów (jeden w każdej ramce odniesienia) może opisać to samo zdarzenie, ale uzyskać różne opisy.

Zwykle potrzeba wielu nakładających się wykresów współrzędnych, aby pokryć rozmaitość. Biorąc pod uwagę dwa wykresy współrzędnych, jeden zawierający (reprezentujący obserwatora), a drugi zawierający (reprezentujący innego obserwatora), przecięcie wykresów reprezentuje region czasoprzestrzeni, w którym obaj obserwatorzy mogą mierzyć wielkości fizyczne, a tym samym porównywać wyniki. Zależność między dwoma zestawami pomiarów jest określona przez transformację współrzędnych nieosobliwych na tym skrzyżowaniu. Idea map współrzędnych jako lokalnych obserwatorów, którzy mogą wykonywać pomiary w ich pobliżu, ma również sens fizyczny, ponieważ w ten sposób faktycznie zbiera się dane fizyczne – lokalnie.

Na przykład dwóch obserwatorów, z których jeden znajduje się na Ziemi, a drugi leci szybką rakietą do Jowisza, może zaobserwować zderzenie komety z Jowiszem (jest to zdarzenie ). Ogólnie rzecz biorąc, nie zgadzają się co do dokładnej lokalizacji i czasu tego uderzenia, tj. będą miały różne 4-krotki (ponieważ używają różnych układów współrzędnych). Chociaż ich opisy kinematyczne będą się różnić, prawa dynamiczne (fizyczne), takie jak zachowanie pędu i pierwsza zasada termodynamiki, będą nadal obowiązywać. W rzeczywistości teoria względności wymaga czegoś więcej w tym sensie, że przewiduje, że te (i wszystkie inne prawa fizyczne) muszą mieć tę samą formę we wszystkich układach współrzędnych. Wprowadza to tensory do teorii względności, za pomocą których reprezentowane są wszystkie wielkości fizyczne.

Mówi się, że geodezja jest podobna do czasu, zerowej lub przestrzennej, jeśli wektor styczny do jednego punktu geodezyjnego ma taki charakter. Ścieżki cząstek i wiązek światła w czasoprzestrzeni są reprezentowane odpowiednio przez geodezję czasopodobną i zerową (światłopodobną).

Uprzywilejowana postać czasoprzestrzeni 3+1

Własności n + m -wymiarowych czasoprzestrzeni

Istnieją dwa rodzaje wymiarów: przestrzenne (dwukierunkowe) i czasowe (jednokierunkowe). Niech liczba wymiarów przestrzennych to N , a liczba wymiarów czasowych to T . To , że N = 3 i T = 1, odkładając na bok zwarte wymiary przywoływane przez teorię strun i do tej pory niewykrywalne, można wyjaśnić odwołując się do fizycznych konsekwencji tego, że N różni się od 3, a T od 1. Argument ten jest często antropiczny charakter i prawdopodobnie pierwszy w swoim rodzaju, aczkolwiek zanim cała koncepcja weszła w modę.

Ukryte pojęcie, że wymiarowość wszechświata jest wyjątkowa, po raz pierwszy przypisuje się Gottfriedowi Wilhelmowi Leibnizowi , który w Rozprawie o metafizyce sugerował, że świat jest „ tym, który jest jednocześnie najprostszy w hipotezie i najbogatszy w zjawiska ”. Immanuel Kant twierdził, że trójwymiarowa przestrzeń jest konsekwencją odwrotnego kwadratowego prawa powszechnego ciążenia . Podczas gdy argument Kanta jest historycznie ważny, John D. Barrow powiedział, że „przesuwa puentę z powrotem na wierzch: to trójwymiarowość przestrzeni wyjaśnia, dlaczego widzimy prawa odwrotnego kwadratu siły w Naturze, a nie odwrotnie”. (Barrow 2002: 204).

W 1920 Paul Ehrenfest wykazał, że jeśli istnieje tylko jeden wymiar czasowy i więcej niż trzy wymiary przestrzenne, orbita planety wokół Słońca nie może pozostać stabilna. To samo dotyczy orbity gwiazdy wokół centrum jej galaktyki . Ehrenfest wykazał również, że jeśli istnieje parzysta liczba wymiarów przestrzennych, to różne części impulsu falowego będą przemieszczać się z różnymi prędkościami. Jeśli istnieją wymiary przestrzenne, gdzie k jest dodatnią liczbą całkowitą, to impulsy falowe ulegają zniekształceniu. W 1922 Hermann Weyl wykazał, że teoria elektromagnetyzmu Maxwella działa tylko z trzema wymiarami przestrzeni i jednym z czasem. Wreszcie Tangherlini wykazał w 1963 roku, że gdy istnieją więcej niż trzy wymiary przestrzenne, orbitale elektronowe wokół jąder nie mogą być stabilne; elektrony albo spadną do jądra , albo rozproszą się.

Max Tegmark rozwija poprzedni argument w następujący antropiczny sposób. Jeżeli T różni się od 1, zachowanie układów fizycznych nie może być wiarygodnie przewidziane na podstawie znajomości odpowiednich równań różniczkowych cząstkowych . W takim wszechświecie nie mogło powstać inteligentne życie zdolne do manipulowania technologią. Co więcej, jeśli T > 1, Tegmark utrzymuje, że protony i elektrony byłyby niestabilne i mogłyby rozpadać się na cząstki o większej masie niż one same. (Nie stanowi to problemu, jeśli cząstki mają wystarczająco niską temperaturę.)

Wreszcie, jeśli N < 3, grawitacja każdego rodzaju staje się problematyczna, a wszechświat jest prawdopodobnie zbyt prosty, aby pomieścić obserwatorów. Na przykład, gdy N < 3, nerwy nie mogą się krzyżować bez przecinania się.

Stąd argumenty antropiczne i inne wykluczają wszystkie przypadki z wyjątkiem N = 3 i T = 1, które akurat opisują otaczający nas świat.

W 2019 roku James Scargill twierdził, że złożone życie może być możliwe w dwóch wymiarach przestrzennych. Według Scargilla czysto skalarna teoria grawitacji może umożliwić lokalną siłę grawitacyjną, a sieci 2D mogą wystarczyć do złożonych sieci neuronowych.

Zobacz też

Uwagi

Dodatkowe Szczegóły

Bibliografia

Dalsza lektura

Zewnętrzne linki