Pochodna — Derivative

Wykres funkcji , koloru czarnego, a linia styczna do tego wykres sporządzony na czerwono. Nachylenie linii stycznej wynosi pochodną funkcji w zaznaczonym miejscu.

W matematyce The pochodną o funkcji zmiennej rzeczywistej środków wrażliwość na zmiany (wartość wyjściowa) jest odpowiednio w stosunku do zmiany jej argumentu (wartości wejściowe). Pochodne są podstawowym narzędziem rachunku różniczkowego . Na przykład pochodną pozycji poruszającego się obiektu względem czasu jest prędkość obiektu : to mierzy, jak szybko zmienia się pozycja obiektu wraz z upływem czasu.

Pochodna funkcji pojedynczej zmiennej w wybranej wartości wejściowej, jeśli istnieje, jest nachylenie w linii stycznej do wykresu funkcji w tym punkcie. Linia styczna jest najlepszym przybliżeniem liniowym funkcji w pobliżu tej wartości wejściowej. Z tego powodu pochodna jest często opisywana jako „chwilowa stopa zmian”, stosunek chwilowej zmiany zmiennej zależnej do zmiennej niezależnej.

Pochodne można uogólnić do funkcji kilku zmiennych rzeczywistych . W tym uogólnieniu pochodna jest reinterpretowana jako przekształcenie liniowe, którego wykres jest (po odpowiednim przesunięciu) najlepszym przybliżeniem liniowym do wykresu funkcji pierwotnej. Jakobian matryca jest matrycą , która przedstawia tę liniową transformację w stosunku do podstawy określonej przez wybór niezależnych i zależnych od zmiennych. Można ją obliczyć w kategoriach pochodnych cząstkowych względem zmiennych niezależnych. W przypadku funkcji kilku zmiennych o wartościach rzeczywistych macierz Jakobianu redukuje się do wektora gradientu .

Proces znajdowania pochodnej nazywa się różniczkowaniem . Proces odwrotny nazywa się antydyferencjacją . Podstawowe twierdzenie rachunku całkowego dotyczy antidifferentiation z integracją . Różniczkowanie i całkowanie to dwie podstawowe operacje w rachunku różniczkowym jednej zmiennej.

Definicja

Funkcją zmiennej rzeczywistej y = f ( x ) jest różniczkowalną w punkcie A, jego domeny , gdy jego domena zawiera otwarty przedział I zawierający , oraz ograniczenie

istnieje. Oznacza to, że dla każdej dodatniej liczby rzeczywistej (nawet bardzo małej) istnieje dodatnia liczba rzeczywista taka, że ​​dla każdego h takiego, że a następnie jest zdefiniowane, a

gdzie pionowe kreski oznaczają wartość bezwzględną (patrz (ε, δ) – definicja granicy ).

Jeżeli funkcja f jest różniczkowalną w , to znaczy, jeżeli granica L nie istnieje, to ograniczenie jest nazywana pochodną o f w i oznaczony (czytane jako „ f sile ”) lub (czytane jako „pochodna f w odniesieniu do x w a ", " dy przez dx w a " lub " dy nad dx w a "); patrz § Notacja (szczegóły) poniżej.

Wyjaśnienia

Różniczkowanie to czynność obliczania pochodnej. Pochodna funkcji y = f ( x ) zmiennej x jest miarą szybkości , z jaką zmienia się wartość y funkcji względem zmiany zmiennej x . Nazywa się pochodne z f względem x . Jeśli x i yliczbami rzeczywistymi , a jeśli wykres z f wykreśla X pochodna jest nachylenie tego wykresu w każdym punkcie.

Nachylenie funkcji liniowej:

W najprostszym przypadku, oprócz trywialne przypadku funkcją stałą , kiedy y jest funkcją liniową z X , to znaczy wykres Y jest linia. W tym przypadku y = f ( x ) = mx + b , dla liczb rzeczywistych m i b , a nachylenie m jest określone wzorem

gdzie symbol Δ ( Delta ) jest skrótem od „zmiany w”, a kombinacje i odnoszą się do odpowiednich zmian, tj.

.

Powyższa formuła obowiązuje, ponieważ

A zatem

Daje to wartość nachylenia linii.

Jeżeli funkcja f nie jest liniowa (tj. jej wykres nie jest linią prostą), to zmiana y podzielona przez zmianę x zmienia się w rozważanym zakresie: różniczkowanie jest metodą znalezienia unikalnej wartości tego tempa zmian, nie w pewnym zakresie, ale przy dowolnej wartości x .

Szybkość zmian jako wartość graniczna
Rysunek 1 . Linia styczna w punkcie ( x , f ( x ))
Figura 2. sieczny na krzywej y = f ( x ) określonej przez punkty ( x , f ( x )) i ( x + h , f ( x + H ))
Rysunek 3. Linia styczna jako granica siecznych
Rysunek 4. Animowana ilustracja: linia styczna (pochodna) jako granica siecznych

Pomysł pokazano na figurach 1 do 3, jest obliczenie szybkości zmiany jako wartość graniczną od stosunku różnic hemibursztynianu Y / Δ x jak Δ x dąży do 0 ° C.

W kierunku definicji

Sieczna zbliża się do stycznej, gdy .

Najpopularniejszym podejściem do przekształcenia tego intuicyjnego pomysłu w precyzyjną definicję jest zdefiniowanie pochodnej jako granicy ilorazów różnicowych liczb rzeczywistych. Jest to podejście opisane poniżej.

Niech f będzie funkcją o wartości rzeczywistej zdefiniowaną w otwartym otoczeniu liczby rzeczywistej a . W geometrii klasycznej, linia styczna do wykresu funkcji f na był unikalny linią przechodzącą przez punkt ( , F ( )) , które nie nie spełniają wykres f poprzecznie , co oznacza, że linia nie przechodzą prosto wykres. Pochodna y względem x w a jest geometrycznie nachyleniem linii stycznej do wykresu f w ( a , f ( a )) . Nachylenie linii stycznej jest bardzo zbliżone do nachylenia linii przechodzącej przez ( a , f ( a )) i pobliski punkt na wykresie, na przykład ( a + h , f ( a + h )) . Linie te nazywane są liniami siecznymi . Wartość h bliska zeru daje dobre przybliżenie nachylenia linii stycznej, a mniejsze wartości (w wartości bezwzględnej ) h dają ogólnie lepsze przybliżenia . Nachylenie m siecznej to różnica między wartościami y tych punktów podzielona przez różnicę między wartościami x , czyli

Wyrażenie to Newton „s iloraz różnicowy . Przejście od przybliżenia do dokładnej odpowiedzi odbywa się za pomocą limitu . Geometrycznie granicą siecznych jest linia styczna. Dlatego granica ilorazu różnicy, gdy h zbliża się do zera, jeśli istnieje, powinna reprezentować nachylenie stycznej do ( a , f ( a )) . Granica ta jest zdefiniowana jako pochodna funkcji f w a :

Gdy granica istnieje, mówi się, że f jest różniczkowalna w a . Tutaj f ( a ) jest jednym z kilku powszechnych zapisów dla pochodnej ( patrz poniżej ). Z tej definicji jest to oczywiste, że różniczkowalną funkcją F jest zwiększenie tylko wtedy, gdy jego pochodna jest dodatnia, i zmniejsza się wtedy i tylko wtedy jego pochodna jest ujemna. Fakt ten jest szeroko wykorzystywany podczas analizy zachowania funkcji, np. przy znajdowaniu ekstremów lokalnych .

Równoważnie pochodna spełnia własność, że

który ma intuicyjną interpretację (patrz rysunek 1), że linia styczna do f w a daje najlepsze przybliżenie liniowe

do f blisko a (tj. dla małego h ). Tę interpretację najłatwiej uogólnić na inne ustawienia ( patrz poniżej ).

Podstawienie 0 za h w ilorazie różnic powoduje dzielenie przez zero , więc nachylenia prostej stycznej nie można znaleźć bezpośrednio przy użyciu tej metody. Zamiast tego zdefiniuj Q ( h ) jako iloraz różnicy jako funkcję h :

Q ( h ) jest nachyleniem siecznej między ( a , f ( a )) i ( a + h , f ( a + h ))) . Jeśli f jest funkcją ciągłą , co oznacza, że ​​jej wykres jest nieprzerwaną krzywą bez przerw, to Q jest funkcją ciągłą z dala od h = 0 . Jeśliistniejegranica lim h →0 Q ( h ) , co oznacza, że ​​istnieje sposób wyboru wartości Q (0), który czyni Q funkcją ciągłą, to funkcja f jest różniczkowalna w a , a jej pochodna w a jest równa P (0) .

W praktyce istnienie ciągłego rozszerzania ilorazu różnicowego Q ( h ) do h = 0 jest pokazane przez modyfikację licznika tak, aby anulować hw mianowniku. Takie manipulacje mogą sprawić, że wartość graniczna Q dla małego h jest jasna, nawet jeśli Q nadal nie jest zdefiniowane przy h = 0 . Ten proces może być długi i żmudny w przypadku skomplikowanych funkcji, a wiele skrótów jest powszechnie stosowanych w celu uproszczenia tego procesu.

Przykład

Funkcja kwadratowa

Funkcja kwadratowa podana przez f ( x ) = x 2 jest różniczkowalna przy x = 3 , a jej pochodna wynosi 6. Wynik ten jest ustalany przez obliczenie granicy, gdy h zbliża się do zera z ilorazu różnicowego f (3) :

Ostatnie wyrażenie pokazuje, że iloraz różnicy wynosi 6 + h, gdy h ≠ 0 i jest niezdefiniowany, gdy h = 0 , ze względu na definicję ilorazu różnicy. Jednak definicja granicy mówi, że ilorazu różnicy nie trzeba określać, gdy h = 0 . Granica jest wynikiem dopuszczenia h do zera, co oznacza, że ​​jest to wartość, do której dąży 6 + h, gdy h staje się bardzo małe:

Stąd nachylenie wykresu funkcji kwadratowej w punkcie (3, 9) wynosi 6 , a więc jego pochodna w x = 3 wynosi f (3) = 6 .

Bardziej ogólnie, podobne obliczenie pokazuje, że pochodna funkcji kwadratowej przy x = a to f ( a ) = 2 a :

Ciągłość i różniczkowalność

Ta funkcja nie ma pochodnej w oznaczonym punkcie, ponieważ funkcja nie jest tam ciągła (w szczególności ma nieciągłość skoku ).

Jeśli f jest różniczkowalna w a , to f musi być również ciągłe w a . Jako przykład wybierz punkt a i niech f będzie funkcją kroku, która zwraca wartość 1 dla wszystkich x mniejszych niż a i zwraca inną wartość 10 dla wszystkich x większych lub równych a . F nie może pochodną w . Jeśli h jest ujemne, to a + h znajduje się w dolnej części stopnia, więc sieczna od a do a + h jest bardzo stroma, a gdy h dąży do zera, nachylenie dąży do nieskończoności. Jeśli h jest dodatnie, to a + h znajduje się w górnej części kroku, więc sieczna linia od a do a + h ma nachylenie zerowe. W konsekwencji sieczne nie zbliżają się do żadnego pojedynczego nachylenia, więc granica ilorazu różnicy nie istnieje.

Funkcja wartości bezwzględnej jest ciągła, ale nie jest różniczkowalna przy x = 0, ponieważ nachylenia stycznej nie zbliżają się do tej samej wartości z lewej strony, co z prawej.

Jednak nawet jeśli funkcja jest ciągła w punkcie, może nie być tam różniczkowalna. Na przykład funkcja wartości bezwzględnej podana przez f ( x ) = | x | jest ciągła w x = 0 , ale nie jest tam różniczkowalna. Jeśli h jest dodatnie, to nachylenie siecznej od 0 do h wynosi jeden, natomiast jeśli h jest ujemne, to nachylenie siecznej od 0 do h jest ujemne. Można to zobaczyć graficznie jako „załamanie” lub „zakręt” na wykresie przy x = 0 . Nawet funkcja z gładkim wykresem nie jest różniczkowalna w punkcie, w którym jej styczna jest pionowa : Na przykład funkcja dana przez f ( x ) = x 1/3 nie jest różniczkowalna w x = 0 .

Podsumowując, funkcja, która ma pochodną, ​​jest ciągła, ale istnieją funkcje ciągłe, które nie mają pochodnej.

Większość funkcji występujących w praktyce ma pochodne we wszystkich punktach lub prawie w każdym punkcie. Na początku historii rachunku różniczkowego wielu matematyków zakładało, że funkcja ciągła jest w większości punktów różniczkowalna. W łagodnych warunkach, na przykład jeśli funkcja jest funkcją monotoniczną lub funkcją Lipschitza , to prawda. Jednak w 1872 Weierstrass znalazł pierwszy przykład funkcji, która jest ciągła wszędzie, ale nigdzie nie jest różniczkowalna. Ten przykład jest teraz znany jako funkcja Weierstrassa . W 1931 roku Stefan Banach udowodnił, że zbiór funkcji, które w pewnym momencie mają pochodną, ​​jest zbiorem ubogim w przestrzeni wszystkich funkcji ciągłych. Nieformalnie oznacza to, że prawie żadna losowa funkcja ciągła ma pochodną nawet w jednym punkcie.

Pochodna jako funkcja

Pochodna w różnych punktach funkcji różniczkowalnej. W tym przypadku pochodna równa się:

Niech f będzie funkcją, która ma pochodną w każdym punkcie swojej dziedziny . Możemy wtedy zdefiniować funkcję, która odwzorowuje każdy punkt x na wartość pochodnej f w punkcie x . Ta funkcja jest zapisywana f i nazywana jest funkcją pochodnej lub pochodną f .

Czasami f ma pochodną co najwyżej, ale nie wszystkie, punkty swojej dziedziny. Funkcja którego wartość w równa f ' ( ) , gdy K ' ( ) jest zdefiniowane i jest zdefiniowana w innym miejscu jest również nazywany pochodną f . Jest to nadal funkcja, ale jej dziedzina jest ściśle mniejsza niż dziedzina f .

Stosując tę ​​ideę, różniczkowanie staje się funkcją funkcji: pochodna jest operatorem, którego dziedziną jest zbiór wszystkich funkcji, które mają pochodne w każdym punkcie swojej dziedziny, a zakresem jest zbiór funkcji. Jeśli oznaczymy ten operator przez D , to D ( f ) jest funkcją f . Ponieważ D ( f ) jest funkcją, można ją oszacować w punkcie a . Z definicji funkcji pochodnej, D ( f )( a ) = f ) ( a ) .

Dla porównania rozważmy funkcję podwajania podaną przez f ( x ) = 2 x ; f jest funkcją liczby rzeczywistej o wartościach rzeczywistych, co oznacza, że ​​przyjmuje liczby jako dane wejściowe i ma liczby jako dane wyjściowe:

Operator D nie jest jednak zdefiniowany na poszczególnych liczbach. Jest zdefiniowany tylko w funkcjach:

Ponieważ wyjście D jest funkcją, wyjście D może być ocenione w punkcie. Na przykład, gdy D jest zastosowane do funkcji kwadratowej, xx 2 , D wyprowadza funkcję podwojenia x ↦ 2 x , którą nazwaliśmy f ( x ) . Ta funkcja wyjściowa może być następnie obliczona tak, aby uzyskać f (1) = 2 , f (2) = 4 i tak dalej.

Wyższe pochodne

Niech f będzie funkcją różniczkowalną i niech f będzie jej pochodną. Pochodna f ' (jeśli istnieje) opisana f "" i nazywa się drugą pochodną o f . Podobnie, pochodne drugiej pochodnej, jeśli istnieje, jest zapisywany f '' " i nazywa się trzeci pochodną o f . Kontynuując ten proces, można zdefiniować, jeśli istnieje, n- tą pochodną jako pochodną ( n −1) -tej pochodnej. Te powtarzalne instrumenty pochodne nazywane są derywatami wyższego rzędu . N p pochodna jest również nazywany pochodną rzędu n .

Jeśli x ( t ) reprezentuje pozycję obiektu w czasie t , to pochodne wyższego rzędu x mają specyficzne interpretacje w fizyce . Pierwsza pochodna x to prędkość obiektu . Druga pochodna x to przyspieszenie . Trzecia pochodna x to szarpnięcie . I wreszcie, pochodne x od czwartej do szóstej to snap, crackle i pop ; najbardziej odpowiednie do astrofizyki .

Funkcja f nie musi mieć pochodnej (na przykład, jeśli nie jest ciągła). Podobnie, nawet jeśli f ma pochodną, ​​może nie mieć drugiej pochodnej. Na przykład niech

Obliczenie pokazuje, że f jest funkcją różniczkowalną, której pochodna w jest dana przez

f' ( x ) jest dwukrotnością funkcji wartości bezwzględnej wi nie ma pochodnej w zero. Podobne przykłady pokazują, że funkcja może mieć k- tą pochodną dla każdej nieujemnej liczby całkowitej k, ale nie może mieć ( k + 1) -tej pochodnej. Funkcja, która ma k kolejnych pochodnych nazywa się k razy różniczkowalna . Jeżeli dodatkowo k- ta pochodna jest ciągła, to mówi się, że funkcja należy do klasy różniczkowalności C k . (Jest to silniejszy warunek niż posiadanie k pochodnych, jak pokazano w drugim przykładzie Smoothness § Przykłady .) Funkcja, która ma nieskończenie wiele pochodnych nazywana jest nieskończenie różniczkowalną lub gładką .

Na linii rzeczywistej każda funkcja wielomianowa jest nieskończenie różniczkowalna. Zgodnie ze standardowymi regułami różniczkowania , jeśli wielomian stopnia n jest różnicowany n razy , staje się on funkcją stałą . Wszystkie jego kolejne pochodne są identycznie zerowe. W szczególności istnieją, więc wielomiany są funkcjami gładkimi.

Pochodne funkcji f w punkcie x zapewniają wielomianowe przybliżenia tej funkcji w pobliżu x . Na przykład, jeśli f jest dwukrotnie różniczkowalna, to

w tym sensie, że

Jeśli f jest nieskończenie różniczkowalna, to jest to początek szeregu Taylora dla f obliczonego w x + h wokół x .

Punkt przegięcia

Punkt, w którym druga pochodna funkcji zmienia znak nazywamy punktem przegięcia . W punkcie przegięcia druga pochodna może wynosić zero, jak w przypadku punktu przegięcia x = 0 funkcji danej przez , lub może nie istnieć, jak w przypadku punktu przegięcia x = 0 funkcji podane przez . W punkcie przegięcia, funkcja przełączania z będąc funkcją wypukłą do bycia wklęsła Funkcja lub vice versa.

Notacja (szczegóły)

notacja Leibniza

Symbole , i zostały wprowadzone przez Gottfrieda Wilhelma Leibniza w 1675 roku. Jest nadal powszechnie używany, gdy równanie y = f ( x ) jest postrzegane jako funkcjonalna relacja między zmiennymi zależnymi i niezależnymi . Wtedy pierwsza pochodna jest oznaczona przez

i kiedyś uważano go za nieskończenie mały iloraz. Wyższe pochodne wyraża się za pomocą notacji

dla n- tej pochodnej . Są to skróty oznaczające wielokrotne zastosowania operatora pochodnego. Na przykład,

Za pomocą notacji Leibniza możemy zapisać pochodną w punkcie na dwa różne sposoby:

Notacja Leibniza pozwala określić zmienną do różniczkowania (w mianowniku), co ma znaczenie przy różnicowaniu częściowym . Można go również użyć do napisania reguły łańcucha jako

Notacja Lagrange'a

Czasami określane jako głównego notacji , jedna z najczęstszych współczesnej notacji dla różnicowania ze względu na Joseph Louis Lagrange i wykorzystuje doskonałą znaku , tak że pochodna funkcji oznaczamy . Podobnie druga i trzecia pochodna są oznaczone

  i  

Aby oznaczyć liczbę derywatów poza tym punktem, niektórzy autorzy używają cyfr rzymskich w indeksie górnym , podczas gdy inni umieszczają liczbę w nawiasach:

  lub  

Ta ostatnia notacja uogólnia, dając notację dla n- tej pochodnej – notacja ta jest najbardziej użyteczna, gdy chcemy mówić o pochodnej jako o funkcji samej w sobie, ponieważ w tym przypadku notacja Leibniza może stać się nieporęczna.

notacja Newtona

Notacja Newtona dla różniczkowania, zwana także notacją kropkową, umieszcza kropkę nad nazwą funkcji, aby przedstawić pochodną czasową. Jeśli , to

  i  

oznaczają odpowiednio pierwszą i drugą pochodną . Ten zapis jest używany wyłącznie dla pochodnych ze względu na czas lub długość łuku . Jest zwykle używany w równaniach różniczkowych w fizyce i geometrii różniczkowej . Notacja z kropką staje się jednak niemożliwa do zarządzania w przypadku instrumentów pochodnych wyższego rzędu (rzędu 4 lub więcej) i nie może radzić sobie z wieloma zmiennymi niezależnymi.

notacja Eulera

Notacja Eulera wykorzystuje operator różniczkowy , który jest stosowany do funkcji w celu uzyskania pierwszej pochodnej . N p pochodną oznaczono .

Jeśli y = f ( x ) jest zmienną zależną, to często indeks dolny x jest dołączany do D w celu wyjaśnienia zmiennej niezależnej x . Następnie zapisuje się notację Eulera

  lub   ,

chociaż ten indeks jest często pomijany, gdy zmienna x jest rozumiana, na przykład, gdy jest to jedyna zmienna niezależna obecna w wyrażeniu.

Notacja Eulera jest przydatna do określania i rozwiązywania liniowych równań różniczkowych .

Zasady obliczeń

Pochodną funkcji można w zasadzie obliczyć z definicji, biorąc pod uwagę iloraz różnicy i obliczając jego granicę. W praktyce, znając pochodne kilku prostych funkcji, łatwiej jest obliczyć pochodne innych funkcji, stosując reguły uzyskiwania pochodnych funkcji bardziej skomplikowanych od funkcji prostszych.

Zasady podstawowych funkcji

Oto zasady dotyczące pochodnych najczęstszych funkcji podstawowych, gdzie a jest liczbą rzeczywistą.

  • Pochodne uprawnień :
  • Funkcje wykładnicze i logarytmiczne :
  • Funkcje trygonometryczne :
  • Odwrotne funkcje trygonometryczne :

Zasady dla połączonych funkcji

Oto niektóre z najbardziej podstawowych zasad wyprowadzania pochodnej funkcji złożonej z pochodnych funkcji podstawowych.

  • Stała reguła : jeśli f ( x ) jest stałe, to
  • Zasada sumy :
    dla wszystkich funkcji f i g oraz wszystkich liczb rzeczywistych i .
  • Zasada produktu :
    dla wszystkich funkcji f i g . W szczególnym przypadku reguła ta obejmuje fakt, że kiedykolwiek jest stałą, ponieważ przez regułę stałej.
  • Reguła ilorazu :
    dla wszystkich funkcji f i g na wszystkich wejściach, gdzie g ≠ 0 .
  • Reguła łańcuchowa dla funkcji złożonych: Jeśli, to

Przykład obliczenia

Pochodna funkcji podanej przez

jest

Tutaj drugi składnik został obliczony przy użyciu reguły łańcucha, a trzeci przy użyciu reguły iloczynu . Wykorzystano również znane pochodne funkcji elementarnych x 2 , x 4 , sin( x ), ln( x ) i exp( x ) = e x , a także stałą 7.

Definicja z hiperrealizmami

Względem hiperrzeczywistego rozszerzenia RR liczb rzeczywistych, pochodną funkcji rzeczywistej y = f ( x ) w punkcie rzeczywistym x można zdefiniować jako cień ilorazu Δ Y/Δ xdla nieskończenie małych ∆ x , gdzie y = f ( x + ∆ x ) − f ( x ) . Tutaj naturalne rozszerzenie f do hiperrzeczywistych jest nadal oznaczane f . Tutaj mówi się, że pochodna istnieje, jeśli cień jest niezależny od nieskończenie małej wybranej.

W wyższych wymiarach

Funkcje o wartościach wektorowych

Wektor wartościach Funkcja Y zmiennej rzeczywistej wysyła rzeczywistych numerów wektorów w pewien wektor przestrzeń R n . Funkcja o wartościach wektorowych może być podzielona na jej funkcje współrzędnych y 1 ( t ), y 2 ( t ), ..., y n ( t ) , co oznacza, że y ( t ) = ( y 1 ( t ) ). .., y n ( t )) . Obejmuje to, na przykład, parametryczne krzywe z R 2 i R 3 . Funkcje współrzędnych są funkcjami o wartościach rzeczywistych, więc dotyczy ich powyższa definicja pochodnej. Pochodną y ( t ) definiuje się jako wektor , zwany wektorem stycznym , którego współrzędne są pochodnymi funkcji współrzędnych. To jest,

Równoważnie,

jeśli limit istnieje. Odejmowanie w liczniku to odejmowanie wektorów, a nie skalarów. Jeśli pochodna y istnieje dla każdej wartości t , to y ′ jest inną funkcją o wartościach wektorowych.

Jeśli e 1 , ..., e n jest standardową bazą dla R n , to y ( t ) można również zapisać jako y 1 ( t ) e 1 + ⋯ + y n ( t ) e n . Jeżeli założymy, że pochodna funkcji o wartościach wektorowych zachowuje własność liniowości , to pochodna y ( t ) musi być

ponieważ każdy z wektorów bazowych jest stałą.

To uogólnienie jest przydatne, na przykład, jeśli y ( t ) jest wektorem położenia cząstki w czasie t ; wtedy pochodna y ′( t ) jest wektorem prędkości cząstki w czasie t .

Częściowe pochodne Part

Załóżmy, że f jest funkcją, która zależy od więcej niż jednej zmiennej — na przykład

f może być reinterpretowane jako rodzina funkcji jednej zmiennej indeksowanej przez inne zmienne:

Innymi słowy, każda wartość x wybiera funkcję oznaczoną f x , która jest funkcją jednej liczby rzeczywistej. To jest,

Po wybraniu wartości x , powiedzmy a , wtedy f ( x , y ) określa funkcję f a , która wysyła y do a 2 + ay + y 2 :

W tym wyrażeniu a jest stałą , a nie zmienną , więc f a jest funkcją tylko jednej zmiennej rzeczywistej. W związku z tym obowiązuje definicja pochodnej funkcji jednej zmiennej:

Powyższa procedura może być wykonywana dla każdego wyboru . Zestawienie pochodnych razem w funkcję daje funkcję, która opisuje zmianę f w kierunku y :

Jest to pochodna cząstkowa f po y . Tutaj jest zaokrąglonym d zwanym symbolem pochodnej cząstkowej . Aby odróżnić go od litery d , ∂ jest czasami wymawiane jako „der”, „del” lub „częściowe” zamiast „dee”.

Ogólnie pochodna cząstkowa funkcji f ( x 1 , …, x n ) w kierunku x i w punkcie ( a 1 , ..., a n ) jest zdefiniowana jako:

W powyższym ilorazie różnic wszystkie zmienne z wyjątkiem x i są utrzymywane na stałym poziomie. Ten wybór stałych wartości determinuje funkcję jednej zmiennej

i z definicji

Innymi słowy, różne wybory w indeksie rodziny funkcji jednej zmiennej tak jak w powyższym przykładzie. Wyrażenie to pokazuje również, że obliczanie pochodnych cząstkowych sprowadza się do obliczania pochodnych jednej zmiennej.

Jest to fundamentalne dla badania funkcji kilku zmiennych rzeczywistych . Niech f ( x 1 , ..., x n ) będzie taką funkcją o wartościach rzeczywistych . Jeśli wszystkie pochodne cząstkowe f / ∂ x j o f są zdefiniowane w punkcie A = ( 1 , ..., n ) te pochodne cząstkowe określają wektor

który jest nazywany gradientu o f w . Jeśli f jest różniczkowalne w każdym punkcie w jakiejś dziedzinie, to gradient jest funkcją wektorową f, która odwzorowuje punkt ( a 1 , ..., a n ) na wektor f ( a 1 , ..., n ) . W konsekwencji gradient wyznacza pole wektorowe .

Pochodne kierunkowe

Jeśli f jest funkcją o wartościach rzeczywistych na R n , to pochodne cząstkowe f mierzą jego zmianę w kierunku osi współrzędnych. Na przykład, jeśli f jest funkcją x i y , to jej pochodne cząstkowe mierzą zmienność f w kierunku x i kierunku y . Nie mierzą jednak bezpośrednio zmienności f w żadnym innym kierunku, na przykład wzdłuż linii ukośnej y = x . Są one mierzone za pomocą pochodnych kierunkowych. Wybierz wektor

Kierunkowe pochodną o f w kierunku p w punkcie x, jest granica

W niektórych przypadkach może być łatwiej obliczyć lub oszacować pochodną kierunkową po zmianie długości wektora. Często ma to na celu przekształcenie problemu w obliczenie pochodnej kierunkowej w kierunku wektora jednostkowego. Aby zobaczyć, jak to działa, załóżmy, że v = λ u gdzie u jest wektorem jednostkowym w kierunku v . Podstaw h = k / λ do ilorazu różnicowego. Iloraz różnicy staje się:

Jest to λ razy iloraz różnicy kierunkowej pochodnej f względem u . Co więcej, przyjęcie granicy, ponieważ h dąży do zera, jest tym samym, co przyjęcie granicy, ponieważ k dąży do zera, ponieważ h i k są wielokrotnościami siebie. Dlatego też, D V ( f ) = λ D U ( f ) . Ze względu na tę właściwość przeskalowania pochodne kierunkowe są często rozważane tylko dla wektorów jednostkowych.

Jeżeli wszystkie pochodne cząstkowe f istnieją i są ciągłe w x , to wyznaczają pochodną kierunkową f w kierunku v ze wzoru:

Wynika to z definicji pochodnej całkowitej . Wynika z tego , że pochodna kierunkowa jest liniowa w v , co oznacza , że D v + w ( f ) = D v ( f ) + D w ( f ) .

Ta sama definicja działa także wówczas, gdy M jest funkcją z wartościami R m . Powyższą definicję stosuje się do każdego składnika wektorów. W tym przypadku, kierunkowy pochodną wektora w R m .

Pochodna całkowita, różniczka całkowita i macierz Jakobian

Gdy m jest funkcją z otwartego podzbioru R n z R m , a następnie kierunkowy pochodną f w wybranym kierunku, jest najlepszym przybliżeniem liniowy f w tym punkcie i w tym kierunku. Ale gdy n > 1 , żadna pojedyncza pochodna kierunkowa nie daje pełnego obrazu zachowania f . Całkowita pochodna daje pełny obraz, biorąc pod uwagę wszystkie kierunki jednocześnie. Oznacza to, że dla dowolnego wektora v rozpoczynającego się od a , równanie aproksymacji liniowej zawiera:

Podobnie jak pochodna jednej zmiennej, f  ′( a ) jest dobierana tak, aby błąd w tym przybliżeniu był jak najmniejszy.

Jeśli n i m są jednością, to pochodna f  ′( a ) jest liczbą, a wyrażenie f  ′( a ) v jest iloczynem dwóch liczb. Ale w wyższych wymiarach niemożliwe jest, aby f  ( a ) było liczbą. Gdyby to była liczba, wtedy f  ( a ) v byłoby wektorem w R n, podczas gdy pozostałe terminy byłyby wektorami w R m , a zatem wzór nie miałby sensu. Dla liniowego wzoru przybliżeń do sensu, F  "( ) może być funkcją, która wysyła wektorów w R n wektorów z R m i m  '( ) V musi oznaczać funkcję oceniona na przeciwko .

Aby określić, jaki to rodzaj funkcji, zauważ, że wzór aproksymacji liniowej można przepisać jako

Zauważ, że jeśli wybierzemy inny wektor w , to to przybliżone równanie określa inne przybliżone równanie, zastępując w za v . To określa trzeci przybliżonego równania przez podstawienie zarówno w o v i a + V dla . Odejmując te dwa nowe równania, otrzymujemy

Jeśli założymy, że v jest małe i że pochodna zmienia się w sposób ciągły w a , wtedy f  ′ ( a + v ) jest w przybliżeniu równe f  ′ ( a ) , a zatem prawa strona wynosi w przybliżeniu zero. Lewą stronę można przepisać w inny sposób, używając wzoru na aproksymację liniową z v + w podstawionym za v . Formuła aproksymacji liniowej implikuje:

Sugeruje to, że f  ′( a ) jest przekształceniem liniowym z przestrzeni wektorowej R n do przestrzeni wektorowej R m . W rzeczywistości możliwe jest dokładne wyprowadzenie poprzez pomiar błędu w przybliżeniach. Załóżmy, że błąd w tym wzorze z przybliżeniem liniowym jest ograniczony przez stałą razy || v ||, gdzie stała jest niezależna od v, ale stale zależy od a . Następnie, po dodaniu odpowiedniego składnika błędu, wszystkie powyższe przybliżone równości można przeformułować jako nierówności. W szczególności, f  ( a ) jest transformacją liniową aż do małego składnika błędu. W granicy, gdy v i w dążą do zera, musi to być zatem transformacja liniowa. Ponieważ definiujemy całkowitą pochodną, ​​przyjmując granicę, gdy v dochodzi do zera, f  ′( a ) musi być transformacją liniową.

W jednej zmiennej fakt, że pochodna jest najlepszym przybliżeniem liniowym, wyraża się tym, że jest to granica ilorazów różnicowych. Jednak zwykły iloraz różnic nie ma sensu w wyższych wymiarach, ponieważ zwykle nie jest możliwe dzielenie wektorów. W szczególności, licznik i mianownik iloraz różnicy nawet nie są w tej samej przestrzeni ilustracji: licznik leży w codomain R m , natomiast mianownik leży w domenie R n . Co więcej, pochodna jest przekształceniem liniowym, innym typem obiektu niż licznik i mianownik. Aby sprecyzować ideę, że f  ′( a ) jest najlepszym przybliżeniem liniowym, konieczne jest zaadaptowanie innego wzoru na pochodną jednej zmiennej, w której te problemy znikają. Jeśli f  : RR , to zwykłą definicją pochodnej można manipulować, aby pokazać, że pochodna f w a jest unikalną liczbą f  ′ ( a ) taką, że

To jest równoważne

ponieważ granica funkcji dąży do zera wtedy i tylko wtedy, gdy granica bezwzględnej wartości funkcji dąży do zera. Ta ostatnia formuła może być dostosowana do sytuacji wielu zmiennych poprzez zastąpienie wartości bezwzględnych normami .

Definicja całkowitej pochodnej o f w więc, jest to, że jest unikalny transformacji liniowej F  "( ) R nR m , tak że

Tutaj h jest wektorem w R n , więc normą w mianowniku jest standardowa długość w R n . Jednak f ′( a ) h jest wektorem w R m , a normą w liczniku jest standardowa długość w R m . Jeśli v jest wektorem zaczynając , a f  "( ) V nazywany jest odwzorowanie styczne z v o f a czasami napisane f * V .

Jeżeli pochodna całkowita istnieje w a , to wszystkie pochodne cząstkowe i pochodne kierunkowe f istnieją w a i dla wszystkich v , f  ′( a ) v jest pochodną kierunkową f w kierunku v . Jeśli zapiszemy f używając funkcji współrzędnych, tak że f = ( f 1 , f 2 , ..., f m ) , to pochodna całkowita może być wyrażona za pomocą pochodnych cząstkowych jako macierzy . Matryca ta jest nazywana jakobian matrycy o f w :

Istnienie całkowitej pochodnej f ′( a ) jest ściślej silniejsze niż istnienie wszystkich pochodnych cząstkowych, ale jeśli pochodne cząstkowe istnieją i są ciągłe, wtedy istnieje pochodna całkowita, jest dana jakobianem i zależy w sposób ciągły od a .

Definicja całkowitego instrumentu pochodnego obejmuje definicję instrumentu pochodnego w jednej zmiennej. Oznacza to, że jeśli f jest funkcją zmiennej rzeczywistej o wartościach rzeczywistych, to pochodna całkowita istnieje wtedy i tylko wtedy, gdy istnieje zwykła pochodna. Macierz Jakobianu redukuje się do macierzy 1×1, której jedynym wpisem jest pochodna f ′( x ). Ta macierz 1×1 spełnia własność, że f ( a + h ) − ( f ( a ) + f  ′( a ) h ) wynosi w przybliżeniu zero, innymi słowy, że

Do zmiany zmiennych jest to stwierdzenie, że funkcja jest najlepszym przybliżeniem liniowym do f w a .

Całkowita pochodna funkcji nie daje innej funkcji w taki sam sposób, jak przypadek jednej zmiennej. Dzieje się tak, ponieważ pochodna całkowita funkcji wielu zmiennych musi rejestrować znacznie więcej informacji niż pochodna funkcji jednej zmiennej. Zamiast tego, pochodna całkowita daje funkcję od wiązki stycznej źródła do wiązki stycznej celu.

Naturalny analog pochodnych całkowitych drugiego, trzeciego i wyższego rzędu nie jest przekształceniem liniowym, nie jest funkcją na wiązce stycznej i nie jest budowany przez wielokrotne branie pochodnej całkowitej. Analog pochodnej wyższego rzędu, zwany dżetem , nie może być transformacją liniową, ponieważ pochodne wyższego rzędu odzwierciedlają subtelne informacje geometryczne, takie jak wklęsłość, których nie można opisać za pomocą danych liniowych, takich jak wektory. Nie może to być funkcja na wiązce stycznej, ponieważ w wiązce stycznej jest miejsce tylko na przestrzeń bazową i pochodne kierunkowe. Ponieważ dżety przechwytują informacje wyższego rzędu, przyjmują jako argumenty dodatkowe współrzędne reprezentujące zmiany kierunku wyższego rzędu. Przestrzeń wyznaczona przez te dodatkowe współrzędne nazywana jest wiązką dżetów . Związek między pochodną całkowitą a pochodnymi cząstkowymi funkcji jest równoległy w stosunku między dżetem k- tego rzędu funkcji a jej pochodnymi cząstkowymi rzędu mniejszego lub równego k .

Wielokrotnie biorąc pochodną całkowitą, otrzymujemy wyższe wersje pochodnej Frécheta , wyspecjalizowane w R p . K th zamówić Razem pochodne mogą być interpretowane jako mapa

który przyjmuje punkt x w R n i przypisuje mu element przestrzeni k -liniowych przekształceń od R n do R m – „najlepsze” (w pewnym sensie) k- liniowe przybliżenie do f w tym punkcie. Wstępnie składając go z przekątnej , x → ( x , x ) , uogólniony szereg Taylora można rozpocząć jako

gdzie f( a ) jest utożsamiane ze stałą funkcją, x ia i są składowymi wektora xa , a ( Df ) i oraz ( D 2 f ) jk są składowymi Df i D 2 f jako liniowymi przekształcenia.

Uogólnienia

Pojęcie pochodnej można rozszerzyć na wiele innych ustawień. Wspólnym wątkiem jest to, że pochodna funkcji w punkcie służy jako liniowe przybliżenie funkcji w tym punkcie.

  • Ważnym uogólnienie dotyczy pochodnych złożonych funkcji o złożonych zmienne , takie jak funkcje: (a) domenę na liczbach zespolonych C na C . Pojęcie pochodnej takiej funkcji uzyskuje się przez zastąpienie zmiennych rzeczywistych zmiennymi złożonymi w definicji. Jeśli C jest utożsamiany z R 2 przez zapisanie liczby zespolonej z jako x + iy , wtedy funkcja różniczkowalna z C do C jest z pewnością różniczkowalna jako funkcja z R 2 do R 2 (w tym sensie, że wszystkie jej pochodne cząstkowe istnieją), ale odwrotność nie jest generalnie prawdziwa: pochodna zespolona istnieje tylko wtedy, gdy pochodna rzeczywista jest zespolona liniowa, a to narzuca relacje między pochodnymi cząstkowymi zwanymi równaniami Cauchy'ego-Riemanna – patrz funkcje holomorficzne .
  • Inne uogólnienie dotyczy funkcji między rozmaitościami różniczkowymi lub gładkimi . Mówiąc intuicyjnie, taka rozmaitość M jest przestrzenią, którą można aproksymować w pobliżu każdego punktu x przestrzenią wektorową zwaną przestrzenią styczną : prototypowym przykładem jest gładka powierzchnia w R 3 . Pochodna (lub różniczkowa) (różniczkowalnego) odwzorowania f : MN między rozmaitościami, w punkcie x w M , jest więc liniową mapą z przestrzeni stycznej M w x do przestrzeni stycznej N w f ( x ). Funkcja pochodną się mapa pomiędzy wiązkami stycznych z M i N . Ta definicja jest fundamentalna w geometrii różniczkowej i ma wiele zastosowań – patrz pushforward (dyferencjał) i pullback (geometria różnicowa) .
  • Różnicowanie można również zdefiniować dla map między nieskończenie wymiarowymi przestrzeniami wektorowymi, takimi jak przestrzenie Banacha i przestrzenie Frécheta . Istnieje uogólnienie zarówno pochodnej kierunkowej zwanej pochodną Gateaux , jak i różniczki zwanej pochodną Frécheta .
  • Jedną z wad klasycznej pochodnej jest to, że bardzo wiele funkcji nie jest różniczkowalnych. Niemniej jednak istnieje sposób na rozszerzenie pojęcia pochodnej tak, aby wszystkie funkcje ciągłe i wiele innych funkcji można było różnicować za pomocą pojęcia znanego jako pochodna słaba . Pomysł polega na osadzeniu funkcji ciągłych w większej przestrzeni zwanej przestrzenią rozkładów i wymaga jedynie, aby funkcja była różniczkowalna „średnio”.
  • Właściwości pochodnej zainspirowały wprowadzenie i badanie wielu podobnych obiektów w algebrze i topologii — patrz na przykład algebra różniczkowa .
  • Dyskretnym odpowiednikiem zróżnicowania są różnice skończone . Badanie rachunku różniczkowego jest ujednolicone z rachunkiem różnic skończonych w rachunku skali czasu .
  • Zobacz także pochodna arytmetyczna .

Historia

Rachunek , znany w swojej wczesnej historii jako rachunek nieskończenie mały , jest dyscypliną matematyczną skupiającą się na granicach , funkcjach , pochodnych, całkach i szeregach nieskończonych . Isaac Newton i Gottfried Leibniz niezależnie odkryli rachunek różniczkowy w połowie XVII wieku. Jednak każdy wynalazca twierdził, że drugi ukradł jego dzieło w zaciekłym sporze, który trwał do końca ich życia.

Zobacz też

Uwagi

Bibliografia

Bibliografia

Wydrukować

Książki online

Linki zewnętrzne