Różniczka zupełna

Pochodna, różniczka, czasami: różniczka zupełna funkcji f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } w punkcie a R n {\displaystyle a\in \mathbb {R} ^{n}} to przekształcenie liniowe d f ( a ) : R n R {\displaystyle df(a)\colon \mathbb {R} ^{n}\to \mathbb {R} } będące najlepszym liniowym przybliżeniem przyrostu funkcji f {\displaystyle f} w tym punkcie. Różniczkę zupełną da się przedstawić w postaci

d f ( a ) = i = 1 n f x i ( a ) d x i , {\displaystyle df(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)dx^{i},}

gdzie d x i := d π i {\displaystyle dx^{i}:=d\pi ^{i}} to pochodne rzutowań na i {\displaystyle i} -tą współrzędną względem bazy standardowej R n , {\displaystyle \mathbb {R} ^{n},} tzn. funkcji π i : R n R ,   i = 1 , , n {\displaystyle \pi ^{i}\colon \mathbb {R} ^{n}\to \mathbb {R} ,\ i=1,\dots ,n} danych wzorami

π i ( x 1 , , x n ) := x i . {\displaystyle \pi ^{i}(x_{1},\dots ,x_{n}):=x_{i}.}

Różniczka (tzn. przekształcenie dane wzorem x d f ( x ) {\displaystyle x\mapsto df(x)} ) jest przykładem 1 {\displaystyle 1} -formy różniczkowej.

Definicja

Niech U R n {\displaystyle U\subset \mathbb {R} ^{n}} będzie zbiorem otwartym. Niech f : U R {\displaystyle f\colon U\to \mathbb {R} } będzie funkcją różniczkowalną w punkcie a U . {\displaystyle a\in U.} Wówczas różniczka zupełna funkcji f {\displaystyle f} w punkcie a {\displaystyle a} to jej pochodna w punkcie a , {\displaystyle a,} czyli przekształcenie liniowe d f ( a ) : R n R , {\displaystyle df(a)\colon \mathbb {R} ^{n}\to \mathbb {R} ,} które w pewnym sensie jest najlepszym liniowym przybliżeniem przyrostu

f ( a + h ) f ( a ) . {\displaystyle f(a+h)-f(a).}

W szczególności można napisać

f ( a + h ) f ( a ) d f ( a ) ( h ) {\displaystyle f(a+h)-f(a)\approx df(a)(h)}

dla dowolnego h R n {\displaystyle h\in \mathbb {R} ^{n}} takiego, że a + h U . {\displaystyle a+h\in U.}

Postać kanoniczna

Pochodna d f ( a ) {\displaystyle df(a)} ma macierz w bazie standardowej R n {\displaystyle \mathbb {R} ^{n}}

[ d f ( a ) ] = [ f x 1 ( a ) f x n ( a ) ] . {\displaystyle [df(a)]=\left[{\frac {\partial f}{\partial x_{1}}}(a)\ldots {\frac {\partial f}{\partial x_{n}}}(a)\right].}

Wynika z tego, że pochodna d f ( a ) {\displaystyle df(a)} jest dana wzorem

d f ( a ) ( h 1 , , h n ) = [ f x 1 ( a ) f x n ( a ) ] [ h 1 h n ] = i = 1 n f x i ( a ) h i . {\displaystyle df(a)(h_{1},\dots ,h_{n})=\left[{\frac {\partial f}{\partial x_{1}}}(a)\ldots {\frac {\partial f}{\partial x_{n}}}(a)\right]{\begin{bmatrix}h_{1}\\\vdots \\h_{n}\end{bmatrix}}=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)h_{i}.}

W szczególności rzutowania π i : R n R ,   i = 1 , , n {\displaystyle \pi ^{i}\colon \mathbb {R} ^{n}\to \mathbb {R} ,\ i=1,\dots ,n} na i {\displaystyle i} -tą współrzędną względem bazy standardowej R n , {\displaystyle \mathbb {R} ^{n},} tzn. funkcje dane wzorami

π i ( x 1 , , x n ) := x i {\displaystyle \pi ^{i}(x_{1},\dots ,x_{n}):=x_{i}}

są różniczkowalne i ich pochodne są dane wzorami

d π i ( a ) ( h 1 , , h n ) = h i ,   i = 1 , , n {\displaystyle d\pi ^{i}(a)(h_{1},\dots ,h_{n})=h_{i},\ i=1,\dots ,n}

dla dowolnego a R n . {\displaystyle a\in \mathbb {R} ^{n}.}

Widzimy, że różniczkę można zapisać w postaci

d f ( a ) = i = 1 n f x i ( a ) d π i {\displaystyle df(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)d\pi ^{i}}

(dla prosty oznaczeń piszemy d π i {\displaystyle d\pi ^{i}} zamiast d π i ( a ) {\displaystyle d\pi ^{i}(a)} ), którą nazywamy postacią kanoniczną. Oznaczając pochodne d π i {\displaystyle d\pi ^{i}} przez d x i , {\displaystyle dx^{i},} można powyższemu wzorowi nadać klasyczną formę

d f ( a ) = i = 1 n f x i ( a ) d x i . {\displaystyle df(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)dx^{i}.}

Przykład

Różniczka funkcji f : R 3 R {\displaystyle f\colon \mathbb {R} ^{3}\to \mathbb {R} } różniczkowalnej w punkcie a R 3 {\displaystyle a\in \mathbb {R} ^{3}} ma postać kanoniczną

d f ( a ) = f x ( a ) d x + f y ( a ) d y + f z ( a ) d z , {\displaystyle df(a)={\frac {\partial f}{\partial x}}(a)dx+{\frac {\partial f}{\partial y}}(a)dy+{\frac {\partial f}{\partial z}}(a)dz,}

gdzie:

d x ( h 1 , h 2 , h 3 ) = h 1 , d y ( h 1 , h 2 , h 3 ) = h 2 , d z ( h 1 , h 2 , h 3 ) = h 3 {\displaystyle dx(h_{1},h_{2},h_{3})=h_{1},\quad dy(h_{1},h_{2},h_{3})=h_{2},\quad dz(h_{1},h_{2},h_{3})=h_{3}}

(dla uproszczenia piszemy d x {\displaystyle dx} zamiast d x ( a ) {\displaystyle dx(a)} itd.).

Przybliżanie przyrostu funkcji za pomocą różniczki

Z definicji różniczki wynika, że za jej pomocą można przybliżać przyrost funkcji. Z własności różniczki wynika, że to przybliżenie ma postać

Δ f := f ( a + Δ x ) f ( a ) i = 1 n f x i ( a ) Δ x i {\displaystyle \Delta f:=f(a+\Delta x)-f(a)\approx \sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)\Delta x_{i}}

dla dowolnego Δ x = ( Δ x 1 , , Δ x n ) R n {\displaystyle \Delta x=(\Delta x_{1},\dots ,\Delta x_{n})\in \mathbb {R} ^{n}} takiego, że a + Δ x {\displaystyle a+\Delta x} należy do dziedziny f . {\displaystyle f.} To przybliżenie jest tym lepsze im mniejsze co do normy jest Δ x . {\displaystyle \Delta x.}

Trochę nadużywając notacji można d x i {\displaystyle dx^{i}} we wzorze

d f ( a ) = i = 1 n f x i ( a ) d x i {\displaystyle df(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)dx^{i}}

interpretować jako przyrosty argumentów funkcji f . {\displaystyle f.} Oznaczenie d x i {\displaystyle dx^{i}} odzwierciedla wtedy to, że zakłada się, że są one małe. W szczególności, trochę nadużywając notacji, można napisać, że np.

f ( x + d x , y + d y ) f ( x , y ) d f ( x , y ) = f x ( x , y ) d x + f y ( x , y ) d y . {\displaystyle f(x+dx,y+dy)-f(x,y)\approx df(x,y)={\frac {\partial f}{\partial x}}(x,y)dx+{\frac {\partial f}{\partial y}}(x,y)dy.}

Różniczka zupełna jako 1-forma

 Zobacz też: Forma różniczkowa.

Niech U R n {\displaystyle U\subset \mathbb {R} ^{n}} będzie zbiorem otrwartym. Różniczkowalna funkcja f : U R {\displaystyle f\colon U\to \mathbb {R} } indukuje odwzorowanie d f {\displaystyle df} z U {\displaystyle U} w L ( R n , R ) , {\displaystyle {\cal {L(\mathbb {R} ^{n},\mathbb {R} ),}}} tj. w przestrzeń przekształceń liniowych z R n {\displaystyle \mathbb {R} ^{n}} w R {\displaystyle \mathbb {R} } dane wzorem

x d f ( x ) . {\displaystyle x\mapsto df(x).}

Przekształcenie d f {\displaystyle df} nazywamy pochodną funkcji f {\displaystyle f} albo różniczką funkcji f . {\displaystyle f.} Przekształcenie d f {\displaystyle df} spełnia definicję 1 {\displaystyle 1} -formy. Różniczka jest zatem 1 {\displaystyle 1} -formą na zbiorze otwartym U . {\displaystyle U.} Ogólna 1 {\displaystyle 1} -forma na zbiorze otwartym U R n {\displaystyle U\subset \mathbb {R} ^{n}} ma postać kanoniczną

ω = i = 1 n f i d x i , {\displaystyle \omega =\sum _{i=1}^{n}f_{i}dx^{i},}

gdzie współczynniki f i {\displaystyle f_{i}} to dowolne funkcje rzeczywiste i niekonicznie muszą być pochodnymi cząstkowymi innej funkcji. Ogólna 2 {\displaystyle 2} -forma na zbiorze otwartym w R 3 {\displaystyle \mathbb {R} ^{3}} ma postać kanoniczną

ω = f   d x d y + g   d x d z + h   d y d z , {\displaystyle \omega =f\ dx\wedge dy+g\ dx\wedge dz+h\ dy\wedge dz,}

gdzie {\displaystyle \wedge } to iloczyn zewnętrzny. Ogólna k {\displaystyle k} -forma na zbiorze otwartym w R n {\displaystyle \mathbb {R} ^{n}} ma postać

ω = 1 i 1 < < i k n f i 1 , , i k   d x i 1 d x i k . {\displaystyle \omega =\sum _{1\leqslant i_{1}<\ldots <i_{k}\leqslant n}f_{i_{1},\dots ,i_{k}}\ dx^{i_{1}}\wedge \ldots \wedge dx^{i_{k}}.}

O formie różniczkowej mówi się z definicji, że jest klasy C r {\displaystyle C^{r}} lub klasy C {\displaystyle C^{\infty }} jeżeli takimi są funkcje f i 1 , , i k . {\displaystyle f_{i_{1},\dots ,i_{k}}.}

Pochodną zewnętrzną k {\displaystyle k} -formy ω {\displaystyle \omega } nazywa się następującą ( k + 1 ) {\displaystyle (k+1)} formę

d ω := 1 i 1 < < i k n d f i 1 , , i k d x i 1 d x i k . {\displaystyle d\omega :=\sum _{1\leqslant i_{1}<\ldots <i_{k}\leqslant n}df_{i_{1},\dots ,i_{k}}\wedge dx^{i_{1}}\wedge \ldots \wedge dx^{i_{k}}.}

O formie różniczkowej która jest postaci ω = d η {\displaystyle \omega =d\eta } dla pewnej formy η {\displaystyle \eta } mówi się, że jest dokładna. O formie różniczkowej, której pochodna zewnętrzna znika mówi się, że jest zamknięta. Z twierdzenia Schwarza i własności iloczynu zewnętrznego wynika, że

d ( d ω ) 0 {\displaystyle d(d\omega )\equiv 0}

o ile tylko funkcje f i 1 , , i k {\displaystyle f_{i_{1},\dots ,i_{k}}} są klasy co najmniej C 2 , {\displaystyle C^{2},} a zatem każda forma dokładna (i klasy co najmniej C 1 {\displaystyle C^{1}} ) jest zamknięta. Odwrotna implikacja nie musi być prawdziwa, ale jak wynika z Lematu Poincarégo jest prawdziwa na zbiorach otwartych i gwiaździstych.

W szczególności z definicji pochodnej zewnętrznej wynika, że różniczka (zupełna) d f {\displaystyle df} jest pochodną zewnętrzną 0 {\displaystyle 0} -formy ω = f , {\displaystyle \omega =f,} czyli zwykłej funkcji. Wynika stąd, że różniczka (zupełna) jest dokładna i zamknięta.

Całka po krzywej zamkniętej

Ponieważ różniczka d f {\displaystyle df} jest 1 {\displaystyle 1} -formą to można rozważać jej całkę jako całkę z formy po 1 {\displaystyle 1} -wymiarowej rozmaitości różniczkowej, czyli po krzywej.

γ d f . {\displaystyle \int _{\gamma }df.}

Ogólne twierdzenie Stokesa mówi, że całka ( n 1 ) {\displaystyle (n-1)} -formy ω {\displaystyle \omega } po brzegu M {\displaystyle \partial M} n {\displaystyle n} -wymiarowej rozmaitości różniczkowej M {\displaystyle M} jest równa (brzeg jest wówczas rozmaitością różniczkową ( n 1 ) {\displaystyle (n-1)} wymiarową)

M ω = M d ω . {\displaystyle \int _{\partial M}\omega =\int _{M}d\omega .}

Krzywa zamknięta M {\displaystyle \partial M} jest brzegiem pewnej 2-wymiarowej rozmaitości różniczkowej, czyli powierzchni w R n . {\displaystyle \mathbb {R} ^{n}.} Ponieważ różniczka (zupełna) jest zamknięta to z twierdzenia Stokesa dostajemy

M d f = M d ( d f ) = M 0 = 0 , {\displaystyle \int _{\partial M}df=\int _{M}d(df)=\int _{M}0=0,}

a zatem całka z różniczki (zupełnej) po krzywej zamkniętej znika.

Niezależność od drogi całkowania

Rozpatrzmy dwa dowolne punkty A , B R n {\displaystyle A,B\in \mathbb {R} ^{n}} oraz dwie dowolne krzywe je łączące – krzywą γ 1 {\displaystyle \gamma _{1}} biegnącą z punku A {\displaystyle A} do punktu B {\displaystyle B} oraz krzywą γ 2 {\displaystyle \gamma _{2}} biegnącą z punktu B {\displaystyle B} do punktu A . {\displaystyle A.} Krzywe γ 1 {\displaystyle \gamma _{1}} i γ 2 {\displaystyle \gamma _{2}} tworzą razem 1-wymiarową rozmaitość różniczkową kawałkami gładką dla której prawdziwe jest Ogólne Twierdzenie Stokesa. Z dyskusji w poprzednim rozdziale dostajemy

γ 1 d f + γ 2 d f = 0 , {\displaystyle \int _{\gamma _{1}}df+\int _{\gamma _{2}}df=0,}

czyli

γ 1 d f = γ 2 d f . {\displaystyle \int _{\gamma _{1}}df=-\int _{\gamma _{2}}df.}

Zamieniając parametryzację krzywej γ 2 {\displaystyle \gamma _{2}} na przeciwną, dostajemy

γ 1 d f = γ 2 d f . {\displaystyle \int _{\gamma _{1}}df=\int _{-\gamma _{2}}df.}

Oznacza to, że całka od punktu A {\displaystyle A} do B {\displaystyle B} z d f {\displaystyle df} nie zależy od drogi całkowania.

Twierdzenie o istnieniu różniczki zupełnej

Tw. Jeżeli mamy dane wyrażenie Pfaffa postaci

i = 1 n f i ( q 1 , q 2 , , q n ) d q i , {\displaystyle \sum _{i=1}^{n}{f_{i}(q_{1},q_{2},\dots ,q_{n})dq_{i}},}

gdzie f i ( q 1 , q 2 , , q n ) , i = 1 , , n {\displaystyle f_{i}(q_{1},q_{2},\dots ,q_{n}),i=1,\dots ,n} – dane funkcje zmiennych q 1 , q 2 , , q n , {\displaystyle q_{1},q_{2},\dots ,q_{n},}

to jest ono różniczką zupełną d f {\displaystyle df} pewnej funkcji f ( q 1 , q 2 , , q n ) , {\displaystyle f(q_{1},q_{2},\dots ,q_{n}),} jeżeli dla każdego i , j {\displaystyle i,j} zachodzi:

f i ( q 1 , q 2 , , q n ) q j = f j ( q 1 , q 2 , , q n ) q i . {\displaystyle {\frac {\partial f_{i}(q_{1},q_{2},\dots ,q_{n})}{\partial q_{j}}}={\frac {\partial f_{j}(q_{1},q_{2},\dots ,q_{n})}{\partial q_{i}}}.}

Dowód:

Wychodząc z wyrażenia na różniczkę zupełną d f , {\displaystyle df,} widzimy, że funkcje f i ( q 1 , q 2 , , q n ) {\displaystyle f_{i}(q_{1},q_{2},\dots ,q_{n})} mają postacie

f i ( q 1 , q 2 , , q n ) = f ( q 1 , q 2 , , q n ) q i {\displaystyle f_{i}(q_{1},q_{2},\dots ,q_{n})={\frac {\partial f(q_{1},q_{2},\dots ,q_{n})}{\partial q_{i}}}}

i powyższy warunek na istnienie różniczki zupełnej funkcji f ( q 1 , q 2 , , q n ) {\displaystyle f(q_{1},q_{2},\dots ,q_{n})} sprowadza się do żądania, by równe były pochodne cząstkowe drugiego rzędu

2 f ( q 1 , q 2 , , q n ) q j q i = 2 f ( q 1 , q 2 , , q n ) q i q j {\displaystyle {\frac {\partial ^{2}f(q_{1},q_{2},\dots ,q_{n})}{\partial q_{j}\partial q_{i}}}={\frac {\partial ^{2}f(q_{1},q_{2},\dots ,q_{n})}{\partial q_{i}\partial q_{j}}}}

– wymóg ten jest zawsze spełniony, jeżeli istnieją powyższe pochodne, cnd.

Zobacz też

Przypisy

Bibliografia

  • Michael Spivak: Analiza matematyczna na rozmaitościach. Warszawa: Wydawnictwo Naukowe PWN, 2006.

Linki zewnętrzne

  • 1. Pochodne cząstkowe; 2. Różniczki, 2.1. Różniczka zupełna; Filip A. Wudarski na: www.fizyka.umk.pl (Materiay MMF)