Gâteaux-Differential

Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Angaben ohne ausreichenden Beleg könnten demnächst entfernt werden. Bitte hilf Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst.

Das Gâteaux-Differential, benannt nach René Gâteaux (1889–1914), stellt eine Verallgemeinerung des gewöhnlichen Differentiationsbegriffes dar, indem es die Richtungsableitung auch in unendlichdimensionalen Räumen definiert. Gewöhnlich hat man für eine Funktion f : G R ,   G R n {\displaystyle f\colon G\to \mathbb {R} ,\ G\subset \mathbb {R} ^{n}} offene Menge, die an der Stelle x 0 G {\displaystyle x_{0}\in G} differenzierbar ist, als Definition der partiellen Ableitung

f x i ( x 0 ) = lim h 0 f ( x 0 , 1 , x 0 , 2 , , x 0 , i + h , , x 0 , n ) f ( x 0 ) h ,     ( i = 1 , 2 , . . . , n ) {\displaystyle {\frac {\partial f}{\partial x_{i}}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0,1},x_{0,2},\ldots ,x_{0,i}+h,\ldots ,x_{0,n})-f(x_{0})}{h}},\ \ (i={1,2,...,n})} .

Insbesondere ergibt sich für n = 1 {\displaystyle n=1} das bekannte Differential

d f d x ( x 0 ) = lim h 0 f ( x 0 + h ) f ( x 0 ) h {\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})=\lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})}{h}}} .

Das Gâteaux-Differential verallgemeinert diese Konzepte auf unendlichdimensionale Vektorräume.

Definitionen

Weierstraßsche Zerlegungsformel

Sei f : D X Y {\displaystyle f\colon D\subset X\to Y} mit D {\displaystyle D} offen und X , Y {\displaystyle X,Y} normierte Räume. Dann heißt f {\displaystyle f} in x 0 D {\displaystyle x_{0}\in D} Gâteaux-differenzierbar, falls die weierstraßsche Zerlegungsformel gilt, also falls eine lineare Funktion A L ( X , Y ) {\displaystyle A\in L(X,Y)} existiert, sodass

lim t 0 1 t [ f ( x 0 + t h ) f ( x 0 ) t A h ] = 0 {\displaystyle \lim _{t\rightarrow 0}{\frac {1}{t}}[f(x_{0}+th)-f(x_{0})-tAh]=0}

für alle h X {\displaystyle h\in X} mit h = 1 {\displaystyle \lVert h\rVert =1} . Dies ist äquivalent zu

f ( x 0 + t h ) f ( x 0 ) = t A h + o ( | t | ) {\displaystyle f(x_{0}+th)-f(x_{0})=tAh+o(|t|)} .

Dann bezeichnet man A =: f ( x 0 ) {\displaystyle A=:f'(x_{0})} als die Gâteaux-Ableitung von f {\displaystyle f} im Punkt x 0 {\displaystyle x_{0}} .

1. Variation; Variationsableitung

Hauptartikel: Erste Variation

Sei nun für das Gâteaux-Differential folgende Situation gegeben: Es sei wie üblich f : D ( f ) R {\displaystyle f\colon D(f)\to \mathbb {R} } ein in D ( f ) Ω {\displaystyle D(f)\subseteq \Omega } definiertes Funktional; Ω {\displaystyle \Omega } sei ein linearer normierter Raum (das heißt ein Vektorraum, versehen mit einer Norm {\displaystyle \|\cdot \|} ) oder ein allgemeinerer topologischer Vektorraum mit Voraussetzungen, über die man sich im konkreten Anwendungsfall nähere Gedanken machen muss; ferner sei x 0 D ( f ) {\displaystyle x_{0}\in D(f)} und v Ω {\displaystyle v\in \Omega } . Dann ist das Gâteaux-Differential an der Stelle x 0 {\displaystyle x_{0}} in Richtung v {\displaystyle v} , falls es existiert, definiert durch die folgende Ableitung nach ε {\displaystyle \varepsilon } :

δ f ( x 0 , v ) = lim ε 0 f ( x 0 + ε v ) f ( x 0 ) ε = d f ( x 0 + ε v ) d ε | ε = 0 {\displaystyle \delta f(x_{0},v)=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}=\left.{\frac {\mathrm {d} f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon }}\right|_{\varepsilon =0}}

oder auch für x 1 D ( f ) {\displaystyle x_{1}\in D(f)} durch

δ f ( x 0 , x 1 x 0 ) = lim ε 0 f ( x 0 + ε ( x 1 x 0 ) ) f ( x 0 ) ε . {\displaystyle \delta f(x_{0},x_{1}-x_{0})=\lim _{\varepsilon \to 0}{\frac {f(x_{0}+\varepsilon \cdot (x_{1}-x_{0}))-f(x_{0})}{\varepsilon }}\,.\,}

Man beachte dabei x 0 D ( f ) {\displaystyle x_{0}\in D(f)} , v Ω {\displaystyle v\in \Omega } und ebenfalls x 1 x 0 {\displaystyle x_{1}-x_{0}} darin, aber ε R {\displaystyle \varepsilon \in \mathbb {R} } .

Die Gâteaux-Ableitung nach ε {\displaystyle \varepsilon } ist bezüglich der Größe h := x 1 x 0 {\displaystyle h:=x_{1}-x_{0}} ein Funktional, das auch als 1. Variation von f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} bezeichnet wird.

Eine andere Möglichkeit ist, anstelle normierter Vektorräume allgemeinere topologische Vektorräume mit entsprechendem Konvergenzbegriff zu benutzen. Vor allem in Physikbüchern werden Funktionale üblicherweise mit dem Buchstaben I {\displaystyle I} bezeichnet, und statt der Größe h := x 1 x 0 {\displaystyle h:=x_{1}-x_{0}} schreibt man meist δ q ( x ) {\displaystyle \delta q(x)} , mit distributionswertigen Größen. Statt der Ableitung d I ( x + ε h ) d ε | ε = 0 {\displaystyle {\tfrac {dI(x+\varepsilon \cdot h)}{d\varepsilon }}_{\,|\varepsilon =0}} führt man in einem Zusatzschritt die Variationsableitung ein, die eng mit der Gâteaux-Ableitung zusammenhängt.

Beispiel

Für

f ( ε ) := d t L ( t , q ( t ) + ε δ q ( t ) , q ˙ ( t ) + ε d ( δ q ( t ) ) d t ) {\displaystyle f(\varepsilon ):=\int \,{\rm {d}}t\,{\mathcal {L}}\left(t,q(t)+\varepsilon \cdot \delta q(t),{\dot {q}}(t)+\varepsilon \cdot {\frac {{\rm {d}}(\delta q(t))}{{\rm {d}}t}}\right)}

erhält man nach einer partiellen Integration mit verschwindendem ausintegrierten Teil ein Resultat der Form d f d ε ( ε 0 ) = d t δ L δ q ( t ) δ q ( t ) {\displaystyle \textstyle {\frac {{\rm {d}}f}{{\rm {d}}\varepsilon }}(\varepsilon \to 0)\,=\,\int \,{\rm {d}}t\,{\frac {\delta {\mathcal {L}}}{\delta q(t)}}\cdot \delta q(t)} mit der Variationsableitung

δ L δ q ( t ) L q ( t ) d d t L q ˙ ( t ) . {\displaystyle {\frac {\delta {\mathcal {L}}}{\delta q(t)}}\equiv {\frac {\partial {\mathcal {L}}}{\partial q(t)}}-{\frac {\rm {d}}{{\rm {d}}t}}{\frac {\partial {\mathcal {L}}}{\partial {\dot {q}}(t)}}\,.}

(Die Variationsableitung "an der Stelle q(t)" bei kontinuierlichen Variablen ist also die Verallgemeinerung der partiellen Ableitung L x i {\displaystyle {\tfrac {\partial {\mathcal {L}}}{\partial x_{i}}}} einer Funktion von n Variablen, also zum Beispiel für den fiktiven Fall L = L ( x 1 , . . . , x n ) {\displaystyle {\mathcal {L}}={\mathcal {L}}(x_{1},...,x_{n})} . So ähnlich wie im fiktiven Fall das totale Differential einer Funktion von n Variablen, so hat auch hier δ f {\displaystyle \delta f} , das totale Differential des Funktionals, invariante Bedeutung. Weitere Einzelheiten im Kapitel Lagrange-Formalismus.)

Im Folgenden wird wegen der Einfachheit auf die Kennung der Vektoren durch „fett geschriebene“ Buchstaben verzichtet.

2. Variation

δ 2 f ( x 0 , v ) = d 2 f ( x 0 + ε v ) d ε 2 | ε = 0 {\displaystyle \delta ^{2}f(x_{0},v)=\left.{\frac {\mathrm {d} ^{2}f(x_{0}+\varepsilon \cdot v)}{\mathrm {d} \varepsilon ^{2}}}\right|_{\varepsilon =0}}

Halbseitiges Differential und Richtungsableitung

Unter denselben Voraussetzungen wie oben ist das einseitige Gâteaux-Differential durch

δ + f ( x 0 , v ) = lim ε 0 + f ( x 0 + ε v ) f ( x 0 ) ε {\displaystyle \delta _{+}f(x_{0},v)=\lim _{\varepsilon \to 0^{+}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}

beziehungsweise durch

δ f ( x 0 , v ) = lim ε 0 f ( x 0 + ε v ) f ( x 0 ) ε {\displaystyle \delta _{-}f(x_{0},v)=\lim _{\varepsilon \to 0^{-}}{\frac {f(x_{0}+\varepsilon \cdot v)-f(x_{0})}{\varepsilon }}}

definiert. Das einseitige Gâteaux-Differential wird auch Richtungsdifferential von f {\displaystyle f} an der Stelle x 0 {\displaystyle x_{0}} genannt. Für die zum Vektor v {\displaystyle v} gehörende Richtung verallgemeinert nämlich bei „kontinuierlichen Variablen“ das einseitige Gâteaux-Differential (genauer: die zugehörige Variationsableitung) gerade die Richtungsableitung von f {\displaystyle f} in Richtung v {\displaystyle v} an der Stelle x 0 {\displaystyle x_{0}} .

Gâteaux-Ableitung

Ist δ f ( x 0 , v ) {\displaystyle \delta f(x_{0},v)} ein in v {\displaystyle v} stetiges lineares Funktional (d. h. die Funktion vermittelt durch v δ f ( x 0 , v ) {\displaystyle v\mapsto \delta f(x_{0},v)} ist homogen, additiv und stetig im Argument v {\displaystyle v} ), dann heißt f ( x 0 ) {\displaystyle f'(x_{0})} Gâteaux-Ableitung an der Stelle x 0 {\displaystyle x_{0}} und f {\displaystyle f} Gâteaux-differenzierbar in x 0 {\displaystyle x_{0}} .

Eigenschaften der 1. Variation

  • Das Gâteaux-Differential ist homogen, das bedeutet

    δ f ( x 0 , k v ) = k δ f ( x 0 , v ) {\displaystyle \delta f(x_{0},k\cdot v)=k\cdot \delta f(x_{0},v)}

    für alle k R {\displaystyle k\in \mathbb {R} } . Die Eigenschaft gilt analog für das einseitige Gâteaux-Differential.
  • Das Gâteaux-Differential ist eine lineare Operation, es gilt also

    δ ( f 1 + f 2 ) ( x 0 , v ) = δ f 1 ( x 0 , v ) + δ f 2 ( x 0 , v ) . {\displaystyle \delta (f_{1}+f_{2})(x_{0},v)=\delta f_{1}(x_{0},v)+\delta f_{2}(x_{0},v).}

    und

    k δ f ( x 0 , v ) = δ ( k f ) ( x 0 , v ) . {\displaystyle k\cdot \delta f(x_{0},v)=\delta (k\cdot f)(x_{0},v).}

    für alle k R {\displaystyle k\in \mathbb {R} }

Beispiele

  1. f ( x 1 , x 2 ) = 1 {\displaystyle f(x_{1},x_{2})=1} , falls x 2 = x 1 2 {\displaystyle x_{2}=x_{1}^{2}} , x 1 0 {\displaystyle x_{1}\neq 0} bzw. 0 {\displaystyle 0} sonst δ f ( ( 0 , 0 ) , v ) = lim t 0 0 0 t = 0 {\displaystyle \delta f((0,0),v)=\lim _{t\to 0}{\frac {0-0}{t}}=0} .
  2. f ( x ) = | x | ,   x R n {\displaystyle f(x)=|x|,\ x\in \mathbb {R} ^{n}} δ + f ( 0 , v ) = lim ε 0 + | 0 + ε v | 0 ε = | v | {\displaystyle \delta _{+}f(0,v)=\lim _{\varepsilon \to 0^{+}}{\frac {|0+\varepsilon \cdot v|-0}{\varepsilon }}=|v|}
  3. f ( x 1 , x 2 ) = x 1 2 ( 1 + 1 x 2 ) {\displaystyle f(x_{1},x_{2})=x_{1}^{2}\left(1+{\frac {1}{x_{2}}}\right)} für x 2 0 {\displaystyle x_{2}\neq 0} und x 1 2 x 2 2 {\displaystyle -{\frac {x_{1}^{2}}{x_{2}^{2}}}} für x 2 = 0 {\displaystyle x_{2}=0} , f ( x 1 , x 2 ) = ( 2 x 1 ( 1 + 1 x 2 ) , x 1 2 x 2 2 ) T {\displaystyle \nabla f(x_{1},x_{2})=\left(2\cdot x_{1}\cdot \left(1+{\frac {1}{x_{2}}}\right),-{\frac {x_{1}^{2}}{x_{2}^{2}}}\right)^{T}}

δ f ( ( 0 , 0 ) , v ) = lim ε 0 ( ε v 1 ) 2 ( 1 + 1 ε v 2 ) ε = v 1 2 v 2 {\displaystyle \delta f((0,0),v)=\lim _{\varepsilon \to 0}{\frac {(\varepsilon \cdot v_{1})^{2}\cdot \left(1+{\frac {1}{\varepsilon \cdot v_{2}}}\right)}{\varepsilon }}={\frac {v_{1}^{2}}{v_{2}}}} (wobei v = ( v 1 , v 2 ) T {\displaystyle v=(v_{1},v_{2})^{T}} )

Anwendungen

Wie die gewöhnliche Ableitung ist das Gâteaux-Differential zum Bestimmen von Extrema und daher in der Optimierung von Nutzen. Sei f : X R ,   X D ( f ) Ω {\displaystyle f\colon X\to \mathbb {R} ,\ X\subset D(f)\subset \Omega } offen, Ω {\displaystyle \Omega } linearer normierter Raum, x 0 int ( X ) {\displaystyle x_{0}\in \operatorname {int} (X)} (das Innere der Menge X {\displaystyle X} ), int ( X ) {\displaystyle \operatorname {int} (X)\neq \emptyset } und B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} der offene Ball um x 0 {\displaystyle x_{0}} mit Radius ε {\displaystyle \varepsilon } . Notwendige Optimalitätsbedingung: Sei x 0 {\displaystyle x_{0}} ein lokales Minimum von f {\displaystyle f} auf X {\displaystyle X} , dann ist δ + f ( x 0 , v ) 0   v Ω {\displaystyle \delta _{+}f(x_{0},v)\geq 0\ \forall v\in \Omega } , falls das einseitige Gâteaux-Differential in x 0 {\displaystyle x_{0}} existiert. Hinreichende Optimalitätsbedingung: f {\displaystyle f} besitze in B ε ( x 0 ) {\displaystyle B_{\varepsilon }(x_{0})} eine 2. Variation v Ω {\displaystyle \forall v\in \Omega } und x B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} . Falls gilt δ f ( x 0 , v ) = 0   v Ω {\displaystyle \delta f(x_{0},v)=0\ \forall v\in \Omega } und für ein c > 0 {\displaystyle c>0} δ 2 f ( x 0 , v ) c v 2   v Ω {\displaystyle \delta ^{2}f(x_{0},v)\geq c\cdot \|v\|^{2}\ \forall v\in \Omega } und x B ε ( x 0 ) {\displaystyle \forall x\in B_{\varepsilon }(x_{0})} , dann ist x 0 {\displaystyle x_{0}} strenge lokale Minimalstelle von f {\displaystyle f} auf int ( X ) {\displaystyle \operatorname {int} (X)} .

Siehe auch