3.1 Vektorraum und Funktionenraum
In der linearen Algebra wird der Begriff des reellen Vektorraums, kurz
-Vektorraum, eingeführt. Ein
-Vektorraum
ist eine Menge, deren Elemente sich addieren und mit reellen Zahlen skalieren lassen. Ein besonders einfacher
-Vektorraum ist
selbst: Je zwei reelle Zahlen lassen sich addieren und ihre Skalierung (Multiplikation) mit einer reellen Zahl ist wieder eine reelle Zahl.
Ein weiterer Vektorraum ist
. In diesem Vektorraum werden die Addition und die skalare Multiplikation definiert durch

Sowohl
als auch
sind endlich dimensionale Vektorräume. Ein Beispiel für einen Vektorraum unendlicher Dimension ist der Vektorraum
,
denn es gilt:



Die Addition entspricht also der Superposition beider Funktionen.
Vektorräume, die aus Funktionen bestehen, wie den Raum aller Polynome oder den Raum aller dreimal stetig differenzierbaren Funktionen auf dem Einheitsintervall, nennt man auch Funktionenräume.
Gegenbeispiel:
ist kein Vektorraum, also auch kein Funktionenraum, denn 
3.2 Funktionale
Auf Vektorräumen definierte reellwertige Funktionen bekommen einen speziellen Namen:
Definition 3.1: Funktional
Sei
ein
-Vektorraum und sei
. Eine Funktion
, die also jedem Vektor
eine reelle Zahl
zuordnet, heißt Funktional.
Insbesondere könnte man alle gewöhnlichen Funktionen

als Funktionale bezeichnen. Die Minimierung oder Maximierung eines solchen Funktionals fällt dann unter die Rubrik Optimierung im
, siehe Kapitel 2.
Speziell auf Funktionenräumen definierte Funktionale sind die folgenden.
Beispiel 1: Stellenfunktional
sei fest gewählt (beliebig).
ist das Stellenfunktional.
Beispiel 2: Bestimmtes Integral
![Rendered by QuickLaTeX.com V: = C\left[ {a,b} \right],\quad J:V \to \mathbb{R},\quad f \mapsto J\left( f \right) = \int_a^b {f\left( x \right)dx}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-8e71d30fa0f7590f32f36783a214080c_l3.png)
Beispiel 3: Bogenlänge
![Rendered by QuickLaTeX.com V = {C^1}\left[ {a,b} \right];\quad J:V \to \mathbb{R},\quad f \mapsto J\left( f \right) = \int_a^b {\sqrt {1+{f^\prime }{{\left( x \right)}^2}} dx}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-790917228981a65089afc2f8f3434554_l3.png)
Beispiel 4: Funktional vom Brachistochrone Problem
![Rendered by QuickLaTeX.com V = {C^1}\left( {0,a} \right];\quad D = \left\{ {y \in V:y\left( 0 \right) = 0,\:y\left( a \right) = b,\:y\left( x \right) > 0,\:\:x \in \left( {0,a} \right]} \right\}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-7283249b89f561f669f880f241cd5e86_l3.png)
ist kein Vektorraum, aber das ist auch nicht gefordert. Ein Funktional bildet eine Teilmenge eines Vektorraumes auf
ab. In diesem Fall:

3.3 Grundaufgabe der Variationsrechnung, Gâteaux-Ableitung
Die Grundaufgabe der Variationsrechnung ist die Optimierung in Vektorräumen:
Finde einen Vektor
für eine Teilmenge
des Vektorraums
, der ein gegebenes Funktional
minimiert:

In den meisten Fällen ist
ein Funktionenraum und damit das gesuchte
eine Funktion. Euler hat dieses Problem auf ein Optimierungsproblem in
zurückgeführt.
Idee:
Angenommen,
sei die bereits bekannte Lösung der Grundaufgabe der Variationsrechnung und
(
liegt nicht auf dem Rand).
Dann ist

nach Voraussetzung “
ist ein Minimum”. Daraus folgt:
ist eine univariante Funktion und hat ein Minimum in
.
(Differenzierbarkeit vorausgesetzt)
Für den hier auftretenden Differentialquotienten führen wir einen Namen ein.
Definition 3.2: Gâteaux-Ableitung
sei ein
-Vektorraum,
,
ein Funktional. Sei
und
mit
für alle
.
Dann heißt

Gâteaux-Ableitung oder 1. Variation, falls der Grenzwert existiert. Existiert in
die Gâteaux-Ableitung in alle Richtungen
, dann heißt
Gâteaux-differenzierbar in
.
Es ist äquivalent:

Die Gâteaux-Ableitung verallgemeinert den Begriff der Richtungsableitung: Für eine
-Funktion
und
ergibt sich:

Beispiel 3.3a: Gâteaux-Ableitung
Sei
.
ist (auch) Funktional.
Die Kettenregel lautet:

Damit erhalten wir:

ist die Richtungsableitung von
in Richtung
an der Stelle
.
Beispiel 3.3b: Gâteaux-Ableitung
![Rendered by QuickLaTeX.com f,g \in V = C\left[ {a,b} \right],\quad J:V \to \mathbb{R},\quad f \mapsto J\left( f \right) = \int_a^b {f\left( x \right)dx}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-2365e2ec5409a91a0e3a3a94a82e3dfe_l3.png)
![Rendered by QuickLaTeX.com \delta J\left( {f,g} \right) = {\left. {\frac{d}{{d\varepsilon }}J\left( {f+\varepsilon g} \right)} \right|_{\varepsilon = 0}} = {\left. {\frac{d}{{d\varepsilon }}\int_a^b {\left[ {f\left( x \right)+\varepsilon g\left( x \right)} \right]dx} } \right|_{\varepsilon = 0}}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-cbc2b238ac44b5fe300788f6e66a24f1_l3.png)
![Rendered by QuickLaTeX.com = \int_a^b {{{\left. {\frac{d}{{d\varepsilon }}\left[ {f\left( x \right)+\varepsilon g\left( x \right)} \right]} \right|}_{\varepsilon = 0}}dx} = \int_a^b {g\left( x \right)dx}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-0baa4b6addb623b27541359797c67756_l3.png)
Also z.B. 
Die Reihenfolge von Integration und Ableitung dürfen wir wegen folgenden Zusammenhanges tauschen. Wir definieren:

Dann ist

falls
stetig partiell differenzierbar bezüglich
ist. Man darf also immer dann unter dem Integral differenzieren, wenn die Ableitung existiert und stetig ist.
Neben der Gâteaux-Ableitung gibt es noch die sogenannte Fréchet-Ableitung, die den Begriff der totalen Ableitung verallgemeinert und auf der Idee der linearen Approximation beruht. Zur Einführung der Fréchet-Ableitung werden Normen auf Funktionenräumen benötigt. Wir kommen hier ohne Fréchet-Ableitung aus, erwähnen aber dennoch, dass aus der Fréchet-Differenzierbarkeit stets die Gâteaux-Differenzierbarkeit folgt und beide Ableitungen dann gleich sind.
3.4 Notwendige Bedingung für Extrema
Die Idee von Euler lässt sich mit Hilfe der 1. Variation folgendermaßen ausdrücken.
Satz 3.4: Notwendige Bedingung für Extrema:
Es sei
ein
-Vektorraum,
,
ein Funktional. Sei
Lösung von

Dann gilt für alle
, die zulässig sind in dem Sinne dass
für genügend kleine
:

sofern die Gâteaux-Ableitung existiert.
Bemerkungen:
- Der Satz bezeichnet eine notwendige Bedingung für ein Extremum. Umgekehrt ist also jede Lösung
der Gleichung
(für alle zulässigen
) nur Kandidat für ein Extremum, genau wie bei der Optimierung im
das Verschwinden des Gradienten noch nicht hinreichend für ein Extremum ist. - Bei der Optimierung im
lassen sich Aussagen für Extrema mit Hilfe der Hesse-Matrix machen. Dies ist nun anders: Zwar gibt es auch eine 2. Variation
,doch sind selbst die beiden Bedingungen

noch nicht hinreichend für ein lokales Minimum.
- Es gibt dennoch auch hinreichende Bedingungen für Extrema von Funktionalen. Wir gehen später darauf ein.
3.5 Variationsaufgabe mit festen Endpunkten, Lagrange-Funktion
Die notwendigen Bedingungen aus dem letzten Kapitel geben ein Prinzip vor, wie man bei der Optimierung in Funktionenräumen vorgehen könnte, nämlich zuerst die Gleichung

nach
lösen und dann weiter untersuchen, welche der Lösungen tatsächlich Extrema sind. Aber mit der abstrakten Formulierung des Satzes zu notwendigen Bedingungen für Extrema lässt sich noch nicht rechnen. Dazu brauchen wir eine konkretere Problemstellung. Die Grundaufgabe der Variationsrechnung muss spezialisiert werden.
Erste Spezialisierung: Variationsaufgabe mit festen Randpunkten
Ausgehend vom Problem der Brachistochrone geben wir uns jetzt die folgende konkrete Problemstellung vor.
Aufgabe (A): Variationsaufgabe mit festen Endpunkten
Es seien
![Rendered by QuickLaTeX.com \left( {{t_0},{y_0}} \right),\left( {{t_1},{y_1}} \right) \in {\mathbb{R}^2},\quad {t_0} < {t_1},\quad D = \left\{ {y \in {C^2}\left[ {{t_0},{t_1}} \right]:y\left( {{t_0}} \right) = {y_0},y\left( {{t_1}} \right) = {y_1}} \right\}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-254ea12e6f3b025fd1faf1b491b98281_l3.png)
sei zweimal stetig partiell differenzierbar. Dann ist das folgende Problem zu lösen:

Dabei heißt
Lagrange-Funktion, die Aufgabe heißt Variationsaufgabe mit festen Randpunkten.
Viele Aufgaben können in diese Form gebracht werden, z.B. hatten wir schon das Brachistochrone-Problem mit

3.6 Herleitung der Euler-Lagrange-Gleichung
Wir wollen nun für das zu minimierende Funktional die Gâteaux-Ableitung in einem Extremum
berechnen. Damit alle Vergleichsfunktionen
zulässig, also Elemente von
sind, setzen wir
und
voraus.


Wenn die Funktion nach
stetig differenzierbar ist, dürfen wir unter dem Integral differenzieren. Hierbei müssen wir die Kettenregel beachten:

In diesem Fall haben wir:


Hierbei haben wir eine mathematisch bedenkliche, aber bequeme und allgemein übliche Schreibweise gewählt:
bedeutet, dass die Funktion nach der dritten Variable abgeleitet wird, beziehungsweise genauer: Nach der Variable, an deren Stelle
eingetragen wird.
Einsetzen:



![Rendered by QuickLaTeX.com = \int_{{t_0}}^{{t_1}} {\left[ {{L_y}\left( {t,y,\dot y} \right)v+{L_{\dot y}}\left( {t,y,\dot y} \right)\dot v} \right]dt}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-c803da72cd6757204571d830e3cea1ac_l3.png)
Nebenrechnung partielle Integration:
![Rendered by QuickLaTeX.com \int_{{t_0}}^{{t_1}} {{L_{\dot y}}\dot vdt} = \left[ {{L_{\dot y}}v} \right]_{t = {t_0}}^{t = {t_1}}-\int_{{t_0}}^{{t_1}} {\frac{d}{{dt}}\left( {{L_{\dot y}}} \right)v\left( t \right)dt}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-59d91f677d6216f8a220e2596278df05_l3.png)
Dabei ist:


Einsetzen liefert:
![Rendered by QuickLaTeX.com \delta J\left( {\hat y,v} \right) = \int_{{t_0}}^{{t_1}} {\left[ {{L_y}v+{L_{\dot y}}\dot v} \right]dt} = \int_{{t_0}}^{{t_1}} {{L_y}\left( {t,\hat y\left( t \right),\dot \hat y\left( t \right)} \right)v\left( t \right)+{L_{\hat y}}\left( {t,\hat y\left( t \right),\dot \hat y\left( t \right)} \right)\dot v\left( t \right)dt}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-9ef54f0499fd67f1c854adc09e266c8a_l3.png)
![Rendered by QuickLaTeX.com = \left[ {{L_{\dot y}}v} \right]_{{t_0}}^{{t_1}}+\int_{{t_0}}^{{t_1}} {\left[ {{L_y}-\frac{d}{{dt}}\left( {{L_{\dot y}}} \right)} \right]vdt} = \left[ {{L_{\dot y}}v} \right]_{{t_0}}^{{t_1}}+\int_{{t_0}}^{{t_1}} {\left[ {{L_y}-\left( {{L_{\dot yt}} \cdot 1+{L_{\dot yy}}\dot y+{L_{\dot y\dot y}}\ddot y} \right)} \right]vdt} \mathop = \limits^! 0](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-f93e28fdd3632a4cad605e88a3b2c85a_l3.png)
Wir haben jetzt also folgende Situation:
![Rendered by QuickLaTeX.com \delta J\left( {\hat y,v} \right) = \left[ {{L_{\dot y}}v} \right]_{{t_0}}^{{t_1}}+\int_{{t_0}}^{{t_1}} {\left( {{L_y}-\frac{d}{{dt}}{L_{\dot y}}} \right)vdt} \mathop = \limits^! 0](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-5c9a983c5f58f743bc3991c00791d824_l3.png)
![Rendered by QuickLaTeX.com \left( {{t_0},{y_0}} \right),\left( {t,y} \right) \in {\mathbb{R}^2},\quad {t_0} < t,\quad D = \left\{ {y \in {C^2}\left[ {{t_0},t} \right]:y\left( {{t_0}} \right) = {y_0},y\left( {{t_1}} \right) = {y_1}} \right\}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-17ba8f464da77d0274f1634d21446a39_l3.png)
![Rendered by QuickLaTeX.com y \in D,\quad y+\varepsilon v\mathop \in \limits^! D\quad \Rightarrow \quad v \in {C^2}\left[ {{t_0},{t_1}} \right],\quad v\left( {{t_0}} \right) = 0 = v\left( {{t_1}} \right)](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-9ab82aac624a648b95d75dcc2dc1a32e_l3.png)
Aus der letzten Bedingung folgt:
![Rendered by QuickLaTeX.com v\left( {{t_0}} \right) = 0 = v\left( {{t_1}} \right)\quad \Rightarrow \quad \left[ {{L_{\dot y}}v} \right]_{{t_0}}^{{t_1}} = 0](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-bbf1f6ea3ffea697b60cd24478ea5f1c_l3.png)

Wir benötigen nun folgenden Hilfssatz 3.5:
Sei
und für alle
mit
sei
. Dann ist
für
.
Beweis: Dieser Hilfssatz folgt aus dem Fundamentallemma der Variationsrechnung. Gäbe es ein
mit
, also etwa mit
, dann wäre wegen der Stetigkeit
für eine ganze Umgebung
. Dann ließe sich eine
-Funktion
konstruieren, die für
positiv und sonst 0 ist. Damit wäre

und das stünde im Widerspruch zur Voraussetzung.
Wendet man diesen Hilfssatz auf die Aussage

an, so ergibt sich folgendes Resultat.
Satz 3.6: Euler-Lagrange-Differentialgleichungen
Es seien die Voraussetzungen der Variationsaufgabe (A) erfüllt. Eine Lösung
von (5) erfüllt dann die Gleichung


Diese Gleichung haben wir auch in der höheren technischen Mechanik als die Bewegungsgleichung nach Lagrange kennengelernt. Es handelt sich um eine gewöhnliche (implizite) Differentialgleichung 2. Ordnung für das gesuchte
. Wenn
, kann man nach
auflösen und erhält eine explizite Differentialgleichung. Jede Lösung heißt Extremale. Der Begriff Extremale ist also nicht zu verwechseln mit dem Extremum: Jede Extremale ist nur ein Kandidat für eine Extremstelle.
Wir erhalten damit einen Lösungsansatz für Variationsaufgaben:
- Versuche, die Euler-Lagrange-Gleichung zu lösen
- Lösung soll vorgegebene Randwerte annehmen
3.7 Anwendungsbeispiele für die Euler-Lagrange-Gleichung





Die allgemeine Lösung hat zwei unbekannte Parameter.
Zwei unabhängige Lösungen sind
und
. Damit ist auch jede Linearkombination Lösung. Wir erhalten

Allgemeine Lösung mit Randbedingungen
und
:

Wir haben bisher angenommen, dass die Funktion
ist. Dies ist eine ziemlich starke Voraussetzung, die oft nicht so gegeben ist. Folgenden Satz für nur einfach differenzierbare Funktionen werden wir nicht beweisen, da dies mit größerem Aufwand verbunden ist.
Satz 3.7: Euler-Gleichung für nur einfach differenzierbare Funktionen
Es sei für
mit 
.
Die Funktion
sei stetig auf einer offenen Menge
, die alle
enthält und auf
bezüglich der zweiten und der dritten Variable stetig differenzierbar. Dann muss jede Lösung des Problems

notwendig die Euler-Gleichung

erfüllen.
Für den Beweis siehe: Leitmann, The Calculus of Variations and Optimal Control, Plenum Press, 1986
Hier werden geringere Stetigkeitsvoraussetzungen als im ursprünglichen Problem (Satz 3.6) gemacht. Wenn eine Lösung
der Variationsaufgabe mit festen Randpunkten (5) existiert, so kommt durch die Euler-Gleichung zum Ausdruck, dass die Funktion
stetig differenzierbar ist. Wegen der fehlenden Stetigkeitsvoraussetzungen an
lässt sich
aber nicht mehr wie in (9) ausdifferenzieren und deswegen ist hier die Euler-Gleichung keine Differentialgleichung für
.
Es gibt sogar Varianten, die nur noch stückweise stetige Differenzierbarkeit voraussetzen und damit Funktionen mit Knicken zulassen. Das ist nicht nur mathematische Spielerei, sondern wichtig in der Optimalsteuerung, wenn Steuerungsfunktionen an den Rand des zulässigen Bereichs kommen.
Wir kommen in Abschnitt 7 nochmals auf diese Erweiterungen zurück, bringen zunächst aber ein weiteres Beispiel.
Beispiel 3.8: Kürzeste Strecke
Es seien
mit
und
.
Gesucht wird ein
, das die Bogenlänge

minimiert. Gesucht ist also die kürzeste Strecke zwischen zwei Punkten. Die Lagrange-Funktion
hängt in diesem Fall nicht explizit von
und auch nicht explizit von
ab. Insbesondere ist:
.
Euler-Lagrange-Gleichung:

Eine Funktion, deren Ableitung gleich 0 ist, muss konstant sein:




Eine Funktion, deren Ableitung konstant ist, muss linear sein. Lösungen der Euler-Lagrange-Gleichung sind also Geraden. Da Anfangs- und Endpunkt fest sind, gibt es nur eine einzige Gerade, die die Randbedingungen erfüllt. Als kürzeste Strecke kommt also nur diese Gerade in Frage:

Dass diese Gerade tatsächlich die kürzeste Verbindung zwischen den beiden angegebenen Punkten ist, folgt formal aus der Konvexität der Optimierungsaufgabe. Darauf gehen wir aber erst in Abschnitt 5 ein.
3.8 Brachistochrone-Problem
Im Prinzip gleich, wenn auch mit deutlich mehr Anstrengung als bei den letzten beiden Beispielen, können wir jetzt das Problem der Brachistochrone angehen.
Um Satz 3.5 anwenden zu können, fassen wir für gegebene Werte
und
die Menge
![Rendered by QuickLaTeX.com D: = \left\{ {y \in {C^1}\left[ {0,a} \right]:\:y\left( 0 \right) = 0,\:\:y\left( a \right) = b} \right\}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-aa1688beef1328e4add6e8f16b09d202_l3.png)
ins Auge und suchen dort ein Minimum von

Den bei der Optimierung unwichtigen Term
haben wir weggelassen. In der Einleitung hatten wir die Integrationsvariable
genannt. Wir hätten also eigentlich:


Damit wir die vorher besprochenen Definitionen nicht ändern müssen, nennen wir die Integrationsvariable hier aber einfach
.
Hier steht gleich zu Anfang die Schwierigkeit ins Haus, dass der Integrand wegen der Forderung
eine Singularität aufweist. Das macht eine mathematisch saubere Herangehensweise an das Brachistochrone-Problem schwierig. In der Tat besitzt das Problem auf der Menge
gar keine Lösung – vielmehr darf man im Punkt 0 lediglich Stetigkeit und keine stetige Differenzierbarkeit fordern. Die Kandidatenmenge für die Suche nach einem Optimum ist auf
![Rendered by QuickLaTeX.com \left\{ {y \in {C^1}\left( {0,a} \right]:\:\:y\left( 0 \right) = 0,\:\:y\left( a \right) = b,\:\:y\left( t \right) > 0\:\:\forall 0 < t \leq a} \right\}](http://me-lrt.de/wp-content/ql-cache/quicklatex.com-7f6e0897e88294f40c22ebd680ac06e8_l3.png)
einzuschränken. Für eine mathematisch korrekte Behandlung des Problems verweisen wir auf [Ko]. An dieser Stelle rechnen wir “einfach drauf los”.
Die Lagrange-Funktion
hängt hier nicht explizit von
ab und wir bekommen mit der Euler-Lagrange-Gleichung die autonome Differentialgleichung
.
Zur Lösung wenden wir den folgenden Trick an: Wir multiplizieren die DGL mit
und erhalten

Probe:



Die Rechnung ist gerechtfertigt, wenn
eine
-Funktion und
genügend oft stetig partiell differenzierbar ist. Durch die Multiplikation mit
können “Pseudolösungen” hinzukommen. Zwar folgt (11) immer aus (10), aber umgekehrt folgt (10) aus (11) nur, wenn nicht
auf einem t-Intervall ist. Stückweise konstante Funktionen muss man also von einer Lösung von (11) ausschließen.
Somit bekommen wir:




für eine Konstante
. Multiplikation mit
bringt:





Das ist eine sogenannte separierte DGL (oder DGL mit getrennten Variablen). Solche DGL haben generell die Form

Seien
und
zwei Stammfunktionen. Dann gilt:


Als Merkregel kann man die mathematisch bedenkliche Schreibweise wählen:

Lösung:

Dieses Prinzip wenden wir nun auf unser Problem an. Wir bekommen eine Lösung
mit
in der impliziten Form:

Also brauchen wir eine Stammfunktion
für den Integranden auf der linken Seite. Dafür machen wir die Substitution
.
Es folgt

und
.
Daraus folgt für ein
:




wobei
so zu wählen ist, dass
. Speziell bekommen wir für
aus (12)
die Lösung in einer nach
parametrisierten Form:

Probe:







Die parametrisierte Form ist also korrekt.
Die resultierende Kurve ist als Zykloidenbogen bekannt:

Der Parameter
ist so zu bestimmen, dass der gewünschte Endpunkt erreicht wird. Das ist immer möglich, wenn es für jedes
und
Werte
und
gibt, so dass die Gleichungen (13) erfüllt sind. Dazu kann man zunächst den Quotienten
anschauen, der die Form

haben müsste. Tatsächlich lässt sich nachrechnen, dass
eine monoton fallende Funktion ist mit Grenzwerten
und
.
Somit lässt sich ein eindeutiges
angeben mit
. Anschließend braucht nur noch
so eingestellt werden, dass (13) passt.
Trotz der etwas langwierigen Rechnung haben wir jetzt das Problem der Brachistochrone immer noch nicht gelöst. Es ist nämlich noch nachzuweisen, dass die gefundene Extremale wirklich Lösung des Problems ist und nicht nur ein Kandidat dafür. Darauf kommen wir in Abschnitt 5 zurück.


