Satz (implizite Funktion)
Sei \(r > 0\) ein Radius und seien \(x_0 \in \mathbb{R}^n\), \(y_0 \in \mathbb{R}^m\) Punkte. Wir betrachten die offene Teilmenge
\[B_r^{\mathbb{R}^n} (x_0) \times B_r^{\mathbb{R}^m} (y_0) = {(x,y) \in \mathbb{R}^n \times \mathbb{R}^m :|: ||x-x_0||_2 < r : \text{und} : ||y-y_0||_2 < r }\]von \(\mathbb{R}^n \times \mathbb{R}^m\). Sei \(F: B_r^{\mathbb{R}^n} (x_0) \times B_r^{\mathbb{R}^m} (y_0) \mapsto \mathbb{R}^m\) eine stetige Funktion, die die folgenden drei Bedingungen erfüllt:
- \(F(x_0,y_0) = 0.\)
- Die partiellen Ableitungen \({\partial_y}_k F : B_r^{\mathbb{R}^n} (x_0) \times B_r^{\mathbb{R}^m} (y_0) \mapsto \mathbb{R}^m\) existieren für alle \(k \in \{1,...,m\}\) und sind auf \(B_r^{\mathbb{R}^n} (x_0) \times B_r^{\mathbb{R}^m} (y_0)\) stetig.
- Die totale Ableitung A bei \(y_0\) der Abbildung \(y \in B_r (y_0) \mapsto F(x_0,y)\) ist invertierbar, das heisst, die Matrix \(A = ({\partial_y}_k F_j (x_0,y_0))_{j,k} \in \text{Mat}_{m,m} (\mathbb{R})\) hat nicht-verschwindende Determinante.
Dann existiert ein offener Ball \(U_0 = B_\alpha(x_0)\) um \(x_0\) und ein offener Ball \(V_0 = B_\beta (y_0)\) um \(y_0\) mit \(\alpha, \beta \in (0,r)\) und eine stetige Funktion \(f: U_0 \mapsto V_0\), so dass alle \((x,y) \in U_0 \times V_0\) die Gleichung \(F(x,y) = 0\) genau dann gilt, wenn \(y = f(x)\) gilt. Insbesondere ist \(f(x_0) = y_0.\)
Beweis (implizite Funktion)
Da wir zu einem jeweils fest gewählten \(x\) ein \(y\) mit \(F(x,y) = 0\) suchen wollen, wird die Notation \(F_x(y) = F(x,y)\) für \((x,y) \in B_r (x_0) \times B_r (y_0)\) nützlich sein. Wir verwenden diese bereits, um für ein festes \(x \in B_r (x_0)\) die Hilfsfunktion
\[T_x : y \in B_r(y_0) \mapsto y-A^{-1} F_x(y) \in \mathbb{R}^m\]zu definieren. Diese entspricht gerade der Iterationsvorschrift im Newton-Verfahren, wobei wir allerdings die Ableitung von \(F_x\) bei \(y\) schlicht durch \(A = {D_y}_0 {F_x}_0\) ersetzt haben. Trotz dieser Änderung bemerken wir, dass für \((x,y) \in B_r(x_0) \times B_r(y_0)\) die Gleichung \(F(x,y) = 0\) zur Fixpunktgleichung \(T_x(y) = y\) äquivalent ist.
Die Abbildung \(T_x\) als Lipschitz-Kontraktion: Sei \(x \in B_r(x_0).\) Nach Annahme ist \(F_x\) auf \(B_r(y_0)\) eine stetig differenzierbare Funktion, womit nach der Kettenregel \(T_x\) ebenso stetig differenzierbar ist mit Ableitung
\[D_yT_x = I_m - A^{-1} (A-D_yF_x)\]für \(y \in B_r(y_0)\), wobei \(I_m \in \text{Mat}_{m,m} (\mathbb{R})\) die Identitätsmatrix bezeichnet. Für \(x = x_0\) und \(y = y_0\) ergibt sich damit
\[D_{y_0} T_{x_0} = A^{-1}(A-D_{y_0} T_{x_0}) = 0.\]Aufgrund der angenommenen Stetigkeit von \((x,y) \in B_r(x_0) \times B_r(y_0) \mapsto D_yF_x\) existiert also ein \(\delta \in (0,r)\), sodass für alle \((x,y) \in B_\delta(x_0) \times B_\delta(y_0)\) die Abschätzung \(||D_yF_x||_{op} \leq \frac{1}{2}\) gilt. Wir, zeigen, dass dies die Lipschitz-Kontraktionseigenschaft impliziert. In der Tat folgt für \(x \in B_\delta (x_0)\) und \(y_1,y_2 \in B_\delta (y_0)\) mit Hilfe des geraden Weges \(\gamma : t \in [0,1] \mapsto (1-t)y_1+ty_2\) von \(y_1\) nach \(y_2\)
\[||T_x(y_1)-T_x(y_2)|| = ||T_x \circ \gamma(1)-T_x \circ \gamma(0)|| = \Bigg|\Bigg|\int_0^1 (T_x \circ \gamma)'(t) dt \Bigg|\Bigg|\] \[\leq \int_0^1 ||D_{\gamma(t)}T_x(y_2-y_1)|| dt \leq \int_0^1|| D_{\gamma(t)}T_x||_{\text{op}}||(y_2-y_1)||dt \leq \frac{1}{2}||y_2-y_1||.\]Sei nun \(\beta = \frac{\delta}{2}\), \(V_0 = B_\beta (y_0)\) und \(Y = \overline{B_\beta(y_0)}.\) Wir erhalten also, dass für jedes fest gewählte \(x \in B_\delta(x_0)\) die eingeschränkte Abbildung
\[T_x: Y \mapsto \mathbb{R}^m, \:\:\:y \mapsto T_x(y) =y -A^{-1} F_x(y),\]die eine Lipschitz-Kontraktion mit Lipschitz-Konstante \(\frac{1}{2}\) ist. Um den Banachschen Fixpunktsatz anweden zu können, müssen wir noch \(T_x(Y) \subseteq Y\) zeigen. Nach Stetigkeit von \(F\) und wegen \(F(x_0,y_0) = 0\) existiert ein \(\alpha \in (0,\delta)\), sodass für alle \(x \in \overline{B_\alpha(x_0)}\) die Abschätzung
\[||T_x(y_0)-y_0||=||A^{-1} F(x,y_0)|| < \frac{\beta}{3}\]gilt. Falls nun \(x \in \overline{B_\alpha(x_0)}\) und \(y \in Y = \overline{B_\beta(y_0)}\) sind, dann folgt
\[||T_x(y)-y_0|| = ||T_x(y)-T_x(y_0) + T_x(y_0)-y_0||\] \[\leq || T_x(y)-T_x(y_0)|| + || T_x(y_0)-(y_0)||\] \[\leq \frac{1}{2}||y-y_0||+\frac{\beta}{3} \leq \frac{5}{6}\beta < \beta.\]Für \(x \in \overline{B_\alpha(x_0)}\) und den oben definierten, vollständigen metrischen Raum \(Y = \overline{B_\beta(y_0)}\) gilt daher \(T_x(Y) \subseteq Y\). Aus dem Banachschen Fixpunktsatz folgt, dass es einen eindeutig bestimmten Punkt \(y \in Y\) mit \(T_x(y)=y\) gibt. Es gilt außerdem \(||y-y_0|| < \beta\).
Zusammenfassend haben wir also gezeigt, dass es für jedes \(x \in \overline{B_\alpha(x_0)}\) ein eindeutig bestimmten Punkt \(y = y(x) \in \overline{B_\beta(y_0)}\) mit \(F(x,y) = 0\) gibt, welches zusätzlich auch \(y \in \overline{B_\beta(y_0)}\) erfüllt. Dies definiert somit eine Funktion \(f : \overline{B_\alpha(x_0)} \mapsto B_\beta(y_0)\) mit der Eigenschaft \(F(x,f(x)) = 0\) für alle \(x \in \overline{B_\alpha(x_0)}\).
Um die Stetigkeit von \(f\) zu zeigen, wiederholen wir obiges Argument für alle \(x \in \overline{B_\alpha(x_0)}\) "gleichzeitig". Wir betrachten dazu die Teilmenge $\(\tilde{Y} = \{g: \overline{B_\alpha(x_0)} \mapsto Y \:|\: g \text{ ist stetig} \} \subseteq C(\overline{B_\alpha(x_0)}, \mathbb{R}^m)\)$ \(C(\overline{B_\alpha(x_0)}, \mathbb{R}^m)\) ist ausgestattet mit der Supremumsnorm
\[||g||_{\infty} = \sup_{\overline{x \in {B_\alpha(x_0)}}} ||g(x)||\]ein vollständiger metrischer Raum. Da \(Y\) abgeschlossen ist, folgt des Weiteren, dass \(\tilde{Y}\) als abgeschlossene Teilmenge ebenso vollständig ist. Zu einer Funktion \(g \in \tilde{Y}\) definieren wir nun die Funktion
\[\tilde{T}g:x \in \overline{B_\alpha(x_0)} \mapsto T_x(g(x)) = g(x) - A^{-1} F(x,g(x))\]welche aufgrund von der Stetigkeit von \(g \in \tilde{Y}\) und \(F\) wiederum stetig ist. Für \(g \in \tilde{Y}\) gitl nach Definition \(||g(x)-y_0|| \leq \beta\) für alle \(x \in \overline{B_\alpha(x_0)}\) und somit gilt auch \(||\tilde{Y}g(x) - y_0|| < \beta\) für alle \(x \in \overline{B_\alpha(x_0)}\), wodurch \(\tilde{T}g\) ebenso in \(\tilde{Y}\) liegt. Schlussendlich gilt für \(g_1,g_2 \in \tilde{Y}\) und \(x \in \overline{B_\alpha(x_0)}\)
\[||(\tilde{T}g_1 - \tilde{T}g_2)(x)|| = ||T_x(g_1(x)) - T_x(g_2(x))|| \leq \frac{1}{2}||g_1(x)-g_2(x)||\] \[\leq \frac{1}{2}||g_1-g_2||_\infty\]da \(T_x\) Lipschitz-stetig ist mit Lipschitz-Konstante \(\frac{1}{2}\). Dies zeigt, dass \(\tilde{T} = \tilde{Y} - \tilde{Y}\) eine Lipschitz-Kontraktion auf einem vollständigen metrischen Raum darstellt und damit nach dem Banachschen Fixpunktsatz einen eindeutig bestimmten Finxpunkt besitzt. Sei \(y \in \tilde{T}y\) dieser Fixpunkt. Dann ist \(y\) stetig und für alle \(x \in \overline{B_\alpha(x_0)}\) gilt \(y(x) = \tilde{T}y(x) = T_x(y(x)) \in \overline{B_\beta(y_0)}\), wodurch \(y(x) = f(x)\) die eindeutige Lösung der Gleichung \(F(x,y) = 0\) mit \(y \in \overline{B_\beta(y_0)}\) sein muss. \(\square\)