Statt "da \(d^t\) orthodonal zu \(g^t\) ist", muss es heißen: "da \(\large d^{t-1}\) orthogonal zu \(g^t\) ist".
Die Gleichung \(\langle d^t, Ad_t\rangle = \|Ad_t\|_2\) stimmt definitiv i.a. nicht, z.B. für A=2E, E=Einheitsmatrix, \(d_t=0\). Diese Gleichung brauchst Du aber auch gar nicht. Du hast ja \(\langle d^t,g^t\rangle = -\|g^t\|_2^2\). Das reicht, um \(\alpha_t = \frac{\|g^t\|_2^2}{\langle d^t, A d_t\rangle}\) zu folgern.
Bei Deinem Satz "Durch Umformen ergibt sich" verstehe nicht, wieso die Gleichung darunter sich aus der Gleichung darüber ergibt.
Noch weiter unten steht \(\displaystyle \alpha_t = \frac{\|g^t\|_2^2}{\| A d_t\|_2^2}\), was aber nicht stimmt, denn \(\| A d_t\|_2^2 \not= \langle d^t, Ad^t\rangle\) i.a.
Die letzte Gleichungskette "\(\beta_t=\ldots\)" verstehe ich nicht; hier kommt der Ausdruck \(\displaystyle \frac{\|g^{t+1}\|_2^2}{\|g^t\|_2^2}\) gleich drei Mal vor.
Punkte: 2.4K
Danke dir für deine Antwort - mache ich das in meinem Edit der Frage nun schon richtiger?
LG Euler
PS: Das in der letzten Gleichungskette meines ersten Versuches, der Ausdruck drei Mal vorkommt, war ein versehen :) ─ euler03 13.12.2023 um 20:15
Der Beweis für die Formel von \(\alpha_t\) ist m.E. ok.
Die 5.-letzten Zeile von Deinem Edit beginnt mit \(\displaystyle \beta_t = \frac{\|g^{t+1}\|_2^2}{\|g^t\|_2^2}\). Das aber willst Du ja noch beweisen, Du setzt es hier aber schon voraus.
In der vorletzten Zeile steht \(\langle g^t,Ad^t\rangle=-\langle g^t,d^t\rangle\). Das kann nicht richtig sein. Setze z.B. A=Einheitsmatrix,
Deine letzte Zeile beginnt mit \(\displaystyle \beta_t=\frac{\|g^t\|_2^2}{\|g^t\|_2^2}\), was aber definitiv falsch ist. ─ m.simon.539 14.12.2023 um 01:34
Wenn \( \alpha_{t} \) so richtig ist, dann habe ich ja schonmal einen Teil geschafft :)
Jetzt, an einem neuen Tag, ergibt das, was ich bei Beta geschrieben habe wirklich nicht so viel Sinn!
Grundsätzlich müsste ich hier doch aber ähnlich wie bei \( \alpha_{t} \) argumentieren können mit Lemma 2.18 (iv)?
Gemäß Lemma 2.18 (iv) gilt \( \left(d^{t}, A d^{i}\right)=0 \) für \( i \leq t-1 \) und gemäß Bemerkung 2.19 (i) sind die Abstiegsrichtungen paarweise \( A \)-orthogonal.
Mit der Information \( d^{t} \in-g^{t}+\operatorname{span}\left(d^{0}, d^{1}, \ldots, d^{t-1}\right) \) und dass \( \left\langle d^{t}, g^{t}\right\rangle=-\left\|g^{t}\right\|_{2}^{2} \), folgt \( g^{t+1}=g^{t}+\alpha_{t} A d^{t} \), also ergibt sich:
\(
\left\|g^{t+1}\right\|_{2}^{2}=\left\|g^{t}+\alpha_{t} A d^{t}\right\|_{2}^{2}=\left\|g^{t}\right\|_{2}^{2}+2 \alpha_{t}\left\langle g^{t}, A d^{t}\right\rangle+\alpha_{t}^{2}\left\|A d^{t}\right\|_{2}^{2}
\)
\( \alpha_{t}=\frac{\left\|g^{t}\right\|_{2}^{2}}{\left\langle d^{t}, A d^{t}\right\rangle} \) einsetzten:
\(
\left\|g^{t+1}\right\|_{2}^{2}=\left\|g^{t}\right\|_{2}^{2}-2 \frac{\left\|g^{t}\right\|_{2}^{2}}{\left\langle d^{t}, A d^{t}\right\rangle}\left\langle g^{t}, A d^{t}\right\rangle+\frac{\left\|g^{t}\right\|_{2}^{4}}{\left\langle d^{t}, A d^{t}\right\rangle^{2}}\left\langle d^{t}, A d^{t}\right\rangle
\)
Bin ich damit auf dem richtigen Wege?
LG Euler ─ euler03 14.12.2023 um 09:05
Es ist mir allerdings schleierhaft, wie Lemma 2.18(iii) allein hier zum Ziel führen soll.
Meiner Meinung nach braucht man nämlich noch, dass alle \(g^t\) orthogonal zueinander sind: \(\langle g^t, g^i\rangle=0\) für \(i\not=t\).
Diese Aussage fehlt im Lemma 2.18.
Mit dieser Aussage ginge der Beweis dann so:
\(\displaystyle \beta_t \;= \;
\frac{\langle g^{t+1}Ad^t\rangle}{\langle d^t, Ad^t\rangle}\;= \;
\left\langle g^{t+1},-\frac{\langle g^t,d^t\rangle}{\langle d^t,Ad^t\rangle} Ad^t \right \rangle \frac{1}{-\langle g^t,d^t\rangle}\;= \;
\left\langle g^{t+1},g^t-\frac{\langle g^t,d^t\rangle}{\langle d^t,Ad^t\rangle} Ad^t \right \rangle \frac{1}{\| g^t\|_2^2}\;= \;
\langle g^{t+1},g^t-\alpha_t Ad^t \rangle \frac{1}{\| g^t\|_2^2}\;= \;
\frac{\langle g^{t+1},g^{t+1} \rangle} {\| g^t\|_2^2}\;= \;
\frac{\|g^{t+1}\|_2^2}{\| g^t\|_2^2}
\)
─ m.simon.539 14.12.2023 um 14:19
Danke dir nochmals für deine Antwort und die Geduld die du mitgebracht hast :) - dass man alles nur mit dem Lemma zeigen soll, habe ich ja auch nicht behauptet (vielleicht ist es ja gerade so gewollt, dass man die von dir eingebrachte zusätzliche Information ins spiel bringen soll??) - Dann versuche ich das mal nachzuvollziehen!
Danke dir,
LG Euler ─ euler03 14.12.2023 um 15:18
Vor.:
Beh.:
Bew.:
Unter Vor. sollte alles stehen, was benutzt werden darf. Wird das nicht in Deiner Vorlesung so gemacht?
In Bem. 2.19 (iii) steht das zu zeigende. In Lemma 3.18 stehen hilfreiche Dinge, die Du aber nicht zitierst, sondern mit "lässt sich zeigen" erwähnst. Also was denn nun? Und in Deinem Beweis steht $d^t$ sei orthogonal zu $g^t$, das ist falsch.
Also, da blickt man nicht mehr durch.
Bring erstmal Ordnung rein (oben "Frage bearbeiten"). ─ mikn 13.12.2023 um 12:17