analysis iiianalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · literatur...

87
Analysis III Walter Bergweiler Wintersemester 2013/14 Fassung vom 3. Februar 2014 Inhaltsverzeichnis I Das Lebesgue-Integral 1 1 Treppenfunktionen und Hüllreihen ................ 1 2 Definition und Eigenschaften des Lebesgue-Integrals ....... 7 3 Messbare Mengen und Nullmengen ................ 14 4 L p -Räume .............................. 18 5 Volumenänderung unter affinen Abbildungen ........... 21 6 Konvergenzsätze ........................... 23 7 Parameterabhängige Integrale ................... 29 8 Der Satz von Fubini ........................ 31 9 Die Transformationsformel ..................... 34 II Gewöhnliche Differentialgleichungen 43 1 Beispiele und elementare Lösungsmethoden ............ 43 2 Differentialgleichungssysteme .................... 52 3 Der Satz von Picard-Lindelöf ................... 54 4 Der Existenzsatz von Peano .................... 59 5 Abhängigkeit von Parametern ................... 65 6 Lineare Differentialgleichungssysteme ............... 67 7 Lineare Differentialgleichungssysteme mit konstanten Koeffizienten 74 8 Lineare Differentialgleichungen höherer Ordnung ......... 78 i

Upload: others

Post on 05-Nov-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Analysis III

Walter Bergweiler

Wintersemester 2013/14Fassung vom 3. Februar 2014

InhaltsverzeichnisI Das Lebesgue-Integral 1

1 Treppenfunktionen und Hüllreihen . . . . . . . . . . . . . . . . 12 Definition und Eigenschaften des Lebesgue-Integrals . . . . . . . 73 Messbare Mengen und Nullmengen . . . . . . . . . . . . . . . . 144 Lp-Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 Volumenänderung unter affinen Abbildungen . . . . . . . . . . . 216 Konvergenzsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 Parameterabhängige Integrale . . . . . . . . . . . . . . . . . . . 298 Der Satz von Fubini . . . . . . . . . . . . . . . . . . . . . . . . 319 Die Transformationsformel . . . . . . . . . . . . . . . . . . . . . 34

II Gewöhnliche Differentialgleichungen 431 Beispiele und elementare Lösungsmethoden . . . . . . . . . . . . 432 Differentialgleichungssysteme . . . . . . . . . . . . . . . . . . . . 523 Der Satz von Picard-Lindelöf . . . . . . . . . . . . . . . . . . . 544 Der Existenzsatz von Peano . . . . . . . . . . . . . . . . . . . . 595 Abhängigkeit von Parametern . . . . . . . . . . . . . . . . . . . 656 Lineare Differentialgleichungssysteme . . . . . . . . . . . . . . . 677 Lineare Differentialgleichungssysteme mit konstanten Koeffizienten 748 Lineare Differentialgleichungen höherer Ordnung . . . . . . . . . 78

i

Page 2: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

LiteraturFolgende Bücher sind nur eine kleine Auswahl aus der umfangreichen Literaturzu den behandelten Themen.

Integrationstheorie

• K. Königsberger, Analysis 2, Springer, 1993.

• H. Amann, J. Escher, Analysis III, Birkhäuser, 2001.

• O. Forster, Analysis 3, Vieweg, 1981.

• W. Rudin, Real and Complex Analysis, McGraw-Hill, 1987

Gewöhnliche Differentialgleichungen

• H. Amann, Gewöhnliche Differentialgleichungen, de Gruyter, 1983.

• H. Heuser, Gewöhnliche Differentialgleichungen, B. G. Teubner, 1989.

• W. Walter, Gewöhnliche Differentialgleichungen, Springer, 1972.

• E. A. Coddington & N. Levinson, Theory of Ordinary Differential Equa-tions, McGraw Hill, 1955.

ii

Page 3: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

I Das Lebesgue-Integral

1 Treppenfunktionen und Hüllreihen

Grundidee bei der Definition des Riemann-Integrals ist die Approximation einerFunktion f : [a, b] → R durch „Treppenfunktionen“. Man zerlegt [a, b] in Teilin-tervalle und betrachtet Funktionen, die auf diesen Teilintervallen konstant sind;vgl. Abbildung 1.

Abbildung 1: Approximation eines Integrals durch Unter- und Obersumme.

Dieselbe Idee benutzt man auch in höheren Dimensionen: Sei d ∈ N. EineTeilmenge Q des Rd von der Form

Q = I1 × I2 × ...× Id = (x1, ..., xd) ∈ Rd : xj ∈ Ij für alle j

mit beschränkten Intervallen I1, ..., Id heißt Quader. Sind alle Ij offen (bzw.abgeschlossen), so ist Q ein offener (bzw. abgeschlossener) Quader.

Für ein Intervall I = [a, b], (a, b), [a, b) oder (a, b] heißt |I| = b − a Längevon I. Für einen Quader Q = I1 × ...× Id heißt

υ(Q) =d∏j=1

|Ij|

(d-dimensionales) Volumen von Q. Ausgeartete Intervalle [a, a] mit Länge 0 undausgeartete Quader mit Volumen 0 sind zugelassen.

Für M ⊆ Rd ist die charakteristische Funktion χM : Rd → R definiert durch

χM(x) =

1, x ∈M,

0, x 6∈M.

Definition 1.1. Eine Funktion ϕ : Rd → C der Form

ϕ(x) =n∑k=1

ckχQk(x),

wobei c1, ..., cn ∈ C und Q1, ..., Qn ⊂ Rd paarweise disjunkte Quader sind, heißtTreppenfunktion.

1

Page 4: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 1.2. Seien c1, ..., cn ∈ C und Q1, ..., Qn ⊆ Rd Quader, die aber nicht not-wendigerweise paarweise disjunkt sind. Dann ist

ϕ =n∑k=1

ckχQk

Treppenfunktion, d.h., es existieren c′1, ..., c′m ∈ C und paarweise disjunkte Qua-der Q′1, ..., Q′m ⊆ Rd mit

ϕ =m∑j=1

c′jχQ′j .

Der Beweis ist elementar, aber wir verzichten hier darauf. Die Idee ist, dieQk in geeignete Q′j zu zerlegen, vgl. Abbildung 2. Alternativ hätte man in der

Abbildung 2: Zerlegung der Vereinigung zweier Quader in disjunkte Quader.

Definition der Treppenfunktion auf die Disjunktheit der Quader verzichten kön-nen.

Eine Folgerung aus Satz 1.2 ist, dass die Summe zweier Treppenfunktionenwieder Treppenfunktion ist. Hieraus folgt, dass die Treppenfunktionen einenVektorraum bilden.

Definition 1.3. Sei ϕ Treppenfunktion wie in Definition 1.1. Das Integral vonϕ über Rd ist dann durch∫

ϕ =

∫Rdϕ(x)dx =

n∑k=1

ckυ(Qk)

definiert.

Bemerkung. Es muss gezeigt werden, dass das Integral wohldefiniert ist, d.h.,dass aus

n∑k=1

ckχQk =m∑j=1

c′jχQ′j

mit ck, c′j ∈ C und (jeweils paarweise disjunkten) Quadern Qk, Q′j folgt, dass

n∑k=1

ckv(Qk) =m∑j=1

c′jv(Q′j)

2

Page 5: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

gilt. Dies kann man wie folgt einsehen:Zunächst zeigt man die Aussage, wenn die Q′j eine „Verfeinerung“ der Qk

bilden, d.h., jedes Qk Vereinigung gewisser Q′j ist. Dann zeigt man, dass dieQk und Q′j eine gemeinsame Verfeinerung haben. Wir verzichten hier auf dieDetails.

Für einen Quader Q = I1 × ...× Id gilt offensichtlich

υ(Q) =d∏j=1

|Ij| =∫Ij1

(∫Ij2

(...

(∫Ijd

χQ(x1, ..., xd)dxjd

)...

)dxj2

)dxj1

für eine beliebige Permutation (j1, ..., jd) von (1, ..., d).Entsprechend gilt auch∫

Rdϕ(x)dx =

∫R

(∫R

(...

(∫Rϕ(x1, . . . , xd)dxjd

)...

)dxj2

)dxj1

für eine Treppenfunktion ϕ.Durch diese Zurückführung auf eindimensionale Integrale gewinnt man Re-

chenregeln wie ∫(αϕ+ βψ) = α

∫ϕ+ β

∫ψ

und ∣∣∣∣∫ ϕ

∣∣∣∣ ≥ ∫ |ϕ|für Treppenfunktion ϕ, ψ und α, β ∈ C.

Sei d = p+ q. Wir schreiben die Punkte z ∈ Rd in der Form

z = (x, y) = (x1, ..., xp, y1, ..., yq).

Sei ϕ : Rd = Rp×Rq → C, (x, y)→ ϕ(x, y) Treppenfunktion. Dann ist für festesx ∈ Rp durch y 7→ ϕ(x, y) eine Treppenfunktion auf Rq und für y ∈ Rq durchx 7→ ϕ(x, y) eine Treppenfunktion auf Rp gegeben. Aus obigen Überlegungenfolgt dann, dass∫

Rq

(∫Rpϕ(x, y)dx

)dy =

∫Rp

(∫Rqϕ(x, y)dy

)dx =

∫Rp×Rq

ϕ(z)dz.

Dieses Resultat heißt Satz von Fubini (für Treppenfunktionen).Im Folgenden ist es sinnvoll, den Wert ∞ zu C und R hinzuzufügen, mit

x <∞ für x ∈ R, c+∞ =∞ für c ∈ C und c · ∞ =∞ für c ∈ C\0.Außerdem wird die Konvention 0 ·∞ = 0 benutzt. Wir setzen R = R∪ ∞

und C = C ∪ ∞.

Definition 1.4. Sei f : Rd → C. Eine Reihe der Form

Φ =∞∑k=1

ckχQk

heißt Hüllreihe zu f , falls gilt:

3

Page 6: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

(i) Qk ist offener Quader für alle k,

(ii) ck ≥ 0 für alle k,

(iii) |f(x)| ≤ Φ(x) =∑∞

k=1 ckχQk(x) für alle x ∈ Rd.

Weiter heißt

I(Φ) =∞∑k=1

ckυ(Qk)

Inhalt der Hüllreihe Φ und

‖f‖1 = infI(Φ) : Φ Hüllreihe von f

heißt L1-Halbnorm von f .

Bemerkung. Es ist zugelassen, dass I(Φ) =∞ und ‖f‖1 =∞. Zum Beispiel giltfür f : Rd → C, f(x) = 1 für alle x ∈ Rd, dass ‖f‖1 =∞. Damit ist ‖ · ‖1 keineNorm auf der Menge der Funktion von Rd nach C.

Auch eine zweite Eigenschaft einer Norm gilt nicht: Aus ‖f‖1 = 0 folgt nicht,dass f = 0 gilt. Etwa für f : Rd → C,

f(x) =

1, x = 0,

0, x 6= 0,

gilt ‖f‖1 = 0. Dies sieht man etwa mit den Hüllreihen Φε =∑∞

k=1 ckχQk , wobeic1 = 1, Q1 = (−ε, ε)d sowie ck = 0 und Qk beliebig für k ≥ 2. Es gilt dannI(Φε) = (2ε)d, also ‖f‖1 = 0. Die anderen Normeigenschaften gelten aber. Diesist der Inhalt des folgenden Lemmas.

Lemma 1.5. Für f, g : Rd → C und c ∈ C gilt

‖c · f‖1 = |c| · ‖f‖1

und die Dreiecksungleichung∣∣∣‖f‖1 − ‖g‖1∣∣∣ ≤ ‖f + g‖1 ≤ ‖f‖1 + ‖g‖1.

Des Weiteren folgt aus |f | ≤ |g|, also |f(x)| ≤ |g(x)| für alle x ∈ Rd, dass‖f‖1 ≤ ‖g‖1.

Die sehr einfachen Beweise lassen wir aus. Allgemeiner als die Dreiecksunglei-chung gilt sogar folgendes Lemma.

Lemma 1.6. Sei (fk) eine Folge von Funktionen von Rd nach [0,∞]. Dann gilt∥∥∥∥∥∞∑k=1

fk

∥∥∥∥∥1

≤∞∑k=1

‖fk‖1.

4

Page 7: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Zu gegebenem ε > 0 und k ∈ N sei Φk eine Hüllreihe von fk mitI(Φk) < ‖fk‖1 + ε/2k. Sei Φk gegeben durch Φk =

∑∞j=1 cj,kχQj,k . Wir setzen

Φ =∞∑k=1

∞∑j=1

cj,kχQj,k .

Es gilt also Φ =∑∞

k=1 Φk. Dann ist Φ Hüllreihe von∑∞

k=1 fk und

I(Φ) =∞∑k=1

∞∑j=1

cj,kv(Qj,k)

=∞∑k=1

I(Φk)

<∞∑k=1

(‖fk‖1 +

ε

2k

)=

(∞∑k=1

‖fk‖1

)+ ε.

Die Behauptung folgt.

Beispiele. 1. Sei a ∈ Rd und f = χa, also f(a) = 1 und f(x) = 0 für x 6= a.Weiter sei g : Rd → R definiert durch g(a) = ∞ und g(x) = 0 für x 6= a. Wieoben gilt ‖f‖1 = 0. Mit g =

∑∞k=1 fk, wobei fk = f für alle k, folgt ‖g‖1 = 0.

2. Sei A ⊆ Rd abzählbar, etwa A = a1, a2, .... Sei h : Rd → R, h(x) = ∞für x ∈ A und h(x) = 0 für x 6∈ A. Dann gilt ‖h‖1 = 0, denn h =

∑∞k=1 gk mit

gk(ak) =∞ und gk(x) = 0 für x 6= ak.

Bemerkung. In Analysis II wurde das Oberintegral∫If einer beschränkten Funk-

tion f : I → R, wobei I abgeschlossenes Intervall ist, definiert. In unserer Ter-minologie ergibt sich Folgendes: Ist f die triviale Fortsetzung von f auf R, alsof(x) = f(x) für x ∈ I und f(x) = 0 für x ∈ R\I, so gilt∫

I

f = inf∫

ϕ : ϕ Treppenfunktion, f ≤ ϕ

= inf

n∑k=1

ckv(Qk) : f ≤n∑k=1

ckχQk

Der entscheidende Unterschied zwischen dem Oberintegral∫I|f | und der Halb-

norm ‖f‖1 ist, dass dort unendliche Reihen zugelassen sind, d.h.,∫I

|f | = inf

n∑k=1

ckv(Qk) : |f | ≤n∑k=1

ckχQk

und

‖f‖1 = inf

∞∑k=1

ckv(Qk) : |f | ≤∞∑k=1

ckχQk

.

5

Page 8: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Offensichtlich gilt also ‖f‖1 ≤∫I|f |, aber zum Beispiel für f : [0, 1]→ R,

f(x) =

1, x ∈ Q,0, x 6∈ Q,

gilt 0 = ‖f‖1 < 1 =∫ 1

0|f |.

Satz 1.7. Für jede Treppenfunktion ϕ : Rd → C gilt

‖ϕ‖1 =

∫Rd|ϕ(x)|dx.

Zur Vorbereitung des Beweises behandeln wir zunächst einen Spezialfall.

Lemma 1.8. Sei A abgeschlossener Quader in Rd. Dann gilt

‖χA‖1 =

∫χA = v(A).

Beweis. Zu ε > 0 existiert ein offener Quader Qmit Q ⊃ A und v(Q) < v(A)+ε.Mit der Hüllreihe

∑∞k=1 ckχQk , wobei Q1 = Q, c1 = 1 sowie ck = 0 und Qk

beliebig für k ≥ 2 folgt ‖χA‖1 ≤ v(Q), also ‖χA‖1 ≤ v(A).Sei umgekehrt Φ =

∑∞k=1 ckχQk Hüllreihe von χA. Sei ε > 0. Zu x ∈ A

existiert dann N(x) ∈ N mit

N(x)∑k=1

ckχQk(x) ≥ 1− ε.

Da die Qk offen sind, gilt das in einer (offenen) Umgebung U(x) von x. Da Akompakt ist, kann A mit endlich vielen dieser Umgebungen überdeckt werden.Damit existiert N ∈ N mit

N∑k=1

ckχQk(x) ≥ 1− ε

für alle x ∈ A. Es folgtN∑k=1

ckχQk ≥ (1− ε)χA.

Mit Lemma 1.5 folgt∫Rd

N∑k=1

ckχQk(x)dx ≥ (1− ε)∫RdχA(x)dx = (1− ε)v(A).

Andererseits gilt∫Rd

N∑k=1

ckχQk(x)dx =N∑k=1

ckv(Qk) ≤∞∑k=1

ckv(Qk) = I(Φ).

Damit folgt I(Φ) ≥ v(A), also auch ‖χA‖1 ≥ v(A).

6

Page 9: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis von Satz 1.7. Ohne Einschränkung der Allgemeinheit sei ϕ ≥ 0. Sei

ϕ =n∑k=1

ckχQk +m∑j=1

djχRj

eine Darstellung von ϕ mit disjunkten Quadern Qk und Rj, wobei die Qk offensind und die Rj Volumen 0 haben. Um einzusehen, dass so eine Darstellungexistiert, schreibt man ϕ zunächst als Linearkombination von charakteristischenFunktionen disjunkter Quader, und dann nehme man deren Inneres als die Qk

und deren Seitenflächen und Kanten als Rj. Es gilt dann ck ≥ 0 und dj ≥ 0 füralle k, j. Sei ε > 0 und Sj offener Quader mit Sj ⊃ Rj und v(Sj) < ε. Dann ist

n∑k=1

ckχQk +m∑j=1

djχSj

Hüllreihe zu ϕ und damit

‖ϕ‖1 ≤n∑k=1

ckv(Qk) + εm∑j=1

dj.

Es folgt

‖ϕ‖1 ≤n∑k=1

ckv(Qk) =

∫Rdϕ(x)dx.

Sei nun A abgeschlossener Quader mit ϕ(x) = 0 für x 6∈ A. Sei M =maxx∈A |ϕ(x)| und sei ψ = MχA − ϕ. Dann ist auch ψ Treppenfunktion undnach dem bereits Bewiesenen gilt

‖ψ‖1 ≤∫Rdψ(x)dx = M

∫RdχA(x)dx−

∫Rdϕ(x)dx.

Mit Lemma 1.8 folgt

‖ψ‖1 ≤M‖χA‖1 −∫Rdϕ(x)dx

und damit ∫Rdϕ(x)dx ≤M‖χA‖1 − ‖ψ‖1 ≤ ‖MχA − ψ‖1 = ‖ϕ‖1.

2 Definition und Eigenschaften des Lebesgue-Integrals

Definition und Satz 2.1. Eine Funktion f : Rd → C heißt (Lebesgue)-inte-grierbar, wenn es eine Folge (ϕk) von Treppenfunktionen mit

limk→∞‖f − ϕk‖1 = 0

gibt. In diesem Fall existiert der Grenzwert limk→∞∫Rd ϕk(x)dx und er ist un-

abhängig von der Folge (ϕk). Man nennt∫Rdf(x)dx = lim

k→∞

∫Rdϕk(x)dx

das Lebesgue-Integral von f .

7

Page 10: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Mit Lemma 1.5 und Satz 1.2 gilt∣∣∣∣∫ ϕj −∫ϕk

∣∣∣∣ ≤ ∫ |ϕj − ϕk| = ‖ϕj − ϕk‖1 ≤ ‖ϕj − f‖1 + ‖ϕk − f‖1

für j, k ∈ N. Gilt ‖f − ϕk‖1 → 0, so folgt hieraus, dass (∫ϕk) Cauchyfolge und

damit konvergent ist.Gilt auch

limk→∞‖f − ψk‖1 = 0

mit Treppenfunktionen ψk, so folgt analog∣∣∣∣∫ ϕk −∫ψk

∣∣∣∣ ≤ ‖ϕk − f‖1 + ‖ψk − f‖1

und damitlimk→∞

∫ϕk = lim

k→∞

∫ψk.

Bemerkung. Für eine Treppenfunktion ϕ stimmt das Lebesgue-Integral aus De-finition 2.1 mit dem Integral aus Definition 1.1 überein. (Man wähle ϕk = ϕ füralle k.)

Satz 2.2. Seien f, g : Rd → C integrierbar und seien α, β ∈ C. Dann gilt

(i) |f | ist integrierbar und |∫fdx| ≤

∫|f |dx = ‖f‖1.

(ii) αf + βg ist integrierbar und∫αf + βg = α

∫f + β

∫g.

(iii) Die komplex konjugierte Funktion f ist integrierbar und∫f =

∫f .

(iv) Aus f ≤ g folgt∫f ≤

∫g.

(v) Ist g beschränkt, so ist auch f · g integrierbar.

Beweis. Aussage (ii) folgt direkt aus den entsprechenden Regeln für Treppen-funktionen. Auch (iii) ist sehr einfach – und folgt auch direkt aus (ii).

Zu (i): Sei (ϕk) Folge von Treppenfunktionen mit ‖ϕk− f‖1 → 0. Dann sindauch die |ϕk| Treppenfunktionen und es gilt

‖ |ϕk| − |f | ‖1 ≤ ‖ϕk − f‖1.

Damit ist |f | integrierbar und∫|f | = lim

k→∞

∫|ϕk| ≥

∣∣∣∣ limk→∞

∫ϕk

∣∣∣∣ =

∣∣∣∣∫ f

∣∣∣∣ .Außerdem gilt

‖f‖1 − ‖ϕk − f‖1 ≤ ‖ϕk‖1 ≤ ‖f‖1 + ‖ϕk − f‖1.

8

Page 11: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Wegen

‖ϕk‖1 =

∫|ϕk| →

∫|f |

folgt mit k →∞, dass ‖f‖1 =∫|f |.

Zu (iv): Wegen ∫g −

∫f =

∫g − f =

∫|g − f |

folgt dies aus (i).Zu (v): Seien ϕ und ψ Treppenfunktionen. Dann gilt

|f · g − ϕ · ψ| = |f · g − g · ϕ+ g · ϕ− ϕ · ψ| ≤ |g| · |f − ϕ|+ |ϕ| · |g − ψ|.

Sei M = supx∈Rd |g(x)|. Zu ε > 0 wählt man ϕ mit M‖f − ϕ‖1 < ε/2. SeiL = maxx∈Rd |ϕ(x)|. Nun wählt man ψ mit L‖g − ψ‖1 < ε/2. Es folgt dann

‖f · g − ϕ · ψ‖ ≤M‖f − ϕ‖1 + L‖g − ψ‖1 < ε.

Folgerung 1. Eine Funktion f : Rd → C ist genau dann integrierbar, wenn Re fund Im f integrierbar sind. Es gilt dann

∫f =

∫Re f + i

∫Im f .

2. Sind f, g : Rd → R integrierbar, so auch maxf, g und minf, g. Diesfolgt aus

maxf, g =1

2(f + g + |f − g|) und minf, g =

1

2(f + g − |f − g|).

Mitf+ = maxf, 0 und f− = max−f, 0

gilt wegen f = f+ − f− dann, dass f genau dann integrierbar ist, wenn f+ undf− integrierbar sind. In diesem Fall gilt

∫f =

∫f+ −

∫f−.

Daher kann man sich oft auf den Fall f ≥ 0 beschränken.

Definition 2.3. Sei A ⊆ B ⊆ Rd und f : B → C. Die Funktion fA : Rd → C,

fA(x) =

f(x), x ∈ A0 , x ∈ Rd\A

heißt triviale Fortsetzung (von f |A). Man nennt f integrierbar über A, falls∫Rd fA(x)dx existiert und ∫

A

f(x)dx =

∫RdfA(x)dx

heißt dann Lebesgue-Integral von f über A.

Satz 2.4. Seien a, b ∈ R, a < b, und sei f : [a, b] → R Riemann-integrierbar.Dann ist f auch Lebesgue-integrierbar über [a, b] und das Lebesgue-Integral unddas Riemann-Integral von f über das Intervall [a, b] stimmen überein.

9

Page 12: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Nach Riemannschem Integralibitätskriterium existiert eine Folge (Zn)von Zerlegungen von [a, b] mit

S(Zn)− S(Zn)→ 0

und

S(Zn)→∫ b

a

f(x)dx.

Sei n ∈ N. Die Zerlegung Zn bestehe aus den Intervallen I1, ..., Ikn . Weitersei mj = infx∈Ij f(x) und Mj = supx∈Ij f(x). Dann ist

ϕn =kn∑j=1

mjχIj

eine Treppenfunktion und es gilt

S(Zn) =kn∑j=1

mj|Ij| =∫Rϕn(x)dx.

Weiter gilt

‖f[a,b] − ϕn‖1 ≤

∥∥∥∥∥kn∑j=1

(Mj −mj)χIj

∥∥∥∥∥1

≤kn∑j=1

(Mj −mj)|Ij|

= S(Zn)− S(Zn)

Es folgt, dass ‖f[a,b] − ϕn‖1 → 0 für n→∞. Damit ist f Lebesgue-integrierbarüber [a, b] und

limn→∞

∫Rϕn(x)dx = lim

n→∞S(Zn).

Die linke Seite ist das Lebesgue-Integral, die rechte das Riemann-Integral von füber [a, b].

Nächstes Ziel ist, die Integrierbarkeit stetiger Funktionen auf kompaktenMengen zu zeigen. Vorbereitend dazu beweisen wir das folgende Ergebnis.

Satz 2.5. (Kleiner Satz von Beppo Levi) Sei f : Rd → R ∪ ∞ und sei(ϕk) eine monoton wachsende Folge von Treppenfunktionen, so dass gilt:

(i) limk→∞ ϕk(x) = f(x) für alle x ∈ Rd.

(ii) Die Folge (∫ϕk)k∈N ist beschränkt.

Dann ist f integrierbar und∫f = limk→∞

∫ϕk.

10

Page 13: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Da (∫ϕk) monoton wachsend und beschränkt ist, ist (

∫ϕk) konvergent.

Mit

f − ϕn =∞∑k=n

(ϕk+1 − ϕk)

folgt aus Lemma 1.6 und Satz 1.7, dass

‖f − ϕn‖1 ≤∞∑k=n

‖ϕk+1 − ϕk‖1

=∞∑k=n

∫|ϕk+1 − ϕk|

=∞∑k=n

∫(ϕk+1 − ϕk)

=∞∑k=n

(∫ϕk+1 −

∫ϕk

)=

(limk→∞

∫ϕk

)−∫ϕn,

also‖f − ϕn‖1 → 0.

Die Behauptung folgt.

Satz 2.6. Sei U ⊂ Rd offen und beschränkt und sei f : U → C stetig und be-schränkt. Dann ist f über U integrierbar.

Beweis. Ohne Einschränkung der Allgemeinheit kann man f ≥ 0 annehmen.Leicht sieht man, dass eine Folge (Wk) von Würfeln (d.h., Quadern mit gleicherSeitenlänge) existiert, so dass v(Wk) → 0, Wk ⊂ U für alle k und jeder Punktin U in unendlich vielen Wk liegt. Für k ∈ N sei

mk = infx∈Wk

f(x) und ϕn = max1≤k≤n

mkχWk.

Dann ist (ϕn) monoton steigende Folge von Treppenfunktionen, und aus derStetigkeit von f folgt ϕn(x) → f(x) für alle x ∈ U . Mit M = supx∈U f(x) undeinem Quader Q mit U ⊂ Q folgt außerdem

∫ϕn ≤ M · v(Q). Die Behauptung

folgt mit Satz 2.5.

Satz 2.7. Sei K ⊂ Rd kompakt und f : K → C stetig. Dann ist f über Kintegrierbar.

Wir werden Satz 2.7 auf Satz 2.6 zurückführen. Dafür benötigen wir folgendesResultat.

Lemma 2.8. Sei K ⊂ Rd kompakt und f : K → C stetig. Dann hat f einestetige Fortsetzung auf Rd, d.h., es existiert F : Rd → C mit F |K = f .

11

Page 14: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Bemerkung. Dies ist ein Spezialfall des Fortsetzungssatzes von Tietze.

Beweisskizze. Ohne Einschränkung der Allgemeinheit sei f ≥ 0. Da K kompaktist, ist f gleichmäßig stetig. Es seien u,w : [0,∞)→ [0,∞) definiert durch

u(t) = maxx,y∈K‖x−y‖≤t

|f(x)− f(y)| und w(t) = supα≥1

u(αt)

α.

Die Funktionen u und w sind monoton wachsend und es gilt limt→0w(t) = 0 =w(0) sowie w(s+ t) ≤ w(s) + w(t) für s, t ∈ [0,∞). Außerdem gilt

|f(x)− f(y)| ≤ w(‖x− y‖)

für x, y ∈ K. Dann leistet

F (x) = supy∈K

(f(y)− w(‖x− y‖))

das Verlangte.

Beweis von Satz 2.7. Sei Q offener Quader mit Q ⊃ K und sei F stetige Fort-setzung von f auf Rd. Dann ist FQ beschränkt. Wegen fK = FQ−FQ ·χQ\K undda FQ und χQ\K nach Satz 2.6 integrierbar sind, folgt die Integrierbarkeit vonf über K mit Satz 2.6, (ii) und (v).

Zur konkreten Berechnung von Integralen über Teilmengen des Rd führt mandiese auf eindimensionale Integrale zurück. Wir schreiben für d = p + q wiederz ∈ Rd in der Form z = (x, y) mit x ∈ Rp und y ∈ Rq.

Satz 2.9. Sei U ⊂ Rd = Rp×Rq offen und beschränkt und sei f : U → C stetigund beschränkt. Für y ∈ Rq sei

Uy = x ∈ Rp : (x, y) ∈ U.

Dann ist für jedes y ∈ Rq die Funktion fy : Uy → C, fy(x) = f(x, y) integrierbar.(Falls Uy = ∅, ist

∫Uyfy = 0). Des Weiteren ist die durch

F (y) =

∫Uy

fy(x)dx =

∫Uy

f(x, y)dx

gegebene Funktion F : Rq → C integrierbar und es gilt∫U

f(z)dz =

∫RqF (y)dy =

∫Rq

(∫Uy

f(x, y)dx

)dy.

Die Aussage gilt auch, falls U kompakt und f : U → C stetig.

Bemerkung. Die Rollen von x und y können vertauscht werden. Mit

U ′x = y ∈ Rq : (x, y) ∈ U

für x ∈ Rp folgt∫Rp

(∫U ′x

f(x, y)dy

)dx =

∫U

f(z)dz =

∫Rq

(∫Uy

f(x, y)dx

)dy.

12

Page 15: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Ohne Einschränkung der Allgemeinheit sei wieder f ≥ 0. Sei (ϕk) mo-notone Folge von Treppenfunktionen mit ϕk(z) → fU(z) für alle z ∈ Rd. Fürjedes y ∈ Rq ist dann ϕy,k : Uy → C, ϕy,k(x) = ϕk(x, y), eine Treppenfunktion.Die Folge (ϕy,k) ist monoton wachsend und konvergiert punktweise gegen fy. Daf und U beschränkt sind, ist die Folge (

∫ϕy,k) beschränkt. Nach dem kleinen

Satz von Beppo Levi folgt, dass fy integrierbar über Uy ist und

F (y) =

∫Uy

fy = limk→∞

∫Rpϕk(x, y)dx

gilt. Mit

Φk(y) =

∫Rpϕk(x, y)dx

gilt aber Φk(y) → F (y) für alle y ∈ Rq. Auch die Φk sind Treppenfunktionenund die Folge (Φk) ist monoton wachsend. Es folgt, dass F integrierbar ist und∫

RqF (y)dy = lim

k→∞

∫Rq

Φk(y)dy = limk→∞

∫Rq

(∫Rpϕk(x, y)dx

)dy

gilt. Mit dem Satz von Fubini für Treppenfunktionen gilt∫Rq

(∫Rpϕk(x, y)dx

)dy =

∫Rdϕk(z)dz

und damit folgt die Behauptung.Den Fall, dass U kompakt ist, führt man wie in Satz 2.7 auf den Fall, dass

U offen ist, zurück.

Bemerkung. Satz 2.9 heißt auch „Kleiner Satz von Fubini“.

Beispiel. Sei K = (x, y) ∈ R2 : x2 ≤ y ≤ 1 und f : K → R, f(x, y) = x2y. Esist K kompakt und f stetig.

Für y ∈ [0, 1] gilt Uy = [−√y,√y] und es ist Uy = ∅ für y 6∈ [0, 1]. Es folgt

∫K

f(x, y)d(x, y) =

∫ 1

0

(∫ √y−√y

x2y dx

)dy =

∫ 1

0

y · 1

3x3

∣∣∣∣∣x=√y

x=−√y

dy

=

∫ 1

0

y · 2

3

√y3dy =

2

3

∫ 1

0

y52dy =

4

21.

Alternativ kann man dies mit U ′x = [x2, 1] auch wie folgt berechnen:∫K

f(x, y)d(x, y) =

∫ 1

−1

(∫ 1

x2x2ydy

)dx

=

∫ 1

−1x2 · 1

2y2

∣∣∣∣∣y=1

y=x2

dx =1

2

∫ 1

−1

(x2 − x6

)dx

=1

2

(1

3x3 − 1

7x7) ∣∣∣∣∣

1

−1

=1

3− 1

7=

4

21.

13

Page 16: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

3 Messbare Mengen und Nullmengen

Definition 3.1. Eine Teilmenge A des Rd heißt (Lebesgue-)messbar, falls χAintegrierbar ist. In diesem Fall heißt

vd(A) = v(A) =

∫A

1 dx =

∫RdχA

das (d-dimensionale) Volumen oder (Lebesgue)-Maß von A. (Im Falle d = 2spricht man von Flächeninhalt.)

Bemerkung. Nach Satz 2.6 und Satz 2.7 sind beschränkte offene Mengen undkompakte Mengen messbar.

Beispiele. 1. Sei A das Dreieck mit den Ecken (0,0), (0,1), (1,0). Dann gilt

v2(A) =

∫ 1

0

(∫ 1−x

0

dy

)dx =

∫ 1

0

(1− x)dx = x− x2

2

∣∣∣∣∣1

0

=1

2.

Die Integrationsreihenfolge kann hier auch wieder vertauscht werden.2. Sei K abgeschlossene Kreisscheibe mit Radius r um 0, also

K = (x, y) ∈ R2 : x2 + y2 ≤ r2.

Dann gilt

v(K) =

∫K

1 d(x, y) =

∫ r

−r

(∫ √r2−y2

−√r2−y2

dx

)dy =

∫ r

−r2√r2 − y2dy

= 2r2∫ 1

−1

√1− t2dt =

∫ π2

−π2

√1− sin2 u cosu du

= 2r2∫ π

2

−π2

cos2 u du = 2r2∫ π

2

−π2

1

2(1 + cos 2u)du

= r2(u+

sin 2u

2

) ∣∣∣∣∣π2

−π2

= πr2.

Für messbares A,B ⊂ Rd folgt aus χA∪B = χA + χB − χA∩B, dass

v(A ∪B) = v(A) + v(B)− v(A ∩B),

insbesondere alsov(A ∪B) = v(A) + v(B),

falls A ∩B = ∅. Induktiv erhält man

v

(n⋃j=1

Aj

)=

n∑j=1

v(Aj)

für paarweise disjunkte Mengen Aj. Ebenso gilt v(A) ≤ v(B), falls A ⊆ B.Die konkrete Berechnung von Volumina erfolgt wieder mit dem Satz von

Fubini. Der Spezialfall p = d − 1, q = 1, f = χA ist als Cavalierisches Prinzipbekannt:

14

Page 17: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 3.2. Sei A ⊂ Rd kompakt und für t ∈ R sei

At = (x1, ..., xd−1) ∈ Rd−1 : (x1, ..., xd−1, t) ∈ A.

Dann gilt

vd(A) =

∫Rvd−1(At)dt.

Beweis. Nach Satz von Fubini ist

vd(A) =

∫A

1 dz =

∫R

(∫At

1 dx

)dt =

∫Rvd−1(At)dt.

Beispiel. Sei K = (x, y, z) ∈ R3 : x2 + y2 + z2 ≤ R2 die Kugel um 0 vomRadius R. Für z ∈ [−R,R] ist dann Kz = (x, y) ∈ R2 : x2 + y2 ≤ R2− z2 unddamit v2(Kz) = π(R2 − z2) nach Beispiel zum Satz von Fubini. Also gilt

v3(K) =

∫ R

−Rπ(R2 − z2

)dz = π

(R2z − z3

3

) ∣∣∣∣∣R

−R

=4π

3R3.

Definition 3.3. Eine messbare Menge N mit v(N) = 0 heißt Nullmenge.

Lemma 3.4. Eine Teilmenge N des Rd ist genau dann eine Nullmenge, wenn‖χN‖1 = 0.

Beweis. Ist N Nullmenge, so gilt 0 =∫χN = ‖χN‖1 nach Satz 2.2 (i).

Ist aber ‖χN‖1 = 0, so ist χN auch integrierbar und v(N) =∫χN = 0. (Man

wähle ϕk ≡ 0 in Definition und Satz 2.1.)

Lemma 3.5. (i) Teilmengen von Nullmengen sind wieder Nullmengen.

(ii) Abzählbare Vereinigungen von Nullmengen sind Nullmengen.

Beweis. (i) mit Lemma 3.4, (ii) mit Lemma 1.6.

Folgerung. Abzählbare Mengen sind Nullmengen.

Satz 3.6. Sei f : Rd → C mit ‖f‖1 < ∞. Dann ist N := x ∈ Rd : f(x) = ∞Nullmenge.

Beweis. Es gilt χN ≤ ε · f für alle ε > 0, also ‖χN‖1 ≤ ε · ‖f‖1 für alle ε > 0und damit ‖χN‖1 = 0.

Satz 3.7. Seien f, g : Rd → C und es sei N = x ∈ Rd : f(x) 6= g(x) Nullmen-ge. Ist f integrierbar, so auch g und

∫g =

∫f .

15

Page 18: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Es gilt ‖χN‖1 = 0 und damit gilt für uN : Rd → R,

uN(x) =

∞, x ∈ N,0 , x 6∈ N,

auch ‖uN‖1 = 0, da uN =∑∞

k=1 χN .Sei (ϕk) Folge von Treppenfunktionen mit ‖f − ϕk‖1 → 0. Wegen

|g − ϕk| ≤ |f − ϕk|+ uN

folgt ‖g − ϕk‖1 ≤ ‖f − ϕk‖1. Damit ist auch g integrierbar und∫g = lim

k→∞

∫ϕk =

∫f.

Bemerkung. Sind f und g wie in Satz 3.7, so sagt man, dass f und g fast überallgleich sind oder dass f(x) = g(x) für fast alle x. Ganz allgemein bedeutet „fastüberall“, dass dies außerhalb einer Nullmenge gilt. Satz 3.6 besagt also zumBeispiel, dass für Funktionen f mit ‖f‖1 <∞ fast überall f(x) 6=∞ gilt.

Satz 3.8. Ist f : Rn → C integrierbar, so existiert eine integrierbare Funktionf mit

(i) f(x) 6=∞ für alle x ∈ Rn

(ii) f(x) = f(x) für fast alle x ∈ Rn

Beweis. Sei N = x : f(x) =∞. Wir definieren f durch

f(x) =

f(x), x 6∈ N0 , x ∈ N

Diese Funktion leistet das Verlangte.

Satz 3.9. Sei f : Rd → C. Es gilt ‖f‖1 = 0 genau dann, wenn f(x) = 0 fastüberall.

Beweis. Gilt f = 0 fast überall, so ist ‖f‖1 =∫|f | =

∫0 = 0 nach Satz 3.7.

Es gelte ‖f‖1 = 0. Für k ∈ N sei

Nk =

x ∈ Rd : |f(x)| ≥ 1

k

.

Dann gilt

v(Nk) =

∫Nk

1 ≤ k

∫Nk

|f | ≤ k‖f‖1 = 0.

Damit folgt mit Lemma 3.5 (ii), dass

v(x : f(x) 6= 0) = v

(⋃k∈N

Nk

)= 0.

16

Page 19: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Wichtig ist folgende Charakterisierung von Nullmengen.

Satz 3.10. Sei N ⊆ Rd. Es ist N genau dann Nullmenge, wenn zu jedem ε > 0eine Folge (Qk) von Quadern mit N ⊆

⋃∞k=1Qk und

∑∞k=1 v(Qk) < ε existieren.

Die Qk können als Würfel gewählt werden.

Beweis. Existieren zu jedem ε > 0 solche Quader Qk, so gilt

‖χN‖1 ≤

∥∥∥∥∥∞∑k=1

χQk

∥∥∥∥∥1

≤∞∑k=1

‖χQk‖1 =∞∑k=1

v(Qk) < ε,

also v(N) = 0.Den Beweis der Umkehrung skizzieren wir nur: Es gelte v(N) = 0 und damit

‖χN‖1 = 0. Sei ε > 0. Wir zeigen zuerst, dass eine offene Menge U mit N ⊆ Uund v(U) < ε existiert. Zunächst existieren offene Quader Qk und ck ≥ 0 mit2 · χN ≤

∑∞k=1 ckχQk und

∑∞k=1 ckv(Qk) < ε.

Die Menge

U =

x ∈ Rd :

∞∑k=1

ckχQk(x) > 1

ist offen (da die Qk offen sind und für x ∈ U ein n ∈ N mit

∑nk=1 ckχQk(x) > 1

existiert).Es gilt außerdem

v(U) =

∫χU ≤

∫ ∞∑k=1

ckχQk ≤∞∑k=1

ckv(Qk) < ε

und natürlich U ⊇ N .Es muss jetzt nur noch eine geeignete Überdeckung der offenen Menge U

angegeben werden. Dies erfolgt wie in Abbildung 3 skizziert.

Abbildung 3: Ausschöpfung einer offenen Menge durch abgeschlossene Qua-der.

17

Page 20: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

4 Lp-Räume

Da sich das Integral einer integrierbaren Funktion nach Satz 3.7 nicht ändert,wenn man sie auf eine Nullmenge umdefiniert, kann man auch über Integrationvon Funktionen reden, die auf einer Nullmenge überhaupt nicht definiert sind,d.h. Funktionen, die nur fast überall definiert sind.

Ebenso kann man Nullmengen zum Integrationsbereich hinzufügen oder weg-lassen, d.h., ist f über A integrierbar und N Nullmenge, so gilt∫

A

f =

∫A\N

f =

∫A∪N

f.

Im letzten Integral muss f dabei auf N nicht definiert sein.Sei V der Vektorraum der Funktionen f : Rd → C. Durch

f ∼ g :⇔ f = g fast überall

ist eine Äquivalenzrelation gegeben und

U = f ∈ V : f(x) = 0 fast überall = f ∈ V : ‖f‖1 = 0

ist Unterraum von V . Es ist ‖ · ‖1 aus zwei Gründen keine Norm auf V :

(i) Es existieren f ∈ V mit ‖f‖1 =∞.

(ii) Es existieren f ∈ V \0 mit ‖f‖1 = 0, nämlich alle f ∈ U\0.

Das erste Hindernis können wir durch Einschränkung auf

L1(Rd) = f ∈ V : f integrierbar

beseitigen. Es ist U auch Teilraum von L1(Rd). Wir betrachten nun den Quoti-entenraum

L1(Rd) = L1(Rd)/U.

Sei [f ] ∈ L1(Rd) die Äquivalenklasse von f ∈ L1(Rd). Aus f ∼ g, also [f ] = [g]folgt dann mit Satz 3.9, dass ‖f‖1 = ‖g‖1. Wir können also eine Abbildung‖ ·‖1 : L1(Rd)→ R, ‖[f ]‖1 = ‖f‖1, definieren. Nach Konstruktion gilt ‖[f ]‖1 = 0genau dann, wenn [f ] = [0]. Die anderen Normeigenschaften für die Abbildung‖ · ‖1 : L1(Rd)→ R folgen aus denen von ‖ · ‖1 : L1(Rd)→ R.

Damit erhalten wir folgendes Ergebnis.

Satz 4.1. (L1(Rd), ‖ · ‖1) ist normierter Raum.

Es ist allgemein üblich, die Äquivalenzklasse von f nicht mit [f ], sondern wiedermit f zu bezeichnen.

Anstelle von ‖ · ‖1 kann man allgemein auch für p > 1 und f : Rd → C

‖f‖p = (‖ |f |p ‖1)1/p

betrachten. Auch hier ist ‖f‖p = ∞ möglich, und aus ‖f‖p = 0 folgt auchnicht f = 0. Diese Defizite lassen sich wie im Fall p = 1 beheben. Von denweiteren Eigenschaften einer Norm ist ‖λ · f‖p = |λ| · ‖f‖p für λ ∈ C klar, dieDreiecksungleichung aber zunächst nicht. Dazu zeigen wir folgendes Lemma.

18

Page 21: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Lemma 4.2. Seien a, b ≥ 0 und p, q > 1 mit 1p

+ 1q

= 1. Dann gilt

a · b ≤ 1

pap +

1

qbq.

Beweis. Die Behauptung ist klar, falls a = 0 oder b = 0. Seien a, b > 0. Wirsetzen x = log a und y = log b. Dann gilt auf Grund der Konvexität der Expo-nentialfunktion

a · b = ex · ey

= ex+y

= exp

(1

ppx+

1

qqy

)≤ 1

pexp(px) +

1

qexp(qy)

=1

pap +

1

qbq

Mit Hilfe dieses Lemmas erhalten wir zunächst folgendes Resultat.

Satz 4.3. (Höldersche Ungleichung) Seien f, g : Rd → C und p, q > 1 mit

1

p+

1

q= 1.

Dann gilt‖f · g‖1 ≤ ‖f‖p · ‖g‖q

Beweis. Man kann ‖f‖p, ‖g‖q 6= ∞ annehmen. Gilt ‖f‖p = 0, so ist f = 0 fastüberall, also f · g = 0 fast überall und damit ‖f · g‖1 = 0. Analoges gilt, falls‖g‖q = 0. Man kann also ‖f‖p, ‖g‖q 6= 0 annehmen.

SeiF =

f

‖f‖pund G =

g

‖g‖q.

Dann gilt ‖F‖p = ‖G‖q = 1.Nach Lemma 4.2 gilt

|F (x) ·G(x)| ≤ 1

p|F (x)|p +

1

q|G(x)|q.

Es folgt

‖F ·G‖1 ≤1

p‖F‖pp +

1

q‖G‖qq = 1

und damit die Behauptung.

Die gewünschte Dreiecksungleichung liefert nun folgender Satz.

Satz 4.4. (Minkowskische Ungleichung) Seien f, g : Rd → C und p > 1.Dann gilt

‖f + g‖p ≤ ‖f‖p + ‖g‖p.

19

Page 22: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Sei q gemäß der Hölderschen Ungleichung gewählt, also 1/p+ 1/q = 1.Dann gilt

‖f + g‖pp = ‖ |f + g|p ‖1≤

∥∥ |f | · |f + g|p−1 + |g| · |f + g|p−1∥∥1

≤∥∥ |f | · |f + g|p−1

∥∥1

+∥∥ |g| · |f + g|p−1

∥∥1

≤ ‖f‖p∥∥ |f + g|p−1

∥∥q

+ ‖g‖p∥∥ |f + g|p−1

∥∥q

= (‖f‖p + ‖g‖p)∥∥ |f + g|p−1

∥∥q.

Weiter gilt wegen (p− 1)q = p∥∥ |f + g|p−1∥∥q

=(∥∥ |f + g|(p−1)q

∥∥1

) 1q

= ‖ |f + g|p‖1q

1

= ‖ |f + g|p‖p−1p

1

= ‖f + g‖p−1p .

Die Behauptung folgt.

Sei nun Lp(Rd) die Menge aller Funktionen f : Rd → C, so dass

(i) ‖f‖p <∞

(ii) f ist lokal integrierbar, d.h., für alle x ∈ Rd existiert eine Umgebung Xvon x, so dass f integrierbar über X ist.

Dann ist Lp(Rd) ein Vektorraum. Mit der Äquivalenzrelation ∼ wie oben defi-niert man

Lp(Rd) = Lp(Rd)/f ∈ Lp(Rd) : ‖f‖p = 0.De facto identifiziert man Lp(Rd) und Lp(Rd) wieder miteinander, d.h., die Äqui-valenzklasse von f ∈ Lp(Rd) in Lp(Rd) wird wieder mit f bezeichnet.

Analog zu Satz 4.1 gilt – mit der offensichtlichen Definition der Norm ‖ · ‖pauf Lp(Rd) – folgender Satz.

Satz 4.5. (Lp(Rd), ‖ · ‖p) ist normierter Raum.

Für p =∞ geht man wie folgt vor: Eine Funktion f : Rd → C heißt wesentlichbeschränkt, falls M ∈ R existiert, so dass x ∈ Rd : |f(x)| > M Nullmenge ist.Das Infimum über alle diese M wird mit ‖f‖∞ bezeichnet. Mit L∞(Rp) bezeich-net man den Vektorraum der lokal integrierbaren und wesentlich beschränktenFunktionen f : Rd → C. Wie oben erhält man hieraus einen normierten Raum(L∞(Rd), ‖ · ‖∞).

Analog definiert man für p ≥ 1 und eine messbare Teilmenge A von Rd

auch den Raum Lp(A) der (Äquivalenzklasse von) Funktionen f : A → C mit‖fA‖p <∞ und findet mit ‖f‖p = ‖[f ]‖p = ‖fA‖p, dass (Lp(A), ‖·‖p) normierterRaum ist.

Tatsächlich reicht es zu fordern, dass A „lokal messbar“ ist, d.h., dass jederPunkte in A eine Umgebung X besitzt, so dass X ∩ A messbar ist.

20

Page 23: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Bemerkung. Die Terminologie ist uneinheitlich. In einigen Büchern wird als„messbar“ bezeichnet, was wir „lokal messbar“ genannt haben.

Beispiele. 1. Die durch x 7→ 1/x gegebene Funktion ist in Lp((1,∞)) falls p > 1,aber sie ist nicht in L1((1,∞)).

2. Die durch x 7→ 1/√x gegebene Funktion ist in Lp((0, 1)) für 1 ≤ p < 2,

aber nicht für p ≥ 2.

5 Volumenänderung unter affinen Abbildungen

Satz 5.1. Sei f : Rd → C integrierbar und a ∈ Rd. Sei fa : Rd → C, fa(x) =f(x− a). Dann ist fa integrierbar und

∫fa = f .

Beweis. Die Behauptung folgt leicht, wenn man die Treppenfunktionen ϕk inder Definition von

∫f durch ϕk,a ersetzt.

Folgerung. Ist A ⊂ Rd messbar und a ∈ Rd, so ist auch a+A = a+ x : x ∈ Amessbar und v(a+ A) = v(A).

Satz 5.2. Sei A ⊂ Rd kompakt und sei L : Rd → Rd linear. Dann ist auch L(A)messbar und es gilt

v (L(a)) = | det(L)| · v(A).

Beweis. Jede lineare Abbildung lässt sich als Hintereinanderausführung von li-nearen Abbildungen darstellen, deren Matrizen (aij) von einem der folgendendrei Typen sind:

(i) Es existieren k, l ∈ 1, . . . , d, k 6= l, mit alk = akl = 1, ajj = 1 fürj ∈ 1, . . . , d\k, l und aij = 0 für alle anderen i, j.

Multiplikation mit dieser Matrix vertauscht die k-te und l-te Zeile (bzw.Spalte).

(ii) Es existieren λ1, . . . , λd ∈ R mit ajj = λj und aij = 0 für i 6= j, d.h., (aij)ist Diagonalmatrix.

(iii) Es existiert λ ∈ R mit a12 = λ, ajj = 1 für j ∈ 1, . . . , d und aij = 0 füralle anderen i und j.

Multiplikation mit dieser Matrix addiert das λ-fache der zweiten Zeile(bzw. Spalte) zur ersten.

Es genügt, die Behauptung für lineare Abbildungen zu zeigen, deren zugehörigeMatrizen von einem dieser drei Typen sind.

Zu (i): Ein Quader Qj = I1 × · · · × Ik × · · · × Il × · · · × Id, der in einerTreppenfunktion

∑cjχQj in der Definition von

∫χA auftaucht, wird hier durch

I1×· · ·×Il×· · ·×Ik×· · ·×Id ersetzt. (Man beachte, dass hier die Determinanteder Abbildung −1 ist.)

Zu (ii): Hier ersetzt man I1 × · · · × Id durch λ1I1 × · · · × λdId.

21

Page 24: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Zu (iii): Es reicht, den Fall d = 2 zu betrachten, womit L von der Form

L(x, y) =

(1 λ0 1

)(xy

)=

(x+ λyy

)ist.

Mit Ay = x : (x, y) ∈ A und L(A)y = x : (x, y) ∈ L(A)erkennen wir, dass

L(A)y = λy + Ay.

Hieraus folgt mit der Folgerung zu Satz 5.1, dass

v(L(A)y) = v(Ay).

Nach Cavalierischem Prinzip folgt, dass

v (L(A)) =

∫Rv (L(A)y) dy =

∫Rv(Ay)dy = v(A).

Definition 5.3. Seien a1, . . . , ad ∈ Rd. Dann heißt

P (a1, . . . , ad) =

d∑j=1

tjaj : 0 ≤ tj ≤ 1 für alle j

der von a1, . . . , ad aufgespannte Parallelepiped (oder Parallelotop oder Spat).

Satz 5.4. Parallelepipede sind messbar und es gilt

vd (P (a1, . . . , ad)) = | det(a1, . . . , ad)|.

für a1, . . . , ad ∈ Rd. Dabei ist det(a1, . . . , ad) die Determinante der Matrix mitden Spalten a1, . . . , ad.

Beweis. Seien e1, . . . , ed die Standard-Einheitsvektoren und sei L die lineareAbbildung mit L(ej) = aj. Dann gilt

P (a1, . . . , ad) = L (P (e1, . . . , ed)) .

Wegenv (P (e1, . . . , ed)) = 1

unddet(L) = det(a1, . . . , ad)

folgt die Behauptung nun direkt aus Satz 5.2.

22

Page 25: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

6 Konvergenzsätze

Wir wollen zeigen, dass die Räume (Lp(A), ‖ · ‖p) vollständig sind. Der Einfach-heit halber beschränken wir uns auf den Raum

(L1(Rd), ‖ · ‖1

). Eine Folge (fk)

in L1(Rd), oder allgemeiner eine Folge (fk) von Funktionen von Rd nach C, heißtCauchyfolge (genauer L1-Cauchyfolge), falls zu jedem ε > 0 ein N ∈ N existiert,so dass ‖fm − fn‖1 < ε für m,n ≥ N .

Wir wollen zeigen, dass Cauchyfolgen in L1(Rd) konvergieren. Allgemeinerzeigen wir folgendes Resultat.

Satz 6.1. (Satz von Riesz-Fischer) Sei (fk) eine L1-Cauchyfolge integrier-barer Funktionen von Rd nach C. Dann existiert f ∈ L1(Rd) mit

limk→∞‖fk − f‖1 = 0

und es gilt

limk→∞

∫fk =

∫f.

Außerdem existiert eine Teilfolge (fkj) von (fk) mit fkj(x)→ f(x) fast überall.

Bemerkung. 1. Sei ([fk]) Cauchyfolge in(L1(Rd), ‖ · ‖1

). Dann ist der Satz von

Riesz-Fischer auf die Folge (fk) anwendbar. Ist f wie im diesem Satz gewählt,so ist [f ] Grenzwert von ([fk]) in

(L1(Rd), ‖ · ‖1

). Es folgt, dass

(L1(Rd), ‖ · ‖1

)vollständiger normierter Raum ist. Allgemeiner sind die Räume (Lp(A), ‖ · ‖p)vollständig für 1 ≤ p ≤ ∞.

2. Im Allgemeinen gilt nicht fk(x) → f(x) fast überall. Ein Gegenbeispielerhält man wie folgt:

Für k ∈ N sei n ∈ N0 mit 2n ≤ k ≤ 2n+1 − 1. Weiter sei

Ik =

[k

2n− 1,

k + 1

2n− 1

]und fk = χIk . Es ist also fk die charakteristische Funktion eines Teilintervallsvon [0, 1] der Länge 1/2n.

Es gilt ‖fk‖1 → 0, also ‖fk − f‖1 → 0 für f = 0, aber für x ∈ [0, 1] undn ∈ N0 existiert k mit 2n ≤ k ≤ 2n+1 − 1 und fk(x) = 1. Also existiert keinx ∈ [0, 1] mit fk(x)→ f(x) = 0.

Beweis von Satz 6.1. Sei (kj) wachsende Folge mit

‖fk − fkj‖1 <1

2jfür k ≥ kj.

Wir zeigen zunächst, dass (fkj) fast überall konvergiert.Sei dazu gj = fkj+1

− fkj . Dann gilt ‖gj‖1 < 2−j und mit

h(x) :=∞∑k=1

|gj(x)| =∞∑k=1

|fkj+1(x)− fkj(x)|

folgt ‖h‖1 ≤∑∞

j=1 ‖gj‖1 < 1. Damit existiert eine Nullmenge N mit h(x) 6= ∞für x 6∈ N .

23

Page 26: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Wir definieren nun

f(x) =

fk1(x) +

∑∞j=1

(fkj+1

(x)− fkj(x)), x 6∈ N,

0 , x ∈ N.

Für x 6∈ N gilt also

f(x) = limn→∞

(fk1(x) +

n−1∑j=1

(fkj+1

(x)− fkj(x)))

= limn→∞

fkn(x).

Wir zeigen nun, dass f die behaupteten Eigenschaften hat.Zunächst gilt

‖f − fkm‖1 =

∥∥∥∥∥ limn→∞

n∑j=m

(fkj+1

− fkj)∥∥∥∥∥

1

≤∞∑j=m

‖gj‖1

und damit ‖f − fkm‖1 → 0 für m → ∞. Die L1-Cauchyfolge (fk) hat also einebezüglich der L1-Halbnorm konvergente Teilfolge. Hieraus folgt die Konvergenzvon (fk) bezüglich der L1-Halbnorm mit einem Standardargument:

Denn zu ε > 0 existiert m mit

‖fkm − f‖1 <ε

2und ‖fk − fkm‖1 <

ε

2für k ≥ km.

Es folgt

‖fk − f‖1 ≤ ‖fk − fkm‖1 + ‖fkm − f‖1 < ε für k ≥ km,

also ‖fk − f‖1 → 0.Schließlich existiert eine Folge (ϕk) von Treppenfunktion mit ‖ϕk−fk‖1 → 0

für k →∞. Es folgt wegen

‖ϕk − f‖1 ≤ ‖ϕk − fk‖1 + ‖fk − f‖1,

dass ‖ϕk − f‖1 → 0. Damit ist f integrierbar.Außerdem gilt ∣∣∣∣∫ fk −

∫f

∣∣∣∣ ≤ ‖fk − f‖1und damit

∫fk →

∫f .

Satz 6.2. (Satz von Beppo Levi, Satz von der monotonen Konvergenz)Sei (fk) eine monoton wachsende Folge integrierbarer Funktionen auf Rd und seif der (punktweise) Grenzwert der fk, also f(x) = limk→∞ fk(x) für x ∈ Rd. Istdie Folge (

∫fk) beschränkt, so ist f integrierbar und es gilt∫

f = limk→∞

∫fk.

24

Page 27: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Die Folge (∫fk) ist monoton und beschränkt, also konvergent und damit

auch Cauchyfolge. Da

‖fn − fm‖1 =

∫|fn − fm| =

∫(fn − fm) =

∫fn −

∫fm

für n ≥ m, ist (fn) eine L1-Cauchyfolge. Die Behauptung erhält man jetzt leichtmit Satz 6.1.

Seien A1, A2, . . . Teilmengen des Rd mit A1 ⊆ A2 ⊆ A3 ⊆ . . . und seiA =

⋃∞j=1Aj. Wir sagen, dass die Folge (Aj) eine Ausschöpfung der Menge A

ist. Wendet man Satz 6.2 auf die Folge (χAk) an, so erhält man, dass mit den Akauch A messbar ist, falls die Folge (v(Ak)) beschränkt ist. Außerdem gilt dannv(A) = limk→∞ v(Ak).

Allgemeiner gilt der folgende Satz.

Satz 6.3. Ist (Ak) Ausschöpfung von A und f : A→ C über jedes Ak integrier-bar, so ist f genau dann über A integrierbar, wenn die Folge

(∫Ak|f |)beschränkt

ist. Es gilt dann ∫A

f = limk→∞

∫Ak

f.

Beweisskizze. Ohne Einschränkung der Allgemeinheit kann man f ≥ 0 anneh-men. Man wende jetzt Satz 6.2 auf die Folge (fAk) an.

Es folgt aus Satz 6.3, dass für −∞ ≤ a < b ≤ ∞ und eine stetige Funktionf : (a, b)→ C das Lebesgue-Integral von f über (a, b) genau dann existiert, wenndas uneigentliche Riemann-Integral

∫ ba|f(x)|dx existiert.

Sei (Bk) eine Folge paarweise disjunkter Teilmengen des Rd. Durch Anwen-dung des vor Satz 6.3 genannten Resultats auf die Mengen Ak = B1∪B2∪· · ·∪Bk

erhält man folgenden Satz.

Satz 6.4. Sei (Bj) eine Folge paarweise disjunkter, messbarer Mengen. Dannist⋃∞j=1Bj genau dann messbar, wenn

∑∞j=1 v(Bj) <∞. Es gilt dann

v

(∞⋃j=1

Bj

)=∞∑j=1

v(Bj).

Bemerkung. Nach der Folgerung zu Satz 5.1 und nach Satz 6.4 hat das Lebes-guemaß folgende Eigenschaften:

(i) v(∅) = 0,

(ii) v([0, 1]d) = 1,

(iii) v(a+ A) = v(A), falls A messbar und a ∈ A,

(iv) v(⋃∞

j=1Bj

)=∑∞

j=1 v(Bj), falls die Bj messbare, paarweise disjunkt Men-gen mit

∑∞j=1 v(Bj) <∞ sind.

25

Page 28: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Man kann zeigen, dass (i) − (iv) das Lebesguemaß in gewisser Weise charak-terisieren: Ist B Teilmenge der Potenzmenge des Rd, die alle kompakten undbeschränkten offenen Mengen enthält, und ist v : B → [0,∞) eine Abbildung,die (i) − (iv) erfüllt, so ist v das Lebesguemaß. Einen Beweis dieser Aussagegeben wir hier nicht.

Wie das folgende Beispiel zeigt, kann man B hier nicht gleich der Potenzmen-ge des Rd wählen. Tatsächlich zeigt sich, dass eine auf der ganzen Potenzmengedefinierte Funktion v mit den Eigenschaften (i)− (iv) nicht existiert.

Beispiel. Sei ∼ die durchx ∼ y ⇔ x− y ∈ Q

definierte Relation auf [0, 1]. Dann ist ∼ Äquivalenzrelation. Sei R ein in [0, 1]enthaltenes Repräsentantensystem dieser Äquivalenzrelation, d.h., es ist R ⊆[0, 1] mit

⋃r∈R[r] = [0, 1]/∼ und es gilt r 6∼ s für r, s ∈ R mit r 6= s.

Wir zeigen, dass R nicht messbar ist. Dazu nehmen wir an, R wäre messbar.Dann ist für q ∈ Q auch q +R messbar. Sei (qk) eine Abzählung von Q ∩ [0, 1].Dann gilt [0, 1] ⊆ A :=

⋃∞k=1(qk+R) ⊆ [−1, 2] und wir erhalten, dass A messbar

ist mit

v(A) =∞∑k=1

v(qk +R) =∞∑k=1

v(R)

und1 = v([0, 1]) ≤ v(A) ≤ v([−1, 2]) = 3.

Das ist ein Widerspruch.

Satz 6.5. (Satz von Lebesgue, Satz über majorisierte Konvergenz) Sei(fk) eine Folge integrierbarer Funktionen auf Rd, die fast überall (punktwei-se) gegen eine Funktion f konvergieren. Es existiere eine integrierbare FunktionF : Rd → R mit |fk| ≤ F für alle k. Dann ist f integrierbar und es gilt∫

f = limk→∞

∫fk.

Bemerkung. Ohne die Voraussetzung, dass eine Funktion F wie angegeben exis-tiert, gilt der Satz nicht. Man betrachte etwa die Funktionen fk : [0,∞) → R,fk(x) = k2xe−kx. Hier gilt

∫∞0fk(x) = 1 für alle k ∈ N, aber fk(x) → 0 für

k →∞ und alle x ∈ [0,∞); vgl. Abbildung 4.

Beweis von Satz 6.5. Indem man die fk und F gegebenenfalls auf einer Null-menge umdefiniert, kann man annehmen, dass fk(x) → f(x) für alle x undF (x) 6=∞ für alle x. Des Weiteren kann man annehmen, dass die fk reellwertigsind.

Für i ≤ k seigi,k = max

i≤j≤kfj.

Es gilt dann ∫gi,k ≤

∫F.

26

Page 29: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Abbildung 4: Die Graphen von fk(x) = k2xe−kx für k = 1, 2, 5, 10.

Seigi = sup

j≥ifj.

Dann giltgi(x) = lim

k→∞gi,k(x)

für alle x. Mit dem Satz über monotone Konvergenz folgt, dass integrierbar ist,mit ∣∣∣∣∫ gi

∣∣∣∣ =

∣∣∣∣ limk→∞

∫gi,k

∣∣∣∣ ≤ ∫ F.

Die Folge (gi) ist monoton fallend und es gilt

f(x) = limi→∞

gi(x).

Wir erhalten wiederum mit dem Satz über monotone Konvergenz, dass f inte-grierbar ist und dass ∫

f = limi→∞

∫gi.

Mithi = inf

j≥ifj

folgt analog ∫f = lim

i→∞

∫hi.

Wegen hi ≤ fi ≤ gi folgt die Behauptung.

Bemerkung. Auch wenn die (reellwertige) Folge (fk) nicht konvergiert, könnendie Folgen (gi,k) und (gi) aus dem obigen Beweis betrachtet werden. Es gilt dann

lim supi→∞

fi(x) = limi→∞

supj≥i

fj(x) = limi→∞

gi(x) = limi→∞

limk→∞

gi,k(x).

Mit anderen Worten: Die Grundidee des obigen Beweises ist, den Grenzwert alsLimes superior und damit als Grenzwert einer monotonen Folge zu schreiben,so dass der Satz von der monotonen Konvergenz angewandt werden kann.

27

Page 30: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Bemerkung. Eine entsprechende Aussage gilt für Funktionenfolgen, die auf einer(lokal messbaren) Teilmenge A von Rd definiert sind. Ist A beschränkt, so kannman F konstant wählen. Für eine Folge (fk) von gleichmäßig beschränkten,auf einer messbaren und beschränkten Menge A integrierbaren Funktionen folgtalso aus der punktweisen Konvergenz von (fk) die Integrierbarkeit von f =limk→∞ fk.

Satz 6.6. Sei f : [a, b]→ R differenzierbar. Ist f ′ beschränkt, so ist f ′ integrier-bar und es gilt

f(x)− f(a) =

∫ x

a

f ′(t)dt.

Bemerkung. Man vergleiche die Aussage mit dem Hauptsatz der Differential-und Integralrechnung. Dieser liefert die Aussage, falls f ′ stetig ist.

Beweis. Es gelte |f ′(x)| ≤M für alle x ∈ R. Für k ∈ N sei fk : [a, b]→ R,

fk(x) =

k(f(x+ 1

k

)− f(x)

), a ≤ x ≤ b− 1

k,

0 , b− 1k< x ≤ b.

Dann ist fk integrierbar.Nach Mittelwertsatz gilt

|fk(x)| ≤M

für alle x ∈ [a, b]. Außerdem gilt

fk(x)→ f ′(x)

für alle x ∈ [a, b). Nach dem Satz über majonisierte Konvergenz folgt, dass f ′integrierbar ist und dass∫ b

a

f ′(x)dx = limk→∞

∫ b

a

fk(x)dx

= limk→∞

∫ b−1/k

a

k(f(x+ 1

k

)− f(x)

)dx

= limk→∞

(k

∫ b

b−1/kf(x)dx− k

∫ a+1/k

a

f(x)dx

).

Nun ist f stetig und damit gilt∣∣∣∣∣k∫ a+1/k

a

f(x)dx− f(a)

∣∣∣∣∣ =

∣∣∣∣∣k∫ a+1/k

a

(f(x)− f(a))dx

∣∣∣∣∣≤ max

a≤x≤a+1/k|f(x)− f(a)|.

Es folgt, dass ∫ a+1/k

a

f(x)dx→ f(a).

28

Page 31: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Analog erhält man ∫ b

b−1/kf(x)dx→ f(b).

Insgesamt folgt ∫ b

a

f ′(x)dx = f(b)− f(a).

Damit gilt auch ∫ x

a

f ′(t)dt = f(x)− f(a)

für x ∈ [a, b].

7 Parameterabhängige Integrale

Wir wollen untersuchen, inwieweit sich die Reihenfolge von Integration und Dif-ferentiation vertauschen lässt. Wir schreiben für d = p + q die Elemente vonRd = Rp × Rq wieder in der Form (x1, . . . , xp, y1, . . . , yq).

Sei X ⊆ Rp, Y ⊆ Rq und sei f : X × Y → C. Wir nehmen an, dass für jedesx ∈ X die durch y 7→ f(x, y) definierte Funktion integrierbar ist. Dann kanneine Funktion F : X 7→ C,

F (x) =

∫Y

f(x, y)dy

definiert werden.Aus der Stetigkeit von f folgt im Allgemeinen nicht die von F . Etwa für

X = Y = R und f(x, y) = x exp (−(xy)2) folgt für x > 0, dass

F (x) =

∫ ∞−∞

x exp(−(xy)2

)dy =

∫ ∞−∞

e−t2

dt =√π.

Es folgt

F (x) =

√π , x > 0,

0 , x = 0,

−√π, x < 0.

Damit ist F unstetig.Es gilt aber folgendes Resultat.

Satz 7.1. Seien f : X × Y → C und F : X → C wie oben. Es gelte:

(a) Für alle y ∈ Y ist x 7→ f(x, y) stetig.

(b) Es existiert eine integrierbare Funktion Φ: Y → [0,∞) so dass |f(x, y)| ≤Φ(y) für alle x ∈ X und y ∈ Y .

Dann ist F stetig.

29

Page 32: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Wir müssen zeigen, dass aus xk → x0 folgt, dass F (xk)→ F (x0) gilt.Sei also (xk) Folge in X mit xk → x0 ∈ X. Sei fk : Y → C, fk(y) = f(xk, y).

Da die fk integrierbar sind und |fk| ≤ Φ gilt, folgt mit dem Satz über majorisierteKonvergenz und f0 : Y → C, f0(y) = f(x0, y), dass

F (xk) =

∫Y

f(xk, y)dy =

∫Y

fk →∫Y

f0 =

∫Y

f(x0, y) = F (x0).

Satz 7.2. Seien f : X × Y → R und F : X → R wie vorher. Weiterhin sei Xoffen und es gelte:

(a) Für alle y ∈ Y ist x 7→ f(x, y) stetig differenzierbar (oder äquivalent dazu:alle partiellen Ableitungen ∂f/∂xk existieren und sind stetig in X).

(b) Es existiert eine integrierbare Funktion Φ: Y → [0,∞), so dass∣∣∣∣ ∂f∂xk (x, y)

∣∣∣∣ ≤ Φ(y)

für alle x ∈ X, y ∈ Y und k ∈ 1, . . . , p.

Dann ist F stetig differenzierbar.Außerdem ist die durch

y 7→ ∂f

∂xk(x, y)

gegebene Funktion von Y nach R für alle x ∈ X und alle k ∈ 1, . . . , p inte-grierbar und es gilt

∂F

∂xk(x, y) =

∫Y

∂f

∂xk(x, y)dy.

Beweis. Sei ξ ∈ X und ek der k-te Einheitsvektor. Sei weiter (hj) Nullfolge inR\0 und gj : Y → R,

gj(y) =f(ξ + hjek, y)− f(ξ, y)

hj.

Dann gilt

gj(y)→ ∂f

∂xk(ξ, y)

für j → ∞ und alle y ∈ Y . Aus dem Mittelwertsatz folgt |gj| ≤ Φ, vgl. denBeweis von Satz 6.6. Damit kann der Satz über majorisierte Konvergenz auf dieFolge (gj) angewandt werden. Es folgt, dass y 7→ ∂f/∂xk(ξ, y) integrierbar istund ∫

Y

gj(y)dy →∫Y

∂f

∂xk(ξ, y)dy.

Andererseits gilt ∫Y

gj(y)dy =F (ξ + hjek)− F (ξ)

hj.

Es folgt die partielle Differenzierbarkeit von F und die Formel für ∂F/∂xk. DieStetigkeit der partiellen Ableitungen folgt aus Satz 7.1.

30

Page 33: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beispiel. Sei F : (0,∞)→ R,

F (x) =

∫ 1

0

yxdy =1

1 + x.

Wegen ∣∣∣∣∂yx∂x∣∣∣∣ = |yx log y| ≤ | log y|

und der Integrierbarkeit von y 7→ | log y| über (0, 1) folgt∫ 1

0

yx log y dy = F ′(x) = − 1

(1 + x)2.

Das hätte man natürlich mit partieller Integration auch direkt ausrechnen kön-nen.

8 Der Satz von Fubini

Sei wieder d = p + q, so dass Rd = Rp+q = Rp × Rq. Wie zuvor schreiben wirPunkte z ∈ Rd in der Form z = (x, y) mit x ∈ Rp und y ∈ Rq.

Satz 8.1. (Satz von Fubini) Sei f : Rp+q → C integrierbar. Dann ist die durchx 7→ f(x, y) definierte Funktion von Rp nach C für fast alle y ∈ Rq integrierbarüber Rp.

Sei F : Rq → C, mit

F (y) =

∫Rpf(x, y)dx

falls x 7→ f(x, y) integrierbar und F (y) = 0 sonst. Dann ist F integrierbar undes gilt ∫

Rp+qf(x, y)d(x, y) =

∫RqF (y)dy.

Bemerkung. 1. Da die Menge der y, für die x 7→ f(x, y) nicht integrierbar ist,eine Nullmenge ist, ist eigentlich gleichgültig, wie man F auf dieser Menge defi-niert.

2. Man kann die letzte Formel im Satz auch in der Form∫Rp+q

f(x, y)d(x, y) =

∫Rq

(∫Rpf(x, y)dx

)dy

schreiben. Aus Symmetriegründen gilt auch∫Rp+q

f(x, y)d(x, y) =

∫Rp

(∫Rqf(x, y)dy

)dx.

3. Für Treppenfunktionen hatten wir das Resultat bereits im Anschluss anDefinition 1.3 notiert. Für beschränkte stetige Funktionen auf beschränkten of-fenen Mengen sowie stetige Funktionen auf kompakten Mengen hatten wir dasErgebnis als Satz 2.9 bewiesen.

31

Page 34: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Zum Beweis benötigen wir folgendes Lemma.

Lemma 8.2. Sei A ⊂ Rp+q Nullmenge. Für y ∈ Rq sei

Ay = x ∈ Rp : (x, y) ∈ A.

Dann ist Ay für fast alle y Nullmenge.

Beweis. Wir betrachten die Funktionen g : Rq → R, g(y) = ‖χAy‖1. Wir werdenzeigen, dass ‖g‖1 = 0. Hieraus folgt mit Satz 3.9, dass g(y) = 0 und damitv(Ay) = 0 für fast alle y ∈ Rq gilt.

Man beachte, dass ‖χAy‖1 die L1-Halbnorm in Rp und ‖g‖1 die in Rq ist.Genauer schreiben wir ‖χAy‖R

p

1 bzw. ‖g‖Rq1 .Nach Satz 3.10 existiert zu ε > 0 eine Folge (Qk) von Quadern mit

A ⊆∞⋃k=1

Qk und∞∑k=1

v(Qk) < ε.

Wir schreiben Qk = Q′k ×Q′′k mit Quadern Q′k ⊂ Rp und Q′′k ⊂ Rq. Es gilt dannv(Qk) = vp+q(Qk) = vp(Q

′k) · vq(Q′′k). Wegen

χAy(x) = χA(x, y) ≤∞∑k=1

χQk(x, y) =∞∑k=1

χQ′k(x)χQ′′k (y)

folgt

g(y) = ‖χAy‖Rp

1 ≤∞∑k=1

χQ′′k (y)‖χQ′k(x)‖Rp1 =∞∑k=1

χQ′′k (y)v(Q′k)

und damit

‖g‖Rq1 ≤∞∑k=1

vp(Q′k)‖χQ′′k (y)‖Rq1 =

∞∑k=1

vp(Q′k)vq(Q

′′k) < ε.

Damit gilt ‖g‖1 = 0 und die Behauptung folgt.

Bemerkung. Sei A = [0, 1] × 0 ⊂ R2. Dann ist A Nullmenge (in R2), aberA0 = [0, 1] ist keine Nullmenge (in R). Im Allgemeinen ist in der Situation vonLemma 8.2 die Menge Ay also nicht für alle y eine Nullmenge, sondern nur fürfast alle.

Beweis von Satz 8.1. Nach Definition der Integrierbarkeit existiert eine Folge(ϕk) von Treppenfunktionen mit ‖f − ϕk‖1 → 0. Nach dem Satz von Riesz-Fischer können wir annehmen, dass ϕk → f fast überall. Außerdem können wirannehmen, dass

∞∑k=1

‖ϕk+1 − ϕk‖1 <∞.

Denn wählt man (ϕk) mit ‖ϕk− f‖1 < 2−k, so folgt ‖ϕk+1−ϕk‖1 < 2−k−1 + 2−k

nach Dreiecksungleichung.

32

Page 35: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Für y ∈ Rq sei fy : Rp → C, fy(x) = f(x, y). Analog definiere man ϕk,y. Dannist auch ϕk,y Treppenfunktion. Wir zeigen zunächst, dass für fast alle y die Folge(ϕk,y) gegen fy konvergiert, sowohl punktweise für alle x wie auch bezüglich derL1-Halbnorm in Rp.

Wir beginnen mit der ersten Aussage. Sei dazu A ⊂ Rp×Rq die Nullmenge,so dass ϕk(x, y) → f(x, y) für (x, y) 6∈ A, so gilt ϕk,y(x) → fy(x) für x ∈ Ay.Und nach Lemma 8.2 ist für Ay für fast alle y Nullmenge, etwa für y 6∈ N ′ miteiner Nullmenge N ′.

Um zu zeigen, dass ‖ϕk,y − fy‖1 → 0, sei

Hk(y) =

∫Rp|ϕk+1(x, y)− ϕk(x, y)|dx = ‖ϕk+1,y − ϕk,y‖1.

Da |ϕk+1−ϕk| Treppenfunktion ist, gilt nach dem Satz von Fubini für Treppen-funktionen∫

RqHk(y)dy =

∫Rp×Rq

|ϕk+1(x, y)− ϕk(x, y)|d(x, y) = ‖ϕk+1 − ϕk‖1,

also∞∑k=1

∫RqHk(y)dy <∞.

Mit dem Satz von Beppo Levi folgt, dass∑∞

k=1Hk integrierbar über Rq ist.Insbesondere gilt

∑∞k=1Hk(y) < ∞ für fast alle y, etwa y 6∈ N ′′ mit einer Null-

menge N ′′. Also gilt

∞∑k=1

Hk(y) =∞∑k=1

‖ϕk+1,y − ϕk,y‖ <∞ für y 6∈ N ′′.

Damit ist für y 6∈ N ′′ die Folge (ϕk,y) eine Cauchyfolge bezüglich der L1-Halbnorm.

Nach dem Satz von Riesz-Fischer existiert also für y /∈ N ′′ eine integrierbareFunktion gy : Rp → C mit ‖ϕk,y − gy‖1 → 0, und eine Teilfolge von (ϕk,y)konvergiert fast überall gegen gy. Für y 6∈ N ′ konvergiert aber (ϕk,y) fast überallgegen fy. Für y 6∈ N := N ′∪N ′′ folgt fy = gy und damit ist fy, also x 7→ f(x, y),integrierbar für y 6∈ N . Das liefert die erste Behauptung des Satzes.

Wir zeigen jetzt die Integrierbarkeit von F . Nach dem Satz von Riesz-Fischergilt wegen ‖ϕk,y − fy‖1 = ‖ϕk,y → gy‖1 → 0 auch

F (y) =

∫Rpf(x, y)dx =

∫Rpfy(x)dx = lim

k→∞

∫Rpϕk,y(x)dx

für y 6∈ N . Mit

Φk(y) =

∫Rpϕk,y(x)dx

gilt alsoF (y) = lim

k→∞Φk(y)

33

Page 36: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

für y 6∈ N . Weiterhin gilt

|Φk+1(y)− Φk(y)| ≤∫Rp|ϕk+1,y(x)− ϕk,y(x)|dx = Hk(y).

Dies liefert‖Φk+1 − Φk‖1 ≤

∫RqHk(y)dy = ‖ϕk+1 − ϕk‖1

und damit∞∑k=1

‖Φk+1 − Φk‖1 <∞.

Hieraus folgt, dass (Φk) eine L1-Cauchyfolge ist. Damit existiert eine in-tegrierbare Funktion G, so dass eine Teilfolge von (Φk) fast überall gegen Gkonvergiert. Andererseits gilt Φk(y)→ F (y) für y 6∈ N . Damit folgt F = G fastüberall. Also ist F integrierbar und∫

RqF (y)dy = lim

k→∞

∫Rq

Φk(y)dy

= limk→∞

∫Rq

(∫Rpϕk(x, y)dx

)dy

= limk→∞

∫Rp×Rq

ϕk(x, y)d(x, y)

=

∫Rp×Rq

f(x, y)d(x, y).

Beispiel. Es gilt (nach Übung)∫ 1

0

(∫ 1

0

x− y(x+ y)3

dx

)dy 6=

∫ 1

0

(∫ 1

0

x− y(x+ y)3

dy

)dx.

Dies widerspricht nicht dem Satz von Fubini, denn

(x, y) 7→ x− y(x+ y)3

ist nicht über (0, 1)2 integrierbar.

9 Die Transformationsformel

Wir wollen ein höherdimensionales Analogon der Substitutionsregel beweisen.Eine Formulierung der (eindimensionalen) Substitutionsregel ist wie folgt: Istg : [a, b]→ R stetig differenzierbar und f : g([a, b])→ R stetig, so gilt∫ b

a

f (g(x)) g′(x)dx =

∫ g(b)

g(a)

f(y)dy.

Falls g′(x) > 0 für alle in x ∈ [a, b], so gilt g(a) < g(b), und falls g′(x) < 0 füralle in x ∈ [a, b], so gilt g(b) < g(a). In beiden Fällen erhalten wir∫

[a,b]

f (g(x)) |g′(x)|dx =

∫g([a,b])

f(y)dy.

34

Page 37: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Es sei angemerkt, dass unter den obigen Voraussetzungen g bijektiv ist undneben g auch g−1 stetig differenzierbar ist.

Definition 9.1. Seien U, V ⊆ Rd offen. Eine Abbildung g : U → V heißt Dif-feomorphismus, wenn g bijektiv ist und g und g−1 beide stetig differenzierbarsind.

Wir bezeichnen mit Dg(x) die totale Ableitung von g im Punkte x ∈ U . Diezur linearen Abbildung Dg(x) gehörende Matrix ist die Jacobi-Matrix. Diese be-zeichnen wir mit Jg(x). (Auch hierfür wird oft die Bezeichnung Dg(x) verwandt.Ebenso ist die Bezeichnung f ′(x) sowohl für die totale Ableitung wie auch fürdie Jacobi-Matrix üblich.) Es gilt also Dg(x)(h) = Jg(x) · h für h ∈ Rd.

Ist g : U → V stetig differenzierbar und bijektiv und ist Dg(x) für alle x ∈ Uinvertierbar, so folgt aus dem Umkehrsatz die Differenzierbarkeit von g−1. Mity = g(x) ist dann Dg−1(y) = (Dg(x))−1 und Jg−1(y) = (Jg(x))−1.

Satz 9.2. (Transformationssatz) Seien U, V ⊆ Rd offen und sei g : U → Vein Diffeomorphismus. Sei f : V → C. Dann ist f über V genau dann integrier-bar, wenn (f g) · | detDg| über U integrierbar ist. In diesem Fall gilt∫

U

f (g(x)) | detDg(x)|dx =

∫V

f(y)dy.

Vor dem Beweis machen wir eine Plausibilitätsüberlegung: Wir approximierenU durch eine Vereinigung kleiner Quader Qk und wählen xk ∈ Qk. Dann kann∑

k

f (g(xk)) | detDg(xk)|v(Qk)

als Riemannsche Summe für∫Uf (g(x)) | detDg(x)|dx angesehen werden. Mit

yk = g(xk) und Rk = g(Qk) kann ebenso∑k

f(yk)v(Rk)

als Riemannsche Summe für∫Vf(y)dy betrachtet werden.

In Qk wird g(x) gut durch Lk(x) = g(xk) + Dg(xk)(x − xk) approximiert.Mit Pk = Lk(Qk) gilt also Rk = g(Qk) ≈ Lk(Qk) = Pk. Nach Satz 5.2 ist Pk einParallelepiped und es gilt v(Pk) = | detDg(xk)|v(Qk). Es folgt∑

k

f(yk)v(Rk) ≈∑k

f(yk)v(Pk) =∑k

f (g(xk)) | detDg(xk)|v(Qk),

was mit einem Grenzübergang das gewünschte Ergebnis liefern sollte.Vor dem rigorosen Beweis des Transformationssatzes betrachten wir einige

Beispiele.

Beispiel 1 (Polarkoordinaten). Sei T : (0,∞)× (−π, π)→ R2\(x, 0) : x ≤ 0,(rϕ

)7→(r cosϕr sinϕ

).

35

Page 38: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Es ist T Diffeomorphismus und es gilt

JT (r, ϕ) =

(cosϕ − r sinϕsinϕ r cosϕ

).

Es folgt, dass

detDT (r, ϕ) = det JT (r, ϕ) = r(cos2 ϕ+ sin2 ϕ) = r.

Man beachte, dass N = (x, 0) : x ≤ 0 Nullmenge ist, also das Bild von T bisauf eine Nullmenge der ganze R2 ist.

Sei nun R > 0 und K der durch

K = (x, y) ∈ R2 : x2 + y2 ≤ R2, y ≥ 0

gegebene Halbkreis. Mit

L = (r, ϕ) : 0 < r ≤ R, 0 ≤ ϕ < π

gilt T (L) = K\N .Es folgt, dass∫

K

y d(x, y) =

∫K\N

y d(x, y)

=

∫L

r sinϕ det JT (r, ϕ) d(r, ϕ)

=

∫L

r2 sinϕ d(r, ϕ)

=

∫ R

0

(∫ π

0

r2 sinϕ dϕ

)dr

=

∫ R

0

r2(− cosϕ)∣∣∣π0dr

= 2

∫ R

0

r2dr =2

3R3.

Mit v(K) = 12πR2 folgt, dass der Schwerpunkt von K in (0, 4

3πR) liegt.

Beispiel 2 (Zylinderkoordinaten). Wir führen im R3 Polarkoordinaten in der(x, y)-Ebene ein und lassen die z-Koordinate unverändert.

Wir betrachten also T : (0,∞)×(−π, π)×R→ R3\(x, 0, z) : x ≤ 0, z ∈ R, rϕz

7→ r cosϕ

r sinϕz

.

Es ist T ein Diffeomorphismus und es gilt

detDT (r, ϕ, z) = r.

Außerdem ist N = (x, 0, z) : x ≤ 0, z ∈ R Nullmenge, also das Bild von T bisauf eine Nullmenge der ganze R3.

36

Page 39: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Sei nun 0 < R1 < R2 und

K =

(x, y, z) ∈ R3 : x2 + y2 + z2 ≤ R22, x

2 + y2 ≥ R21

.

Es ist K also der Teil der (abgeschlossenen) Kugel vom Radius R2 um 0, deraußerhalb des Zylinders vom Radius R1 um die z-Achse liegt. Mit

L =

(r, ϕ, z) : R1 ≤ r ≤ R2, −π < ϕ < π, −

√R2

2 − r2 ≤ z ≤√R2

2 − r2

gilt T (L) = K\N .Es folgt

v(K) = v(K\N)

=

∫K\N

1 d(x, y, z)

=

∫L

det JT (r, ϕ, z)d(r, ϕ, z)

=

∫ R2

R1

∫ π

−π

∫ √R22−r2

−√R2

2−r2r dz dϕ dr

=

∫ R2

R1

∫ π

−π2r√R2

2 − r2 dϕ dr

= 2π

∫ R2

R1

2r√R2

2 − r2 dr

= 2π

∫ R22−R2

1

0

√t dt

=4π

3t3/2∣∣∣R2

2−R21

0

=4π

3

(R2

2 −R21

)3/2.

Für R1 = 0 ergibt sich insbesondere – wie bereits bekannt – das Volumen einerKugel von Radius R zu 4π

3R3.

Beispiel 3 (Kugelkoordinaten). Sei T : (0,∞)× (−π, π)×(−π

2, π2

)→ R3, r

ϕθ

7→ r cosϕ cos θ

r sinϕ cos θr sin θ

.

Hier ist θ der Winkel, den die Verbindungsstrecke von (x, y, z) und dem Ursprungmit der (x, y)-Ebene bildet; vgl. Abbildung 5. Es ist auch üblich, stattdessen denWinkel zwischen der Verbindungsstrecke und der z-Achse zu nehmen.

Es existiert eine NullmengeN , so dass T : (0,∞)×(−π, π)×(−π

2, π2

)→ R3\N

ein Diffeomorphismus ist. Eine Rechnung zeigt, dass

detDT (r, ϕ, θ) = r2 cos θ.

37

Page 40: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Abbildung 5: Kugelkoordinaten.

Für K aus Beispiel 2 entspricht die Bedingung x2 + y2 + z2 ≤ R22 der Bedin-

gung r ≤ R2 und die Bedingung x2 + y2 ≥ R21 erhält die Form r2 cos2 θ ≥ R2

1,also r ≥ R1/ cos θ. Man beachte bei der letzten Umformung, dass cos θ > 0 fürθ ∈

(−π

2, π2

). Aus R1/ cos θ ≤ r ≤ R2 folgt, dass nur Werte von θ betrachtet

werden, für die R1/ cos θ ≤ R2 gilt, also − arccos(R1/R2) ≤ θ ≤ arccos(R1/R2).Mit

L =

(r, ϕ, θ) : − π < ϕ < π, − arccos

R1

R2

≤ θ ≤ arccosR1

R2

,R1

cos θ≤ r ≤ R2

ergibt sich mit obiger Nullmenge N , dass T (L) = K\N . Hieraus folgt, dass

v(K) = v(K\N)

=

∫K\N

1 d(x, y, z)

=

∫L

det JT (r, ϕ, θ)d(r, ϕ, θ)

=

∫ π

−π

∫ arccos(R1/R2)

− arccos(R1/R2)

∫ R2

R1/ cos θ

r2 cos θ dr dθ dϕ

= 4π

∫ arccos(R1/R2)

0

1

3

(R3

2 cos θ − R31

cos2 θ

)dθ

=4π

3R3

2 sin θ −R31 tan θ

∣∣∣arccos(R1/R2)

0

=4π

3

(R3

2 −R3

1

cos θ

)sin θ

∣∣∣arccos(R1/R2)

0

=4π

3

(R3

2 −R21R2

)√1−

(R1

R2

)2

=4π

3

(R2

2 −R21

)3/2.

38

Page 41: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Wir kommen nun zum Beweis des Transformationssatzes. Dazu benötigen wireine Reihe von Lemmata. Dabei sei g : U → V wieder ein Diffeomorphismus.

Lemma 9.3. Für einen kompakten Würfel W ⊂ U gilt

v(g(W )) ≤ maxx∈W| detDg(x)| · v(W ).

Beweis. Wir können v(W ) > 0 annehmen. Sei α ≥ 0 mit

v(g(W )) = α · v(W ).

Wir zerlegen W in 2d kompakte Würfel der halben Seitenlänge. Für einen dieserWürfel, den wir W1 nennen, gilt

v(g(W1)) ≥ α · v(W1).

Wir setzen den Prozess induktiv fort und erhalten eine Folge (Wk) kompakterWürfel, so dass Wk+1 in Wk enthalten ist und die halbe Seitenlänge wie Wk hatund außerdem v(g(Wk)) ≥ α · v(Wk) für alle k ∈ N gilt.

Der Schnitt der Wk ist nicht leer und besteht aus genau einem Punkt, denwir mit a bezeichnen, das heißt, es gilt

a =∞⋂k=1

Wk.

Sei b = g(a). Ohne Beschränkung der Allgemeinheit sei a = b = 0. Nach Defini-tion der Differenzierbarkeit gilt

g(x) = Dg(0)(x) + r(x),

wobei r(x)/‖x‖ → 0 für x → 0. Sei s0 die Seitenlänge von W , so dass Wk

Seitenlänge sk = 2−ks0 hat. Zur Abkürzung schreiben wir L = Dg(0). Fürgegebenes ε > 0 erhält man

‖g(x)− L(x)‖ = ‖r(x)‖ < εsk

für x ∈ Wk und genügend große k. Dies liefert

g(Wk) ⊂ Pk := x ∈ Rd : dist(x, L(Wk)) < εsk.

Hierbei bezeichnet dist(·, ·) den Abstand eines Punktes zu einer Menge, also

dist(x, L(Wk)) = infy∈L(Wk)

‖y − x‖∞.

Nun giltv(g(Wk)) ≥ α · v(Wk) = αsdk

und

v(Pk) = sdk · v(x ∈ Rd : dist

(x, L

(s−1k Wk

))< ε)

= sdk · v(x ∈ Rd : dist

(x, L([0, 1]d)

)< ε

).

39

Page 42: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Mit g(Wk) ⊂ Pk folgt

α ≤ v(x ∈ Rd : dist

(x, L([0, 1]d)

)< ε

).

Weiter istv(L([0, 1]d)

)= | det(L)|

nach Satz 5.2, und es ist nicht schwer zu sehen, dass

v(x ∈ Rd : dist

(x, L([0, 1]d)

)< ε

)→ v

(L([0, 1]d)

)= | det(L)|

für ε→ 0. Es folgt, dass α ≤ | det(L)|.

Lemma 9.4. Sei K ⊂ U kompakt und sei ∂K Nullmenge. Dann gilt

minx∈K| detDg(x)| · v(K) ≤ v(g(K)) ≤ max

x∈K| detDg(x)| · v(K).

Beweis. Sei K das Innere von K. Wir schreiben K als Vereinigung kompakterWürfel Wk, deren Inneres paarweise disjunkt ist, vgl. Beweis zu Satz 3.10. Dav(∂K) = 0, folgt

v(K) = v(K) =∞∑k=1

v(Wk).

Es folgt mit Lemma 9.3 sowie Satz 6.4, dass

v(g(K)) = v

(g

(∞⋃k=1

Wk

))

= v

(∞⋃k=1

g(Wk)

)

=∞∑k=1

v(g(Wk))

≤ maxx∈K| detDg(x)| ·

∞∑k=1

v(Wk)

= maxx∈K| detDg(x)| · v(K)

Sei nun η > 0, so dass

K = x : dist(x,K) ≤ η ⊆ U.

Da ∂K Nullmenge ist, existieren zu ε > 0 Würfel V1, V2, . . . mit

∂K ⊆∞⋃j=1

Vj und∞∑j=1

v(Vj) < ε.

Man kann Vj ⊆ K für alle j annehmen.

40

Page 43: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Es folgt, dass

v(g(∂K)) ≤∞∑j=1

v(g(Vj))

≤ maxx∈K

det |Dg(x)| ·∞∑j=1

v(Vj)

≤ ε ·maxx∈K

det |Dg(x)|.

Dies liefertv(g(∂K)) = 0

und wir erhaltenv(g(K)) ≤ max

x∈K| detDg(x)| · v(K).

Die andere Ungleichung erhalten wir, wenn wir g−1 statt g betrachten.

Sei A ⊆ Rd und h : A → C. Der Abschluss der Menge aller x mit h(x) = 0heißt Träger von h und wird mit supp(h) bezeichnet.

Lemma 9.5. Der Transformationssatz gilt für Treppenfunktionen mit Trägerin V .

Beweis. Es genügt, den Fall f = χQ mit einem Quader Q zubetrachten, welcherQ ⊂ V erfüllt. Da ∂Q und wegen Lemma 9.4 auch g(∂Q) Nullmengen sind,können wir ohne Einschränkung der Allgemeinheit Q als kompakt annehmen.

Da g−1(Q) kompakt ist und | detDg| stetig ist, folgt die Integrierbarkeit vonχg−1(Q)| detDg|. Zu zeigen bleibt, dass∫

V

χQ =

∫U

χg−1(Q)| detDg|,

alsov(Q) =

∫Q

1 dy =

∫g−1(Q)

| detDg(x)|dx.

Sei dazu ε > 0. Wegen der gleichmäßigen Stetigkeit von g−1 auf Q und dervon | detDg| auf g−1(Q) existiert eine Zerlegung von Q in kompakte QuaderQ1, ..., Qk mit Qi ∩Qj = ∅ für i 6= j, so dass

maxx∈g−1(Qj)

| detDg(x)| − minx∈g−1(Qj)

| detDg(x)| < ε

für alle j.Es folgt mit Lemma 9.4, dass∫

g−1(Qj)

| detDg(x)|dx− v(Qj)

≤ maxx∈g−1(Qj)

| detDg(x)| · v(g−1(Qj))− minx∈g−1(Qj)

| detDg(x)| · v(g−1(Qj))

< ε · v(g−1(Qj)).

41

Page 44: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Durch Summation erhält man∫g−1(Q)

| detDg(x)|dx− v(Q) < ε · v(g−1(Q)).

Ebenso folgt ∫g−1(Q)

| detDg(x)|dx− v(Q) > −ε · v(g−1(Q))

und mit ε→ 0 dann die Behauptung.

Beweis des Transformationssatzes 9.2. Sei f integrierbar. Dann existiert eineFolge (ϕk) von Treppenfunktionen mit ‖ϕk − f‖1 → 0. Man überlegt sich, dassman die (ϕk) mit Träger in V wählen kann. Wir verzichten hier auf die Detailsdieses Arguments. Durch Übergang zu einer Teilfolge, falls nötig, kann man aufGrund des Satzes von Riesz-Fischer auch annehmen, dass ϕk → f fast überall.

Mitϕk = (ϕk g)| detDg| und f = (f g)| detDg|

folgt, dass die ϕk über U integrierbar sind und dass

‖ϕj − ϕk‖1 =

∫U

|ϕj − ϕk| =∫V

|ϕj − ϕk| = ‖ϕj − ϕk‖1

wegen Lemma 9.5. Damit ist (ϕk) eine L1-Cauchyfolge. Damit konvergiert eineTeilfolge von (ϕk) fast überall gegen eine integrierbare Funktion h.

Andererseits folgt aus ϕk → f fast überall leicht, dass auch ϕk → f fastüberall. Es folgt, dass f integrierbar ist und dass∫

U

f = limk→∞

∫U

ϕk = limk→∞

∫V

ϕk =

∫V

f.

Ist umgekehrt f integrierbar, so folgt die Integrierbarkeit von f , wenn man dasbereits Bewiesene auf g−1 statt g anwendet.

42

Page 45: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

II Gewöhnliche Differentialgleichungen

1 Beispiele und elementare Lösungsmethoden

Bei vielen Wachstums- und Zerfallprozessen ist die zeitliche Änderung einerGröße proportional zu der Größe selbst. Ist y(t) die Größe zum Zeitpunkt t, soerhält man die Gleichung

y′(t) = αy(t)

mit einer reellen Konstanten α. Dabei ist α > 0 bei Wachstumsprozessen undα < 0 bei Zerfallsprozessen. Beispielsweise wird der radioaktive Zerfall durchdiese Gleichung beschrieben.

Des Weiteren sei die Größe zu einem Zeitpunkt t0 bekannt, es gelte etway(t0) = y0 > 0. Ist y eine Lösung der gesuchten Gleichung, so gilt in einemgeeigneten Intervall I um t0 dann y(t) > 0 und damit

α(t− t0) =

∫ t

t0

α ds =

∫ t

t0

y′(s)

y(s)ds = log y(t)− log y(t0) = log

y(t)

y(t0),

alsoy(t) = y(t0)e

α(t−t0) = y0e−αt0eαt

für t ∈ I.Man erkennt leicht, dass durch die letzte Formel eine Lösung der Gleichung

y′(t) = αy(t) auf ganz R gegeben ist und dass diese die eindeutig bestimmteLösung ist, die der Bedingung y(t0) = y0 genügt. Denn ist y eine weitere Lösung,so zeigt eine kurze Rechnung, dass (y/y)′ = 0 und damit y/y konstant ist.

Im Folgenden werden wir Gleichungen des obigen Typs untersuchen, wobeiaber auch höhere Ableitungen vorkommen können. Da die Variable nicht not-wendigerweise die Zeit sein muss, bezeichnen wir die Variable im Allgemeinenmit x statt t. Allgemein heißt eine Gleichung der Form

f(x, y(x), y′(x), . . . , y(n)(x)

)= 0

gewöhnliche Differentialgleichung n-ter Ordnung. Dabei ist n ∈ N und f eineauf einer geeigneten Teilmenge von Rn+2 gegebene Funktion. Gesucht ist einen-mal (stetig) differenzierbare Funktion y : I → R mit einem Intervall I ⊆ R,die dieser Gleichung genügt. (Während in Kapitel I auch entartete IntervalleI = [a, a] = a zugelassen waren, schließen wir dies im Folgenden aus, da fürFunktionen auf solchen Intervallen die Ableitung nicht definiert ist.)

Ist die obige Gleichung nach y(n) aufgelöst, also von der Form

y(n)(x) = g(x, y(x), y′(x), . . . , y(n−1)(x)

),

so spricht man von einer expliziten (gewöhnlichen) Differentialgleichung. An-dernfalls nennt man die Differentialgleichung implizit.

In der Regel sind zusätzlich zu der Differentialgleichung noch sogenannteAnfangsbedingungen

y(x0) = y0, y′(x0) = y1, . . . , y(n−1)(x0) = yn−1

43

Page 46: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

gegeben. Man spricht dann auch von einem Anfangswertproblem.Gelegentlich sind statt Anfangsbedingungen auch andere Bedingungen gege-

ben, etwa sogenannte Randbedingungen, beispielsweise y(a) = ya und y(b) = ybfür Lösungen y auf dem Intervall [a, b].

Es ergeben sich bei Differentialgleichungen die folgenden Fragestellungen:

(a) Existenz und Eindeutigkeit von Lösungen;

(b) Berechnung von Lösungen (möglich nur in speziellen Fällen);

(c) Eigenschaften von Lösungen (insbesondere falls Berechnung nicht mög-lich);

(d) Numerische Lösung.

Hier behandeln wir zunächst (b), dann (a). Später wird auch etwas zu (c) gesagt.Punkt (d) wird in der Numerischen Mathematik behandelt.

Wir betrachten zunächst Differentialgleichungen 1. Ordnung, also

y′(x) = f (x, y(x)) .

Solche Differentialgleichungen kann man geometrisch wie folgt interpretieren.Gesucht wird eine Funktion x 7→ y = y(x), so der Tangentenvektor an denGraphen im Punkte (x, y) durch (1, f(x, y)) gegeben ist; vgl. Abbildung 6. Mannennt die Menge dieser Vektoren auch Vektorfeld. Formal ist ein Vektorfeld nichtsanderes als eine Abbildung von einer offenen Teilmenge des Rd nach Rd.

Abbildung 6: Vektorfeld zur Differentialgleichung y′ = (1 + y2)/(1 + x2).Die Lösungen sind von der Form y(x) = tan(arctan(x) + c) mit c ∈ R.

Wir untersuchen nun Differentialgleichungen gewisser spezieller Typen.

Definition 1.1. Seien I, J Intervalle, a : I → R und b : J → R stetig, x0 ∈ Iund y0 ∈ J . Die Differentialgleichung

y′(x) = a(x)b (y(x)) , y(x0) = y0,

heißt Differentialgleichung mit getrennten Veränderlichen.

44

Page 47: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Lösungsverfahren. Ist b(y0) = 0, so ist y(x) ≡ y0 eine Lösung. Wir nehmen an,dass b(y0) 6= 0 gilt. Da b stetig ist, kann man J so wählen, dass entweder b(y) > 0für alle y ∈ J oder b(y) < 0 für alle y ∈ J gilt.

Wegen

a(x) =y′(x)

b(y(x))

folgt dann ∫ x

x0

a(t)dt =

∫ x

x0

y′(t)

b(y(t))dt =

∫ y(x)

y0

ds

b(s).

MitA(x) =

∫ x

x0

a(t)dt und B(y) =

∫ y

y0

ds

b(s)

erhalten wirA(x) = B(y(x)).

Da B′ = 1/b konstantes Vorzeichen hat, ist B streng monoton. Damit existiertdie Umkehrfunktion B−1 : B(J)→ J . Durch

y(x) = B−1(A(x))

ist dann eine Lösung der Differentialgleichung gegeben, falls die rechte Seitedefiniert ist, das heißt, falls A(I) ⊆ B(J).

Wegen A(x0) = 0 = B(y0) ∈ B(J) existiert ein Intervall I0 mit x0 ∈ I0,so dass A(I0) ⊆ B(J). Auf I0 ist dann durch obige Gleichung eine Lösung ygegeben.

Wir erhalten folgendes Ergebnis.

Satz 1.2. Seien I, J, a, b, x0, y0 wie in Definition 1.1, mit b(y) 6= 0 für alle y ∈ J .Seien

A(x) =

∫ x

x0

a(t)dt und B(y) =

∫ y

y0

ds

b(s).

Weiter sei I0 Intervall mit x0 ∈ I0 ⊆ I und A(I0) ⊆ B(J). Dann ist auf I0 durchy(x) = B−1(A(x)) die eindeutige Löung des Anfangswertproblems

y′(x) = a(x)b(y(x)), y(x0) = y0,

gegeben.

Beispiel. Wir betrachten das Anfangswertproblem

y′(x) = x(1 + y(x)2), y(0) = 1.

Dieses ist vom obigen Typ, mit I = J = R, a(x) = x und b(y) = 1 + y2. Wirerhalten (wobei wir hier und im Folgenden statt y(x) oft nur y schreiben)∫ x

0

t dt =

∫ y

1

ds

1 + s2,

alsoA(x) :=

1

2x2 = arctan y − arctan 1 = arctan y − π

4=: B(y).

45

Page 48: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Dies lieferty(x) = y = tan

(x2

2+π

4

).

Dies gilt in einem Intervall I0 um 0.Zur Bestimmung des Intervalls I0 beachte man, dass der Arcustangens R

auf(−π

2, π2

)abbildet, also B(J) = B(R) =

(−3π

4, π4

)gilt. Wir suchen nun ein

Intervall I0 mit A(I0) ⊆(−3π

4, π4

). Mit A(x) = 1

2x2 erhalten wir schließlich

I0 =(−√

π2,√

π2

).

Man hätte in diesem Beispiel natürlich auch einfach das größte Intervall um 0suchen können, in der y(x) = tan (x2/2 + π/4) definiert ist. Aber diese „naive“Methode kann schiefgehen, wie das folgende Beispiel zeigt.

Beispiel. Wir betrachten das Auslaufen einer Tonne. Wir bezeichnen mit h(t)die Höhe des Flüssigkeitsstand zur Zeit t und mit v(t) die Auslaufgeschwindigkeitzur Zeit t, siehe Abbildung 7.

Abbildung 7: Auslaufen einer Tonne.

Die Änderung der potentiellen Energie bei Auslaufen eines Volumens 4V istproportional zu4V ·h(t). Die Änderung der kinetischen Energie ist proportionalzu 4V · v(t)2. Wegen der Energieerhaltung ist also h(t) proportional zu v(t)2.Andererseits ist h′(t) offensichtlich proportional zu v(t).

Wir erhalten das Anfangswertproblem

h′(t) = −2c√h(t), h(0) = h0 > 0,

mit einer Konstanten c > 0. (Die Konstante ist als 2c gewählt, damit die Formelnspäter schöner werden.)

Mit a(x) = −2c und b(y) =√y erhält man

−2ct =

∫ t

0

a(u)du =

∫ h(t)

h0

ds

b(s)=

∫ h(t)

h0

ds√s

= 2(√

h(t)−√h0

),

alsoh(t) =

(√h0 − ct

)2.

Wir untersuchen jetzt, für welche t-Werte dies gilt. Mit J = (0,∞) undB(y) = 2

(√y −√h0)erhalten wir B(J) =

(−2√h0,∞

). Damit folgt, dass

46

Page 49: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

A(t) = −2ct ∈ B(J) für ct <√h0, also für t < t1 :=

√h0/c. Also ist durch obige

Formel eine Lösung des Anfangswertproblems auf dem Intervall I0 = (−∞, t1)gegeben.

Die durch h(t) =(√

h0 − ct)2 gegebene Funktion h : R → R ist aber keine

Lösung der Differentialgleichung auf ganz R, denn für t > t1 ist√(√h0 − ct

)2=∣∣∣√h0 − ct

∣∣∣ = ct−√h0,

alsodh

dt

((√h0 − ct

)2)= −2c

(√h0 − ct

)6= −2c

√(√h0 − ct

)2.

Physikalisch sinnvoll ist offensichtlich

h(t) =

(√h0 − ct

)2, t < t1

0, t ≥ t1.

Tatsächlich ist diese Funktion eine Lösung des Anfangswertproblems, vgl. auchAbbildung 8.

Abbildung 8: Lösung des Anfangswertproblems zum Auslaufen einer Tonne.

Sei t0 ≥ t1. Dann ist obiges h Lösung des Anfangswertproblems

h′(t) = −2c√h(t), h(t0) = 0.

Eine andere Lösung ist offensichtlich h(t) ≡ 0. Die Lösung ist also nicht eindeu-tig. Dies ist aber natürlich kein Widerspruch zu Satz 1.2, denn mit den dortigenBezeichnungen ist b(y) =

√y und y0 = 0, also b(y0) = 0.

Definition 1.3. Die Differentialgleichung

y′(x) = h

(y(x)

x

)heißt homogene Differentialgleichung. Dabei ist h auf einem Intervall als stetigvorausgesetzt und es wird eine Lösung y auf einem geeigneten Intervall I mit0 6∈ I gesucht.

47

Page 50: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Bemerkung. Der Begriff „homogen“ wird auch in anderen Bedeutungen ver-wandt.

Lösungsverfahren. Man setzt

z(x) :=y(x)

x,

also y(x) = xz(x). Dann gilt y′(x) = z(x) + xz′(x), also

z′(x) =y′(x)− z(x)

x=h(z(x))− z(x)

x.

Dies ist eine Differentialgleichung mit getrennten Veränderlichen und alles dortGesagte gilt sinngemäß auch hier.

Beispiel. Wir betrachten das Anfangswertproblem

y′(x) =y(x)

x− 1− e−y(x)/x, y(1) = 0.

Mith(z) = z − 1− e−z

und z = z(x) folgt

log x =

∫ x

1

dt

t=

∫ z

0

ds

h(s)− s= −

∫ z

0

ds

1 + e−s= − (log (1 + ez)− log 2)

alsolog(1 + ez) = log 2− log x = log

2

x.

Dies liefertz(x) = z = log

(2

x− 1

)und damit

y(x) = x log

(2

x− 1

).

Diese Lösung des Anfangswertproblems existiert auf dem Intervall (0, 2).

Definition 1.4. Sei I Intervall, a, b : I → R stetig. Die Differentialgleichung

y′(x) = a(x)y(x) + b(x)

heißt inhomogene lineare Differentialgleichung 1. Ordnung, im Falle b(x) ≡ 0homogene lineare Differentialgleichung 1. Ordnung.

Lösungsverfahren. Wir betrachten zunächst die homogene Differentialgleichung,also y′(x) = a(x)y(x). Dies ist eine Differentialgleichung mit getrennten Verän-derlichen. Mit der Anfangsbedingung y(x0) = y0 erhalten wir∫ x

x0

a(t)dt =

∫ x

x0

y′(t)

y(t)dt = log

y(x)

y0,

48

Page 51: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

alsoy(x) = y0 exp

(∫ x

x0

a(t)dt

).

Wir kommen jetzt zur inhomogenen Differentialgleichung. Sind y1, y2 Lö-sungen der inhomogenen Differentialgleichung, so ist y := y1 − y2 Lösung derhomogenen Differentialgleichung. Da jede Lösung der homogenen Gleichung vonder Form

y(x) = ceA(x), mit A(x) =

∫ x

x0

a(t)dt,

ist, genügt es, eine Lösung yp der inhomogenen Gleichung zu kennen, eine soge-nannte partikuläre Lösung.

Dazu macht man den Ansatz yp(x) = c(x)yh(x) mit yh(x) = eA(x). Man nenntdies auch die Methode der Variation der Konstanten. Es gilt dann

y′p = c′yh + cy′h = c′yh + cayh = c′yh + ayp.

Aus y′p = ayp + b folgt dann c′yh = b. Nimmt man c(x0) = 0 an, so ergibt sich

c(x) =

∫ x

x0

b(t)

yh(t)dt =

∫ x

x0

b(t)e−A(t)dt

und damityp(x) = c(x)yh(x) = eA(x)

∫ x

x0

b(t)e−A(t)dt.

Insgesamt erhalten wir folgendes Resultat.

Satz 1.5. Seien I Intervall, a, b : I → R stetig, x0 ∈ I und A(x) =∫ xx0a(t)dt.

Dann ist für y0 ∈ R durch

y(x) = y0eA(x) + eA(x)

∫ x

x0

b(t)e−A(t)dt = eA(x)(y0 +

∫ x

x0

b(t)e−A(t)dt

)die eindeutige Lösung des Anfangswertproblems y′ = ay+ b, y(x0) = y0 gegeben.

Beispiel. Wir betrachten das Anfangswertproblem

y′(x) = 2x(y(x) + 1) = 2xy(x) + 2x, y(0) = 1.

Die Lösung ergibt sich zu

y(x) = ex2

(1 +

∫ x

0

2te−t2

dt

)= ex

2

(1−

(e−t

2)∣∣∣t=x

t=0

)= ex

2(

1− e−x2 + 1)

= ex2(

2− e−x2)

= 2ex2 − 1.

49

Page 52: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Alternativ kann man die obige Gleichung auch als Differentialgleichung mit ge-trennten Veränderlichen ansehen und erhält

x2 =

∫ x

0

2t dt =

∫ x

0

y′(t)

y(t) + 1dt =

∫ y(x)

1

ds

s+ 1= log(y(x) + 1)− log 2,

alsoex

2

=y(x) + 1

2

und damity(x) = 2ex

2 − 1.

Definition 1.6. Sei Ω ⊆ Rd offen, f : Ω → Rd stetig und U : Ω → R stetigdifferenzierbar. Dann heißt U Potential (oder Potentialfunktion) von f , fallsf = grad U = (∂U/∂x1, . . . , ∂U/∂xd).

Definition 1.7. Sei Ω ⊆ R2 offen und f = (g, h) : Ω→ R2 stetig. Die Differen-tialgleichung

g (x, y(x)) + h (x, y(x)) y′(x) = 0

heißt exakt, wenn f = (g, h) ein Potential hat.

Satz 1.8. Seien Ω und f = (g, h) wie in Definition 1.7 und die dortige Diffe-rentialgleichung sei exakt. Sei (x0, y0) ∈ Ω mit h(x0, y0) 6= 0. Dann existiert einoffenes Intervall I mit x0 ∈ I, in dem das Anfangswertproblem

g(x, y(x)) + h(x, y(x))y′(x) = 0, y(x0) = y0,

eine eindeutige Lösung hat.Ist U ein Potential von f = (g, h), so ist y : I → R genau dann Lösung des

Anfangswertproblems, wenn (x, y(x)) ∈ Ω und U(x, y(x)) = U(x0, y0) für allex ∈ I.

Beweis. Gilt U(x, y(x)) = U(x0, y0), so folgt

0 =d

dxU(x, y(x))

=∂U

∂x(x, y(x)) +

∂U

∂y(x, y(x))y′(x)

= g(x, y(x)) + h(x, y(x))y′(x).

Gilt außerdem y(x0) = y0, so löst y das Anfangswertproblem. Umgekehrt giltauch U(x, y(x)) = U(x0, y0) für jede Lösung des Anfangswertproblems.

Die Existenz einer Lösung y unter der Bedingung

h(x0, y0) =∂U

∂y(x0, y0) 6= 0

folgt aus dem Satz über implizite Funktionen.

50

Page 53: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beispiel. Gegeben sei das Anfangswertproblem

(2xey − 1) + (x2ey + 1) · y′ = 0, y(1) = 0.

Ein Potential ist U(x, y) = x2ey − x+ y. Wegen U(1, 0) = 0 und

∂U

∂y(1, 0) = x2ey + 1

∣∣∣(x,y)=(1,0)

= 2 6= 0

existiert ein Intervall I mit 1 ∈ I und eine Lösung y : I → R des Anfangswert-problems. Diese erfüllt

x2ey(x) − x+ y(x) = 0.

Explizites Auflösen der Gleichung nach y ist nicht möglich.

Abbildung 9: Lösungen von (2xey − 1) + (x2ey + 1) · y′ = 0 mit den An-fangsbedingungen y(0) = 0 und y(0) = ±1.

Auflösen nach x ist aber möglich und man erhält

x = x(y) =1

2e−y +

√1

4− ye−y

für y < 0, 3574 . . . . Wegen x(0) = 1 ist der positive Wert der Wurzel zu nehmen.

Bemerkung. 1. Damit f = (g, h) ein Potential U haben kann, muss nach demSatz von Schwarz

∂h

∂x=

∂2U

∂x∂y=

∂2U

∂y∂x=∂g

∂y

gelten. Umgekehrt kann man zeigen, dass in konvexen Gebieten im Falle

∂h

∂x=∂g

∂y

tatsächlich ein Potential existiert.

51

Page 54: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

2. Ist die Differentialgleichung

g(x, y) + h(x, y)y′ = 0

nicht exakt, so kann man versuchen, eine Funktion M zu finden, so dass

M(x, y)g(x, y) +M(x, y)h(x, y)y′ = 0

exakt ist. Es muss dann∂

∂x(Mh) =

∂y(Mg)

gelten. Diese Gleichung ist im Allgemeinen nicht lösbar, aber in vielen Fällenfindet man durch spezielle Ansätze für M Lösungen, etwa in dem man M nurvon x oder nur von y abhängig wählt, oder auch als Funktion von x2 + y2.

3. Man schreibt die Differentialgleichung

g(x, y) + h(x, y)dy

dx= 0

auch in der symmetrischen Form

g(x, y)dx+ h(x, y)dy = 0.

2 Differentialgleichungssysteme

Bisher haben wir die (explizite) Differentialgleichungen

y(n)(x) = f(x, y(x), . . . , y(n−1)(x)) (1)

betrachtet, wobei M ⊆ Rn+1, f : M → R, I ⊆ R Intervall und y : I → R.Allgemeiner kann man die Differentialgleichung (1) auch für M ⊆ Rmn+1

und y : I → Rm betrachten, mit m ∈ N. Mit y = (y1, . . . , ym) kann (1) dannals Differentialgleichung für die m Funktionen y1, . . . , ym aufgefasst werden. Istf = (f1, . . . , fm) : M → Rm, so besteht (1) aus den m Gleichungen

y(n)j = fj(x, y1, . . . , ym, y

′1, . . . , y

′m, . . . , y

(n−1)1 , . . . , y(n−1)m ) (2)

für die Funktionen y1, . . . , ym.Man nennt (1) bzw. (2) dann (explizites) Differentialgleichungssystem. Wie

im Falle m = 1 hat man im Allgemeinen zusätzlich Anfangsbedingungen undspricht dann von einem Anfangswertproblem.

Sei nun die Differentialgleichung (1) mit m = 1 gegeben. Sei

Y = (Y1, . . . , Yn) = (y, y′, . . . , y(n−1)).

Die Gleichung (1) hat dann die Form

Y ′n(x) = f(x, Y1(x), Y2(x), . . . , Yn(x)). (3)

Außerdem giltY ′j (x) = Yj+1(x), 1 ≤ j ≤ n− 1. (4)

52

Page 55: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Damit bilden (3) und (4) ein (explizites) Differentialgleichungssystem erster Ord-nung. Offensichtlich ist das durch (3) und (4) gegebene System äquivalent zurGleichung (1).

Somit kann eine explizite Differentialgleichung höherer Ordnung immer aufein explizites Differentialgleichungssystem erster Ordnung reduziert werden. Esreicht also, letztere zu betrachten.

Beispiel. Wir betrachten das Differentialgleichungssystem

x′(t) = x(t) (α− βy(t)) ,

y′(t) = y(t) (−γ + δx(t)) ,

wobei α, β, γ, δ > 0.Wir interpretieren dies wie folgt: x(t) ist die Größe einer (Beute-)Population

zur Zeit t und y(t) die einer (Räuber-)Population. Gilt y(t) = 0, so nimmt x(t)mit konstanter Rate zu, aber mit wachsendem y(t) > 0 sinkt die Rate, und füry(t) > α/β nimmt x(t) ab. Umgekehrt nimmt y(t) ab, wenn keine Beute daist (das heißt, x(t) = 0), aber bei genügend Beute (nämlich für x(t) > γ/δ)nimmt y(t) zu. Man spricht daher auch vom Räuber-Beute-Modell. Nach denMathematikern Lotka und Volterra, die diese als erste untersuchten, sind dieGleichungen auch als Lotka-Volterra-Gleichungen bekannt.

Eine explizite Lösung des obigen Systems ist nicht möglich. Es lässt sich abereine Funktion U finden, so dass t 7→ U(x(t), y(t)) für jede Lösung (x(t), y(t))konstant ist.

Dazu schreiben wir mit

s(x, y) = −γy + δxy und r(x, y) = αx− βxy

das obige System zunächst in der Form

x′ = r(x, y), y′ = s(x, y).

Dies lieferts(x, y)x′ − r(x, y)y′ = 0.

Setzen wir, rein formal,

dy

dx=

dy

dtdx

dt

=y′

x′,

so erhalten wirs(x, y)− r(x, y)

dy

dx= 0.

Diese Gleichung ist nicht exakt, aber M(x, y) = 1/xy ist ein integrierenderFaktor, das heißt,

s(x, y)

xy− r(x, y)

xy

dy

dx=(−γx

+ δ)−(α

y+ β

)dy

dx

ist exakt. Ein Potential ist gegeben durch

U(x, y) = −γ log x− α log y + δx+ βy.

53

Page 56: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Nachrechnen zeigt, dass für eine Lösung (x(t), y(t)) des Differentialgleichungs-systems tatsächlich U(x(t), y(t)) konstant ist.

Abbildung 10 zeigt für (α, β, γ, δ) = (1, 3, 1, 2) einige der Kurven, auf denenU(x, y) konstant ist, sowie das der Abbildung (x, y) 7→ (r(x, y), s(x, y)) entspre-chende normierte Vektorfeld. (Normiert bedeutet, dass die Länge der Vektorennormiert wurde.) Die Lösungen (x(t), y(t)) sind periodisch in t.

Abbildung 10: Vektorfeld und Lösungskurven des Räuber-Beute-Modells.

3 Der Satz von Picard-Lindelöf

Wir untersuchen im Folgenden explizite Differentialgleichungen 1. Ordnung, also

y′(x) = f(x, y(x)),

wobei f : I ×Ω→ Rm stetig, I ⊆ R Intervall und Ω ⊆ Rm. Wir werden I und Ωals offen voraussetzen. Weiter gelte mit x0 ∈ I und y0 ∈ Ω die Anfangsbedingungy(x0) = y0. Gesucht ist eine (stetig differenzierbare) Lösung y : I0 → Ω, wobeiI0 ein Intervall mit x0 ∈ I0 ⊆ I ist.

Lemma 3.1. Seien I,Ω, f, x0 und y0 wie oben. Sei I0 Intervall mit x0 ∈ I0 ⊆ Iund sei y : I0 → Ω stetig differenzierbar. Dann ist y genau dann Lösung desAnfangswertproblems

y′(x) = f(x, y(x)), y(x0) = y0,

wenny(x) = y0 +

∫ x

x0

f(t, y(t))dt

für alle x ∈ I0.

Der Beweis folgt unmittelbar aus dem Hauptsatz der Differential- und Integral-rechnung.

54

Page 57: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Auch wenn der Beweis des Lemmas sehr einfach ist, so stellt sich die Aussageals wesentliches Hilfsmittel beim Beweis von Existenzsätzen heraus. Die Idee ist,auf einer geeigneten Funktionenmenge M einen Operator T : M →M , y 7→ Ty,zu betrachten, mit

(Ty)(x) = y0 +

∫ x

x0

f(t, y(t))dt

Die Lösbarkeit des Anfangswertproblems ist dann äquivalent zur Existenz einesFixpunktes des Operators T .

Wir erinnern an den Banachschen Fixpunktsatz.

Lemma 3.2. Sei (M,d) vollständiger metrischer Raum und T : M → M . Esexistiere c ∈ (0, 1) mit

d(T (x), T (y)) ≤ c · d(x, y)

für alle x, y ∈ M . Dann hat T genau einen Fixpunkt, das heißt, es existiertgenau ein ξ ∈M mit T (ξ) = ξ.

Darüberhinaus gilt für alle x0 ∈ X, dass die rekursiv durch xn+1 = T (xn)definierte Folge (xn) gegen ξ konvergiert.

Wir wollen einen geeigneten Raum M angeben, auf dem der obige OperatorT definiert werden kann. Dazu wählen wir δ, r > 0 mit

Jδ := [x0 − δ, x0 + δ] ⊆ I und Kr = y ∈ Rm : ‖y − y0‖ ≤ r ⊆ Ω.

Für eine Teilmenge A von Rm sei C(Jδ, A) die Menge der stetigen Funktionenvon Jδ nach A. Mit der Supremumsnorm

‖u‖∞ = maxx∈Jδ‖u(x)‖,

ist C(Jδ,Rm) ein Banachraum, und C(Jδ, Kr) ist eine abgeschlossene (und damitvollständige) Teilmenge dieses Banachraums. Durch u 7→ Tu,

(Tu)(x) = y0 +

∫ x

x0

f(t, u(t))dt

ist nun eine Abbildung T : C(Jδ, Kr)→ C(Jδ,Rm) definiert. Im Allgemeinen giltaber nicht T (C(Jδ, Kr)) ⊆ C(Jδ, Kr).

Lemma 3.3. Seien Jδ und Kr wie oben. Sei weiter

Mδ,r = max(x,y)∈Jδ×Kr

‖f(x, y)‖.

Falls δMδ,r ≤ r, so gilt T (C(Jδ, Kr)) ⊆ C(Jδ, Kr).

Bemerkung. Das Maximum Mδ,r existiert, da f stetig und Jδ × Kr kompaktist. Es ist immer möglich, δ und r mit δMδ,r ≤ r zu wählen. Dazu wähle maneinfach r beliebig. Wegen Mδ1,r ≤Mδ2,r für δ1 < δ2 folgt δMδ,r ≤ r für genügendkleine δ.

55

Page 58: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis von Lemma 3.3. Für u ∈ C(Jδ, Kr) und x ∈ Jδ gilt

‖Tu(x)− y0‖ =

∥∥∥∥∫ x

x0

f(t, u(t))dt

∥∥∥∥ ≤ ∣∣∣∣∫ x

x0

‖f(t, u(t))‖ dt∣∣∣∣ ≤Mδ,r|x− x0| ≤ r,

woraus die Behauptung folgt.

Um den Banachschen Fixpunktsatz anwenden zu können, wird noch eineweitere Voraussetzung benötigt. Wir nehmen an, dass f(x, y) bezüglich y einerLipschitz-Bedingung genügt, das heißt, dass eine Konstante L = Lδ,r mit

‖f(x, y1)− f(x, y2)‖ ≤ Lδ,r‖y1 − y2‖

für alle x ∈ Jδ und y1, y2 ∈ Kr existiert. Für u, v ∈ C(Jδ, Kr) und x ∈ Jδ giltdann

‖Tu(x)− Tv(x)‖ =

∥∥∥∥∫ x

x0

f(t, u(t))dt−∫ x

x0

f(t, v(t))dt

∥∥∥∥=

∥∥∥∥∫ x

x0

(f(t, u(t))− f(t, v(t))) dt

∥∥∥∥≤

∣∣∣∣∫ x

x0

‖f(t, u(t))− f(t, v(t))‖dt∣∣∣∣

≤∣∣∣∣∫ x

x0

Lδ,r‖u(t)− v(t)‖dt∣∣∣∣

≤ Lδ,r‖u− v‖∞|x− x0|≤ δLδ,r‖u− v‖∞.

Es folgt‖Tu− Tv‖∞ ≤ δLδ,r‖u− v‖∞.

Wählt man δ bei festem r klein genug, so gilt δLδ,r < 1. Dann ist der Banach-sche Fixpunktsatz auf T anwendbar. Also hat T einen eindeutig bestimmtenFixpunkt in C(Jδ, Kr) und damit hat das Anfangswertproblem in Jδ eine ein-deutig bestimmte Lösung mit Werten in Kr. (Es folgt auch, dass es keine weitereLösung gibt, wenn man Werte außerhalb von Kr zulässt.)

Wir fassen die obigen Überlegungen in folgendem Satz zusammen.

Satz 3.4. (Satz von Picard-Lindelöf) Sei I offenes Intervall, Ω ⊆ Rm offen,f : I × Ω→ Rm stetig, x0 ∈ I und y0 ∈ Ω. Es existiere L ≥ 0 mit

‖f(x, y1)− f(x, y2)‖ ≤ L‖y1 − y2‖

für alle (x, y) aus einer Umgebung von (x0, y0). Dann hat das Anfangswertpro-blem

y′(x) = f(x, y(x)), y(x0) = y0,

eine eindeutig bestimmte lokale Lösung, d.h., es existiert ein offenes Intervall I0mit x0 ∈ I0 ⊆ I, in dem das Anfangswertproblem eine eindeutige Lösung hat.

Genauer gilt: Seien δ, r > 0 mit

J := [x0 − δ, x0 + δ] ⊆ I und K := y ∈ Rm : ‖y − y0‖ ≤ r ⊆ Ω

56

Page 59: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

und seiM := max

(x,y)∈J×K‖f(x, y)‖.

Weiter gelte‖f(x, y1)− f(x, y2)‖ ≤ L‖y1 − y2‖

für alle x ∈ J und y1, y2 ∈ K. Gilt dann δM ≤ r und δL < 1, so hat dasAnfangswertproblem eine eindeutig bestimmt Lösung in J .

Bemerkungen. 1. Die Bedingungen δM ≤ r und δL < 1 können durch Verklei-nerung von δ immer erreicht werden.

Mit anderen Worten: Sind δ, r, L undM wie im Satz, und ist δ′ ≤ δ, δ′M ≤ rund δ′L < 1, so existiert eine eindeutig bestimmte Lösung in [x0 − δ′, x0 + δ′].Da man L,M 6= 0 annehmen kann, wählt man einfach δ′ < minr/M, 1/L, δ.

2. Ist f stetig differenzierbar, so ist nach dem Mittelwertsatz die Lipschitz-bedingung mit

L = max(x,y)∈J×K

∥∥∥∥∂f∂y (x, y)

∥∥∥∥erfüllt. Dabei ist ∂f/∂y die Jacobimatrix (oder auch die totale Ableitung) derdurch y 7→ f(x, y) gegebenen Funktion und ‖∂f/∂y‖ die Norm der Matrix (bzw.die Operatornorm).

3. Der Beweis zeigt, dass die rekursiv durch y0(x) ≡ y0 und yn+1(x) = Tyndefinierte Folge (yn) auf Jδ gegen die Lösung des Anfangswertproblems konver-giert.

4. Der Satz gilt analog auch für nichtoffene Intervalle I. Dies ist sofort klar,wenn x0 im Innern von I liegt, da man einfach I durch sein Inneres ersetzenkann. Eine entsprechende Aussage gilt aber auch, falls x0 einer der Randpunkteist. Etwa für I = [a, b] und x0 = a wählt man dann J = [x0, x0 + δ]. Der Beweisgeht genauso.

Alternativ kann man den Fall nichtoffener Intervalle auch auf den offenerIntervalle zurückführen, indem man etwa für I = [a, b] die Funktion f durchf(x, y) = f(a, y) für x < a und f(x, y) = f(b, y) für x > b zu einer stetigenFunktion f : R× Ω→ Rm fortsetzt und den Satz hierauf anwendet.

Die Voraussetzung, dass Ω offen ist, wurde nur gemacht um zu erreichen,dass für alle y0 ∈ Ω ein r > 0 mit Kr ⊆ Ω existiert. Bei gegebenem y0 reichtes zu fordern, dass f in I × Kr stetig ist und dort einer Lipschitz-Bedingunggenügt.

Beispiele. 1. Wir hatten bereits das Anfangswertproblem y′(x) = x(1 + y(x)2),y(0) = 1 betrachtet und gesehen, dass die Lösung

y(x) = tan

(x2

2+π

4

)auf

(−√

π2,√

π2

)existiert.

Die Differentialgleichung erfüllt die Voraussetzungen des Satzes von Picard-Lindelöf mit I = Ω = R und f : R × R → R, f(x, y) = x(1 + y2). Wir wählenδ = r = 1. Dann gilt J = [−1, 1], K = [0, 2] und

M = max(x,y)∈J×K

|f(x, y)| = 5.

57

Page 60: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Aus dem Mittelwertsatz folgt (vgl. obige Bemerkung), dass wir

L = max(x,y)∈J×K

∣∣∣∣∂f∂y (x, y)

∣∣∣∣ = max(x,y)∈J×K

|2yx| = 4

wählen können. Der Satz von Picard-Lindelöf liefert eine eindeutig bestimmteLösung in [−δ′, δ′] mit δ′ < min1

5, 14, 1 = 1

5.

Lässt man δ und r zunächst unbestimmt, wählt also J = [−δ, δ] und K =[1− r, 1 + r], so erhält man M = δ(1 + r2) und L = 2δr. Dies liefert

min

r

M,

1

L, δ

= min

r

δ(1 + r2),

1

2δr, δ

.

Mit r = 1 und δ = 12

√2 erkennt man, dass es reicht, δ′ < 1

2

√2 zu wählen. Der

Satz von Picard-Lindelöf liefert aber nicht das maximale Intervall.

2. Wir betrachten das Anfangswertproblem y′(x) = αy(x), y(0) = 1. Wiebereits zu Beginn dieses Kapitels ausgeführt, ist die eindeutige Lösung durchy(x) = eαx gegeben.

Der im Beweis des Satzes von Picard-Lindelöf betrachtet Operator T hathier die Form

(Ty)(x) = 1 + α

∫ x

0

y(t)dt.

Für die in der dritten Bemerkung zum Satz von Picard-Lindelöf genannte Picard-Lindelöfsche Folge (yn) erhält man y0(x) ≡ 1,

y1(x) = 1 + α

∫ x

0

1 dt = 1 + αx,

y2(x) = 1 + α

∫ x

0

(1 + αt)dt = 1 + αx+(αx)2

2.

Durch Induktion sieht man, dass

yn(x) =n∑k=0

(αx)k

k!.

Der Induktionsanfang wurde bereits gemacht. Und gilt die Aussage für ein n ∈ N,so folgt

yn+1(x) = 1 + α

∫ x

0

yn(t)dt

= 1 + αn∑k=0

αk

k!

∫ x

0

tkdt

= 1 + αn∑k=0

αk

k!

xk+1

k + 1

=n+1∑k=0

(αx)k

k!xk,

womit die Aussage auch für n+ 1 gilt.Der Satz von Picard-Lindelöf liefert yn(x)→ eαx für |x| < α, aber tatsächlich

gilt das natürlich für alle x ∈ R.

58

Page 61: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

4 Der Existenzsatz von Peano

Der Satz von Picard-Lindelöf besagt, dass die Differentialgleichung

y′(x) = f(x, y(x)), y(x0) = y0,

unter geeigneten Voraussetzungen eine eindeutig bestimmte lokale Lösung be-sitzt, d.h., es existiert dann ein offenes Intervall I0 mit x0 ∈ I0, in dem dieDifferentialgleichung eine eindeutig bestimmte Lösung hat. Die entscheidendeVoraussetzung ist dabei, dass f bezüglich y einer Lipschitz-Bedingung genügt,d.h.,

‖f(x, y)− f(x, y)‖ ≤ L‖y − y‖

für alle (x, y) aus einer Umgebung von (x0, y0).Ohne diese Voraussetzung ist die Lösung im Allgemeinen nicht eindeutig,

wie das in §1 betrachtete Beispiel (Leerlaufen einer Tonne) zeigt. Für das (zumdortigen Beispiel äquivalente) Anfangswertproblem

y′(x) = 2√|y(x)|, y(0) = 0,

hat man etwa die Lösungen y(x) = 0 und y(x) = x|x|.Ziel dieses Abschnitts ist der Beweis des Satzes von Peano, der besagt, dass

man ohne die Lipschitz-Bedingung noch die Existenz von Lösungen hat.

Satz 4.1. (Satz von Peano) Sei I offenes Intervall, Ω ⊆ Rm offen, f : I×Ω→Rm stetig, x0 ∈ I und y0 ∈ Ω. Dann hat das Anfangswertproblem

y′(x) = f(x, y(x)), y(x0) = y0,

eine lokale Lösung, d.h., es existiert ein offenes Intervall I0 mit x0 ∈ I0 ⊆ I, indem das Anfangswertproblem eine Lösung hat.

Genauer gilt: Sind δ, r > 0 mit

Jδ := [x0 − δ, x0 + δ] ⊆ I und Kr := y ∈ Rm : ‖y − y0‖ ≤ r ⊆ Ω,

und gilt mitM := max

(x,y)∈Jδ×Kr‖f(x, y)‖,

dass δM ≤ r, so hat das Anfangswertproblem eine Lösung in Jδ.

Bemerkung. 1. Die Bedingung δM ≤ r kann durch Verkleinerung von δ immererreicht werden.

2. Im Satz von Picard-Lindelöf wurde zusätzlich noch δL < 1 verlangt, wobeiL die Lipschitz-Konstante war.

Es sei an den Beweis des Satzes von Picard-Lindelöf erinnert. Zunächst wurdegezeigt (Lemma 3.1), dass y genau dann Lösung ist, wenn y Fixpunkt des durch

(Ty)(x) = y0 +

∫ x

x0

f (t, y(t)) dt

59

Page 62: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

definierten Operators T ist. Dann wurde gezeigt, dass für geeignete δ, r,M wieangegeben T : C(Jδ, Kr)→ C(Jδ, Kr) eine Kontraktion ist. Hierauf konnte jetztder Banachsche Fixpunktsatz (Lemma 3.2) angewandt werden.

Eine Möglichkeit, den Satz von Peano zu beweisen, besteht darin, ähnlichwie dort vorzugehen, aber statt des Banachschen Fixpunktsatzes den (deutlichtiefer liegenden) Fixpunktsatz von Schauder zu benutzen: Ist X Banachraum,K ⊆ X nicht-leer, kompakt und konvex und ist T : K → K stetig, so hat T einenFixpunkt.

Wir werden einen anderen, elementareren Weg beschreiten. Dazu benötigenwir einige Definitionen und Hilfssätze.

Definition 4.2. Seien (X, dX) und (Y, dY ) metrische Räume und sei F eineMenge von Funktionen von X nach Y . Für x0 ∈ X heißt F gleichgradig stetigin x0, falls zu jedem ε > 0 ein δ > 0 existiert, so dass dY (f(x), f(x0)) < ε fürdX(x, x0) < δ und alle f ∈ F .

Für A ⊆ X heißt F gleichgradig stetig auf A, falls zu jedem ε > 0 ein δ > 0existiert, so dass dY (f(x), f(x′)) < ε für alle x, x′ ∈ A mit dX(x, x′) < δ und füralle f ∈ F .

Bemerkung. Das Entscheidende ist, dass δ unabhängig von f gewählt werdenkann. Bei der gleichgradigen Stetigkeit auf A ist δ zusätzlich noch unabhängigvon den Punkten x, x′ ∈ A. Dies entspricht der gleichmäßigen Stetigkeit (auf A).Wie dort (man vgl. etwa die Analysis I von Herrn König, §3.8) gilt: Ist A kompaktund F gleichgradig stetig in jedem Punkt von A, so ist F gleichgradig stetigauf A.

Lemma 4.3. Sei (X, dX) kompakter metrischer Raum, sei D dichte Teilmengevon X und sei (Y, dY ) vollständiger metrischer Raum. Sei (fn) eine (auf X)gleichgradig stetige Folge von Funktionen von X nach Y . Konvergiert (fn(x))für alle x ∈ D, so ist (fn) gleichmäßig konvergent.

Beweis. Sei ε > 0. Sei δ wie in der Definition der gleichgradigen Stetigkeit, alsodY (fn(x), fn(x′)) < ε für alle x, x′ ∈ X mit dX(x, x′) < δ und alle n ∈ N. Da Ddicht und X kompakt ist, existieren x1, . . . , xN ∈ D mit

X ⊆N⋃j=1

Uδ(xj), wobei Uδ(xj) = x ∈ X : dX(x, xj) < δ.

Für j ∈ 1, . . . , N existiert nun nj ∈ N mit dY (fn(xj), fm(xj)) < ε für n,m ≥nj. Wir setzen n0 = maxj∈1,...,N nj.

Sei nun x ∈ X. Dann existiert xj mit x ∈ Uδ(xj). Es folgt für n,m ≥ n0,dass

dY (fn(x), fm(x)) ≤ dY (fn(x), fn(xj)) + dY (fn(xj), fm(xj))

+ dY (fm(xj), fm(x))

≤ 3ε.

Damit ist (fn) Cauchy-Folge im Raum C(X, Y ) der stetigen Funktion von Xnach Y , versehen mit der durch d(f, g) = maxx∈X dY (f(x), g(x)) gegebenenMetrik d. Folglich konvergiert (fn) in C(X, Y ), ist also gleichmäßig konvergent.

60

Page 63: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Lemma 4.4. Sei (X, dX) kompakter metrischer Raum. Dann hat X eine ab-zählbare dichte Teilmenge von D.

Beweis. Zu n ∈ N existieren xn1 , xn2 , . . . , xnkn ∈ X mit

X ⊆kn⋃j=1

U1/n(xnj ).

Damit leistet D = xnj : n ∈ N, j ∈ 1, . . . , kn das Verlangte.

Lemma 4.5. Seien (X, dX) und (Y, dY ) metrische Räume, sei Y kompakt undsei D abzählbare Teilmenge von X. Sei (fn) Folge von Funktionen von X nach Y .Dann hat (fn) eine Teilfolge, die auf D (punktweise) konvergiert.

Beweis. Sei D = d1, d2, d3, . . . . Da Y kompakt ist, hat die Folge (fn(d1)) einekonvergente Teilfolge. Wir bezeichnen diese mit (f 1

n(d1)). Die Folge (f 1n(d2))

hat eine konvergente Teilfolge (f 2n(d2)). Induktiv erhalten wir so für k ∈ N

eine Teilfolge (fkn) von (fn) mit der Eigenschaft, dass (fkn(xj)) für 1 ≤ j ≤ kkonvergiert. Die „Diagonalfolge“ (fnn ) hat dann die Eigenschaft, dass (fnn (xj))n∈Nfür alle j ∈ N konvergiert.

Durch Kombination dieser Hilfssätze erhalten wir folgendes Resultat.

Satz 4.6. (Satz von Arzelà-Ascoli) Seien (X, dX) und (Y, dY ) kompakte me-trische Räume und sei F Menge von Funktionen von X nach Y . Ist F gleich-gradig stetig, so hat jede Folge in F eine (gleichmäßig) konvergente Teilfolge.

Sind umgekehrt alle Funktionen in F stetig und besitzt jede Folge in F eine(gleichmäßig) konvergente Teilfolge, so ist F gleichgradig stetig.

Beweis. Sei F gleichgradig stetig. Wir wählen gemäß Lemma 4.4 eine dichteTeilmenge, wenden auf diese Lemma 4.5 an, und benutzen dann Lemma 4.3.

Zur Umkehrung: Ist F nicht gleichgradig stetig, so existieren ε > 0 undfn ∈ F sowie xn, x′n ∈ X mit dY (fn(xn), fn(x′n)) ≥ ε und dX(xn, x

′n) ≤ 1/k. Sei

nun (fnk) konvergente Teilfolge von (fn), etwa fnk → f . Ohne Einschränkung derAllgemeinheit können wir annehmen, dass auch (xnk) konvergiert, etwa xnk →x0. Dann gilt auch x′nk → x0. Es folgt fnk(xnk)→ f(x0) und fnk(x′nk)→ f(x0).Andererseits gilt dY (fnk(xnk), fnk(x

′nk

)) ≥ ε. Das ist ein Widerspruch.

Wir kehren nun zum Satz von Peano zurück. Die Idee ist, eine Folge (yn)von „Näherungslösungen“ zu definieren, mit Hilfe des Satzes von Arzelà-Ascolizu zeigen, dass (yn) eine konvergente Teilfolge hat, und dann zu zeigen, dass derGrenzwert Lösung ist.

Wie bereits bemerkt, erfüllt eine Löung y die Gleichung

y(x) = y0 +

∫ x

x0

f(t, y(t)) dt.

Für x1 < x2 gilt dann

y(x2)− y(x1) =

∫ x2

x1

f(t, y(t)) dt.

61

Page 64: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Ist |x2 − x1| klein, so weicht f(t, y(t)) im Intervall [x1, x2] wegen der Stetigkeitvon f nur wenig von f(x1, y(x1)) ab. Es gilt also

y(x2)− y(x1) ≈ (x2 − x1)f(x1, y(x1)).

Alternativ erhält man dies auch aus

f(x1, y(x1)) = y′(x1) ≈y(x2)− y(x1)

x2 − x1.

Für eine Zerlegung (x0, . . . , xk) des Intervalls [x0, x0 + δ], also x0 < x1 < x2 <· · · < xk = x0 + δ definiert man nun, motiviert durch obige Überlegungen,rekursiv

yj+1 = yj + (xj+1 − xj)f(xj, yj)

für 1 ≤ j ≤ k. Sei nun y : [x0, x0 + δ]→ Rm die Funktion, die y(xj) = yj für allej ∈ 0, 1, . . . , n erfüllt und die in den Intervallen [xj, xj+1] linear ist.

Es ist zu erwarten, dass für genügend feine Zerlegungen die so erhalteneFunktion y eine gute Annäherung an eine tatsächliche Lösung ist. Wir werdensehen, dass dies wirklich der Fall ist. Man nennt das beschriebene Verfahrenzur Gewinnung von Näherungslösungen Eulersches Polygonzug-Verfahren. Die-ses Verfahren ist das einfachste Verfahren zur numerischen Lösung von Differen-tialgleichungen. In der Praxis wendet man jedoch in der Regel Verfeinerungendavon an (sogenannte Runge-Kutta-Verfahren). Näheres dazu wird in der Nu-merischen Mathematik gesagt.

Besonders einfach wird das Verfahren bei äquidistanten Zerlegungen: Fürn ∈ N und h = δ/n sei xj = x0 + jh. Es gilt dann

yj+1 = yj + hf(xj, yj).

Sei yn die mit dem Eulerschen Polygonzug-Verfahren gewonnene Näherungs-lösung bei äquidistanter Zerlegung von [x0, x0 + δ] in n Intervalle der Längehn = δ/n. Mit xnj = x0 + jhn und ynj = yn(xj) ist also

ynj+1 = ynj + hnf(xnj , ynj ), yn0 = y0.

Wir werden zeigen, dass yn eine auf [x0, x0 + δ] konvergente Teilfolge hat unddass deren Grenzwert eine Löung der Differentialgleichung auf [x0, x0 + δ] ist.Völlig analog erhält man eine Lösung auf [x0 − δ, x0]. Hieraus folgt dann dieBehauptung.

Zuerst zeigen wir, dass

ynj ∈ Kr = y ∈ Rn : ‖y − y0‖ ≤ r

für alle n ∈ N und j ∈ 0, . . . , n. Wegen

‖ynj+1 − ynj ‖ = hn‖f(xnj , ynj )‖

folgt

‖ynj+1 − ynj ‖ ≤ hnM =δ

nM ≤ r

n,

62

Page 65: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

falls ynj ∈ Kr. Wegen yn0 = y0 erhalten wir aber induktiv

‖ynj − y0‖ ≤ jr

n≤ r

und damit schließlich ynj ∈ Kr für alle n und j. Hieraus folgt, dass

yn : [x0, x0 + δ]→ Kr.

Wir zeigen als Nächstes, dass (yn) gleichgradig stetig ist. Seien dazu zunächstx, x′ ∈ [xnj , x

nj+1]. Da yn im Intervall [xnj , x

nj+1] linear ist, folgt

‖yn(x′)− yn(x)‖ =‖ynj+1 − ynj ‖xnj+1 − xnj

|x− x′| = ‖ynj+1 − ynj ‖n

δ|x− x′| ≤ r

δ|x− x′|.

Die so erhaltene Abschätzung für ‖yn(x′)−yn(x)‖ gilt für alle x, x′ ∈ [x0, x0+δ],denn ist x0 ≤ x < x′ ≤ x0 + δ und sind j, k mit

xnj−1 ≤ x < xnj ≤ xnk < x′ ≤ xnk+1,

so folgt

‖yn(x′)− yn(x)‖ ≤ ‖yn(x′)− yn(xnk)‖+

∥∥∥∥∥k−1∑i=j

yn(xni+1)− yn(xni )

∥∥∥∥∥+‖yn(xnj )− yn(x)‖

≤ r

δ

((x′ − xnk) +

k−1∑i=j

(xni+1 − xni ) + xnj − x

)=

r

δ(x− x′).

Damit ist (yn) gleichgradig stetig. Aus dem Satz von Arzelà-Ascoli folgt nun,dass (yn)n∈N eine konvergente Teilfolge hat, etwa ynk → y. Es bleibt zu zeigen,dass y tatsächlich Lösung der Differentialgleichung (auf [x0, x0 + δ]) ist.

Äquivalent dazu ist, dass

y(x) = y0 +

∫ x

x0

f(t, y(t))dt

für x ∈ [x0, x0 + δ].Nun gilt

yn(xk) = ynk = yn0 +k−1∑j=0

(ynj+1 − ynj ) = y0 + hn

k−1∑j=0

f(xnj , ynj )

und

y0 +

∫ xk

x0

f(t, yn(t))dt = y0 +k−1∑j=0

∫ xj+1

xj

f(t, yn(t))dt.

Zu ε > 0 existiert nun η > 0 mit

‖f(x, y)− f(x′, y′)‖ ≤ ε

63

Page 66: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

falls x, x′ ∈ [x0, x0 + δ], y, y′ ∈ Kr, |x− x′| < η und ‖y − y′‖ < η.Für n groß genug folgt∥∥∥∥∥∫ xj+1

xj

f(t, yn(t))dt− hnf(xnj , ynj )

∥∥∥∥∥ =

∥∥∥∥∥∫ xj+1

xj

(f(t, yn(t))− f(xnj , y

nj ))dt

∥∥∥∥∥≤

∫ xj+1

xj

∥∥f(t, yn(t))− f(xnj , ynj )∥∥ dt

≤ hnε

und damit ∥∥∥∥yn(xk)−(y0 +

∫ xk

x0

f(t, yn(t))dt

)∥∥∥∥≤

k−1∑j=0

∥∥∥∥∥∫ xj+1

xj

f(t, yn(t))dt− hnf(xnj , ynj )

∥∥∥∥∥≤ khnε =

k

nδε ≤ δε.

Für x ∈ [xk, xk+1] gilt außerdem

‖yn(x)− yn(xk)‖ ≤r

n

und ∥∥∥∥∫ x

xk

f(t, yn(t))dt

∥∥∥∥ ≤ hnM =δM

n.

Es folgt ∥∥∥∥yn(x)−(y0 +

∫ x

x0

f(t, yn(t))dt

)∥∥∥∥ ≤ δε+r

n+δM

n.

Mit n = nk →∞ erhalten wir∥∥∥∥y(x)−(y0 +

∫ x

x0

f(t, y(t))dt

)∥∥∥∥ ≤ δε.

Da ε > 0 beliebig war, folgt

y(x) = y0 +

∫ x

x0

f(t, y(t))dt.

Also löst y die Differentialgleichung auf [x0, x0 + δ]. Analog behandelt man dasIntervall [x0− δ, x0] und erhält so eine Lösung auf [x0− δ, x0 + δ]. Damit ist derSatz von Peano bewiesen.

Bemerkung. 1. Wie bereits den Satz von Picard-Lindelöf haben wir den Satzvon Peano so formuliert, dass x0 ein innerer Punkt des betrachteten Intervallsist. Der Beweis zeigt wieder, dass die Aussage auch gilt, wenn x0 Randpunkt ist.

2. Hat die Differentialgleichung eine eindeutige Lösung y auf [x0, x0 + δ], sogilt

y(x) = limn→∞

yn(x) für x ∈ [x0, x0 + δ],

64

Page 67: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

d.h., das Euler-Polygonzug-Verfahren konvergiert gegen diese Lösung. Denn wäredies nicht der Fall, so existierte eine Folge (nk) mit nk →∞ und ε > 0 mit

‖ynk − y‖∞ = maxx∈[x0,x0+δ]

|ynk(x)− y(x)| ≥ ε.

Nun hat aber auch (ynk) nach dem Satz von Arzelà-Ascoli eine konvergenteTeilfolge, etwa ynkj → y. Es gilt dann ‖y − y‖∞ ≥ ε. Andererseits ist auch yLösung. Das ist ein Widerspruch zur Eindeutigkeit.

3. Man kann aber auch direkt nachweisen, dass (yn) konvergiert, falls f bezüg-lich y einer Lipschitz-Bedingung mit Lipschitz-Konstante L genügt, mit Lδ < 1wie im Satz von Picard-Lindelöf.

5 Abhängigkeit von Parametern

Gegeben seien zwei Anfangswertprobleme

y′(x) = f(x, y(x)), y(x0) = y0

undy′(x) = f(x, y(x)), y(x0) = y0.

Weichen f und f sowie y0 und y0 nur wenig voneinander ab, so wird man erwar-ten, dass Lösungen y(x) und y(x) dieser Anfangswertprobleme auch nur wenigvoneinander abweichen. Allerdings kann man das nur dann erwarten, wenn dieDifferentialgleichungen eine eindeutige Lösung haben, denn sonst kann ja auchfür f = f und y0 = y0 durchaus y(x) 6= y(x) gelten.

Wie vorher seien δ, r > 0,

J := Jδ = [x0 − δ, x0 + δ] und K := Kr = y ∈ Rm : ‖y − y0‖ ≤ r.

Es sei f stetig in J ×K und

M := max(x,y)∈J×K

‖f(x, y)‖.

Weiter sei y0 ∈ Rm mit ‖y0 − y0‖ = ε0 < r. Mit r = r − ε0 gilt dann

K := y : ‖y − y0‖ ≤ r ⊆ K.

Sei f stetig in J ×K mit

max(x,y)∈J×K

‖f(x, y)− f(x, y)‖ ≤ εf .

Dann giltM := max

(x,y)∈J×K‖f(x, y)‖ ≤M + εf .

Es gelte δM ≤ r und δM ≤ r. Dann hat

y′(x) = f(x, y(x)), y(x0) = y0

eine Lösung y auf Jδ und

y′(x) = f(x, y(x)), y(x0) = y0

eine Lösung y auf Jδ.

65

Page 68: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 5.1. Seien x0, δ, y0, y0, r, r, f, f ,M, M wie oben. Es existiere L ≥ 0 mit

‖f(x, y1)− f(x, y2)‖ ≤ L‖y1 − y2‖ für y1, y2 ∈ Kr und x ∈ Jδ.

Dann gilt‖y(x)− y(x)‖ ≤ (ε0 + δεf )e

L|x−x0| für x ∈ Jδ.

Zur Vorbereitung des Beweises notieren wir zunächst, dass mit den obigenBezeichnungen nach Lemma 3.1

y(x)− y(x) = y0 − y0 +

∫ x

x0

(f(x, y(t))− f(x, y(t))

)dt

= y0 − y0 +

∫ x

x0

(f(x, y(t))− f(x, y(t))

)dt

+

∫ x

x0

(f(x, y(t))− f(x, y(t))) dt

gilt. Es folgt

‖y(x)− y(x)‖ ≤ ‖y0 − y0‖+

∣∣∣∣∫ x

x0

εfdt

∣∣∣∣+

∣∣∣∣∫ x

x0

L‖y(t)− y(t)‖dt∣∣∣∣

≤ ε0 + δεf + L

∣∣∣∣∫ x

x0

‖y(t)− y(t)‖dt∣∣∣∣ .

Hierauf wenden wir jetzt folgenden Lemma an.

Lemma 5.2. (Gronwallsche Ungleichung) Sei I Intervall, g : I → [0,∞)stetig uns x0 ∈ I. Es gebe Konstanten A,B ≥ 0 mit

g(x) ≤ A+B

∣∣∣∣∫ x

x0

g(t)dt

∣∣∣∣ .Dann gilt

g(x) ≤ AeB|x−x0|.

Beweis. Zunächst sei A > 0 und x ≥ x0. Dann können die Betragsstriche inVoraussetzung und Behauptung entfallen. Sei

h(x) = A+B

∫ x

x0

g(t)dt,

so dass also g(x) ≤ h(x) für x ≥ 0. Nun gilt h′(x) = Bg(x) nach Hauptsatz derDifferential- und Integralrechnung, also h′(x) ≤ Bh(x) und damit

h′(x)

h(x)≤ B.

Es folgt

log h(x)− log h(x0) =

∫ x

x0

h′(t)

h(t)dt ≤ B

∫ x

x0

dt = B(x− x0),

66

Page 69: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

mit h(x0) = A, alsog(x) ≤ h(x) = AeB(x−x0).

Der Fall x < x0 ist analog.Betrachten wir eine Folge von A-Werten, die gegen 0 konvergiert, so erhalten

wir die Behauptung auch für A = 0.

Um den Beweis von Satz 5.1 abzuschließen, müssen wir die GronwallscheUngleichung nun lediglich auf

g(x) = ‖y(x)− y(x)‖, A = ε0 + δεf und B = L

anwenden.

Bemerkung. Die in Lemma 5.2 formulierte Ungleichung ist Spezialfall einer all-gemeineren (ebenfalls auf Gronwall zurückgehenden und nach ihm benannten)Ungleichung. Sind α, β, g : I → [0,∞) stetig und ist x0 ∈ I und gilt

g(x) ≤ α(x) +

∣∣∣∣∫ x

x0

β(t)g(t)dt

∣∣∣∣ ,so gilt

g(x) ≤ α(x) +

∣∣∣∣∫ x

x0

α(t)β(t) exp

(∣∣∣∣∫ x

t

β(s)ds

∣∣∣∣) dt∣∣∣∣ .Für x > x0 können wieder die Absolutzeichen weggelassen werden. Der Beweisist ähnlich.

6 Lineare Differentialgleichungssysteme

Wir betrachten das Differentialgleichungssystem

y′1(x) = a11(x)y1(x) + · · ·+ a1n(x)yn(x) + b1(x),

...

y′n(x) = an1(x)y1(x) + · · ·+ ann(x)yn(x) + bn(x),

wobei die aij und die bj gegebene, auf einem Intervall I stetige Funktionen mitWerten in R (oder C) sind, und die yj gesucht sind. Mit der (n × n)-MatrixA = (aij) und den (Spalten-)Vektoren

b =

b1...bn

und y =

y1...yn

erhält das Differentialgleichungssystem die Form

y′(x) = A(x)y(x) + b(x).

Ein Differentialgleichungssystem dieser Art heißt (n-dimensionales) lineares Dif-ferentialgleichungssystem (auf I). Im Falle b = 0 heißt das System homogen,anderenfalls inhomogen.

67

Page 70: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 6.1. Seiy′(x) = A(x)y(x) + b(x)

ein lineares Differentialgleichungssystem auf einem Intervall I. Sei weiter x0 ∈ Iund y0 ∈ Cn. Dann hat das Anfangswertproblem, das aus obigen Differentialglei-chungen und der Anfangsbedingung y(x0) = y0 besteht, eine eindeutige Lösungauf I.

Beweis. Wir betrachten zunächst den Fall, dass alle auftretenden Größen reellsind. Mit

f(x, y) = A(x)y + b(x)

gilt

‖f(x, y)− f(x, y)‖ = ‖A(x)(y − y)‖ ≤ ‖A(x)‖ · ‖y − y‖

für y, y ∈ Rn und x ∈ I. Dabei ist ‖A(x)‖ die Operatornorm der Matrix A(x).Sei I1 kompaktes Teilintervall von I und

L1 = maxx∈I1‖A(x)‖.

Dann gilt‖f(x, y)− f(x, y)‖ ≤ L1‖y − y‖

für y, y ∈ Rn und x ∈ I1. Nach Satz von Picard-Lindelöf existiert zu x1 ∈ I1 undy1 ∈ Rn damit δ1 > 0, so dass das Anfangswertproblem

y′(x) = A(x)y(x) + b(x), y(x1) = y1,

eine eindeutige Lösung auf [x1 − δ1, x1 + δ1] ∩ I1 hat.Es zeigt sich, dass δ1 unabhängig von x1 und y1 gewählt werden kann, solange

x1 ∈ I1. In der Tat, setzt man r1 = ‖y1‖+ 1,

K1 = y ∈ Rn : ‖y − y1‖ ≤ r1 und M1 = max(x,y)∈I1×K1

‖f(x, y)‖,

so liefert der Satz von Picard-Lindelöf die gewünschte Lösung, falls δ1L1 < 1und δ1M1 ≤ r1. Nun gilt

M1 ≤ max(x,y)∈I1×K1

‖A(x)‖ · ‖y‖+ maxx∈I1‖b(x)‖ ≤ L1(2‖y1‖+ 1) + max

x∈I1‖b(x)‖,

also

M1 ≤ α‖y1‖+ β,

mitα = 2L1 + 1 und β = L1 + max

x∈I1‖b(x)‖+ 1.

Die Ungleichung δ1M1 ≤ r1 gilt also, falls

δ1α‖y1‖+ δ1β ≤ ‖y1‖+ 1

68

Page 71: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

gilt. Insgesamt sehen wir, dass wir

δ1 = min

1

α,

1

β,

1

2L1

wählen können.

Sei nun I1 so gewählt, dass x0 ∈ I1. Man erhält eine eindeutige Lösung y0 in[x0− δ1, x0 + δ1]∩ I1. Ist etwa x1 := x0 + δ1 ∈ I1, liefert das Anfangswertproblemmit der Anfangsbedingung y(x1) = y0(x1) eine Lösung y1 auf [x1−δ1, x1+δ1]∩I1.Auf [x0, x1] stimmen y0 und y1 überein. Damit erhält man eine Lösung auf[x0 − δ1, x1 + δ1]∩ I1 = [x0 − δ1, x0 + 2δ1]∩ I1. Induktiv erhält man eine Lösungauf I1. Da I durch kompakte Intervalle ausgeschöpft werden kann, erhält manschließlich eine Lösung auf I.

Sind A, b und y0 komplex, so erhält man durch Zerlegung in Real- und Imagi-närteile ein System der Dimension 2n, auf das das bisher Bewiesene angewandtwerden kann.

Wie im eindimensionalen Fall betrachten wir zunächst homogene Gleichun-gen.

Satz 6.2. Die Lösungsmenge eines n-dimensionalen homogenen Differential-gleichungssystems bildet einen n-dimensionalen Vektorraum.

Beweis. Man sieht leicht ein, dass die Lösungsmenge L ein Vektorraum ist. Wei-ter ist T : L → Rn bzw. T : L → Cn, y 7→ y(x0), nach Satz 6.1 eine bijektiveAbbildung. Diese ist offensichtlich linear, also ein Isomorphismus.

Seien y1, . . . , yn Lösungen des homogenen Systems y′ = Ay. Wir fassen diesezu einer Matrix Y zusammen, also

Y = (y1, . . . , yn) =

y1,1 · · · yn,1...

...y1,n · · · yn,n

,

wobei yj,k die k-te Komponente von yj ist. Offensichtlich ist Y genau danninvertierbar, wenn y1, . . . , yn linear unabhängig sind (und damit nach Satz 6.2eine Basis des Lösungsraums). Man nennt y1, . . . , yn dann Fundamentalsystemund Y Fundamentalmatrix.

Ist Y Fundamentalmatrix und c = (c1, . . . , cn)t ∈ Rn (oder Cn), so ist

Y c =n∑j=1

cjyj

Lösung der Differentialgleichung, und alle Lösungen sind von dieser Form.Sei nun zk die Lösung des homogenen Anfangswertproblem mit der Anfangs-

bedingung zk(x0) = ek, wobei ek der k-te Einheitsvektor ist. Sei Z = (z1, . . . , zn)die zugehörige Fundamentalmatrix. Wir nennen Z Standardfundamentalmatrix(bezüglich x0). Aus obigen Überlegungen ergibt sich folgendes Resultat.

69

Page 72: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 6.3. Sei Z Standardfundamentalmatrix des Anfangswertproblem y′ = Aybezüglich x0. Sei y0 ∈ Rn. Dann hat das Anfangswertproblem

y′ = Ay, y(x0) = y0,

die Lösung y(x) = Z(x)y0.

Sind y1, . . . , yn Lösungen von y′ = Ay und ist Z = (z1, . . . , zn) die Standard-fundamentalmatrix, so existieren cjk ∈ R, j, k ∈ 1, . . . , n mit yk =

∑nj=1 zjcjk.

Mit C = (cjk) und Y = (y1, . . . , yn) folgt also Y = ZC. Ist C invertierbar, so istauch Y Fundamentalmatrix.

Definition 6.4. Seien y1, . . . , yn Lösungen von y′ = Ay und sei Y die Matrixmit den Spalten y1, . . . , yn, also Y = (y1, . . . , yn). Dann heißt

W (x) = W (y1, . . . , yn)(x) = detY (x)

Wronski-Determinante von Y .

Satz 6.5. Sei I Intervall und y′ = Ay homogenes Differentialgleichungssystemauf I. Seien y1, . . . , yn Lösungen, Y = (y1, . . . , yn) und x, x0 ∈ I. Dann gilt

W (x) = W (x0) exp

(∫ x

x0

Sp(A(t))dt

).

Dabei ist Sp(A) =∑n

j=1 ajj die Spur der Matrix A = (aij).

Beweis. Wir zeigen, dass

W ′(x) = Sp(A(x))W (x)

für alle x ∈ I. Hieraus folgt die Behauptung. Sei dazu x1 ∈ I fest und Z dieStandardfundamentalmatrix bezüglich x1. Dann gilt Y (x) = Z(x)C mit einerkonstanten Matrix C, und da Z(x1) die Einheitsmatrix ist, folgt C = Y (x1).

Mit Hilfe der Darstellung

detZ = det(z1, . . . , zn) =∑σ∈Sn

(−1)sign(σ)z1,σ(1) · z2,σ(2) · . . . · zn,σ(n),

wobei Sn die Menge der Permutationen von 1, . . . , n ist, folgt

(detZ(x))′ =n∑k=1

det(z1, . . . , zk−1, z′k, zk+1, . . . zn)

=n∑k=1

det(z1, . . . , zk−1, Azk, zk+1, . . . , zn).

Es folgt mit zk(x1) = ek, dass

(detZ(x))′|x=x1 =n∑k=1

det(e1, . . . , ek−1, Aek, ek+1, . . . , en)|x=x1

=n∑k=1

akk(x1) = Sp(A(x1)).

70

Page 73: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Außerdem gilt

(detY (x))′ = (det(Z(x)Y (x1)))′

= (detZ(x) · detY (x1))′

= (detZ(x))′ · detY (x1),

also

W ′(x) = (detZ(x))′|x=x1 ·W (x1) = Sp(A(x1))W (x1).

Die Behauptung folgt.

Satz 6.6. Seien y1, . . . , yn Lösungen des homogenen Differentialgleichungssys-tems y′ = Ay auf I. Dann sind äquivalent:

(i) y1, . . . , yn bilden ein Fundamentalsystem;

(ii) W (x) 6= 0 für ein x ∈ I;

(iii) W (x) 6= 0 für alle x ∈ I.

Beweis. Die Äquivalenz (ii) ⇔ (iii) folgt aus Satz 6.5.Offensichtlich gilt auch (ii)⇒ (i) und (iii)⇒ (i), denn sind y1, . . . , yn linear

abhängig, so gilt W (x) ≡ 0.Wir zeigen nun, dass (i) ⇒ (ii). Sei dazu y1, . . . , yn Fundamentalsystem

und es existiere x0 ∈ I mit W (x0) = 0. Dann existieren c1, . . . , cn ∈ R mit∑nj=1 cjyj(x0) = 0. Nun ist aber y(x) =

∑nj=1 cjyj(x) Lösung des Anfangswert-

problems y′ = Ay, y(x0) = 0. Es folgt y(x) = 0 für alle x ∈ I, im Widerspruchzur linearen Unabhängigkeit der yk.

Die allgemeine Lösung des inhomogenen Systems y′ = Ay + b gewinnt manwie im eindimensionalen Fall dadurch, dass man die allgemeine Lösung des ho-mogenen Systems zu einer speziellen (partikulären) Lösung des inhomogenenSystems addiert. Eine solche kann man wieder durch „Variation der Konstanten“gewinnen, also durch den Ansatz

y(x) =n∑k=1

ck(x)yk(x)

wobei y1, . . . , yk ein Fundamentalsystem ist.Wir geben nur das Ergebnis an.

Satz 6.7. Sei Y Standardfundamentalmatrix des homogenen Systems y′ = Ayauf I (zu x0 ∈ I). Dann ist die Lösung des inhomogenen Anfangswertproblemsy′ = Ay + b, y(x0) = y0 durch

y(x) = Y (x)y0 + Y (x)

∫ x

x0

Y −1(t)b(t)dt

gegeben.

71

Page 74: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Beweis. Die Anfangsbedingung ist offensichtlich erfüllt. Weiter gilt

y′(x) = Y ′(x)y0 + Y ′(x)

∫ x

x0

Y −1(t)b(t)dt+ Y (x)Y −1(x)b(x)

= Y ′(x)

(y0 +

∫ x

x0

Y −1(t)b(t)dt

)+ b(x)

= A(x)Y (x)

(y0 +

∫ x

x0

Y −1(t)b(t)dt

)+ b(x)

= A(x)

(Y (x) · y0 + Y (x)

∫ x

x0

Y −1(t)b(t)dt

)+ b(x)

= A(x)y(x) + b(x)

Bemerkung. Auch wenn Y nur Fundamentalmatrix ist (aber nicht Standard-fundamentalmatrix), ist y wie in Satz 6.7 partikuläre Lösung der inhomogenenDifferentialgleichung, löst aber nicht das Anfangswertproblem.

Die Berechnung einer partikulären Lösung mit Hilfe von Satz 6.7 setzt al-so voraus, dass man ein Fundamentalsystem des homogenen Systems kennt. Esgibt aber keine Methode, mit der man ein solches Fundamentalsystem im All-gemeinen bestimmen kann. Sind einzelne Lösungen bekannt, kann man jedochdie Dimension reduzieren. Diese Methode wird im Folgenden beschrieben.

Reduktionsverfahren von d’Alembert. Sei v eine Lösung des (n-dimensionalen)homogenen Differentialgleichungssystems y′ = Ay auf I. Es gelte also v′ = Av.Wir machen für die Lösung y den Ansatz

y(x) = φ(x)v(x) + z(x) mit z(x) =

0

z2(x)...

zn(x)

,

also z1(x) ≡ 0, wobei φ : I → R stetig differenzierbar sei. Es folgt

y′ = φ′v + φv′ + z′.

Da wir annehmen, dass y Lösung ist, folgt

y′ = Ay = A(φv + z) = φAv + Az.

Da v Lösung ist, gilt v′ = Av.Es folgt

φAv + Az = y′ = φ′v + φAv + z′,

alsoAz = φ′v + z′.

Wegen z1 = 0 folgt

φ′vk + z′k =k∑j=2

akjzj

72

Page 75: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

für k = 1, . . . , n.Für k = 1 erhält man

φ′ =1

v1

n∑j=2

a1jzj.

Es folgt für k = 2, . . . , n, dass

z′k =n∑j=2

akjzj − φ′vk

=n∑j=2

akjzj − vk1

v1

n∑j=2

a1jzj

=n∑j=2

(akj −

vkv1a1j

)zj.

Dieses ist ein (n− 1)-dimensionales, homogenes System für z2, . . . , zn.

Bemerkung. Wir haben vorausgesetzt, dass v1(x) 6= 0 gilt. Da wir v 6≡ 0 an-nehmen, existiert zu x0 ∈ I aber immer k ∈ 1, . . . , n und ein Intervall I0 mitx0 ∈ I0, so dass vk(x) 6= 0 für x ∈ I0. Man kann die entsprechende Reduktionmachen, indem man v1 durch vk ersetzt.

Beispiel. Wir betrachten auf I = (0,∞) das System

y′1 =1

xy1 − y2

y′2 =1

x2y1 +

2

xy2.

Es gilt also

y′ = Ay mit A =

1

x−1

1

x22

x

.

Eine Lösung ist gegeben durch

v(x) =

(x2

−x

).

Für z2 erhalten wir die Differentialgleichung

z′2(x) =

(a22(x)− v2(x)

v1(x)a12(x)

)z2(x) =

(2

x− (−x)

x2(−1)

)z2(x) =

1

xz2(x).

Eine Lösung ist z2(x) = x.Mit

φ′(x) =1

v1(x)a12(x)z2(x) =

1

x2(−1)x = −1

x.

können wir alsoφ(x) = − log x

73

Page 76: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

wählen und erhalten mit

y(x) = φ(x)v(x) + z(x)

= − log x

(x2

−x

)+

(0x

)=

(−x2 log xx log x+ x

)eine weitere Lösung der Differentialgleichung. Eine Fundamentalmatrix ist also(

x2 −x2 log x−x x log x+ x

).

Für die Wronski-Determinante W (x) erhalten wir

W (x) = x2(x log x+ x)− x3 log x = x3.

Tatsächlich gilt

W ′(x) = 3x2 =3

xW (x) = Sp(A(x))W (x).

7 Lineare Differentialgleichungssysteme mit konstantenKoeffizienten

Wir betrachten das homogene Differentialgleichungssystem y′ = Ay, wobei A ei-ne konstante (reelle oder komplexe) (n×n)-Matrix ist. Zur Motivation beginnenwir mit dem Picard-Lindelöf-Verfahren, von dem wir nach Satz 6.1 ja wissen,dass es konvergiert. Seien also x0 ∈ R, y0 ∈ Rn (oder Cn), und mit

Ty = y0 +

∫ x

x0

Ay(t)dt = y0 + A

∫ x

x0

y(t)dt

sei durchy0(x) ≡ y0, yn+1(x) = (Tyn)(x)

die Picard-Lindelöfsche Folge gegeben. Es gilt dann

y1(x) = y0 + A

∫ x

x0

y0dt = y0 + (x− x0)Ay0 = (E + (x− x0)A)y0.

Dabei ist E die Einheitsmatrix. (Wenn wir die Dimension n betonen wollen,schreiben wir auch En statt E.)

Es folgt

y2(x) = y0 + A

∫ x

x0

(E + (t− x0)A)y0dt

= y0 + A

((x− x0)E +

(x− x0)2

2A

)y0

=

(E + (x− x0)A+

(x− x0)2

2A2

)y0

74

Page 77: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Induktiv erhält man

yn(x) =

(E + (x− x0)A+ · · ·+ (x− x0)n

n!An)y0.

Für eine (n× n)-Matrix B definiert man nun

exp(B) :=∞∑k=0

Bk

k!.

Dabei ist B0 = E. Die Reihe konvergiert, denn es gilt∥∥∥∥Bk

k!

∥∥∥∥ =1

k!

∥∥Bk∥∥ ≤ 1

k!‖B‖k.

Wir erhalten folgendes Ergebnis.

Satz 7.1. Das homogene Anfangswertproblem

y′ = Ay, y(x0) = x0,

mit x0 ∈ R, y0 ∈ Rn (oder Cn) und einer reellen (oder komplexen) (n×n)-MatrixA hat die (eindeutige) Lösung

y(x) = exp((x− x0)A)y0.

Es verbleibt die Frage, wie man exp(B) für eine gegebene Matrix B be-rechnet. Zunächst überlegt man sich, dass für eine invertierbare Matrix S undC = S−1BS die Gleichung

Ck = S−1BSS−1BS . . . S−1BS = S−1BkS

und damitexp(C) = S−1 exp(B)S,

bzw.exp(B) = S exp(C)S−1

gilt.Am einfachsten ist der Fall einer Diagonalmatrix

D =

d1 0. . .

0 dn

Hier gilt

Dk =

dk1 0. . .

0 dkn

und expD =

ed1 0. . .

0 edn

.

75

Page 78: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Im Allgemeinen findet man aber für gegebenes B keine invertierbare Ma-trix S, so dass S−1BS Diagonalmatrix ist. Es gibt aber immer eine invertierbareMatrix S, so dass S−1BS Jordan-Normalform hat, das heißt, J := S−1BS hatdie Form

J =

J1 0

J2. . .

0 Jq

mit Jordanblöcken J1, . . . , Jq. Diese sind (ml ×ml)-Matrizen der Form

Jl =

λl 1 0

λl 1. . . . . .

. . . 10 λl

sind, wobei λl ∈ C und

∑ql=1ml = n.

Wir definieren die (m × m)-Matrix Nm = (δj+1,k)j,k=1,...,m, mit dem soge-nannten Kronecker-Symbol

δik =

1, wenn i = k,

0, wenn i 6= k,

Dann giltJl = λlEml +Nml .

Offensichtlich gilt

Jk =

Jk1 0

Jk2. . .

0 Jkq

und damit

exp J =

exp J1 0

exp J2. . .

0 exp Jq

Nun gilt

N2m =

0 0 1 0 0

0 0 1. . .

. . . . . . . . . 0. . . . . . 1

. . . 00 0

= (δj+2,k)j,k=1,...,m

76

Page 79: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

und allgemeinNpm = (δj+p,k)j,k=1,...,m für p < m

mitNpm = 0 für p ≥ m.

Allgemein gilt für Matrizen P und Q nicht exp(P + Q) = exp(P ) exp(Q).Dies gilt aber, falls PQ = QP . Der Beweis sei als Übung überlassen. Für t ∈ Rerhalten wir damit

exp(tJl) = exp(λltEml + tNml)

= exp(λltEml) exp(tNml)

= eλltEml

∞∑k=0

tk

k!(Nml)

k

= eλltml−1∑k=0

tk

k!(Nml)

k

also

exp(tJl) = eλlt

1 tt2

2· · · tml−1

(ml − 1)!

1 tt2

2· · ·

1 tt2

2

.... . . . . . . . . ...

. . . . . . t2

2. . . t

0 1

Für das Anfangswertproblem y′ = Ay, y(x0) = y0 erhalten wir also zusam-

menfassend:Sei S invertierbar, so dass

J = S−1AS =

J1 0

J2. . .

0 Jq

Jordan-Normalform hat. Dann ist

y(x) = exp((x− x0)A)y0

= S exp((x− x0)J)S−1y0

= S

exp((x− x0)) J1 0

. . .0 exp((x− x0)) Jq

S−1y0

77

Page 80: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Lösung des Anfangswertproblems, wobei die Blöcke exp((x − x0)Jl) wie obengegeben sind.

Mit y = (y1, . . . , yn)t gilt also

yk(x) =

q∑l=1

pl(x)eλlx,

wobei λ1, . . . , λq die Eigenwerte von A sind und die pl Polynome sind (derenmaximaler Grad um 1 kleiner ist als die Größe de entsprechenden Jordanblocks).

8 Lineare Differentialgleichungen höherer Ordnung

Wir betrachten die Differentialgleichung

y(n) + an−1y(n−1) + · · ·+ a1y

′ + a0y = b,

wobei n ∈ N und a0, a1, . . . , an−1, b : I → R (oder C) mit einem Intervall I.Wie vorher schreiben wir diese Differentialgleichung als System: Mit

y =

yy′

...y(n−1)

erhalten wir

y′ = Ay + b,

wobei

A =

0 1 0 00 1 0

0 1 0. . . . . . . . .

0 1 00 0 1 0−a0 −a1 −a2 · · · · · · −an−2 −an−1

, b =

00.........0b

.

Alles über lineare Differentialgleichungssysteme Gesagte überträgt sich un-mittelbar auf die lineare Differentialgleichung n-ter Ordnung, etwa Existenz undEindeutigkeit von Lösungen, wobei die Anfangsbedingung jetzt die Form

y(x0) = y0, y′(x0) = y1, . . . , y

n−1(x0) = yn−1

hat.Ebenso erhält man die allgemeine Lösung der inhomogenen Differentialglei-

chung aus der allgemeinen Lösung der homogenen Differentialgleichung (d.h.,dem Fall b = 0) sowie einer partikulären Lösung der inhomogenen Differential-gleichung.

78

Page 81: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Die Berechnung einer partikulären Lösung vereinfacht sich aber: Seien dazuy1, . . . , yn linear unabhängige Lösungen der homogenen linearen Differentialglei-chung. Wir nennen y1, . . . , yn dann wieder Fundamentalsystem, denn

Y (x) = (y1, . . . , yn) =

y1 y2 . . . yny1 y2 . . . yn

y(n−1) y(n−1)2 y

(n−1)n

ist Fundamentalmatrix des zugehörigen Systems. Wir setzen

W (y1, . . . , yn) = W (y1, . . . , yn),

also

W (y1, . . . , yn) = det

y1 y2 . . . yny1 y2 . . . yn...

......

y(n−1) y(n−2)2 y

(n−1)n

.

An Stelle von Definition 6.4 findet man dies in der Literatur oft als Definitionder Wronski-Determinante – auch dann, wenn die Funktionen y1, . . . , yn nichtals Lösung einer linearen Differentialgleichung erscheinen.

Nach Satz 6.7 und der anschließenden Bemerkungen ist für x0 ∈ I und c ∈ Rn

durchy(x) = Y (x)c+ Y (x)

∫ x

x0

Y −1(t)b(t)dt

eine Lösung des inhomogenen Systems gegeben.Sei nun u(t) = Y −1(t)b(t), kurz u = Y −1b. Dann gilt Y u = b und nach

Cramerscher Regel folgt mit u = (u1, . . . , un)t, dass

uk =detVkdetY

=detVk

W (y1, . . . , yn),

wobei Vk die Matrix ist, die entsteht, wenn man in Y die k-te Spalte durch bersetzt.

Bis hierher gilt alles auch für allgemeine Systeme. In unserem Fall gilt nun

detVk = det

y1 . . . yk−1 0 yk+1 · · · yny′1 . . . y′k−1 0 y′k+1 · · · y′n...

......

......

y(n−1)1 . . . y

(n−1)k−1 b y

(n−1)k+1 . . . y

(n−1)n

= (−1)k+nb W (y1, . . . , yk−1, yk+1, . . . , yn),

alsouk = (−1)k+nb

W (y1, . . . , yk−1, yk+1, . . . , yn)

W (y1, . . . , yn).

Außerdem interessiert uns nur die erste Komponente von y = (y, y′, . . . , y(n−1))t.Wir erhalten folgendes Resultat.

79

Page 82: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 8.1. Gegeben sei die Differentialgleichung

y(n) + an−1y(n−1) + · · ·+ a1y

′ + a0y = b,

mit stetigen Funktionen a0, a1, . . . , an−1, b : I → C. Seien y1, . . . , yn linear un-abhängige Lösungen der homogenen Gleichung. Dann ist die allgemeine Lösungder inhomogenen Gleichung gegeben durch

y(x) =n∑k=1

ckyk(x) +n∑k=1

(−1)k+nyk(x)

∫ x

x0

b(t)Wk(t)

W (t)dt,

mit W = W (y1, . . . , yn), Wk = W (y1, . . . , yk−1, yk+1, . . . , yn) und c1, . . . , ck ∈ C.

Des Weiteren gilt wegen Sp(A) = −an−1 jetzt

W (x) = W (x0) exp

(−∫ x

x0

an−1(t)dt

)für x, x0 ∈ I.

Wir betrachten nun den Fall konstanter Koeffizienten in der homogenen Dif-ferentialgleichung, also die Gleichung

y(n) + an−1y(n−1) + · · ·+ a1y

′ + a0 = 0

mit a0, a1, . . . , an−1 ∈ C. Auch hier können wir die Ergebnisse für Systeme benut-zen, um ein Fundamentalsystem zu bestimmen. Dies ist allerdings recht mühsam.Andererseits zeigen die Ergebnisse für Systeme, dass die Lösungen Linearkom-binationen von Funktionen der Form x 7→ xkeλx sein müssen.

Wir überprüfen zunächst, wann y(x) = eλx Lösung ist. Mit

dk

dxk(eλx) = λkeλx

erhält man0 = λneλx + an−1λ

n−1eλx + · · ·+ a0eλx,

wegen eλx 6= 0 mit an := 1 also

p(λ) :=n∑k=0

akλk = 0.

Man nennt p das charakteristische Polynom der Differentialgleichung. Tat-sächlich gilt auch

p(λ) = (−1)n det(A− λE)

mit der Matrix A des zugehörigen Systems.Ist λ eine Nullstelle des charakteristischen Polynoms, so ist x 7→ eλx also

Lösung der homogenen Differentialgleichung. Eine genauere Analyse zeigt: Ist λeine m-fache Nullstelle, so ist x 7→ xkeλx für 0 ≤ k ≤ m−1 eine Lösung der Dif-ferentialgleichung. Auf diese Weise erhält man n linear unabhängige Lösungen,also ein Fundamentalsystem.

Wir fassen dies in folgendem Satz zusammen.

80

Page 83: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Satz 8.2. Seien n ∈ N, a0, a1, . . . , an−1 ∈ C, an = 1 und

p(λ) =n∑k=0

akλk.

Seien λ1, . . . , λl die Nullstellen von p, mit den Vielfachkeiten m1, . . . ,ml. (Esgilt also

∑lk=1mk = n.) Dann bilden die Funktionen

x 7→ xkeλjx, 1 ≤ j ≤ l, 0 ≤ k ≤ mj − 1

ein Fundamentalsystem der Differentialgleichung

y(n) + an−1y(n−1) + · · ·+ a1y

′ + a0y = 0.

Bemerkung. Auch wenn alle ak reell sind, können einige der λj komplex sein.Mit λj ist dann aber auch λj Nullstelle von p. Sei λj = µj + iνj mit µj, νj ∈ R,und damit λj = µj − iνj. Dann gilt

1

2

(eλjx + eλjx

)=

1

2eµjx (cos νjx+ i sin νjx+ cos νjx− i sin νjx) = eµjx cos νjx

und1

2i

(eλjx − eλjx

)= eµjx sin νjx.

Man kann also in obigem Fundamentalsystem die Funktionen

xkeλjx und xkeλjx

durchxkeµjx cos νjx und xkeµjx sin νjx

ersetzen und erhält so ein Fundamentalsystem mit ausschließlich reellwertigenFunktionen.

Beispiel. Wir betrachten die Differentialgleichung

y′′(x) + αy′(x) + βy(x) = 0,

wobei α, β ≥ 0. Physikalisch beschreibt dies eine gedämpfte Schwingung. Dabeiist y(x) die Auslenkung einer an einer Feder hängenden Masse zum Zeitpunkt x.Weiter ist β eine von der Masse, der Schwerkraft und der Feder abhängendeKonstante und α ist eine von der Dämpfung abhängige Konstante.

Seien

λ1,2 =−α±

√α2 − 4β

2

die Nullstellen vonp(λ) = λ2 + αλ+ β.

Fall 1. α2 < 4β. Dann gilt

λ1,2 = µ± iν mit µ = −α2, ν =

√4β − α2

2.

81

Page 84: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Damit bildeny1(x) = eµx cos νx, y2(x) = eµx sin νx

ein Fundamentalsystem, d.h., die allgemeine Lösung hat die Form

y(x) = c1y1(x) + c2y2(x).

Im Falle α = 0 gilt µ = 0, ν =√β, und man erhält

y1(x) = cos νx, y2(x) = sin νx.

Dies ist die ungedämpfte Schwingung.

Fall 2. α2 > 4β. Dann gilt

λ2 = −α +√α2 − 4β

2< λ1 = −α−

√α2 − 4β

2< 0

und wir erhalten das Fundamentalsystem

y1(x) = eλ1x, y2(x) = eλ2x.

Fall 3. α2 = 4β. Dann gilt

λ1 = λ2 = µ := −α2

und wir erhalten das Fundamentalsystem

y1(x) = eµx, y2(x) = xeµx.

Wir bestimmen in allen drei Fällen die Lösung mit der Anfangsbedingungy(0) = 1, y′(0) = 0.

Fall 1. Seiy(x) = c1e

µx cos νx+ c2eµx sin νx.

Dann gilty′(x) = (c1µ+ c2ν)eµx cos νx+ (−c1ν + c2µ) sin νx.

Es folgt c1 = 1 und c1µ+ c2ν = 0, also c2 = −µ/ν. Wir erhalten

y(x) = eµx cos νx− µ

νeµx sin νx.

Der Fall α = 2, β = 5 und damit µ = −1, ν = 2 ist in Abbildung 11 skizziert.

Fall 2. Mit

y(x) = c1eλ1x + c2e

λ2x, y′(x) = c1λ1eλ1x + c2λ2e

λ2x,

folgt c1 + c2 = 1 und c1λ1 + c2λ2 = 0, also c2 = −c1λ1/λ2 und damit

c1λ2 − λ1λ1

= c1

(1− λ1

λ2

)= 1.

82

Page 85: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Abbildung 11: Lösungen von y′′+2y′+5y = 0, mit Anfangswerten y(0) = 1,y′(0) = 0 sowie y(0) = 0, y′(0) = 1.

Abbildung 12: Lösungen von y′′+2y′+ 34y = 0, mit Anfangswerten y(0) = 1,

y′(0) = 0 sowie y(0) = 0, y′(0) = 1.

Dies liefert

c1 = − λ2λ1 − λ2

, c2 =λ1

λ1 − λ2,

alsoy(x) =

1

λ1 − λ2(−λ2eλ1x + λ1e

λ2x).

Wegen λ2 < λ1 < 0 gilt λ2eλ1x < λ1eλ1x = λ1e

λ2xe(λ1−λ2)x < λ1eλ2x für x ≥ 0,

also y(x) > 0 für x ≥ 0.Der Fall α = 2, β = 3

4ist in Abbildung 12 dargestellt.

Fall 3. Mity(x) = (c1 + c2x)eµx

folgty′(x) = (c2 + µc1 + µc2x)eµx,

also c1 = 1 und c2 + µc1 = 0, also c2 = −µc1 = −µ. Wir erhalten

y(x) = (1− µx)eµx =(

1 +α

2x)e−αx/2.

Der Fall α = 2, β = 1 ist in Abbildung 13 dargestellt.

83

Page 86: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Abbildung 13: Lösungen von y′′+2y′+ y = 0, mit Anfangswerten y(0) = 1,y′(0) = 0 sowie y(0) = 0, y′(0) = 1.

Bemerkung. Im Fall 1 kann man natürlich auch wie im Fall 2 vorgehen underhält mit λ1,2 = µ± iν, dass

y(x) =1

λ1 − λ2(λ2e

λ1x − λ1eλ2x)

=1

2iν((µ− iν)eµx(cos νx+ i sin νx)− (µ+ iν)eµx(cos νx− i sin νx))

=1

2iνeµx ((µ− iν − µ− iν) cos νx+ (iµ+ ν + iµ− ν) sin νx)

= −eµx cos νx+µ

νeµx sin νx.

Allgemein betrachten wir jetzt die inhomogene Differentialgleichung

y′′(x) + αy′(x) + βy(x) = h(x).

Physikalisch interpretieren wir das als gedämpfte Schwingung mit zeitabhängigeräußerer Kraft.

Wir betrachten nur den Fall 2, aber mit komplexem λ1,2 ist damit auch Fall 1erledigt. Es gilt

Y (x) =

(eλ1x eλ2x

λ1eλ1x λ2e

λ2x

),

also

W (x) = detY (x) = (λ2 − λ1)e(λ1+λ2)x.

Des Weiteren gilt

W1(x) = W (y2)(x) = y2(x) = eλ2x

und

W2(x) = eλ1x.

84

Page 87: Analysis IIIanalysis.math.uni-kiel.de/vorlesungen/ana3.13/ana3.pdf · Literatur FolgendeBüchersindnureinekleineAuswahlausderumfangreichenLiteratur zudenbehandeltenThemen. Integrationstheorie

Mit Satz 6.1 erhalten wir

y(x) = c1y1(x) + c2yx(x) +2∑

k=1

(−1)kyk(x)

∫ x

x0

h(t)Wk(t)

W (t)dt

= c1eλ1x + c2e

λ2x − eλ1x∫ x

x0

h(t)eλ2t

(λ2 − λ1)e(λ1+λ2)tdt

+eλ2x∫ x

x0

h(t)eλ1t

(λ2 − λ1)e(λ1+λ2)tdt

= c1eλ1x + c2e

λ2x − eλ1x

λ2 − λ1

∫ x

x0

h(t)e−λ1tdt+eλ2x

λ2 − λ1

∫ x

x0

h(t)e−λ2tdt

In vielen konkreten Fällen ist es aber einfacher, partikuläre Lösungen durchAnsätze zu gewinnen. Ist etwa h von der Form

h(x) = p(x)eαx

mit einem Polynom p und α ∈ C\λ1, λ2, so existiert eine partikuläre Lösungy von der Form

y(t) = q(x)eαx,

wobei q ein Polynom vom gleichen Grad wie p ist.

85