1 vorwort · tutorium mathematik in den wirtschaftswissenschaften 1 vorwort liebe kommilitoninnen...

Tutorium Mathematik

in den Wirtschaftswissenschaften

1 Vorwort

Liebe Kommilitoninnen und Kommilitonen,

wer hat keine Angst davor, dass seine Mathematikkenntnisse aus der Schule nicht ausreichen,

um ein mathelastiges Studium zu bestreiten? Wer hat nicht schon einen Teil der Methodik

aus den ersten Semestern vergessen, die irgendwann einfach fehlt? Dieses Skript entstand, um

euch die Angst vor dem Mathematikanteil in BWL und VWL zu nehmen und soll als Lern-

und Nachschlagewerk - nicht nur fur Erstsemester - dienen. Zu diesem Zweck wurden zum

Wintersemester 09/10 auch freiwillige Mathematiktutorien eingefuhrt, die keine Erganzung zur

Vorlesung Mathematik fur Wirtschaftswissenschaftler bilden, sondern als separate Lerngruppen

dem Erwerb und der Auffrischung methodischer Kenntnisse dienen sollen. Sollten euch die ma-

thematischen Werkzeuge auf den folgenden Seiten nicht (mehr) gelaufig sein, bieten die Tutorien

eine gute Gelegenheit, eure Lucken ganz unproblematisch zu fullen, bevor diese zum Problem

werden. Wir haben versucht, dieses Skript als ein Leitfaden zu den Tutorien zu gestalten und al-

le gangigen Methoden, die ihr im Laufe eures Studiums benotigen werdet, darzustellen. Auf den

folgenden Seiten findet ihr deshalb die wichtigesten mathematischen Werkzeuge fur BWL und

VWL, angefangen bei den Grundrechenarten bis hin zur Stochastik. Trotz sorgfaltiger Arbeit

erheben wir allerdings nicht den Anspruch auf Vollstandigkeit oder vollkommene Fehlerfreiheit.

Vielmehr hoffen wir, dass dieses Skript im Laufe der Semester aktualisiert und immer weiter

verbessert wird. Im Gegenteil befinden sich einige Passagen noch in der Bearbeitung. Deshalb

begrußen wir Verbesserungen und Vervollstandigungen eurerseits, die dazu fuhren sollen, das

Skript zu einer immer nutzlicheren Hilfe fur moglichst viele Studentinnen und Studenten wer-

den zu lassen.

Eure Vertreter der Fachschaft VWL, Oktober 2009

Version v0.3: 16. Oktober 2010

1

Inhaltsverzeichnis

1 Vorwort 1

2 Grundrechenarten 5

2.1 Addition und Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Bruchrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.1 Gleicher Nenner: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.2.2 Ungleicher Nenner: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3 Potenzrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.1”Ganze“ Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3.2 Rationale Exponenten: Wurzeln . . . . . . . . . . . . . . . . . . . . . . . 8

2.4 Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Gleichungen 10

3.1 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.2 Aquivalenzumformungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.3 Verschiedene Gleichungstypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.3.1 Lineare Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.3.2 Quadratische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.3.3 Kubische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.3.4 Bruchgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.3.5 Wurzelgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3.6 Binomische Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.3.7 Exponentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.3.8 Logarithmusgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.4 Beispiel: Das IS-LM-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4 Differentialrechnung 24

4.1 Rechenregeln der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . 25

4.2 Marginale und diskrete Wertanderungen . . . . . . . . . . . . . . . . . . . . . . 29

4.3 Extremwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.4 Krummungsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

5 Funktionen mit mehreren Variablen 33

5.1 Ableiten einer Funktion mit mehreren Variablen . . . . . . . . . . . . . . . . . . 33

5.2 Beispiel: Grenzprodukte und Skalenertrage . . . . . . . . . . . . . . . . . . . . . 34

5.3 Extremwerte bei Funktionen mehrerer Variablen . . . . . . . . . . . . . . . . . . 35

5.4 Das totale Differential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2

5.5 Methode nach Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

6 Integralrechnung 41

6.1 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

6.1.1 Fundamentalsatz der Analysis . . . . . . . . . . . . . . . . . . . . . . . . 42

6.1.2 Bilden von Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . 42

6.2 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

6.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

6.4 Beispiel: Konsumentenrente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

7 Matrixalgebra 46

7.1 Warum Matrizen nutzlich sind . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

7.2 Rechnen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

7.2.1 Addition und Subtraktion . . . . . . . . . . . . . . . . . . . . . . . . . . 47

7.2.2 Matrizen-Multipikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

7.2.3 Multipikation einer Matrix mit einem Skalar . . . . . . . . . . . . . . . . 50

7.2.4 Transponieren einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . 51

7.3 Besondere Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

7.3.1 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

7.3.2 Nullmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

7.3.3 Quadratische Matrix und Einheitsmatrix . . . . . . . . . . . . . . . . . . 52

7.4 Zusammenfassung der Rechenregeln der Matrixalgebra . . . . . . . . . . . . . . 53

7.5 Lineare Abhangigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

7.6 Determinanten quadratischer Matrizen . . . . . . . . . . . . . . . . . . . . . . . 55

7.7 Inverse einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

7.7.1 Formale Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

7.7.2 Gauß-Jordan Elimination . . . . . . . . . . . . . . . . . . . . . . . . . . 57

7.7.3 Cramer’sche Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

7.8 Beispiel: Herleitung des multivariaten OLS-Schatzers . . . . . . . . . . . . . . . 61

7.8.1 Ableiten der Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

7.8.2 Auflosen der Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

8 Stochastik 66

8.1 Begriff der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

8.2 Definition von Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 67

8.2.1 Laplace-Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 67

8.2.2 Axiomatische Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . 68

3

8.3 Diskrete und stetige Zufallsvariablen:

Wahrscheinlichkeits-, Dichte- und Verteilungsfunktion . . . . . . . . . . . . . . . 69

8.3.1 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

8.3.2 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

8.3.3 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

8.4 Rechnen mit Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

8.4.1 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

8.4.2 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . 77

8.4.3 Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

8.4.4 Die Momente einer Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . 80

4

2 Grundrechenarten

Da bei manchem Studienanfanger der Schulunterricht vielleicht schon eine Weile zuruck liegt,

wollen wir in diesem ersten einfuhrenden Kapitel zunachst mathematische Grundprinzipien

wiederholen. Wir wollen so jedem Nutzer dieses Skripts ermoglichen, sich die mathematische

Methode”von der Pike“ an in Erinnerung zu holen.

2.1 Addition und Multiplikation

Fur Addition und Multiplikation gelten drei Gesetze:

1. Kommutativgesetz: a + b = b + a

Beispiel: 1 + 2 = 2 + 1 = 3

2. Assoziativgesetz: (a + b) + c = a + (b + c)

Beispiel: (1 + 2) + 3 = 1 + (2 + 3) = 6

3. Distributivgesetz: (a + b) · c = c· a + c· bBeispiel: (2 + 5) · 2 = 2 · 2 + 5 · 2 = 14

2.2 Bruchrechnung

Ein Bruch ist eine Zahl der Form”mn

“. m ist der Zahler, n der Nenner. Ein Nenner n = 0 ist

nicht definiert. Sogenannte”Echte Bruche“ sind Bruche mit m < n. Fur

”unechte Bruche“ gilt

m > n. Bruche mit m = 1 sind Stammbruche. Der Kehrwert bildet sich durch die Vertauschung

von Zahler und Nenner.

Bruchoperationen:

• Erweitern: ab

= a·cb·c = ac

bc; c = 0

5

Beispiel: 23

= 2·53·5 = 10

15

• Kurzen: ab

= a÷cb÷c

Beispiel: 918

= 9÷918÷9

= 12

• Addieren/Subtrahieren

2.2.1 Gleicher Nenner:

ac

+ bc

= a+bc

Beispiel: 56

+ 16

= 11

= 1

2.2.2 Ungleicher Nenner:

Bruche mit ungleichen Nennern mussen auf den gleichen Nenner gebracht werden, bevor

eine Addition oder Subtraktion moglich ist. Hierbei bedient man sich des Erweiterns. Der

Hauptnenner ist das kleinste gemeinsame Vielfache der Nenner.ab

+ cd

= a·db·d + c·b

d·b = ad+cbbd

Beispiel: 14

+ 23

Hauptnenner: 4· 3 = 12

⇒ 1·3+4·24·3 = 11

12

• Multiplizieren: ab· cd

= acbd

• Dividieren: ab÷ c

d= a

b· dc

= adbc

Das Kurzen und Dividieren, sowie Multiplizieren und Erweitern sind zu unterscheiden!

2.3 Potenzrechnung

2.3.1”Ganze“ Exponenten

an: Potenz

n: Exponent

6

a: Basis

an sei eine Kurzschreibweise fur das Produkt∏n a = a · a · . . . · a

Es gelten folgende Definitionen:

• a(pq) = b ⇔ ap = bq

• a−n = 1an

• a1 = a

• a0 = 1

Zusatzlich gelten folgende Operationen:

• b · an + c · an = (b + c) · an

Diese Regel ist einfach eine Verallgemeinerung des Distributivgesetzes.

• am · an = a(m+n)

Wenn die Basen (die a’s) gleich sind, werden diese multipliziert, indem man einfach deren

Exponenten addiert.

• am

an= a(m−n)

Diese Regel lauft analog zur vorhergehenden Regel, nur dass bei einer Division gleicher

Basen die Hochzahlen subtrahiert werden.

• (ab)−n = ( b

a)n

Ist die Hochzahl negativ, so erhalt man einen positiven Exponenten, wenn man Zahler

und Nenner vertauscht. Dieses Ergebnis kann man sehr leicht selbst ausrechnen.

• an · bn = (ab)n

Sind die Basen unterschiedlich, aber die Exponenten gleich, so kann man den Exponenten

herausziehen. Umgekehrt gilt naturlich auch: Sollte man zwei zu multiplizierende Basen

umschreiben wollen, muss man selbstverstandlich bei jeder Basis an den Exponenten

denken.

• (an)m = anm

Und zum Schluss: Wird eine Potenz potenziert, so multipliziert man einfach die Expo-

nenten.

7

2.3.2 Rationale Exponenten: Wurzeln

Wurzeln sind Potenzen mit rationalen Exponenten. Somit ist das Rechnen mit Wurzeln nur

Rechnen mit Bruchen als Hochzahl.n√am = a(

mn)

Beispiele: √a2 = a(

22) = a1 = a

3√a4 = a(

43)√

5√ab3 =

√(ab)(

35) = (ab)(

35· 12) = (ab)(

310

)

Nebenbei: Rechnungen in dieser Ausfuhrlichkeit kosten zwar ein klein wenig mehr Zeit, aber

sie minimieren die Fehlerwahrscheinlichkeit drastisch. Zum Uben und in der Klausur ist diese

Ausfuhrlichkeit auf jeden Fall gerechtfertigt!

Nun sei noch auf das Rationalmachen der Nenner verwiesen:

a√b⇔ a

√b

b

Auch wenn es banal klingt: Ubt das Rechnen mit Wurzeln! Unsicherheiten mit solchen Grund-

operationen konnen in Klausuren viele Punkte kosten, die leicht verdient waren.

8

2.4 Logarithmen

Hier betrachten wir nun allein die Rechenregeln zum Logarithmus. Was ein Logarithmus kon-

kret ist oder woher die zunachst unverstandlichen Rechenregeln uberhaupt kommen, wird spater

noch erlautert. Hier beschranken wir uns zunachst nur auf den ”naturlichen Logarithmus”.

Die Gleichung ax = b ist nur durch den Logarithmus losbar:

ax = b| ln

⇒ x · ln a = ln b

⇔ x =ln b

ln a

Diese Regel ist manchen noch aus der Oberstufe gelaufig. Die Nutzlichkeit und seine Praktika-

bilitat gewinnt der Logarithmus durch diese Beziehung:

ln(bmcn) = m ln b + n ln c

ln(bm

cn) = m ln b− n ln c

Diese Beziehung bedeutet nichts anderes als den Ausdruck einer Multiplikation durch eine

Addition. Fur diejenigen, die sich an Rechengesetzte wie die”Produktregel“ in der Differenti-

alrechnung erinnern, wissen, wie wertvoll es sein kann, einen multiplikativen Zusammenhang

additiv ausdrucken zu konnen.

Der naturliche Logarithmus ist sehr eng mit der Eulerzahl e verbunden. Es gilt namlich:

ex = b ⇒ x = ln b

Es gilt vor allem ln e = 1.

9

3 Gleichungen

Durch Gleichungen lassen sich quantitative, also zahlbare, Beziehungen zwischen verschiedenen

Variablen beschreiben. Das Beschreiben solcher Zusammenhange spielt in den Wirtschaftswis-

senschaften eine große Rolle. Dazu betrachten wir ein einfaches Beispiel: Verkauft eine Eisdiele

an einem Tag y Kugeln Eis zu einem Preis von p, dann ist es nur logisch, dass sich der Umsatz

durch Multiplikation der beiden Großen berechnen lasst. Verkauft die Eisdiele also konkret 200

Kugel Eis fur je 0,5 Euro, so betragt der Umsatz 100 Euro. Der Umsatz ist also sowohl von Preis

und Verkaufsmenge abhangig. Eine Gleichung ist dabei nichts weiter als die”Ubersetzung“ ei-

nes solchen, beschriebenen Sachverhaltes in eine formale Notation. Im Beispiel unserer Eisdiele

konnen wir den Umsatz U folgendermaßen beschreiben:

U = p · y

Fur die zuvor gewahlten Zahlen betragt der Umsatz also U = 200 · 0,5 = 100 wie wir es bereits

verbal beschrieben haben. In den Wirtschaftswissenschaften werden naturlich haufig weitaus

komplexere Probleme analysiert. Allgemein erfreut sich die Beschreibung dieser Probleme mit

Hilfe mathematischer Schreibweisen großer Beliebtheit. Dies liegt an unter anderem an zwei

wesentlichen Vorteilen dieser Methodik, die sich aber auch in unserem einfachen Beispiel bereits

offenbaren:

• Formale Schreibweisen sind sehr kompakt: Die formale Notation lasst sich fur einen

geubten Leser deutlich schneller lesen als die Schilderung eines Sachverhalts durch einen

langen Aufsatz. Dazu erlaubt die Mathematik im Gegensatz zu einer verbalen Erlauterung

keine mehrdeutige Interpretation durch einen dritten Leser.

• Gleichungen haben trotzdem immer eine nichtmathematische Intention. In der Okonomie

mussen Gleichungen wie der Zusammenhang zwischen Umsatz, Preis und Verkaufsmenge

okonomisch und nur sehr selten mathematisch begrundet werden. Alle Zusammenhange,

die sich aus Kombination der zu Beginn als gegeben angenommenen Gleichungen durch

Anwendung der mathematischen Gesetze ableiten lassen sind ebenfalls richtig und haben

eine okonomische Bedeutung.

Bei der obigen Gleichung handelt es sich bereits um eine Funktion und damit um einen speziellen

Typen einer Gleichungen. Allgemein lassen sich Gleichungen in drei verschiedene Grundtypen

unterteilen, die im Folgenden kurz aufgefuhrt sind.

10

1. Identitaten: Bei Identitaten last sich durch Umformen einer Seite der Gleichung immer

der Inhalt der anderen Seite replizieren. Somit waren Gleichungen wie z.B. a = a eine

triviale Identitat. Andere Beispiele fur Identitaten sind:

• an · am = an+m

• ln(x · y) = ln x + ln y

• 3 + 4 = 7

2. Bestimmungen: Bei Bestimmungen lassen sich unbekannte Werte der Gleichung durch

Auflosen nach diesen Werten errechnen. Haufig ist dazu eine Umformung von Noten.

Beispiele sind:

• x + 1 = 7

• 4x = 5

• ln x = 1 + x

3. Funktionen: Mit Funktionen werden Werte einer abhangigen Variablen durch Werte von

anderen, unabhangigen Variablen beschrieben. So war es zum Beispiel mit dem Umsatz

der Fall. Der Umsatz, die abhangige Variable, ist durch die Werte von Preis und Verkaufs-

menge festgelegt, die wir hier als unabhangig angenommen haben. Somit ist Der Umsatz

eine Funktion von Preis und Verkaufsmenge. Wie das Beispiel schon naheliegt sind Funk-

tionen fur die Wirtschaftswissenschaften sehr wichtig. Wir werden Funktionen im folgen-

den Verlauf dieses Skriptes deshalb noch naher betrachten. Andere (nicht-okonomische)

Beispiele fur Funktionen sind:

• y = x2 + 2

• y = sin x

• y = ex2

+ x

3.1 Funktionen

Eine Funktion beschreibt immer eine Input-Output-Beziehung. So ist unser Umsatz U wie

bereits erwahnt, eine Funktion der Variablen Preis (p) und Verkaufsmenge (y). Die beiden

zuletztgenannten Variablen sind hierbei der (exogene, also von außen vorgegebene) Input.

Der Umsatz, das Ergebnis der Funktion, ist der (endogene, also durch Anwendung unseres

11

Modells beschriebene) Output, der sich aus diesem Input errechnen lasst. Man beschreibt eine

solche allgemeine Input-Output-Beziehung in der Mathematik auch mit

U = f(p, y)

wobei der Autor damit lediglich zum Ausdruck bringen will, dass U eine (bisher noch nicht

spezifizierte) Funktion (hier f) der Werte p und y ist. Eine solche allgemeine Funktion lasst

sich nun genauer definieren. Der Umsatz ist, wie uns bereits bekannt, einfach das Produkt der

beiden Variablen. Also setzen wir:

f(p, y) := p · y

Mit dem Doppelpunkt vor dem Gleichheitszeichen signalisieren wir dem Leser unserer Formel,

dass wir die obige, spezielle Funktionsform an dieser Stelle zum ersten Mal (selbst) definieren.

Wir mochten ihn dadurch darauf aufmerksam machen, dass dieser Zusammenhang zuvor noch

nicht bekannt war und insbesondere nicht nach den allgemeinen, mathematischen Gesetzen gilt.

In den Wirtschaftswissenschaften ist es dabei wichtig, sich den Unterschied zwischen einer

Funktion und einfachen (exogenen) Variablen immer vor Augen zu halten. In vielen Aufsatzen

und Skripten sind diese beiden Variablentypen namlich nicht immer in ihrer Notation zu unter-

scheiden. Wollte man zum Beispiel den Gewinn unserer Eisdiele errechnen, so ware der Gewinn

(π) widerum eine Funktion von Umsatz abzuglich der Kosten. Definieren wir die Kosten mit

K = g(x) := x2 so liese sich der Gewinn mit

π = h(U,K) := U −K

beschreiben. Hier ist der Gewinn aber nicht von zwei Variablen sondern von zwei Funktionen

abhangig, die selbst widerum durch (exogene) Variablen erklart werden. Sauberer konnte man

auch schreiben: π = h(U,K) := U(p, x) − K(x). Allerdings verzichten viele Autoren auf ei-

ne solche explizite Darstellung. Dass Funktionen hier mit Großbuchstaben markiert sind und

Variablen durch Kleinbuchstaben soll hier lediglich der einfacheren Lesbarkeit im weiteren Ver-

lauf des Skriptes dienen und wird in der Literatur in dieser Prazision selten befolgt. Außerdem

ist darauf zu achten, dass Funktionen nicht immer so deutlich wie oben dargestelt definiert

werden, sondern dass sich diese Eigenschaft manchmal lediglich aus dem Kontext verstehen

lasst. Wurden wir beispielsweise, wie zu Beginn dieses Kapitels, einfach behaupten, dass der

Umsatz durch ein Produkt aus Preis und Verkaufsmenge ist, hatten wir sinngemaß ebenfalls

eine Funktion definiert.

Formal korrekter werden Funktionen haufig auch als explizite Abbildung eines Werteraums auf

einen anderen Werteraum aufgeschrieben. Inhaltlich macht dies keinen Unterschied, allerdings

sind viele Studenten mit dem Lesen solcher Formalisierungen nicht vertraut. Aus diesem Grund

12

wollen wir an dieser Stelle bereits kurz auf die Mengenlehre, die in den spateren Kapiteln noch

im Detail beschrieben ist, vorgreifen. Hier soll zunachst nur kurz dargestellt werden, wie die

Beschreibung einer Abbildung allgemein zu interpretieren ist. Unsere als Beispiel genutzte,

allgemeine Funktion fur den Umsatz (U = f(p, x)) liese sich als Abbildung folgendermaßen

notieren:

f :R+0 × N+

0 → R+0

Diese Darstellung sieht auf den ersten Blick sehr kompliziert aus, ist aber eigentlich sehr trivial.

Diese Formel liest sich wie folgt: Die Funktion f kombiniert (×) jede beliebige, positive reele

Zahl (R+0 ) mit einer beliebigen positiven naturlichen Zahl (N+

0 ). Als Ergebnis (→) ergibt sich

daraus widerum eine beliebige, positive reele Zahl (R+0 ). An unserem Beispiel also konnte ein

Leser aus dieser Notation sinngemaß erkennen, dass sich aus der Funktion f der Preis mit der

Absatzmenge zu dem Umsatz als Ergebnis kombinieren lasst. Dass aber eine Multiplikation vor-

genommen wird oder welche andere spezielle Form die Funktion annimmt, lasst sich aus dieser

Schreibweise nicht erkennen. Allerdings sind die Wertbereiche der Variablen aus der Definition

einer Abbildung zu erkennen. Wir wissen also, dass fur die Verkaufsmenge nur Ganzzahlen

erlaubt sind. Dass Preis und Umsatz hingegen auch Kommastellen zulassen.

3.2 Aquivalenzumformungen

Existierende Gleichungen, nicht nur Funktionen, lassen sich grundsatzlich beliebig um neue

Elemente erweitern oder um bestehende Elemente kurzern. Dadurch wollen wir den Zusam-

menhang der Zahlen und Variablen kompakter darstellen oder Ergebnisse hervorheben. Die

eigentliche Aussage oder Gultigkeit einer Gleichung wird dabei nicht verandert. Dieses, vie-

len sicherlich noch aus der Schulmathematik bekannte, Konzept wird mit Hilfe sogenannter

Aquivalenzumformungen umgesetzt.

Als Beispiel betrachten wir den beliebig gewahlten Term: x − a = b. Um hieraus z.B. x zu

bestimmen greifen wir auf die Aquivalenzumformung zuruck: Wir wollen ein Ergebnis im Sinne

von: x = . . . erhalten.

x− a = b | + a

⇔ (x− a) + a = b + a

⇔ x = b + a

13

Mit Hilfe des Pfeilsymbols ⇔ verdeutlichen wir dabei, dass es sich um eine Aquivalenzumformung

handelt; wir also lediglich die Darstellung der Gleichung verandert haben und sich die vorherige

und aktuelle Zeile im eigentlichen Inhalt nicht unterscheiden. Wollen wir dem Leser außerdem

deutlich machen, welches Element wir in der nachsten Zeile auf beiden Seiten hinzufugen oder

entfernen, so schreiben wir die Rechenoperation hinter einen Lamngsstrich (|) an die rechte

Seite der Gleichung. Letzteres ist in der Literatur oder auch in Skripten allerdings unublich.

Analog funktionieren solche Aquivalenzumformungen fur die Subtraktion, was am folgenden

Beispiel verdeutlicht sein soll:

x + a = b | − a

⇔ (x + a) − a = b− a

⇔ x = b− a

Das Gleiche funktioniert naturlich auch bei multiplikativen Verknupfungen:

x

a= b | · a

⇔ x

a· a = b · a

⇔ x = b · a

Oder auch fur die Division:

a · x = b | : a

⇔ a · xa

=b

a

⇔ x =b

a

3.3 Verschiedene Gleichungstypen

Leider sind Gleichungen nur selten so einfach losbar wie wir es im vorherigen Abschnitt beschrie-

ben und gezeigt haben. Das Losen von komplexeren Gleichungen erfordert die im folgenden

beschriebenen Theorie, aber auch viel Ubung und ein Auge fur den nachsten Losungsschritt.

Macht euch aber keine Sorgen: Das Losen von Gleichungen ist keine rocket science sondern

14

erfordert lediglich Routine und kann von Jedem erlernt werden. Lasst euch deshalb bitte nicht

frustrieren, wenn ihr nicht von Anfang an selbststandig auf alle Losungen der in den Vorlesung

gerechneten Aufgaben kommt. Wie fast immer macht Ubung auch hier den Meister.

3.3.1 Lineare Gleichungen

Lineare Gleichungen sind die einfachste Form von Gleichungen. In solchen Gleichungen steht

die unbekannte Variable, nach der wir auflosen wollen und die wir hier immer mit x bezeichnen

wollen, mit der Hochzahl Eins. (x1 = x) Jede lineare Gleichung lasst sich deshalb in der Form

a ·x+ b = 0 beschreiben, wobei a und b beliebige reele Zahlen sind und a = 0. Die Losung einer

linearen Gleichung ist deshalb trivial immer: x = − ba. Wir verdeutlichen dies an folgendem

Beispiel:

5(x + 2) = −3(x− 6)

⇔ 5x + 10 = −3x + 18 | + 3x

⇔ 8x + 10 = 18 | − 10

⇔ 8x = 8 | : 8

⇔ x = 1

Wer sich, insbesondere bei komplexeren Gleichungen, unsicher ist, ob das Ergebnis stimmt,

kann abschließend eine Probe durchfuhren. Nur wenn das Einsetzen des Ergebnisses in jede

Seite der ursprunglichen Gleichung indentisch ist, stimmt das errechnete Ergebnis.

3.3.2 Quadratische Gleichungen

Quadratische Gleichungen sind algebraische Gleichungen, in denen hochstens die zweite Potenz

vorkommt. Die unbekannte Variable, auch hier wieder mit x bezeichnet, darf also Hochstens mit

der Hochzahl Zwei notiert sein. (x2) Gleichzeitig darf x aber auch mit der Hochzahl Eins in der

Gleichung vorkommen. Jede quadratische Gleichung lasst sich deshalb in der Form ax2+bx+c =

0 mit a = 0 aufschreiben.

15

Solche quadratische Gleichungen konnen einfach mit der sogenannten Mitternachtsformel oder

der p-q-Formel gelost werden. Beide Arten der Losung sind zur Losung quadratischer Gleichun-

gen geeignet. Die Mitternachtsformel lautet:

x1,2 =−b±

√b2 − 4ac

2a

Dazu betrachten wir beispielhaft eine beliebig gewahlte Gleichung:

3x2 − 18x + 13 = 4 + 2x

Diese Gleichung mussen wir zunachst auf eine der Seiten auflosen. Wir bringen deshalb durch

Subtraktion beziehungsweise Addition alle Terme auf die linke Seite. Es folgt:

3x2 − 18x + 23,25 = 4 + 2x | − 4 − 2x

⇔ 3x2 − 20x + 19,25 = 0

Zur Losung dieser quadratische Gleichung nach x lasst sich nun die Mitternachtsformel anwen-

den. Dazu lassen sich durch simples Ablesen die Werte fur a, b und c bestimmen. Diese sind

nach der obigen Gleichung a = 3, b = −20 und c = 19,25. Diese Werte setzen wir nun in die

Mitternachtsformel ein:

x1,2 =−(−20) ±

√(−20)2 − 4 · 3 · 19,25

2 · 3

⇔ =20 ±

√400 − 231

6

⇔ =10

3± 13

6

Diese Losung besagt, dass die quadratische Gleichung zwei Nullstellen besitzt. Fur die erste

Losung werden beide Ausdrucke addiert. Fur die zweite Losung wird der zweite Ausdruck vom

ersten Ausdruck subtrahiert. Damit hat die Gleichung Nullstellen an den Punkten:

x1 =10

3+

13

6≈ 5,5

x2 =10

3− 13

6≈ 1,167

Betrachten wir nun die selbe Gleichung mit der p-q Formel. Die p-q Formel lautet

x1,2 = −p

2±√

(p

2)2 − q

Um zu wissen, welche der beiden Formeln man anwenden soll, muss man zwischen allgemeiner

Form und Normalform unterscheiden. Eine quadratische Gleichung in allgemeiner Form wurde

16

oben bei der Mitternachtsformel behandelt (ax2 + bx + c = 0). Die Normalform erhalt man,

indem man die quadratische Gleichung in allgemeiner Form durch a dividiert. Also:

x2 +b

ax +

c

a= 0

. Fur die p-q Formel werden ba

= p und ca

= q gesetzt. Die Normalform ist also

x2 + px + q = 0.

Betrachtet man unsere quadratische Gleichung aus dem Beispiel, 3x2 − 20x + 19,25 = 0, so

muss hier zuerst die Gleichung durch das a geteilt werden. In diesem Fall ist a = 3, also ergibt

sich

x2 − 20

3+

19,25

3= 0.

Nun ist die quadratische Gleichung in Normalform und die p-q Formel kann verwendet werden.

Hier setzt man wieder sturr ein:

x1,2 = −−20

3

2±

√(−20

3

2)2 − 19,25

3

Selbstverstandlich sind die Ergebnisse fur x1 und x2 die selben wie bei Anwendung der Mit-

ternachtsformel. Welche Formel man verwendet, ist eine Frage der Gewohnung und des Ge-

schmacks.

Je nach Art der Gleichung konnen quadratische Terme auch keine Nullstellen besitzen. Das

ist immer dann der Fall wenn der Ausdruck unter der Wurzel der Mitternachtsformel negativ

ist und ein Ergebnis damit nicht definiert ist. Sofern der Term unter der Wurzel Null zum

Ergebnis hat, besitzt eine Gleichung nur eine Nullstelle. Mehr als zwei Nullstellen sind fur

einen quadratischen Ausdruck nicht moglich.

3.3.3 Kubische Gleichungen

Als kubische Gleichung bezeichnet man eine Gleichung, in der die unbekannte Varbiable x in

keiner hoheren Potenz als der dritten vorkommt. (x3) Sie haben also die folgende Form:

ax3 + bx2 + cx + d = 0, a = 0

Solche Gleichungen werden in der Praxis zumeist mit Hilfe von Computerprogrammen gelost. In

den Veranstaltungen unseres Studiums hingegen werden kubische Gleichungen zumeist vermie-

den. Der Grund hierfur ist, dass es kein einfaches Losungsverfahren fur Gleichungen dieser Art

gibt und die Mathematik viel Zeit verbrauchen wurde. Die einzigen manuellen Moglichkeiten

zur Losung sind die folgenden:

17

• Fur den Fall d = 0 wird schlichtweg ein x ausgeklammert. Somit reduziert sich die vormals

kubische Gleichung zu x · (ax2 + bx + c) = 0. Die erste triviale Losung der Gleichung ist

x = 0. Aus der Klammer erhalten wir weiterhin eine quadratische Gleichung, die nach dem

eben besprochenen Verfahren gelost werden kann. Alle Nullstellen dieser quadratischen

Gleichung sind auch Nullstellen der ursprunglichen, kubischen Gleichung.

• Ist d = 0 muss zur Bestimmung aller Nullstellen hingegen eine Losung bekannt sein.

Anschließend wird eine sogenannte Polynomdivision durchgefuhrt, die hier aber auf Grund

der geringen Relevanz nicht besprochen werden soll.

3.3.4 Bruchgleichungen

Wenn in einer Gleichung eine Variable im Nenner eines Ausdruckes auftritt, dann spricht man

von sogenannten Bruchgleichungen. Um solche Gleichungen zu losen mussen die Variablen

im Nenner einfach beseitigt werden. Deshalb wird die Gleichung auf beiden Seiten mit dem

sogenannten Hauptnenner multipliziert. Der Hauptnenner ist dabei derjenige Term, welcher

alle Ausdrucke der Gleichung enthalt fur die gilt, dass sie im Nenner stehen und die gesuchte

Variable beinhalten. Zur Veranschaulichung betrachten wir eine Beispielgleichung:

x + 1

x− 1=

2x− 1

x

Der Hauptnenner dieser Gleichung setzt sich, wie erklart, aus den Ausdrucken im Nenner beider

Seiten zusammen. Dieser Ausdruck ist:

x · (x− 1)

Multipliziert man nun den Hauptnenner mit beiden Seiten erhalt man die folgende Gleichung:

x · (x + 1) = (2x− 1) · (x− 1)

Losen wir die Klammer auf und bringen alle Ausdrucke auf eine Seite erhalten wir das folgende

Ergebnis:

x · (x + 1) = (2x− 1) · (x− 1)

⇔ x2 − 4x + 1 = 0

Das Losungsverfahren fur solche quadratische Losungen ist uns bereits bekannt. Unter Verwen-

dung der Mitternachtsformel konnen wir losen:

x1,2 = 2 ±√

4 − 1

x1 = 2 +√

3 ≈ 3,73

x2 = 2 −√

3 ≈ 0,27

18

Allerdings ist eine letzte Einschrankung fur diese Losung zu beachten. Es ist moglich, dass die

berechneten Ergebnisse in der Ursprungsgleichung eine Definitionslucke treffen. Das ware dann

der Fall wenn durch Verwenden der Losung in einem Bruch eine Division durch Null verursacht

wurde, welche bekanntlich nicht definiert ist. Dann ware das berechnete Ergebnis in Folge keine

gultige Losung. Das ist in unserer Beispielgleichung allerdings nicht der Fall.

3.3.5 Wurzelgleichungen

Eine Gleichung, bei der eine Variable unter einer Wurzel (oder mit einer anderen Hochzahl 0 <

p < 1 versehen) steht, ist eine sogenannte Wurzelgleichung. Zur Erlauterung des zugehorigen

Losungsverfahrens betrachten wir ein Beispiel:

5 +√x + 1 = 8

Um eine solche Gleichung zu losen, isolieren wir den Ausdruck mit der Variable unter der

Wurzel auf eine Seite:√x + 1 = 3

Anschließend quadrieren wir den Wurzelausdruck, um die Wurzel zu entfernen:

x + 1 = 32

⇔ x = 8

Allerdings ist auch hier wieder darauf zu achten, dass die errechneten Ergebnisse keine Losung

fur die Ursprungsgleichung sein mussen. Sofern das Ergebnis einen negativen Ausdruck unter

der Wurzel verursacht, ware die Nullstelle widerum nicht definiert.

Anmerkung: Wenn man eine Gleichung betrachtet, bei der die Seiten quadriert werden, muss

man eine wichtige Sache beachten, die, wie die Erfahrung gezeigt hat, oft falsch gemacht wird.

Betrachtet man zum Beispiel die Wurzelgleichung√x2 + 5 = x + 12.

Nun quadriert man die Gleichung und erhalt

(x2 + 5)12·2 = (x + 12)1·2

Leider wird die rechte Seite oftmals falsch umgeschrieben. Der Ausdruck ist namlich nicht

x2 + 122! (x + 12)2 ist per Definition (x + 12) · (x + 12). Eine solche Form muss eigentlich

ausmultipliziert werden. Um das nicht standig tun zu mussen (große Fehlerquelle!) hat wahr-

scheinlich jeder in der Schule die sogenannten binomischen Formeln auswendig lernen mussen,

die wir im nachsten Abschnitt zeigen.

19

3.3.6 Binomische Formeln

Binomische Formeln sind nutzliche Werkzeuge zum Losen und Vereinfachen von Termen in der

Form (a ± b)n. In den Wirtschaftswissenschaften sind diese Formeln fast ausschließlich in der

quadratischen Ausfuhrung zu finden. Die binomischen Formeln lauten hier:

1. (a + b)2 = a2 + 2ab + b2

2. (a− b)2 = a2 − 2ab + b2

3. (a− b)(a + b) = a2 − b2

Durch binomische Formeln lassen sich unter anderem auch hochdimensionale Gleichungen losen,

die andernfalls ein komplexeres Losungsverfahren erfordern wurden. Betrachten wir dazu als

Beispiel die folgende Gleichung.

4x4 − 8x2 − 5 = 0

Durch Anwendung der oben als zweites notierten binomischen Formel mit a = 2x2 und b = 2

konnen wir die folgende Umformung durchfuhren:

4x4 − 8x2 − 5 = 0

⇔ 4x4 − 8x2 + 4 − 9 = 0

⇔ (2x2 − 2)2 = 9

⇔ 2x2 − 2 =√

9

⇔ x2 = 52

⇔ x =√

2,5

Naturlich gibt es auch fur die n-te Potenz eine allgemeine Form der binomischen Formeln. Die

allgemeine Form wirkt allerdings sehr abschreckend, weswegen wir sie hier nicht zeigen.

3.3.7 Exponentialgleichungen

Gleichungen, in denen eine Variable im Exponenten steht, nennt man Exponentialgleichung.

Exponentialgleichungen lassen sich in aller Regel nie exakt losen, außer wenn die Variablen

ausschließlich in Exponenten vorkommen. In diesem Fall fuhrt am einfachsten eine Umformung

20

durch einen Logarithmus zum Erfolg. Dazu versucht man zunachst die Ausdrucke mit dem

Exponenten zu isolieren. Als Beispiel betrachten wir die folgende Gleichung:

5x + 1 = 3

⇔ x ln 5 = ln (3 − 1) | ÷ ln 5

⇔ x = ln 2ln 5

Eine Gleichung in denen die Variablen nicht ausschließlich in den Exponenten vorkommen,

lasst sich hingegen nicht nach dem vorgestellten Verfahren losen. Sucht man beispielsweise eine

Losung fur eine Gleichung wie

2x = x + 1

so lasst sich eine solche nur durch Naherungsverfahren wie z.B. das Newtonverfahren losen. Da

solche Verfahren in den Wirtschaftswissenschaften aber nur eine geringe Rolle spielen wollen

wir an dieser Stelle allerdings nicht naher auf diese Methoden eingehen.

3.3.8 Logarithmusgleichungen

Befindet sich eine Variable im Argument eines Logarithmus, dann betrachten wir eine Logarith-

musgleichung. Sind diese Ausdrucke nicht durch schlichte Umformungen auflosbar, so mussen

die Gleichungen durch geeignete Substitutionen, wie im folgenden besprochen, in eine losbare

Form gebracht werden. Treten Variablen hingegen nicht ausschließlich in den Logarithmen auf,

so ist die Gleichung wie zuvor nur durch Naherungsverfahren losbar, die hier nicht besprochen

werden. Wir betrachten zur Verdeutlichung des Losungsverfahrens ein Beispiel:

ln x2 = 2 ln (3x + 1)

⇔ lnx2 = ln (3x + 1)2

Da ein Logarithmus sogenannte injektive Eigenschaften1 mussen beide Ausdrucke fur den Loga-

rithmus ebenfalls gleich sein, damit die oben beschriebene Gleichheit erfullt sein kann. Daraus

folgt:

x2 = (3x + 1)2

⇔ x = −12

1Eine Funktion ist injektiv, wenn man von der Gleichheit der Funktionswerte darauf schließen kann hat,

dass die eingesetzten Werte die gleichen waren. Interessierte konnen sich den Begriff der Surjektivitat auch mal

naher anschauen

21

3.4 Beispiel: Das IS-LM-Modell

Der Großteil der Veranstaltung Makrookonomie I setzt ein gutes Grundverstandnis im Umgang

mit Gleichungen voraus. Deswegen wollen wir beispielhaft eine zentrale Gleichung aus einem

Modell der Veranstaltung diskutieren. Diese lautet:

Y = C + I + G

Diese Gleichung ist eine Identitat und besagt das Folgende: Das Einkommen einer Okonomie

(Y ) soll sich aus dem Konsum (C), den Investitionen (I) und den Staatsausgaben (G) zusam-

mensetzen. Diese Komponenten sind im Modell selbst widerum als Identitaten definiert. Der

Konsum sei C = c0+c1(Y −T ), die Investitionen seien I = b0+b1Y −b2i und die Staatsausgaben

seien G = g1Y = T , wobei T die Steuern reprasentieren. Es soll im Folgenden aber nicht die

Intuition der Gleichungen diskutiert werden, dafur wollen wir uns auf die algebraischen Eigen-

schaften der Gleichungen konzentrieren. Ziel der Ubung ist es, einen Wert fur Y zu bestimmen,

der nur von den exogenen Variablen erklart wird. Durch simples Einsetzen dieser Identitaten

konnen wir Y zunachst zu

Y = c0 + c1(Y − g1Y ) + b0 + b1Y − b2i + g1Y

auflosen. Bis auf den im IS-LM-Modell endogenen Zins i und das zu bestimmende Einkommen

Y sind all diese Variablen nach Aussage des Modells exogen bestimmt. Der Zins (i) wird dabei

auf dem Geldmarkt festgesetzt. Die Geldnachfrage sei durch

M

P= d1Y − d2i

gegeben. Diese Gleichung besagt inhaltlich: M ist die exogene Geldmenge, P das exogene Preis-

niveau. Die Variable d1 bezeichnet dabei die sogenannte Einkommensreagibilitat der Geldnach-

frage, d2 die Zinsreagibilitat. Auch diese Variablen sind exogen. Da wir bereits eine Gleichung

kennen, in welcher nur i und Y unbekannt sind konnen wir durch Einsetzen einer Gleichung in

die andere ein definitives Ergebnis fur diese Variablen bestimmen. Dafur wollen wir zunachst

die zweite Gleichung, die des Geldmarktes, nach i auflosen:

M

P= d1Y − d2i

⇔ d2i = d1Y − MP

| · 1

d2⇔ d2

d2i = 1

d2d1Y − 1

d2MP

⇔ i = d1d2Y − M

d2P

Somit haben wir einen Ausdruck fur i erhalten den wir im weitren Rechenvorgang verwenden

konnen. Es folgt durch Einsetzen in die zuerst besprochene Gleichung:

Y = c0 + c1(Y − g1Y ) + b0 + b1Y − b2(d1d2

Y − M

d2P) + g1Y

22

Dieser Term entspricht nun allerdings noch nicht dem gesuchten Ergebnis. Die unbekannte und

von uns zu bestimmende Variable Y steht namlich noch auf beiden Seiten der Gleichung. Diesen

Fehler wollen wir deshalb schrittweise beseitigen.

Zunachst multiplizieren wir die Klammern aus:

Y = c0 + c1Y − c1g1Y + b0 + b1Y − b2d1d2

Y + b2M

d2P+ g1Y

Nun bringen wir durch Addition beziehungsweise Subtraktion alle Y auf die linke Seite der

Gleichung:

Y − c1Y + c1g1Y − b1Y + b2d1d2

Y − g1Y = c0 + b0 + b2M

d2P

Nun konnen wir Y ausklammern:

Y (1 − c1 + c1g1 − b1 + b2d1d2

− g1) = c0 + b0 + b2M

d2P

Zum Schluss mussen wir nur noch Y isolieren also alle ubrigen Variablen auf die rechte Seite

bringen:

Y =1

1 − c1 + c1g1 − b1 + b2d1d2

− g1(c0 + b0 + b2

M

d2P)

Damit haben wir das sogenannte gesamtwirtschaftliche Gleichgewicht im IS-LM-Modell her-

geleitet: Wir haben also einen Wert fur Y bestimmt, der durch ausschließlich exogene Varia-

blen beschrieben wird. Dessen okonomische Bedeutung wird noch in der zugehorigen VWL-

Veranstaltung besprochen. An dieser Stelle sollte die rein algebraische Herleitung durch Ein-

setzen und Aufosen veranschaulicht werden.

23

4 Differentialrechnung

Mit der Differentialrechnung, vielen aus Schulzeiten sicher noch mit Bezeichnung das Ableiten

bekannt, lasst sich bestimmen wie sensibel das Ergebnis einer Funktion auf eine Veranderung

seiner Input-Werte reagiert. Anders gesagt lasst sich mit der Differentialrechnung also bestim-

men in welche Richtung und mit welcher Starke eine Variable y = f(x) sich andert wenn wir

den Eingabewert x variieren. Dabei ist y = f(x) eine zunachst noch unspezifizierte Funktion

mit einer einzigen unabhangigen Variable x, die den Wert von y bestimmt. Die Ableitung einer

solchen Funktion, haufig notiert mit f ′(x), zeigt dabei genauer gesagt an, in welchem relativen

Verhaltnis sich y bei einer Anderung des x-Wertes verandert. Es sind hierfur aber auch folgende

alternative Schreibweisen ublich:

f ′(x) =dy

dx= fx(x)

Alle diese Schreibweisen sind in den Wirtschaftswissenschaften gebrauchlich und bringen den

oben beschriebenen Zusammenhang gleichwertig zum Ausdruck. Zum naheren Verstandnis kon-

kretisieren wir nun unsere Funktion f(x), um zuerst die Intuition der Differentialrechnung zu

verstehen. Erst anschließend werden dann die zugehorigen Rechenregeln erlautert.

Wir betrachten deshalb die beliebig gewahlte Funktion y = f(x) mit f(x) := 4·x. Wie verandert

sich hier der Wert von y wenn wir den Wert von x um eine Werteinheit erhohen? Beim Betrach-

ten der Funktion zeigt sich schnell: Naturlich verandert sich y um genau 4 Werteinheiten wenn

x um 1 wachst. Erhoht man beispielsweise x von x = 1 auf x = 2 so wachst der Funktionswert

y von y = 4 · 1 = 4 auf y = 4 · 2 = 8 um eben jene 4 Werteinheiten. Damit wachst der Wert

von y also viermal so schnell wie der Wert von x. Diesen soeben verbal erklarten Zusammen-

hang wurde auch die Differentialrechnung anzeigen. Deshalb gilt aus unserer Intuition fur die

Ableitung:

f ′(x) = (+) 4

Naturlich ist dieser Anstieg nur bei einer solch trivialen Funktion mit dem bloßen Auge er-

kennbar. Außerdem sind die Wertanderungen fur eine nicht-lineare Funktion wie zum Beispiel

g(x) = x2 auch nicht mehr fur alle Werte von x konstant wie es in unserem einfachen Bei-

spiel der Fall war. Aus diesem Grund nutzen wir die Rechengesetze der Differentialrechnung,

um zuverlassig allgemeine Ableitungen fur komplexere Funktionen zu berechnen. Diese in den

Wirtschaftswissenschaften sehr haufig gebrauchten Rechengesetze wollen wir im folgenden Ka-

pitel wiederholen.

24

4.1 Rechenregeln der Differentialrechnung

Die Regeln zur Ableitung mochten wir hier kurz mit jeweils einem Beispiel vorstellen.

• Konstante Funktion

Wir betrachten eine Funktion f(x) = a wobei a hier einen fixierten Wert reprasentiert;

einen exogenen Wert also, der sich innerhalb der Funktion niemals andert. Der Wert x

kommt in der Funktion f(x) folglich uberhaupt nicht vor. Konsequenterweise ist auch die

Ableitung f ′(x) = 0. Dadurch wird nur naheliegendes zum Ausdruck gebracht: Wenn sich

x andert, verbleibt y bei seinem Ausgangswert. Die Variable y verandert sich also um das

nullfache von x. Beide Variablen stehen also in keinem Zusammenhang und die Ableitung

ist Null.

• Potenzfunktion

Diese Regel zahlt wohl zu einer der bekanntesten Regeln der Differentialrechnung. Diese

Regel besagt, dass eine Funktion differenziert wird, indem man bei jedem Argument

zunachst den Exponenten als Produkt vor die Zahl zieht und dann den verbleibenden

Exponenten um den Wert 1 vermindert. Eine Funktion f(x) = xa wird also mit f ′(x) =

a · xa−1 differenziert. Diese Regel lasst sich am vorherigem Beispiel einfach verdeutlichen.

Ist g(x) = x2, dann ist die Ableitung f ′(x) = 2 · x2−1 = 2 · x. Andert man den Wert

von x also um eine sehr kleine Einheit, so andert sich der Wert von y um das 2x-fache.

Damit wird bei dieser Ableitung dem Umstand Rechnung getragen, dass der Wert von

y bei großer werdenden x immer starker ansteigt. Andert man den Wert von x = 1 um

eine kleine Einheit so steigt der Wert von y also 2 · 1 = 2 mal schneller als der von x.

Ein Erhohung ausgehend von einem Wert x = 10 verursacht hingegen bereits ein relativ

2 · 10 = 20-faches Ansteigen von y.

• Summenregel

Sind die Variablen einer Funktion additiv verknupft, so lassen sich die Argumente jeweils

fur sich differenzieren. Eine Funktion der Form f(x) = 3 ·x2−5 ·x+9 ergibt als Ableitung

bei Anwendung der eben erlauterten Regeln damit beispielsweise f ′(x) = 6 · x − 5. Die

Vorzeichen der Verknupfungen bleiben naturlich erhalten.

• Produktregel

Will man eine Funktion differenzieren, die selbst widerum ein Produkt aus Funktionen

reprasentiert, dann benotigen wir hierfur die Produktregel. Betrachten wir fur eine an-

schaulichere Darstellung dazu zwei beliebige Funktionen, die jeweils nur von einer exoge-

25

nen Variablen x abhangen.

u(x) = x2 − 7x

v(x) = x3 − 2x2

Es ist uns nun ohne weiteres moglich eine weitere Funktion zu definieren, deren Ergebnis

sich aus dem Produkt von u(x) und v(x) bestimmen lasst. Wir definieren hierzu:

f(x) = u(x) · v(x) = (x2 − 7x) · (x3 − 2x2)

Die Produktregel besagt dann, dass sich das Ergebnis der Ableitung dieses Produkts

allgemein wie folgt berechnen lasst:

f ′(x) = u′(x) · v(x) + u(x) · v′(x)

Wir Berechnen aus Grunden der Ubersichtlichkeit zunachst:

u′(x) = 2x− 7

v′(x) = 3x2 − 4x

Mit diesen Zwischenergebnissen lasst sich nun die Ableitung der ursprunglichen Funktion

nach der Produktregel berechnen:

f ′(x) = u′(x) · v(x) + u(x) · v′(x)

⇔ f ′(x) = (2x− 7) · (x3 − 2x2) + (x2 − 7x) · (3x2 − 4x)

⇔ f ′(x) = 2x4 − 4x3 − 7x3 + 14x2 + 3x4 − 4x3 − 21x3 + 28x2

⇔ f ′(x) = 5x4 − 36x3 + 42x2

Naturlich liese sich diese Ableitung auch durch einfaches Ausmultiplizieren der Ursprungs-

funktion errechnen. Anschließend waren die Argumente dieser Funktion additiv verknupft

und liesen sich einzeln differenzieren. Allerdings ist die Produktregel haufig deutlich zeit-

sparend und gestattet außerdem allgemeiner notierte Differenzierungen.

• Quotientenregel

Die Quotientenregel wird bei sogenannten rationalen Funktionen angewendet. Eine ra-

tionale Funktion setzt sich, ahnlich wie im Beispiel zur Produktregel, selbst wieder aus

zwei Funktionen zusammen. Es gilt also: f(x) = u(x)v(x)

. Verwenden wir die spezifizier-

ten Teilfunktionen u(x) und v(x) aus dem vorherigen Beispiel, dann ware zum Beispiel

f(x) = x2−7xx3−2x2 zu differenzieren. Die darauf anzuwendende Quotientenregel lautet nun:

f ′(x) =u′(x) · v(x) − u(x) · v′(x)

(v(x))2

26

Hier ist starker noch als bei der Produktregel auf die Reihenfolge der Ableitungen im

Zahler und Nenner zu achten. Wir machen uns bei der anfolgenden Berechnung die bis-

herigen Zwischenergebnisse zu nutze.

f ′(x) =u′(x) · v(x) − u(x) · v′(x)

(v(x))2

⇔ f ′(x) =(2x− 7) · (x3 − 2x2) − (x2 − 7x) · (3x2 − 4x)

(x3 − 2x2)2

⇔ f ′(x) =2x4 − 4x3 − 7x3 + 14x2 − 3x4 + 4x3 + 21x3 − 28x2

x6 − 4x5 + 4x4

• Kettenregel

Die Kettenregel kommt immer dann zum Einsatz wenn zwei Funktionen ineinander ver-

schachtelt sind. Man unterscheidet dabei zwischen einer inneren Funktion und einer

außeren Funktion. Diese Unterscheidung ist am einfachsten an einem Beispiel erklart:

Wir betrachten deshalb eine innere Funktion v(x) = x2 + 1 und eine außere Funktion

u(x) = (v(x))3. Die Bezeichnungen bestehen deshalb, weil die außere Funktion u(x) die

innere Funktion v(x) vollstandig umschließt.

Die zugehorige Kettenregel zur Differenzierung solcher Funktionen f(x) = u(v(x)) ist

gemeinhin mit dem Merkspruch Außere mal innere Ableitung bekannt. Formal notiert

gilt also:

f ′(x) = u′(v(x)) · v′(x)

Auch zum Ableiten dieser Beispielfunktion f(x) = u(v(x)) = (x2 + 1)3 betrachten wir

zunachst die Teilergebnisse der jeweiligen Ableitungen von v(x) und u(x). Im Unterschied

zu den bisherigen Ableitungen wird die außere Funktion aber nach ihrer inneren Funktion

anstatt nach x differenziert. Wir suchen also:

u′(v(x)) =du(v(x))

dv(x)= 3(v(x))3−1 = 3(v(x))2

v′(x) =dv(x)

dx= 2x2−1 + 0 = 2x

Bei Berucksichtigung der Kettenregel und der bisherigen Zwischenergebnisse lasst sich

nun auch das Ergebnis von f ′(x) errechnen. Es gilt:

f ′(x) = u′(v(x)) · v′(x)

⇔ f ′(x) = 3(x2 + 1)2 · 2x

⇔ f ′(x) = 6x(x4 + 2x2 + 1)

⇔ f ′(x) = 6x5 + 12x3 + 6x

27

• Exponentialfunktion

Bei Exponentialfunktionen befindet sich die abzuleitende Variable naheliegenderweise im

Exponenten der Funktion. Wir betrachten also eine Funktion des Typen f(x) = eg(x)

wobei als Basis e = 2,718 . . . die sogenannte Euler’sche Zahl bezeichnet. Bei solchen Ex-

ponentialfunktionen wird zur Ableitung der differenzierte Exponent vor den Term gezo-

gen; der ursprungliche Term bleibt dabei allerdings unverandert. Die Ableitung ist damit

allgemein:

f ′(x) = g′(x) · eg(x)

Fur eine konkrete Funktion f(x) = e3x ware die Ableitung beispielsweise f ′(x) = 3 ·e3x. Diese Form der Ableitung reflektiert den Umstand, dass Funktionen solcher Art

exponentiell, also immer starker, ansteigen. Die Wachstumsrate ist dabei auf Grund der

Euler’schen Zahl konstant was diese Funktionsform in den Wirtschaftswissenschaften sehr

popular macht. Steht in der Basis allerdings eine andere als die Euler’sche Zahl ist diese

Rechenregel nicht mehr anwendbar. Da solche Varianten in den Wirtschaftswissenschaften

allerdings außerst selten vorkommen, soll die Weiterfuhrung dieser Rechenregel an dieser

Stelle aber nicht besprochen werden.

• Logarithmusfunktion

Bei Logarithmusfunktionen wird ahnlich wie bei der Kettenregel zwischen einer inneren

und einer außeren Funktion unterschieden. Der Logarithmus selbst ist dabei die außere

Funktion, sein Inhalt die innere Funktion. Fur eine Funktion des Typen f(x) = ln(g(x))

ist die Ableitungsregel wie folgt definiert:

f ′(x) =g′(x)

g(x)

Betrachten wir zur Veranschaulichung eine Beispielfunktion f(x) = ln(x3 + 4) so lautet

die Ableitung unter Verwendung dieser Regel:

f ′(x) =g′(x)

g(x)

⇔ f ′(x) =3x2

x3 + 4

Auch hier wurde wie bei der vorherigen Regel der sogenannte naturliche Logarithmus zur

Basis e betrachtet. (ln = loge) Fur Logarithmen zu einer anderen Basis muss diese Ablei-

tungsregel wieder verallgemeinert werden. Da derartige Ableitungen in den Wirtschafts-

wissenschaften allerdings ebenfalls außerst selten sind, wollen wir diese Verallgemeinerung

hier nicht betrachten.

28

Abschlussbemerkung: Das Beherrschen dieser Ableitungsregeln ist ein außerst zentrales Kon-

zept in den Wirtschaftswissenschaften weshalb es sich lohnt selbige gut zu trainieren. In vielen

Fallen sind dabei verschiedene Regel zu kombinieren was erst nach ausreichend Ubung flussig

gelingt.

4.2 Marginale und diskrete Wertanderungen

Haufig versuchen Studenten Ableitungen falschlicherweise dazu zu nutzen, um zu bestimmen

wie stark ein Funktionswert y = f(x) bei einer diskreten Wertanderung von x ansteigt. Mit

einer diskreten Wertanderung ist dabei eine reale, zahlbare Wertanderung gemeint. So ware

eine Wertamnderung von x = 1 auf x = 2 eine solche diskrete Wertanderung. Eine mar-

ginale Wertanderung meint hingegen eine Wertanderung von beispielsweise x = 1 auf einen

kleinstmoglich großeren Wert x = 1 + ϵ wobei ϵ ≈ 0 ist. Die Wertveranderung ϵ ist also beinahe

Null.

Wie wir soeben gelernt haben, gibt eine Ableitung immer das relative Wachstum von y = f(x)

im Verhaltnis zu x an. Dieses relative Wachstum kann sich von marginaler Einheit zu marginaler

Einheit allerdings drastisch verandern. Betrachten wir zum Verstandnis dieses Unterschieds eine

Beispielfunktion y = f(x) := x2 und f ′(x) = 2x. Erhohen wir den Wert von x = 1 auf x = 2 so

wachst y von f(x = 1) = 1 auf f(x = 2) = 4. Der Funktionswert wachst also um drei Einheiten

wahrend die Ableitung f ′(x = 1) = 2 lediglich eine Verdopplung, also ein Wachstum um zwei

Einheiten, vermuten lasst.

Das liegt in der Tatsache begrundet, dass die Ableitung f ′(x) weiter von x abhangig ist, der

Funktionswert y auf dem Weg von x = 1 zu x = 2 also immer starker ansteigt. So verdoppelt

sich y bei einem Anstieg von x = 1 auf x = 1 + ϵ zwar noch, bei einem Anstieg ausgehend

von beispielsweise x = 1,5 betragt die Ableitung hingegen bereits f ′(x = 1,5) = 3. Der Funk-

tionswert von y verdreifacht sich auf halbem Weg also bereits. Als Konsequenz lasst sich die

absolute Wertdifferenz von y = f(x) zwischen zwei diskreten x nur noch sehr muhevoll aus der

Ableitung bestimmen, da sich das relative Wachstum bestandig andert.

Eine Ausnahme bilden lineare Funktionen. Hier ist die Ableitung f ′(x) nicht mehr von x

abhangig sondern bleibt fur alle Wertanderungen gleich. Will man aus der Ableitung zu y =

g(x) := 3x mit g′(x) = 3 also bestimmen wie stark der Funktionswert y mit einer Veranderung

von x = 1 auf x = 2 ansteigt, so lasst sich dies aus der Ableitung ersehen: y wird um 3 Einheiten

29

wachsen, da das relative Wachstum auf dem Weg von 1 zu 2 unverandert bleibt.

4.3 Extremwerte

In den Wirtschaftswissenschaften ist es ein bestandiges Ziel Werte entweder zu minimieren

oder zu maximieren: Sei dies der Nutzen eines Individiums, die Kosten einer Firma oder die

Wohlfahrt Aller. Solche Extremwerte konnen wir mit unserem bisherigen Wissen sehr einfach

bestimmen: Sie ergeben sich aus Anwendung der eben besprochenen Differentialrechnung.

Betrachten wir dazu das einfache Beispiel einer Firma. Selbige kann auf einem Konkurenzmarkt

ein Produkt x fur einen festen Preis von p = 3 verkaufen. Bei der Herstellung fallen allerdings

Kosten von K(x) = x2 an. Aus Intuition ergibt sich daher eine Gewinnfunktion π(x), die wir

maxmimieren wollen:

π(x) = 3x− x2

Wie wir im vorherigen Kapitel gelernt haben, zeigen positive Ableitungen ein relatives Wachs-

tum an wahrend negative Ableitungen ein Abfallen von Funktionswerten darstellen. Ein Ma-

ximum, sofern ein solches existiert, muss also an einem Punkt liegen, bis zu dem die Funktion

mit x angestiegen ist und von dem aus die Funktion mit noch großeren x wieder abfallt. Das

Maximum selbst wurde demnach den Gipfelpunkt zwischen positiver und negativer Ableitung

reprasentieren: Wir suchen also einen Punkt, in dem weder positives noch negtives Wachstum

stattfindet, einen Punkt also in dem die Ableitung π′(x) = 0 ist. Ein solcher Punkt ist leicht

zu ermitteln, indem wir die Ableitung unserer Funktion nullsetzen:

π′(x) = 3 − 2x = 0

⇔ 3 = 2x

⇔ x = 1,5

Dass ein solcher Punkt mit der Ableitung gleich Null existiert ist die sogenannte Bedingung

erster Ordnung fur einen Extrempunkt. Es ist fur ein Maximum oder Minimum eine notwen-

dige (also zwingend erforderliche) Bedingung, zur Bestimmung eines Extremwerts allerdings

noch nicht hinreichend (wir konnten einen Extrempunkt also noch nicht eindeutig nachweisen).

Denn bisher konnten wir lediglich zeigen, dass die Ableitung im Punkt x = 1,5 gleich Null

ist. Wir wissen hingegen noch nicht, dass der Funktionswert bei einen marginal kleineren Wert

ansteigt und bei einem marginal großerem Wert abfallt wie wir zuvor argumentiert hatten.

Hinreichend ist lediglich die sogenannte Bedingung zweiter Ordnung, die im Abschluss des

Folgekapitels, dem Krummungsverhalten, erlautert wird.

30

4.4 Krummungsverhalten

Die Krummung einer Funktion wird durch deren zweite Ableitung angezeigt. Diese wird mit:

f ′′(x) =d2y

dx2= fxx(x)

notiert. Man unterscheidet dabei zwischen rechtsgekrummten (konvexen, f ′′(x) > 0), links-

gekrummten (konkaven, f ′′(x) < 0) und flachen (gleichzeitig konvex und konkav, f ′′(x) = 0)

Funktionen oder Funktionsabschnitten. Man teilt eine Funktionskurve in konvexe und konka-

ve Intervalle ein: Eine Funktion kann also in bestimmten Wertebereichen konvex, in anderen

hingegen konkav sein.

Aus der Krummung einer Kurve lasst sich die Bedingung zweiter Ordnung fur einen Extremwert

bestimmen. Hierfur uberlegen wir uns aber zunachst was die Krummung einer Kurve impliziert.

• Bei einer konvexen Funktion ist die zweite Ableitung, wie zuvor angefuhrt, großer Null.

Wie wir bereits argumentiert haben zeigt das Vorzeichen der ersten Ableitung immer an,

ob eine Funktion steigt oder fallt. Wenn wir mit der zweiten Ableitung also ein positi-

ves Vorzeichen erhalten, wissen wir, dass die (positive) Steigung mit marginal großeren

Werten wachst. (Oder dass die Funktion bei negativem Wachstum mit großer werdenden

x immer weniger abfallt.) Denn die zweite Ableitung beschreibt die Eigenschaften der

ersten Ableitung nicht anders als die erste Ableitung die Ursprungsfunktion beschreibt.

Folglich der Definition konvexer Funktionen beschleunigt sich das Wachstum einer kon-

vexen Funktion deshalb mit großeren x-Werten. Betrachten wir dazu als Beispiel die

Funktion y = f(x) := x3. Die erste Ableitung dieser Funktion lautet f ′(x) = 3x2. Die

zweite Ableitung ist f ′′(x) = 6x. Aus dem Vorzeichen der zweiten Ableitung konnen wir

algebraisch folgern, dass die Funktion fur x > 0 konvex ist, sich das Wachstum mit großer

werdenden x also immer starker beschleunigt.

• Bei einer konkaven Funktion ist hingegen gegenteiliges der Fall. Die Steigung wird mit

großer werdenden x nun immer schwacher was durch das negative Vorzeichen der zweiten

Ableitung angezeigt wird. Betrachten wir wieder die Funktion f(x) = x3. Fur x < 0 ist

die zweite Ableitung negativ, weshalb wir folgern konnen, dass die Funktion mit großeren

x immer schwacher wachst.

• Bei gleichzeitig konkaven und konvexen Funktionen ist die zweite Ableitung gleich Null.

Das bedeutet analog zur ersten Ableitung, dass die Steigung unverandert stark ist. Folglich

ist die Steigung konstant. Dies ist fur f(x) = x3 an der Stelle x = 0 der Fall.

31

Mit diesem Wissen uber das Krummungsverhalten lasst sich nun spezifizieren, ob ein Extrem-

wert ein Minimum, Maximum oder Flachpunkt ist. Betrachten wir dazu wieder die vorherige

Gewinnfunktion π(x) = 3x− x2. Die erste Ableitung ist π′(x) = 3 − 3x. Die zweite Ableitung

lautet π′′(x) = −3. Folglich ist die Funktion konkav. Aus obiger Argumentation wissen wir

also, dass das (positive) Wachstum der Funktionskurve in jedem Punkt schwacher wird. Das ist

auch am Extrempunkt x = 1,5 der Fall. In Folge dessen wissen wir, dass der Funktionswert fur

marginal kleinere x immer weniger wachst. Fur marginal großere x hingegen fallt die Funktion

immer starker ab. Nur falls dies der Fall ist, konnen wir uns gleichzeitig in einem Extrempunkt

befinden und die Bedingung der Konkavitat erfullen. Folglich muss es sich bei dem Extrem-

punkt um ein Maximum handeln. Bis zu diesem x-Wert war die Funktion gewachsen. Fur noch

großere x fallt die Funktion hingegen wieder ab. Ist eine Funktion in einem Extrempunkt also

konkav befinden wir uns in einem Maximum. Man sagt auch: Die Bedinung zweiter Ordnung

fur ein Maximum ist erfullt.

32

5 Funktionen mit mehreren Variablen

In den Wirtschaftswissenschaften sind Funktionen haufig nicht nur von einer einzelnen Inputva-

riablen abhangig. Wollen wir beispielsweise eine Abhangigkeitsbeziehung fur die Verkaufsmenge

(y) zu Preis (p) und Werbeausgaben (m) darstellen, mussten wir bereits zwei Variablen in die

Funktion integrieren. Dies wurde formal durch y = f(p,m) geschehen. Man spricht dabei auch

von einer multivariaten Funktion. Bisher waren alle betrachteten Funktionen hingegen uni-

variat. Die zuvor vorgestellten Rechengesetzte der Differentialrechnung sind auch fur solche

Funktionen gultig. Allerdings mussen beispielweise zur Bestimmung eines Maximums abwei-

chende Bedingungen uberpruft werden.

5.1 Ableiten einer Funktion mit mehreren Variablen

Zur Veranschaulichung der Ableitungsregeln betrachten wir eine beliebige Beispielfunktion mit

zwei Variablen. In diesem Fall die Funktion eines sogenannten Paraboloiden:

y = f(x1, x2) := x21 + x2

2

Wollen wir nun untersuchen wie sich der abhangige y-Wert bei marginalem Wachstum eines

einzelnen Inputwerts andert, so bilden wir die sogenannte partielle Ableitung. Diese wird

nach den zuvor besprochenen Rechenregeln der Differentialrechnung gebildet. Dabei ist die

nicht abzuleitende Variable einfach als Konstante anzusehen. Anstelle eines Delta-Symbols (d)

wird zur Kenntlichmachung das Symbol der partiellen Ableitung (∂) verwendet. Selbige ist

formal wie folgt definiert:

∂f(x1, x2, . . . , xn)

∂xi

=d f(x1, x2, . . . , xn)

dxi

|dx−i=0

Diese Definition besagt nichts anderes als das eben erklarte: In einer Funktion mit n un-

abhangigen Variablen ist die partielle Ableitung nach einer einzelnen der Variablen in der

Funktion xi (linke Seite) nichts weiter als das Differential (rechte Seite) unter der Bedingung,

dass alle Variablen, die nicht xi sind (x−i), unverandert bleiben (dx−i = 0). Die partiellen

Ableitungen unseres Paraboloiden sind also:

∂f(x1, x2)

∂x1

= 2x1 x2 als Konstante

∂f(x1, x2)

∂x2

= 2x2 x1 als Konstante

33

Auch die Interpretation der partiellen Ableitung verhalt sich analog zur Ableitung mit einer

Variablen. Steigt eine der Variablen um einen marginalen Wert an, so wachst y relativ um das

2x1- beziehungsweise 2x2-fache.

5.2 Beispiel: Grenzprodukte und Skalenertrage

Wir betrachten die sogenannte aggregierte Produktionsfunktion einer Volkswirtschaft. Dabei

sei Y die Produktionsmenge. Diese ist von der Menge des eingesetzten Kapitals K und der

eingesetzten Arbeitskraft N abhangig. Die Produktionsfunktion sei dabei wie folgt definiert:

Y = F (K,N) := KαN1−α

Wenn die Variable α zwischen 0 und 1 liegt (0 < α < 1), handelt es sich bei der Produktions-

funktion um eine sogenannte Cobb-Douglas-Funktion. Von selbiger wollen wir die sogenannten

Grenzproduktivitat bestimmen. Diese Grenzprodukte sollen zum Ausdruck bringen wie stark

sich die Produktion andert wenn man einen Inputfaktor marginal variiert. Dies wird mathema-

tisch, wie zuvor besprochen, durch die partielle Ableitung zum Ausdruck gebracht. Fur unsere

Beispielfunktion betragen die Grenzprodukte:

∂Y

∂N= (1 − α)KαN (1−α)−1 = (1 − α)KαN−α

∂Y

∂K= αKα−1N1−α

Zunachst ist festzustellen, dass die partiellen Ableitungen weiterhin von beiden Input-Variablen

abhangig sind. Dass dies der Fall sein muss, ergibt sich intuitiv bereits aus der Ursprungsglei-

chung. Denn die beiden Variablen der Funktion sind multiplikativ verknupft. Wurden zur Pro-

duktion Y beispielsweise Null Einheiten Arbeit N eingesetzt ware die Produktion immer Null,

unabhangig vom verwendeten Kapital K. Ist das Niveau der eingesetzten Arbeit N hingegen

sehr hoch ist der Einsatz einer weiteren Einheit Kapitals K fur die Produktion Y hingegen sehr

rentabel.

Weiterhin sind beide Ableitungen und damit die Grenzertrage fur alle Werte von N > 0 und

K > 0 positiv. Das bedeutet, dass eine zusatzliche Einheit Arbeit N oder Kapital K den

Output Y immer erhohen. (Und ihn nicht veringern was sich aus einer negativen Ableitung

folgern liese.) Wie sich diese Wertsteigerung fur immer großeren Einsatz der Inputfaktoren

verandert (steigende oder fallende Grenzertrage), gibt die zweite partielle Ableitung an:

∂2Y

∂N2= −α(1 − α)KαN−α−1

∂2Y

∂K2= α(α− 1)Kα−2N1−α

34

Die Ausdrucke am vorderen Ende der Ableitungen (−α) und (α − 1) sind jeweils negativ.

Damit ist der Grenzertrag fur beide Inputvariablen fallend. Dies bedeutet inhaltlich, dass eine

zusatzliche Einheit Arbeit N oder Kapital K den Output Y zwar ansteigen lassen, aber die

Produktivitatssteigerungen mit immer großeren Werten kontinuierlich abfallen.

Betrachten wir zum Abschluss noch die sogenannten Skalenertrage dieser Funktion. Man un-

tersucht mit solchen, in welchem Verhaltnis eine Erhohung (bzw. Veringerung) beider Input-

werte zu einer Erhohung (bzw. Verminderung) des Outputs fuhrt. Hierzu multipliziert man

jeden Faktor der Funktion Y = F (K,N) mit einer einzufuhrenden Konstanten c. Es gilt al-

so Y = F (cK, cN). Setzt man diese Werte in die gegebene Funktion ein und berechnet den

resultierenden Exponenten des auszuklammernden c, so erhalt man ein Ergebnis fur die Skale-

nertrage:

(cK)α(cN)1−α = cαKαc1−αN1−α

= cαcα−1KαN1−α

= cα+(1−α)KαN1−α

= c1KαN1−α

= c1Y

Fur Skalenertrage gilt: Wenn der Exponent von c kleiner als 1 ist, so sind die Skalenertrage

der Funktion fallend. Ist der Exponent gleich 1, so sind die Skalenertrage der Funktion kon-

stant. Und fur einen Exponenten großer 1 gelten steigende Skalenertrage. Zusammenfassend:

Positive, allerdings abnehmende Grenzertrage mit konstanten Skalenertragen sind die Eigen-

schaften, welche sich fur die Cobb-Douglas-Produktionsfunktion ergeben. All dies wird in den

Vorlesungen unseres Studiums noch im Detail besprochen. In diesem Abschnitt sollte lediglich

ein Beispiel fur die zuvor erlernte Methodik gegeben werden.

5.3 Extremwerte bei Funktionen mehrerer Variablen

Betrachten wir nochmals unseren Paraboloiden f(x1, x2) = x21 + x2

2 mit den ersten partiellen

Ableitungen fx1 = 2x1 und fx2 = 2x2. Solche Werte, an denen beide partiellen Ableitungen

gleich Null sind, heißen stationare Stellen. Fur einen Extrempunkt ist es anschließend noch

wichtiger als bei univariaten Funktionen, die zweite, hinreichende Bedingung fur einen solchen

Punkt zu uberprufen. Bevor wir hierauf aber naher eingehen, wollen wir aber zunachst die

stationaren Stellen unseres Paraboloiden bestimmen. Beide Ableitungen sind trivialerweise bei

x1 = 0 und x2 = 0 gleich Null. Es handelt sich hierbei um die einzige stationare Stelle unserer

35

Funktion.

Als hinreichende Bedingung fur einen Extremwert gilt bei multivariate Funktionen die erwei-

terte zweite Bedingung, dass das Produkt der zweiten partiellen Ableitung jeder Variablen an

allen Punkten fur x1 und x2 großer sein muss, als der Funktionswert der sogenannten gemischten

partiellen zweiten Ableitung zum Quadrat. Einfacher ist diese Bedingung formal ausgedruckt:

fx1x1(x1, x2) · fx2x2(x1, x2) > (fx1x2(x1, x2))2

Bilden wir also die zur Uberprufung der hinreichenden Bedingung geforderten Ableitungen:

fx1x1 = 2

fx2x2 = 2

Die Berechnung von fx1x2 ist auch nicht schwieriger durchzufuhren. Hierzu mussen wir ledig-

lich das Ergebnis der ersten partiellen Ableitung nach x1 nochmal nach x2 differenzieren. Die

Reihenfolge des Ableitens ist dabei nicht von Bedeutung, da das Ergebnis beider Reihenfolgen

in jedem Fall identisch ist. Wir erhalten fur unsere Beispielfunktion:

fx1x2 = 0

Nun setzen wir unsere Ergebnisse nur noch in die besprochene Bedingung ein:

2 · 2 > 02

Diese Bedingung ist selbstverstandlich erfullt. Wir haben also einen potentiellen Extremwert

gefunden. Es bleibt die Frage, ob es sich bei selbigem um ein Minimum oder ein Maximum

handelt. Diese Frage ist leicht zu beantworten: Sind beide zweiten partiellen Ableitungen nach

x1 und x2 positiv, so handelt es sich bei dem Punkt um ein Minimum. Sind beide Ableitungen

hingegen negativ, so haben wir ein Maximum gefunden. Haben beide Ableitungen verschiedene

Vorzeichen, liegt kein Extrempunkt vor. In unserem Beispiel sind beide partiellen Ableitungen

positiv. Das bedeutet der gefundene Punkt ist ein Minimum.

5.4 Das totale Differential

Das totale Differential ist ein Werkzeug mit dem wir allgemein uberprufen konnen wie sich das

Ergebnis einer Funktion y = f(x1, x2, . . . , xn) mit beliebig vielen Input-Variablen andert, wenn

wir beliebig viele dieser Eingabewerte variieren. Formal ist das totale Differential folgenderma-

ßen definiert:

df(x1, x2, . . . , xn) =n∑

i=1

∂f(x1, x2, . . . , xn)

∂xi

· dxi

36

Dieser Ausdruck ist einfach zu ubersetzen. Das Sigma-Symbol (∑

) gibt eine Summe an. Diese

Summe lauft uber alle Variablen der Funktion von den Indizes 1 bis n. Summiert werden dabei

alle partiellen Ableitungen der Funktion, welche mit der jeweiligen Anderung”(dxi) multipliziert

werden. Betrachten wir zunachst das triviale Beispiel einer Funktion mit einer unabhangigen

Variablen: y = f(x) := x2. Das totale Differential fur diese Funktion lautet: dy = ∂f(x)∂x

· dx =

2x · dx. Wollen wir also bestimmen wie sich ausgehend von einem bestimmten x der y-Wert

bei einer Variation von x verandert, konnen wir durch das totale Differntial eine approximative

Anderung bestimmen. Befinden wir uns beispielsweise an einem Punkt x = 4 und erhohen

diesen x-Wert auf x = 6 (dx = 2), so ergibt das totale Differential:

∆

Betrachten wir als Beispiel fur den Fall zweier Variablen:

df

dx=

δf

δx1

dx1 +δf

δx2

dx2

Betrachten wir nochmal den Ausdruck fur das Gesamtwirtschaftliche Gleichgewicht

Y =1

1 − c1 + c1g1 − b1 + b2d1d2

− g1(c0 + b0 + b2

M

d2P)

Wir wollen nun untersuchen, wie eine marginale Erhohung der Geldmenge den Output verandert.

Hierzu bilden wir das Differential von Y

dY =1

1 − c1 + c1g1 − b1 + b2d1d2

− g1

b2d2

(d(M

P))

Teilt man nun durch d(MP

), erhalt man

dY

d(MP

)=

b2

(1 − c1 + c1g1 − b1 + b2d1d2

− g1)d2

Da eine Anderung von c0 und b0 nicht betrachtet wird, werden diese Komponenten mit 0 mul-

tipliziert, sind also gleich 0. Was bedeutet dieser Term nun? Wir haben so den Geldmengen-

multiplikator fur diese Volkswirtschaft hergeleitet. Dieser gibt an, um wieviel sich der Output

Y verandert, wenn die Geldmenge um eine Einheit erhoht wird.

37

5.5 Methode nach Lagrange

Bei der Behandlung des Lagrange mochten wir die okonomische Interpretation außen vor las-

sen. Diese wird in der Veranstaltung ”Mathematische Methodenausgiebig diskutiert. Ebenso

nehmen wir an, dass die hinreichende Bedingung bei der Maximierung/Minimierung unter Ne-

benbedingungen bereits erfullt ist.

Betrachten wir also den in der Mikro 1 klassischen Fall2. U(x1, x2) = 6x121 x2 ist gegeben, dazu

die Budgetbeschrankung fur den Zwei - Guter - Fall p1x1 + p2x2 = m.

Erster Schritt ist immer das Aufstellen der Lagrange-Funktion.

L = 6x121 x2 − λ(p1x1 + p2x2 −m)

Hierbei ist es (noch) egal, ob ihr die durch das λ gewichtete Nebenbedingung addiert oder

subtrahiert, was man an den nun folgenden Rechenschritten auch sehen wird.

Da wir hier den Nutzen eines Individuums maximieren, gilt ebenso das Prinzip, partielle Ab-

leitungen zu bilden und Null zu setzen. Beim Lagrange-Verfahren differenzieren wir nach allen

Variablen und λ, wobei die Differenzierung nach λ uns wieder die Nebenbedingungen gibt.

δ L

δx1

= 3x− 1

21 x2 − λp1 = 0

δ L

δx2

= 6x121 − λp2 = 0

δ L

δλ= −p1x1 − p2x2 + m

Nun losen wir geschickt nach einer der beiden Variablen x1 oder x2 auf. Als erster Schritt bietet

sich an, λp1 und λp2 auf die rechte Seite zu bringenund die erste Gleichung durch die zweite

Gleichung zu dividieren, da sich so das λ eliminiert.

3x− 1

21 x2

6x121

=p1p2

Aufgrund der Rechenregeln fur Exponenten bei gleichen Basen (s. Grundlagenkapitel) folgt

3x2

6x121 x

121

=p1p2.

Kurzen und Anwenden der Potenzregeln fuhrt zu

x2

2x1

=p1p2

2Klausuraufgabe SS09

38

Nun empfiehlt es sich, nach x2 aufzulosen:

x2 =2p2x1

p2

Diesen Ausdruck setzt man nun in die Nebenbedingung ein und lost nach x1 auf, um die

optimale Menge von x1 zu erhalten:

p1x1 + p2(2p2x1

p2) = m

3p1x1 = m

x∗1 =

m

3p1

Analog rechnet man nun fur x2 und erhalt fur x2

x∗2 =

2m

3p2

Um zu zeigen, wie einfach die Methode funktioniert, rechnen wir im Folgenden nicht mit zwei

Variablen, sondern mit dreien.

Wir betrachten als erstes einen beliebigen Studenten Hubert. Hubert will ein moglichst beque-

mes Semester haben. Seine Zufriedenheit lasst sich funktional darstellen aus einer Verknupfung

der ”Guter”Lernen (L), Schlaf (S) und Freizeit (F).

Z(L, S,B) = L2 + S2 + F 2

Allerdings hat der Tag nur 24 Stunden, unser Maximierungsproblem unterliegt also einer Re-

striktion: R := L + S + F = 24. Hieraus bilden wir nun die Lagrangefunktion L = Z − λR:

L(L, S,B) = L2 + S2 + F 2 − λ(L + S + F − 24)

Beim Lagrange geht es schlichtweg nur um Maximierung unter Nebenbedingungen. Das erste,

was man beim Wort ”Maximierung”denken muss, ist erste Ableitung!”. Das gilt auch hier.

1.) Bilde alle partiellen Ableitungen erster Ordnung und setze sie Null!

d L

dL= 2L− λ = 0

d L

dS= 2S − λ = 0

d L

dF= 2F − λ = 0

d L

dλ= −L− S − F + 24 = 0

39

2.) Lose geschickt nach den Variablen auf!

In diesem Beispiel ist es recht einfach. Man sieht, dass alle drei Variablen die gleiche Gewichtung

haben. Daraus folgert man, dass L = S = F = 6. Leider gibt es kein”Universal-Rezept“ hierfur,

weshalb das Losen manchmal etwas mehr Denken erfordert.

40

6 Integralrechnung

Die Integralrechnung nutzt man zur Bestimmung der Flache zwischen dem Graphen einer Funk-

tion und der x-Achse. Die okonomischen Anwendungen sind zahlreich, die erste Anwendung im

VWL-Studium ist die der”Rente“ sein. Zunachst werden Rechenregeln fur unbestimmte In-

tegrale erlautert und im zweiten Teil fur bestimmte Integrale gezeigt, wie man ein Integral

uberhaupt berechnet.

6.1 Stammfunktionen

Gegeben sei eine Funktion f : D −→ ℜ, wobei D ein Intervall sei. Gesucht wird eine differen-

zierbare Funktion mit F ′ = f . Wir betrachten hier der Einfachkeit halber nur stetige f . Um

eine Verbindung zwischen der Flache zwischen Graph und x-Achse und der Differentialrechnung

herzustellen, sei auf den Mittelwertsatz der Integralrechnung hingewiesen:

Sei f eine stetige Funktion auf [a,b] mit a¡b, dann gibt es eine Stelle ξ, mit a < ξ, b, sodass∫ b

af(x)dx = (b− a)f(ξ).

Der Beweis hierzu ist nicht so kompliziert:3

Sei w der kleinste und W der großte Wert, den f im Intervall [a, b] annehmen kann. Dann gilt

w(b− a) ≤∫ b

af(x)dx ≤ W (b− a).

Deswegen liegt 1b−a

∫ b

af(x)dx zwischen w und W . Einen Zwischenwertsatz gibt es auch fur

stetige Funktionen.4 Nach diesem kann auch jeder Wert zwischen w und W als Funktionswert

f(ξ) angenommen werden.

3Zu Beweisen gilt generell: Sie mogen vielleicht in einer Vorlesung oder Ubungsrunde schnell hingeschrieben

sein. Aber: Dahinter steht oftmals tagelanges, in vielen Fallen sogar jahrelanges (jahrhundertelanges) Uberlegen

und Probieren. Von daher: Sich nicht verruckt machen lassen, wenn man so etwas nicht sofort nachvollziehen

kann.4Ubrigens auch auf Lagrange zuruck zu fuhren.

41

6.1.1 Fundamentalsatz der Analysis

Sei f : D −→ ℜ, D ein Intervall, eine stetige Funktion und aϵD ein Punkt. Dann ist die

Funktion

F (x) :=

∫ x

a

f(t)dt(xϵD)

eine Stammfunktion von f .

Auch hier gehen wir wieder uber den Differenzenquotienten im Intervall D, bezeichnet mit x0:

F (x) − F (x0)

x− x0

=1

x− x0

∫ x

x0

f(t)dt

Nach dem vorhergehenden Mittelwertsatz gelte∫ x

x0f(t)dt = (x−x0)f(ξ), mit ξ = ξ(x) zwischen

x und x0. Daraus folgt nun:

F (x) − F (x− 0)

x− x0

= f(ξ)

Wenn x nach x0 strebt, strebt ξ auch nach x0. Wegen der Stetigkeit von f strebt auch f(ξ)

gegen f(x0). Somit ist:

F ′(x0) = f(x0)

6.1.2 Bilden von Stammfunktionen

Das Bilden von Stammfunktionen (unschon auch als”Aufleiten“ bezeichnet.5) ist zentraler Be-

standteil der Integralrechnung.

Generell bildet man fur eine Funktion der Gestalt f(x) = xn die Stammfunktion mit der Formel

1

n + 1xn+1

5Denn eine Stammfunktion ist nicht einfach nur eine Umkehrung der Ableitung.

42

6.2 Das unbestimmte Integral

• Konstante

Eine Konstante kann aus dem Integral”herausgezogen“ werden:∫

cf(x)dx = c

∫f(x)dx

• Summen

∫(f(x) + g(x))dx =

∫f(x)dx +

∫g(x)dx

• Bruch, indem Zahler die erste Ableitung des Nenners ist

∫f ′(x)

f(x)dx = ln f(x) + c

• Partielle Integration

Ist eine Funktion f(x) das Produkt zweier Funktionen g(x) = u(x) und h(x) = v′(x) -

somit f(x) = u(x) · v′(x) , dann gelte∫u(x)v′(x)dx = u(x)v(x) −

∫u′(x)v(x)dx

Hier kann ein Beispiel hilfreich sein:

Betrachten wir das Integral∫xexdx.

Setzt man u(x) = x und v′(x) = ex, folgt u′(x) = 1 und v(x) = ex.∫xexdx = xex −

∫1 · exdx = xex − ex + c = (x− 1)ex + c

• Substitution

Durch die Substitution x = ς(k) der unabhangigen Variable einer Funktion y = f(x), ist

das unbestimmte Integral ∫f(x)dx =

∫f(ς(k))ς ′(k)dk

Beispiel:

Betrachten wir das Integral∫

(1 + x)n. Substitutiert man x = ς(k) = k + 2, erhalt man

ς ′(k) = 1. Daraus folgt nun:∫(1 + x)ndx =

∫kndk =

kn+1

n + 1+ x

=(x + 1)n+1

n + 1+ c

43

6.3 Das bestimmte Integral

Aus dem Fundamentalsatz der Analysis lasst sich recht schnell die Verbindung zwischen unbe-

stimmten und bestimmten Integralen folgern:

Sei F eine differenzierbare Funktion auf dem Intervall D mit stetiger Ableitung f ′. Dann gilt∫ b

a

f(x)dx = F (b) − F (a)

(a und b sind Elemente des Intervalls)

Auf einen Beweis verzichten wir an dieser Stelle.

Beispiel: ∫ 3

1

xdx = [1

2x2]31 = [(

1

2· 32) − (

1

212)] = 4

Nun zu einigen Eigenschaften bestimmter Integrale:

• Integrationsintervalle zusammenfassen:∫ b

a

f(x)dx +

∫ c

b

f(x)dx =

∫ c

a

f(x)dx

• Sind untere und obere Integrationsgrenzen gleich, so ist ”die Flache unter dem Graphen”=

0. ∫ a

a

f(x)dx = 0

• Vertauschen der Integrationsgrenzen∫ a

b

f(x)dx = −∫ b

a

f(x)dx

6.4 Beispiel: Konsumentenrente

In der Veranstaltung”Mikrookonomie I

”lernt man, dass die Konsumentenrente beschreibt, wie

sehr die Konsumenten von einem Gut profitieren. Diese Konsumentenrente wird nicht selten

44

mit Hilfe von Integralen beschrieben. Die Konsumentenrente bezeichnet dabei die aggregierte

Differenz zwischen maximaler Zahlungsbereitschaft und zu zahlendem Preis.

Betrachten wir wieder ein Munchner Grundnahrungsmittel: Bier. Der Preis fur Bier sei 2, 50,

die inverse Nachfrage durch p = 6−0, 001B gegeben. Als erstes berechne man den Schnittpunkt

der beiden (linearen) Kurven, um die Integrationsgrenzen zu erhalten:

6 − 0, 001B = 2, 50

B = 3500

Nicht vergessen: Die Differenz zwischen Prohibitivpreis und Preis betragt 3, 5, was wir in die

Funktion einbeziehen mussen. Nun bilde man die Stammfunktion:

p(B) = 3, 5 − 0, 001B

P (B) = 6B − 0, 0005B2

Mit dieser Vorbereitung konnen wir die Konsumentenrente berechnen:

KR =

∫ Bd

0

p(B) dB

KR =

∫ 3500

0

3, 5 − 0, 001B dB

= [3, 5B − 0, 0005B2]35000

= [3, 5 · 3500 − 0, 0005 · 35002]

= 6125

45

7 Matrixalgebra

In vielen Feldern der Volkswirtschaftslehre spielen lineare Gleichungssysteme eine wichtige Rol-

le. Insbesonders in der Okonometrie wird haufig eine Notation in Form von Vektoren und

Matrizen verwendet. Deshalb ist fur ein erfolgreiches Studium ein gutes Verstandnis der Matri-

xalgebra außerst hilfreich. Im Folgenden wollen wir dazu einige Konzepte der linearen Algebra,

das Rechnen mit Vektoren und Matrizen, verstehen lernen und uben.

Eine Matrix ist dabei zunachst nicht viel mehr als eine rechteckige Anordnung von Zahlen oder

Variablen. Man spricht dabei von einer N×K (Sprich: N-Kreuz-K) Matrix. Das N reprasentiert

dabei die Zahl der Zeilen einer Matrix, das K steht fur die Anzahl der Spalten. Man sagt auch:

Eine Matrix besitzt die Ordnung oder Dimension N ×K. Ein Vektor entspricht einer Matrix

mit nur einer Spalte oder Zeile und ist somit nichts weiter als eine Sonderform der Matrix, wie

spater noch ausfuhrlicher erlautert wird.

In der Mathematik wird eine Matrix der Dimension N ×K folgendermaßen notiert:

M =

m11 m12 · · · m1K

m21 m22 · · · m2K

......

. . ....

mN1 mN2 · · · mNK

M bezeichnet dabei die gesamte Matrix. Die Werte mij stehen fur ihre jeweiligen Elemente in

der i-ten Zeile und j-ten Spalte. Das Element m21 steht dabei beispielsweise fur das Element

in der zweiten Zeile und der ersten Spalte obiger Matrix. Die Buchstaben i und j sind dabei

typisch verwendete Zahlindikatoren, wobei mit i eine beliebige Zeile einer Matrix und mit j

eine beliebige Spalte bezeichnet wird.

Es ist eine Konvention, dass Matrizen mit fettgedruckten Großbuchstaben, Vektoren mit fett-

gedruckten Kleinbuchstaben gekennzeichnet werden. Die Notation mit einem Pfeil uber dem

Buchstaben, wie sie vielen sicherlich aus dem Schulunterricht noch bekannt ist, wird in wissen-

schaftlichen Aufsatzen und in Lehrbuchern hingegen kaum verwendet.

46

7.1 Warum Matrizen nutzlich sind

Bei der Arbeit mit Matrizen fragen sich viele Studenten zunachst haufig wie das Rechnen mit

Matrizen Vorteile mit sich bringt. Anders als bei zum Beispiel einfachen Funktionsbeziehun-

gen ist es bei Matrizen verstandlicherweise schwieriger sich vorzustellen was solche Konstrukte

denn eigentlich bedeuten. Im Gegenteil zum abstrakten Anschein sind Matrizen allerdings ein

sehr nutzliches Werkzeug zum einfachen Losen vieler wirtschaftswissenschaftlicher Aufgaben-

stellungen. Betrachten wir beispielsweise ein System von Gleichungen, das gleichzeitig erfullt

sein muss:

2a + 5b− 2c = 4

6a + 3b = 3

5b + 1c = 19

Naturlich liese sich durch schrittweises inneinander Einsetzen der Gleichungen ein Ergebnis

finden. Mit Hilfe einer Matrix lasst sich gleiche Anforderung an die linke Seite der Gleichungen

allerdings auch viel einfacher notieren: 2 5 −2

6 3 0

0 5 1

Schreibt man die rechte Seite der Gleichung nun in eine weitere Matrix, so liese sich mit Hilfe

einfacher Rechenoperationen schnell und zuverlassig ein Ergebnis fur das Gleichungssystem

finden. Diese Rechengesetze wollen wir im Folgenden ausfuhrlich erlautern, da sie in weiten

Teilen der Wirtschaftswissenschaften von Bedeutung sind.

7.2 Rechnen mit Matrizen

7.2.1 Addition und Subtraktion

Um eine Addition oder Subtraktion zweier Matrizen durchzufuhren ist es zwingend erforderlich,

dass diese die gleiche Dimension besitzen. Eine Matrix der Dimension 3× 3 kann beispielsweise

nur mit einer Matrix addiert werden, die ebenfalls die Dimension 3 × 3 besitzt. Dabei werden

jeweils die Elemente addiert, die sich in beiden Matrizen an gleicher Zeilen- und Spaltenposition

47

befinden. Ausgehend von zwei 3 × 3-Matrizen A und B :

A =

19 8 12

8 117 12

−4 12 37

B =

24 5 50

19 2 34

109 0 −1

gilt:

A + B =

19 8 12

8 117 12

−4 12 37

+

24 5 50

19 2 34

109 0 −1

=

19 + 24 8 + 5 12 + 50

8 + 19 117 + 2 12 + 34

−4 + 109 12 + 0 37 + (−1)

=

43 13 62

27 119 46

105 12 36

Die Subtraktion funktioniert nach dem gleichen Prinzip, nur dass hierbei die jeweiligen Elemente

der zwei Matrizen voneinander subtrahiert werden:

A−B =

19 8 12

8 117 12

−4 12 37

−

24 5 50

19 2 34

109 0 −1

=

19 − 24 8 − 5 12 − 50

8 − 19 117 − 2 12 − 34

−4 − 109 12 − 0 37 − (−1)

=

−5 3 −38

−11 115 −22

−113 12 38

Durch das Verrechnen der beiden Matrizen entsteht dabei wieder eine Matrix mit selber Dimen-

sion N×K der beiden Ausgangsmatrizen. Bei Betrachten des Ergebnisses fallt auch sogleich ins

Auge, warum nur Matrizen mit den gleichen Dimensionen verrechnet werden konnen: Andern-

falls ware eine Addition oder Subtraktion der jeweiligen Elemente nicht moglich - das Ergebnis

einer solchen Rechnung ist daher nicht definiert.

7.2.2 Matrizen-Multipikation

Ein wenig anders funktioniert die Multiplikation zweier Matrizen. Im Unterschied zur Addition

oder Subtraktion ist es nun nicht mehr notwendig, dass diese die gleiche Dimension besitzen.

Vielmehr ist es erforderlich, dass die Zahl der Spalten in der Matrix A (Dimension: NA ×KA)

der Zahl der Zeilen in Matrix B (Dimension: NB ×KB) entspricht. Dagegen muss gelten, dass

KA = NB, also dass die Zahl der Spalten in Matrix A der Zahl der Zeilen in Matrix B entspricht.

Die Ergebnismatrix besitzt anschließend gleiche Dimension NB × KA der Ausgangsmatrizen.

48

Die Werte von NA und KB sind fur die Durchfuhrbarkeit einer solchen Multiplikation dagegen

irrelvant.

Die Funktionsweise einer Multiplikation sei an einem einfachen Beispiel veranschaulicht. Wir

verwenden dabei wieder gleiche Matizen A und B wie zuvor. Da es sich um zwei 3 x 3-Matrizen

handelt, ist die Bedingung KA = NB mit 3 = 3 erfullt. Im Ergebniss wollen wir eine Matrix C

berechnen.

C = A ·B ⇔

c11 c12 c13

c21 c22 c23

c31 c32 c33

=

a11 a12 a13

a21 a22 a23

a31 a32 a33

·

b11 b12 b13

b21 b22 b23

b31 b32 b33

Dabei berechnet sich ein Element cij nicht durch Multiplikation der jeweiligen Elemente aij

und bij. Um ein Element cij zu berechnen, multiplizieren wir stattdessen jedes Element der

i-ten Zeile von A mit dem entsprechenden Element der j-ten Spalte von B und addieren dann

alle Produkte auf.

Intuitiver kann dies an unserem Beispiel erlautert werden. Wir betrachten dabei zunachst die

allgemeine Form der Matrizen und berechnen erst im Anschluss die Ergebnisse mit den eigent-

lichen Zahlen.

Fur die Berechnung des Elements c21 betrachten wir beispielsweise alle Elemente aus der zweiten

Spalte der Matrix A und alle Elemente aus der ersten Zeile der Matrix B. Wir erhalten dadurch

zwei”Reihen

”mit jeweils drei Elementen:

a11 a12 a13

a21 a22 a23

a31 a32 a33

b11 b12 b13

b21 b22 b23

b31 b32 b33

Diese sind a21, a22 und a23 fur die Matrix A. Fur die Matrix B erhalten wir (geordnet von oben

nach unten) die Elemente b11, b21 und b31. Um nun unser Ergebnis zu berechnen, multiplizieren

wir die Elemente an den jeweils gleichen Positionen unserer beiden “Reihen”

miteinander und

addieren die dadurch erhaltenen Ergebnisse. c21 entspricht also a21 · b11 + a22 · b21 + a32 · b31.

Mit den tatsachlichen Werten erhalten wir die”Reihen“ 8, 117 und 12 aus der Matrix A.

Aus B erhalten wir 24, 19 und 109. Fur c21 erhalten wir damit: 8 · 24 + 117 · 19 + 12 · 109 =

192 + 2.223 + 1.308 = 3.723

In einer allgemeinen Form lasst sich jedes Element cij einer Matrix C folgendermaßen definieren:

49

(Wobei Q = KA = NB)

cij =

Q∑q=1

aiq · bqj = ai1 · b1j + ai2 · b2j + . . . + aiQ · bQj

Um solche Matrizenmultiplikationen im Studienalltag schneller durchfuhren zu konnen, gibt es

einen einfachen grafischen Trick, um schnell und einfach zu einem Ergebnis zu kommen. Man

schreibt, wie untenstehend veranschaulich, die Matrix A links neben die Ergebnismatrix und

setzt die Matrix B daruber. 24 5 50

19 2 34

109 0 −1

19 8 12

8 117 12

−4 12 37

c11 c12 c13

c21 c22 c23

c31 c32 c33

=

1916 111 1210

3723 274 4366

4165 4 171

Um das Ergebnis fur eine Feld der Ergebnismatrix C zu erhalten, werden nun jeweils die linksste-

henden Zeilen-Elementen der Matrix A mit den obenstehenden Spalten-Elementen der Matrix

B multipliziert und die errechneten Werte wie oben erklart aufaddiert.

Achtung: Das Kommutativgesetz gilt bei der Multiplikation von Matrizen nicht! Es gilt also,

dass A · B = B · A. Es muss deshalb zwischen Vor- und Nachmultiplikation unterschieden

werden. Suchen wir also die Matrix C = B · A, so erhalten wir nicht das oben errechneten

Ergebnis:

19 8 12

8 117 12

−4 12 37

24 5 50

19 2 34

109 0 −1

c11 c12 c13

c21 c22 c23

c31 c32 c33

=

296 1377 2198

241 794 1510

2075 860 1271

7.2.3 Multipikation einer Matrix mit einem Skalar

Ein sogenanntes Skalar ist eine einfache Zahl, die keine Dimension besitzt. (Beziehungsweise

eine Dimension der Große 1× 1) Damit stellt sie keinen Vektor oder eine Matix dar. Trotzdem

lasst sich ein Skalar einfach mit einer Matrix multiplizieren. Eine Addition eines Skalars mit

einer Matrix ist hingegen nicht moglich.

50

So lasst sich zum Beispiel die Matrix A mit dem Skalar (also der Zahl) 2 multiplizieren:

2 ·A = 2 ·

a11 a12 a13

a21 a22 a23

a31 a32 a33

=

2 · a11 2 · a12 2 · a132 · a21 2 · a22 2 · a232 · a31 2 · a32 2 · a33

=

2 · 19 2 · 8 2 · 12

2 · 8 2 · 117 2 · 12

2 · (−4) 2 · 12 2 · 37

=

38 16 24

16 234 24

−8 24 74

7.2.4 Transponieren einer Matrix

Das Transponieren einer Matrix entspricht einer Umkehrung der Anordnung der Elemente in

einer Matrix. Die jeweiligen Werte der Elemente bleiben dabei unverandert, lediglich deren

Position in der Matrix verandert sich: Aus ei ner N ×K-Matrix soll eine K × N -Matrix ent-

stehen. Jedes Element mij findet sich nach einer Transponierung dann an Position mji wieder.

Bezeichnet wir eine transponierte Matrix mit M′.

Konkret bedeutet dies am Beispiel der Matrix B:

B′ =

24 19 109

5 2 0

50 34 −1

7.3 Besondere Matrizen

7.3.1 Vektoren

Eine Matrix mit nur einer Spalte (Eine N×1-Matrix) wird als Spaltenvektor bezeichnet. Dies ist

die gebrauchlichste Form, einen Vektor zu notieren. Eher unublich ist eine Matrix mit nur einer

Zeile (Eine 1×K-Matrix) welche entsprechend ein Zeilenvektor genannt wird. Wie bereits an-

gesprochen, werden solche Vektoren haufig mit einem Kleinbuchstaben gekennzeichnet. Haufige

auftretende Rechenformulierungen von Vektoren sind das innere und das außere Produkt. Sei

dazu ein Vektor v ein Spaltenvektor mit N Zeilen.

51

Das außere Produkt ist dann definiert als:

v · v′ =

v1

v2...

vN

·(

v1 v2 · · · vN

)=

v21 v1 · v2 · · · v1 · vN

v2 · v1 v22 · · · v2 · vN...

.... . .

...

vN · v1 vN · v2 · · · v2N

Das innere Produkt hingegen ist:

v′ · v =(

v1 v2 · · · vN

)·

v1

v2...

vN

= v21 + v22 + . . . + v2N =N∑i=1

v2i

Zu den Ergebnissen ist anzumerken, dass bei Bildung des außeren Produktes eine quadratische

Matrix der Dimension N ×N entsteht. Das innere Produkt ergibt hingegen immer ein Skalar.

(Was einer 1 × 1-Matrix entspricht.)

7.3.2 Nullmatrix

Eine Nullmatrix ist eine Matrix der Dimension N × K, die fur jedes Element die Zahl Null

(0) annimmt. Sie wird haufig mit einer fettgedruckten Null (0) angezeigt. Dabei ist wichtig,

sich vor Augen zu halten, dass eine Nullmatrix nicht dem Skalar (also der reelen Zahl) Null

enstspricht! Eine Nullmatrix enthalt zwar ausschließlich solche Nullen, verfugt aber weiterhin

uber eine Dimension.

0 =

0 0 · · · 0

0 0 · · · 0...

.... . .

...

0 0 · · · 0

7.3.3 Quadratische Matrix und Einheitsmatrix

Eine andere besondere Form einer Matrix ist die quadratische Matrix. Eine solche Matrix besitzt

eine gleiche Anzahl an Spalten und an Zeilen. Formal gesprochen gilt also dass N = K, wie

auch bei unseren beiden Matrizen A und B, die wir fur unsere bisherigen Beispielrechnungen

verwendet haben.

52

Eine noch speziellere Form der eben erwahnten quadratischen Matrix ist die sogenannte Ein-

heitsmatrix. Eine solche Matrix besteht bis auf eine Linie aus Einsen entlang ihrer sogenannten

Hauptdiagonalen lediglich aus Nullen. Sie hat folgende Form und wir haufig mit dem Buchsta-

ben I kenntlich gemacht:

I =

1 0 · · · 0

0 1 · · · 0...

.... . .

...

0 0 · · · 1

Eine Multiplikation mit der Einheitsmatrix enspricht einer Multiplikation mit der Zahl 1 im

System der reelen Zahlen, denn es gilt:

I ·M = M · I = M

Die Gultigkeit dieser Rechenregel lasst sich auch durch einfaches Ausprobieren nach den oben

stehenden Rechenregeln zur Matrizen-Multiplikation schnell uberprufen. Auch wenn wir den

Beweis dazu an dieser Stelle aussparen wollen, ist es oft hilfreich, sich daran zu erinnern.

7.4 Zusammenfassung der Rechenregeln der Matrixalgebra

Fur gleichdimensionierte Matrizen gilt: (Matrizen sind dabei fettgedruckt. Skalare sind in ein-

fachem Druck gekennzeichnet.)

1. (A + B) + C = A + (B + C)

2. A + (-A) = 0 = 0

3. A + B = B + A

4. A + 0 = 0 + A = A

5. (x1 + x2) ·A = x1 ·A + x2 ·A

6. x · (A + B) = x ·A + x ·B

7. (A′)′ = A

8. (A + B) = A + B

9. (A ·B)′ = B′ ·A′

53

10. I′ = I

11. x = x sowie (x ·A)′ = x ·A′

Fur Matrizen, welche die Eigenschaft KA = NB erfullen, gilt:

1. Das Assoziativgesetz : (A ·B) ·C = A · (B ·C)

2. Das Distributivgesetz : A · (B + C) = A ·B + A ·C

3. Nicht das Kommutativgesetz : A ·B = B ·A

7.5 Lineare Abhangigkeit

Eine Gruppe gleichdimensionierter Vektoren sind linear voneinander abhangig, wenn sich min-

destens einer dieser Vektoren durch eine beliebige Kombination der anderen abbilden lasst.

Diese Eigenschaft lasst sich einfach an einem Beispiel verdeutlichen: Angenommen es existieren

drei Zeilenvektoren v, w und z der Dimension 4 × 1.

v =

17

9

−3

12

w =

9

15

7

12

z =

15

−33

−37

−12

Dann muss es bei linearer Abhangigkeit moglich sein, eine Losung fur beliebige Skalare x1, x2

und x3 (außgenommen der Zahl Null) zu finden, sodass:

x1 · v + x2 ·w + x3 · z = 0

In unserem Beispiel gilt fur die Werte x1 = 3, x2 = −2 und x3 = 1:

3 ·

17

9

−3

12

+ (−2) ·

9

15

7

12

+ 1 ·

15

−33

−37

−12

=

3 · 17 − 2 · 9 + 1 · 15

3 · 9 − 2 · 15 + 1 · (−33)

3 · (−3) − 2 · 7 + 1 · (−37)

3 · 12 − 2 · 12 + 1 · (−12)

=

0

0

0

0

= 0

Die drei Vektoren v, w und z sind demnach linear voneinander abhangig.

54

7.6 Determinanten quadratischer Matrizen

Als Determinante einer quadratischen Matrix wird eine reele Zahl bezeichnet, die sich aus

den Elementen der Matrix errechnen lasst. Interpretieren lasst sich diese Determinante als eine

geometrische Flache, wobei mit den Elementwerten die Eckpunkte dieser Flache gesetzt werden.

Da die Interpretation ein tieferes Verstandnis der linearen Algebra voraussetzt, soll an dieser

Stelle nicht darauf eingegangen werden. Trotzdem ist es wichtig, zu wissen, dass sich solche

Determinanten errechen lassen, da sie Voraussetzung fur einige Rechenoperationen innerhalb

der Matrixalgebra ist.

Fur eine 2 × 2-Matrix ist die Determinante noch einfach zu berechnen. Fur großere Matizen

sind kompliziertere Rechnungen (zum Beispiel mit Hilfe der sogenannten Laplace Expansion)

notwendig, auf die an dieser Stelle ebenfalls nicht eingegangen wird.

Die Determinante einer Matrix wird notiert wie folgt und lasst sich im Fall einer 2×2-Dimension

folgendermaßen errechnen:

|M| =m11 m12

m21 m22

= m11 ·m22 −m12 ·m21

Aus einer Beispielmatrix A losst sich zum Beispiel ausrechnen:

|A| =19 4

10 3= 19 · 3 − 4 · 10 = 57 − 40 = 17

Aus dem Wert der Determinanten einer Matrix lasst sich eine weitere wichtige Eigenschaft

der Matrix ablesen. So ist der Wert einer Determinate immer Null, wenn zwischen den Zeilen

oder den Spalten der Matrix eine lineare Abhangigkeit (wie wir sie zuvor kennen gelernt ha-

ben) besteht. Eine Matrix mit einer Determinanten von Null wird auch als singulare Matrix

bezeichnet.

|B| =2 4

3 6= 2 · 6 − 3 · 4 = 12 − 12 = 0

In obigem Fall ist die zweite Zeile schlichtweg das 1,5-fache der ersten Zeile. Die beiden Zeilen

der Matrix sind demnach voneinander abhangig und die Determinante ergibt Null.

Fur Matrizen großerer Dimension gibt es auch ahnlich einfache Regeln, die lediglich etwas

mehr Wiederholungen beim Uben brauchen. Fur 3 × 3 Matrizen nutzt die Regel von Sarrus6.

6Pierre FrŸedŸeric Sarrus, franzosischer Mathematiker. Aus gegebenem Anlass bitten wir, den Nachnamen auch

korrekt auszusprechen (Sarru).

55

Betrachtet man eine 3 × 3 Matrix

A =

14 15 4

21 9 12

14 6 8

so gibt die Regel von Sarrus einen graphischen Trick vor, zuerst die erste und zweite Spalte (in

dieser Reihenfolge) rechts neben die Matrix zu schreiben:14 15 4 14 15

21 9 12 21 9

14 6 8 14 6

Nun multipliziert man die Hauptdiagonalen miteinander:

14 · 9 · 8 = 1008oben

15 · 12 · 14 = 2520oben

4 · 21 · 6 = 504oben

14 · 9 · 4 = 504unten

6 · 12 · 14 = 1008unten

8 · 21 · 15 = 2520unten

Die Ergebnisse oben werden addiert und die Ergebnisse unten subtrahiert.

1008 + 2520 + 504 − 504 − 1008 − 2520 = 0

So erhalt man die Determinante der 3× 3 Matrix. In unserem Fall ist die Determinante 0, was

kein ungewohnlicher Fall ist.

Die Methode zur Determinantenberechnung fur beliebig große Matrizen wird aufgrund der

geringen (oder sogar nicht vorhandenen) Relevanz im Bachelor nicht behandelt. Trotzdem soll

zum Selbststudium fur Interessierte zumindest auf die gangige Methode hingewiesen werden,

den Entwicklungssatz nach Laplace.

7.7 Inverse einer Matrix

Mit Hilfe der Determinanten einer Matrix lasst sich die Inverse einer Matrix errechnen. Eine

quadratische Matrix der Dimension K × K hat immer dann eine Inverse, wenn eine Losung

existiert, sodass: A ·A−1 = I. (I bezeichnet dabei wieder die Einheitsmatrix.)

56

7.7.1 Formale Herleitung

Betrachten wir im Folgenden eine 2×2-Matrix A und definieren dabei die (unbekannten) Werte

der Inversen der Matrix mit dem griechischen Buchstaben α, muss fur das Produkt A · A−1

gelten: (a11 a12

a21 a22

)·

(α11 α12

α21 α22

)=

(1 0

0 1

)Multiplizieren wir dies aus, erhalten wir:(

a11 · α11 + a12 · α21 a11 · α12 + a12 · α22

a21 · α11 + a22 · α21 a21 · α12 + a22 · α22

)=

(1 0

0 1

)Anders notiert lassen sich die Losungen fur obigen Ergebnisvektor in einem Gleichungssystem

festhalten:

a11 · α11 + a12 · α21 = 1

a11 · α12 + a12 · α22 = 0

a21 · α11 + a22 · α21 = 0

a21 · α12 + a22 · α22 = 1

Lost man nun alle Gleichungen nach den unbekannten Werten fur α auf und uberfuhrt das

Ergebnis wieder in die Matrizenschreibweise, so erhalt man:(α11 α12

α21 α22

)=

1

a11 · a22 − a12 · a21·

(a22 −a12

−a21 a11

)=

1

|A|·

(a22 −a12

−a21 a11

)= A−1

Fur Matrizen mit einer großeren Dimension ist der Rechenweg wieder ungleich komplizierter,

denn hierzu muss die sogenannte adjunkte Matrix berechnet werden, was viel Zeit in Anspruch

nimmt. Dafur werden wir eine Methode zur Errechnung der Inversen besprechen, die handisch

einfacher ist und trotzdem zum Ergebnis fuhrt.

7.7.2 Gauß-Jordan Elimination

Die Erfahrung hat gezeigt, dass bei dem sogenannten Gauß - Algorithmus7 vielen ein ”roter

Faden”fehlt. Deswegen mochten wir den Algorithmus zuerst aus der Ferneangehen.

7Hier mochten wir darauf hinweisen, dass Carl Friedrich Gauß nicht wegen dieses Eliminationsverfahrens

als einer der genialsten Kopfe der Mathematik gilt, sondern wegen weitaus tiefergehenden Ideen. Eine weitere

von ihm eingefuhrte Methode, die Kleinste-Quadrate-Schatzung, findet in der Okonomie und in vielen anderen

Wissenschaften eine populare Anwendung. Der Abschnitt 7.8 fuhrt in diese Idee ein.

57

Eine Matrix nennt man in Zeilen-Stufen Form, wenn jede Zeile einer Matrix mit einer fuhrenden

1 beginnt. Dies konnte so aussehen:

A =

0 1 4 999999 72684 π

0 0 1 0 847 84

0 0 0 0 0 0

Wichtig ist hier zu erkennen, dass jede Zeile mit einer 1 beginnt, links von dieser 1 nur Nullen

stehen und falls keine 1 in einer Zeile zu finden ist, erhalt man die Nullzeile. Zusatzlich ist es

in der Zeilen-Stufen Form vollkommen egal, was rechts von der fuhrenden 1 steht.

Bei der Gauß - Jordan Elimination ist das Herstellen der Zeilen-Stufen Form der erste Schritt.

Die Reduzierte Zeilen-Stufen Form (RZF) fordert gegenuber der Zeilen-Stufen Form zusatzlich,

dass in jeder Spalte mit fuhrender 1 keine anderen Zahlen (bzw. allgemeiner gesagt: Elemente)

stehen als 0 und die fuhrende 1 selbst. Diese konnte so aussehen:

A =

1 0 0

0 2 0

0 0 0

Dieses Beispiel durfte wohl das Paradebeispiel fur eine Matrix in RZF sein. Folgende Matrix

ist ebenso in RZF:

A =

1 0 0 14 0 0

0 1 0 0 9 0

0 0 1 0 0 8

Wie wahrscheinlich schon erwartet, ist die RZF das Ziel der Gauß - Elimination. Man verwendet

hierzu Elementare Zeilenumformungen. Diese sind Regeln, die darauf bauen, dass jede Matrix

aquivalent zu ihrer Zeilen - Stufen Form ist und diese wiederum aquivalent zu ihrer Redu-

zierten Zeilen Stufen Form ist. Der soeben eingefuhrte Algorithmus sagt nur, dass man durch

Elementare Zeilenumformungen die RZF herstellen kann. Elementare Zeilenumformungen sind

• Das Addieren einer Zeile zu einer anderen Zeile

• Die Multiplikation einer Zeile mit einem Skalar (welcher auch ein Bruch sein kann)

• Vertauschen zweier Zeilen

• Die Addition einer Linearkombination zu einer Zeile

58

Nun wollen wir ein Beispiel rechnen. Wir betrachten eine 4 × 4 Beispielmatrix A. Diese sei

A =

1 1 1 1

0 1 1 1

0 0 1 1

1 1 1 2

Bei der Gauß-Jordan Elimination wird ein grafischer Trick angewandt8: Man schreibt die Ein-

heitsmatrix neben die zu invertierende Matrix:

A =

1 1 1 1 1 0 0 0

0 1 1 1 0 1 0 0

0 0 1 1 0 0 1 0

1 1 1 2 0 0 0 1

Man sieht, dass diese Matrix bereits in Zeilen-Stufen Form vorliegt. Nun gilt es, die reduzierte

Zeilen-Stufen Form herzustellen. Eine Moglichkeit ist, von der vierten Gleichung die erste Glei-

chung zu subtrahieren. Hierfur schreiben wir wieder die unveranderten Zeilen auf und bilden

die Matrix, indem wir die ursprungliche vierte Zeile durch die modifizierte vierte Zeile ersetzen.

Wir erhalten also die Matrix

A =

1 1 1 1 1 0 0 0

0 1 1 1 0 1 0 0

0 0 1 1 0 0 1 0

0 0 0 1 −1 0 0 1

Nach dieser elementaren Zeilenumformung sind wir schon ein Stck voran gekommen, denn

immerhin steht in der ersten Spalte nur noch eine fuhrende 1 und sonst nur 0. Wir gehen

nun Spalte fur Spalte vor. In der zweiten Spalte erhalten wir die gewunschte Form, indem wir

einfach von der ersten Zeile die zweite Zeile subtrahieren.

A =

1 0 0 0 1 −1 0 0

0 1 1 1 0 1 0 0

0 0 1 1 0 0 1 0

0 0 0 1 −1 0 0 1

8Allgemeiner Hinweis: In vielen mathematischen Strukturen tauchen Begriffe wie neutrales Element und

Inverse auf. Ein neutrales Element ist zum Beispiel die Zahl 1 in der Multiplikation, da eine Zahl a mit 1

multipliziert immer noch gleich a ist. Um das neutrale Element in der Multiplikation herzustellen, dividiert

man a durch a selbst. Oder anders ausgedruckt: Man multipliziert a mit 1a bzw. 1

a = a−1 und erhalt so das

neutrale Element der Multiplikation, 1.

59

Das Prinzip durfte langsam klar sein. Im nachsten Schritt wird die dritte Zeile von der zweiten

Zeile subtrahiert.

A =

1 0 0 0 1 −1 0 0

0 1 0 0 0 1 −1 0

0 0 1 1 0 0 1 0

0 0 0 1 −1 0 0 1

Der letzte Teil ist nicht uberraschend. Nachdem man nun von der dritten Zeile die vierte sub-

trahiert hat, ist die Inverse in diesem Schema auf der rechten Seite ablesbar. Die Einheitsmatrix

hat sozusagen den Platz getauscht.

A =

1 0 0 0 1 −1 0 0

0 1 0 0 0 1 −1 0

0 0 1 0 1 0 1 −1

0 0 0 1 −1 0 0 1

Dieses Beispiel ist aber mit Vorsicht zu genießen. Wir haben uns fur ein eingangiges Beispiel

entschieden, um den Algorithmus leicht nachvollziehbar zu halten. Es sei davor gewarnt, einfach

sturr die die untere Zeile von der oberen zu subtrahieren und so irgendwann zu einer RZF zu

kommen. Der Gauß benotigt Ubung, um den Losungsweg sehen zu konnen.

7.7.3 Cramer’sche Regel

Zur Losung nicht-homogener Gleichungssysteme existiert eine weitere einfache Losungsmethode:

Die Cramer’sche Regel. Nach dieser Regel sind Gleichungssysteme der Form

M · x = y

einfach losbar. Die Matrix M besitzt dabei eine Dimension N ×K (und wird in diesem Zusam-

menhang haufig als Koeffizientenmatrix bezeichnet), x ist ein 1×K-Spaltenvektor, wohingegen

y ein 1 ×N -Spaltenvektor ist. Unsere Unbekannte sei in diesem Fall der Vektor x. Damit gilt:m11 m12 · · · m1K

m21 m22 · · · m2K

......

. . ....

mN1 aN2 · · · mNK

·

x1

x2

...

xK

=

y1

y2...

yN

60

Eine Moglichkeit zur Losung des Gleichungssystems ware nur das Bilden der Inversen von A,

wodurch der Vektor x mit x = A−1 · y errechnet werden konnte. Mit der Cramer’schen Regel

ist die Gleichung allerdings unter Umstanden einfacher zu losen.

Zur Losung fur ein beliebiges xj muss zunachst die Matrix Mj zu aus der Koeffizientenmatrix

M gebildet werden. Dazu wird einfach die j -te Spalte der Matrix M durch den Vektor y ersetzt.

Somit gilt zum Beispiel fur M2:

M2 =

m11 y1 · · · m1K

m21 y2 · · · m2K

......

. . ....

mN1 yN · · · mNK

Die Losung fur den Wert x2 ist nach der Cramer’schen Regel nun einfach als der Quotient

zweier Determinanten definiert. Fur den Wert x2 ist dieser beispielsweise der Quotient aus den

Determinanten obiger Matrix M2 und der Koeffizientenmatrix M selbst. Allgemein gilt fur ein

beliebiges xj:

xj =|Mj||M|

7.8 Beispiel: Herleitung des multivariaten OLS-Schatzers

In der Statistik ist die Methode der Kleinsten Quadrate (Ordinary Least Squares = OLS ) eine

haufig verwendete Analysemethode. Sie dient dazu, lineare Strukturen in zusammengehorigen

Beobachtungen zu prufen und zu beschreiben. Abstrakt gesprochen unterstellt dieses statisti-

sche Modell, dass ein linearer Zusammenhang zwischen einer abhangigen und einer oder mehre-

ren unabhangigen Variablen besteht. So ließe sich mit dieser Methode zum Beispiel uberprufen,

ob gilt, dass:

(Punktzahl in einer Klausur) = a + b1· (Lernzeit) +b2· (Intelligenzquotient)

Das Verstehen dieser Methode soll aber nicht Sinn der folgenden Ubung werden. Vielmehr

wollen wir den OLS-Schatzer herleiten, was nichts anderes bedeutet als die zuvor besproche-

nen mathematischen Methoden zur Matrixalgebra anzuwenden. Betrachten wir also zunachst

folgende Matrizen als gegeben:

61

X =

x11 x12 · · · x1K

x21 x22 · · · x2K

......

. . ....

xN1 xN2 · · · xNK

y =

y1

y2...

yN

Dabei wollen wir am Ende einen (noch unbekannten) Vektor b der Dimension K × 1 finden,

(also untenstehende Gleichung so Auflosen, dass wir eine Form von b = . . . erhalten) fur den

gilt, dass:

y = X · b + u ⇔ u = y−X · b

In ausgedehnter Schreibweise nehmen wir demnach also das folgende Gleichungssystem als

gegeben: (Wobei die Vektoren b und u unbekannt sind. Mehr dazu gleich im Folgenden.)u1

u2

...

uK

=

y1

y2...

yN

−

x11 x12 · · · x1K

x21 x22 · · · x2K

......

. . ....

xN1 xN2 · · · xNK

·

b1

b2...

bK

Die Methode der Kleinsten Quadrate sieht nur vor, die quadrierte Summe der Elemente des

Vektors u zu minimieren. (Auch darauf wollen wir an dieser Stelle nicht eingehen. Im Fokus

dieser Ubung stehen nach wie vor die mathematischen Methoden, die im Folgenden angewandt

werden. Die Bedeutung des OLS-Schatzers wird im Verlauf des Studiums noch detailiert be-

sprochen. Ein Verstandnis der tatsachlichen Bedeutung der Matrizen ist hier also nicht von

Bedeutung.) Die Summe der Elemente eines Vektors ist, wie wir bei der Besprechung der

mathematischen Methoden zuvor gezeigt haben, nichts weiter als sein inneres Produkt. Wir

berechnen im Folgenden also das Ergebnis fur den Ausdruck:

minb

u′ · u ⇔ minb

(y−X · b)′ · (y−X · b)

Ausgehend von all diesen Annahmen wollen wir nun einige unserer Rechenmethoden erproben.

7.8.1 Ableiten der Matrizen

Um eine Matrix oder einen Vektor abzuleiten, sind keine speziellen Rechenregeln anwendbar.

Vielmehr ist einzeln zu prufen, was bei einer zeilenweisen Ableitung nach Methodik der be-

kannten Ableitungsregeln heraus kommt. Dazu multiplizieren wir zunachst obige Gleichung

aus:

62

u′ · u = (y−X · b)′ · (y−X · b)

= (y′ − b′ ·X′) · (y−X · b)

= y′ · y− b′ ·X′ · y− y′ ·X · b + b′ ·X′ ·X · b

Nun lasst sich mit Hilfe eines kleinen Tricks die eben errechnete Gleichung weiter vereinfachen.

Es gilt, dass b′ ·X′ · y′ = (y′ · b ·X)′ = y′ ·X · b, denn bei dem Ergebnis des obigen Ausdrucks

handelt es sich um ein Skalar. (Dies ergibt sich aus den oben angezeigten Dimensionen der Ma-

trizen. Durch Multiplikation erhalten wir eine 1 x 1-Matrix, also eine reele Zahl.) Denn wie bei

Besprechung der Methoden gezeigt, behalt ein transponierter Skalar auch bei Transponierung

seinen ursprunglichen Wert. So konnen wir letzteres Ergebnis in die obige Gleichung einsetzen,

sodass wir erhalten:

u′ · u = y′ · y− 2 · b′ ·X′ · y + b′ ·X′ ·X · b

Wir erhalten also drei durch Summenoperatoren verbundene Teilgleichungen, die wir nach b

ableiten mussen.

1. y′ · y

2. 2 · b′ ·X′ · y

3. b′ ·X′ ·X · b

Die Ableitung fur den ersten Teil der Gleichung (1 ) ist Null, da b in ihr nicht vorkommt. Die

beiden anderen Gleichungen mussen wir hingegen im Detail betrachten. Zunachst losen wir die

Ableitung fur den 2. Teil der Gleichung:

Da X eine Matrix der Dimension N ×K ist und y ein N × 1-Spaltenvektor, ist das Ergebnis

von X′ · y ein K × 1-Spaltenvektor. Aus Grunden der Einfachheit in der Notation bezeichnen

wir dieses Produkt aus X′ und y im Folgenden mit (klein) x = X′ · y.

Dieses Produkt aus b’ und x lasst sich berechnen als:

63

b′ ·X′ · y = b′ · x =(

b1 b2 · · · bK

)·

x1

x2

...

xK

= b1 · x1 + b2 · x2 + . . . + bK · xK

Da wir als Ergebnis ein Skalar erhalten, folgt fur die Ableitung nach einem beliebigen Wert bj

des Vektors b:

∂(b′ · x)

∂bj= xj

Womit gilt, dass: (Im Fall der oben beschriebenen Matrixdimensionen)

∂(b′ · x)

∂b= x = X′ · y

Eine ahnliche Vorgehensweise nutzen wir bei Berechnung der partiellen Ableitung der dritten

Gleichung. Wieder fassen wir aus Grunden der Einfachheit das Produkt aus X’ und X in der

Matrix Z zusammen. Also Z = X′ ·X. Da es sich bei X um eine N ×K-Matrix handelt, ergibt

das Produkt aus transponierter Matrix und Matrix X fur Z eine quadratische Dimension K×K.

Wir suchen also eine Losung fur:

b′ · Z · b =(

b1 b2 · · · bK

)·

z11 z12 · · · z1K

z21 z22 · · · z2K...

.... . .

...

zK1 zK2 · · · zKK

·

b1

b2...

bK

= (∑K

j=1 bj · zj1 +∑K

j=1 bj · zj2 + . . . +∑K

j=1 bj · zjK) ·

b1

b2...

bK

= b1 ·

∑Kj=1 bj · zj1 + b2 ·

∑Kj=1 bj · zj2 + . . . + bK ·

∑Kj=1 bj · zjK

Das eben ausgerechnete Ergebnis lasst sich ebenfalls (aus-)schreiben als:

64

b′ · Z · b = b1 · b1 · z11 + b1 · b2 · z12 + . . . + b1 · bK · z1K +

b2 · b1 · z21 + b2 · b2 · z22 + . . . + b2 · bK · z2K +...

.... . .

...

bK · b1 · zK1 + bK · b2 · zK2 + . . . + bK · bK · zKK

Fur die folgende Ableitung ist es wichtig, sich vor Augen zu halten, dass die Matrix Z symme-

trisch ist, d.h. es gilt: zij = zji. Damit gilt fur die partiellen Ableitungen beispielswiese nach

b1.

∂b′·Z·b∂b1

= 2 · b1 · z11 + b2 · z12 + . . . + bK · z1K + b2 · z21 + . . . + bK · zK1

= 2 · b1 · z11 + 2 · b2 · z12 + . . . + 2 · bK · z1K= 2 ·

∑Kj=1 ·bj · z1j

Oder kurzer: (und in Matrizenschreibweise)

∂b′ · Z · b∂b

= 2 · Z · b = 2 ·X′ ·X · b

Wir sehen also: Das Ableiten von Matrizen ist prinzipiell genau so moglich wie fur reele Zahlen.

Allerdings spielen die Dimensionen der abzuleitenden Matrizen eine entscheidende Rolle fur das

Ergebnis, weshalb unter Umstanden umstandlichere Rechenvorgange vonnoten sind.

7.8.2 Auflosen der Gleichung

Wie wir soeben gezeigt haben, gilt:

∂u′ · u∂b

= 0− 2 ·X′ · y + 2 ·X′ ·X · b != 0

Durch einfaches Umstellen erhalt man:

2 ·X′ ·X · b = 2 ·X′ · y ⇔ b = (X′ ·X)−1 ·X′ · y

65

8 Stochastik

In diesem Kapitel werden einige Konzepte der Stochastik, wie sie aus dem Schulunterricht

bekannt sind, wiederholt. Eine detailierte Besprechnung dieser Materie findet innerhalb des

Studiums allerdings erstmalig in den Statistik-Kursen statt. Vorweg sei gesagt: Die nachfolgen-

den Kapitel ersetzen keinesfalls den Besuch der Statistik-Veranstaltungen! Wir wollen lediglich

versuchen, einige Basiskonzepte zu wiederholen, ohne dass wir auf statistische Testverfahren

eingehen. Wir wollen lediglich sicherstellen, dass ihr uber ein Fundament verfugt, um spater

sicher mit Mengen und Wahrscheinlichkeiten zu rechnen. Außerdem wollen wir spater einige

der wichtigsten Begrifflichkeiten der Statistik moglichst intuitiv erlautern, um insbesondere

Studenten im Nebenfach, die keine Statistikveranstaltungen besuchen, das Verstehen solcher

Thematiken zu erleichtern. Wenn euch das ein oder andere Thema allerdings vollkommen neu

ist: Keine Sorge! Ihr werdet im Verlauf eueres Studiums noch viel Gelegenheit bekommen, diese

zu verstehen.

8.1 Begriff der Wahrscheinlichkeit

Eine Wahrscheinlichkeit im Kontext der Mathematik ist das Maß zur Quantifizierung von Si-

cherheit oder Unsicherheit bei einem Zufallsereignis. Auch wenn dies zunachst sehr kompliziert

klingt, ist das Gemeinte aber bereits aus dem Alltagsgebrauch des Wortes Wahrscheinlichkeit

erschließbar. Denn auch wenn dies aus Sicht einer mathematischen Definition wenig korrekt

ist, versteht man unter einer Wahrscheinlichkeit zumeist eine Zahl, die angibt, ob ein Ereignis

haufig oder weniger haufig im Vergleich zu anderen Ereignissen auftritt.

Verdeutlicht sei dies am Beispiel eines geubten und eines ungeubten Sportlers. Wenn beide Spie-

ler die Chance bekommen, einen Basketball in einen Korb zu werfen, wurden wir vermuten,

dass es wahrscheinlicher ist, dass der geubte Sportler trifft, als dies beim ungeubten Sportler

der Fall ist. Trifft der geubte Sportler beispielsweise in acht von zehn Fallen, so betragt die

(quantitative) Wahrscheinlichkeit fur einen Treffer 0,8 = 80%. Beim ungeubten Sportler ist

diese, wenn er nur bei zwei von zehn Wurfen einen Korb macht, nur 0,2 = 20%.

Solche Zufallsereignisse spielen auch in der VWL eine tragende Rolle. Mit dem Wissen daruber,

ob eine Aktie”wahrscheinlich“ an Wert gewinnen wird oder nicht, lasst sich an der Borse viel

66

Geld verdienen (und verlieren). Im Gegensatz zu zwei verschieden starken Basketballspielern

ist eine solche Wahrscheinlichkeit aber oft ungleich komplexer, weshalb wir es nicht bei dieser

einfachen Begrifflichkeit belassen konnen.

8.2 Definition von Wahrscheinlichkeit

So wenig sich Manchem die Notwendigkeit dafur offenbaren mag: In der Mathematik existieren

verschiedene Definitionen der Wahrscheinlichkeit. Mit der Wahrscheinlichkeitstheorie existiert

sogar ein eigenes Teilgebiet, in dem daruber nachgedacht wird, was eine Wahrscheinlichkeit

tatsachlich bedeutet. Das zu wissen, ist zu einem kleinen Teil auch fur Volkswirte von Bedeu-

tung, da wir, wie oben angesprochen, viel uber Zufallsereignisse nachdenken und diese dann

oft unterschiedlich modelliert werden. Deshalb wollen wir zunachst zwei haufige”Typen“ von

Wahrscheinlichkeiten kennen lernen, bevor wir mit dem Rechnen beginnen.

8.2.1 Laplace-Wahrscheinlichkeit

Die Wahrscheinlichkeit nach dem Mathematiker Laplace ist eine der altesten Definitionen von

Wahrscheinlichkeit. Deshalb wird sie haufig auch als die klassische Definition der Wahrschein-

lichkeit bezeichnet. Nach Laplace definiert sich Wahrscheinlichkeit sehr einfach. Zunachst exi-

sitert eine Menge moglicher Ereignisse Ω. Und jedes Ereignis innerhalb von Ω gilt als gleich

wahrscheinlich. Mit einer Ereignismenge

Ω = Regen,Kein Regen

wurde dies nach Laplace bedeuten, dass es nur zwei mogliche Auspragungen des Zufallsereignis

Wetter gibt. Entweder regnet es morgen oder nicht. Das ist soweit naturlich kaum abzustreiten.

Nur unterstellt Laplace auch, dass beide Ereignisse gleich wahrscheinlich sind. Das heißt, die

Wahrscheinlichkeit (P fur probability) fur Regen betragt zum Beispiel:

P (Regen) = ”Zahl der gunstigen Ereignisse“

”Zahl der moglichen Ereignisse“

=|Regen|

|Regen,Kein Regen|=

1

2= 0,5

67

8.2.2 Axiomatische Wahrscheinlichkeit

Obige Annahme gleicher Wahrscheinlichkeit ist in vielen Anwendungsfallen problematisch.

Denn naturlich ist es Unsinn zu glauben, dass Regen und kein Regen zu jeder Zeit gleich-

wahrscheinliche Ereignisse sind. Auf Grund dieser Einschrankung hat die axiomatische Wahr-

scheinlichkeitstheorie in der Praxis oft eine hohere Bedeutung. Diese geht auf den Mathematiker

Kolmogorow zuruck. Der große Unterschied zur Definition nach Laplace ist, dass nach dieser

Theorie nicht versucht wird, die Wahrscheinlichkeit in eine besondere Form zu fassen, sondern

dass sehr allgemeine Eigenschaften von Wahrscheinlichkeit zusammengefasst wurden. Mit Hilfe

dieser Annahmen, lassen sich Wahrscheinlichkeiten dann einfacher ableiten. Diese Annahmen

sind:

1. Jedes Ereignis aus der Menge Ω hat eine Wahrscheinlichkeit. Diese kann nicht großer als

Eins (sicheres Ereignis = 100%) und nicht kleiner als Null (unmogliches Ereignis = 0%)

sein. Fur ein beliebiges Ereignis A gilt also:

0 ≤ P (A) ≤ 1

2. Die Wahrscheinlichkeit, dass ein beliebiges, aber kein bestimmtes Ereignis aus der Menge

Ω eintritt, betragt Eins. Im Klartext also: Irgendetwas passiert immer.

3. Wenn sich zwei Ereignisse gegenseitig ausschließen (zum Beispiel kann ein Wurfel nicht

gleichzeitig eine Zwei und eine Drei zeigen), dann entspricht die Wahrscheinlichkeit, dass

eines der beiden Ereignisse auftitt, gleich der Summe der Einzelwahrscheinlichkeiten, dass

eines von ihnen eintritt.

Aufbauend auf diesen Annahmen lassen sich, wie wir gleich sehen werden, durch Wahrscheinlichkeits-

, Dichte- und Verteilungsfunktionen komplexere Wahrscheinlichkeiten formulieren.

68

8.3 Diskrete und stetige Zufallsvariablen:

Wahrscheinlichkeits-, Dichte- und Verteilungsfunktion

8.3.1 Zufallsvariablen

Unter einer Zufallsvariablen verstehen wir eine Variable, die in der Mathematik fur ein Ereignis

mit nicht bekanntem Ausgang den Platz halt. Ihr Gegenstuck, die deterministische Variable,

ist einem jedem sicherlich noch bestens aus dem Schulunterricht bekannt. Man konnte mit ihr

einen Platzhalter fur einen unbekannten Wert setzen und so statt mit Zahlen mit dieser Unbe-

kannten weiterrechnen.

Eine Zufallsvariable ist im Grunde genommen nichts anderes als eine solche Unbekannte. Eine

Zufallsvariable kommt immer dann zum Einsatz, wenn wir mit einem Ereignis arbeiten mussen,

dessen Ergebnis noch offen steht. Steht uns beispielsweise frei, einen Betrag M entweder auf

einem Sparkonto mit Zinssatz a = 3% zu anzulegen oder in einer Wette (b) bei einem Sieg das

Geld zu verdoppeln oder bei Verlust alles zu verlieren, so lasst sich das Resultat der ersten

Option durch eine deterministische Variable beschreiben, das Resultat der letzteren aber nur

durch eine Zufallsvariable. Formal notiert wurde fur die Auszahlung Z jeweils gelten:

Sparkonto: Z = M · a

Wette: Z = M · b

Den Betrag auf dem Sparkonto konnen wir nun sehr einfach mit den uns bekannten Regeln

errechnen. Fur die vom Zufall abhangige Wette allerdings benotigen wir spezielle Rechenregeln.

Oft lassen sich Ergebnisse hier namlich nur als Erwartung oder Verteilung darstellen. Denn

welchen Wert b letzendlich annimmt, wissen wir zu diesem Zeitpunkt nocht nicht. Das hierzu

notige Grundwerkzeug lernen wir in den folgenden Kapiteln kennen.

8.3.2 Diskrete Zufallsvariablen

Man spricht von einer diskreten Zufallsvariablen, wenn ein Ereignis nur eine begrenzte Zahl von

Auspragungen annehmen kann. Ein Wurfel kann zum Beispiel nur die Seiten Eins bis Sechs

zeigen. Die Menge der moglichen Ergebnisse ist also Ω = 1, 2, 3, 4, 5, 6 und damit begrenzt. Die

Wahrscheinlichkeitsfunktion gibt dabei fur jede Auspragung xi des Zufallsereignisses Wurfeln

69

an (Im Folgenden wird das Ereignis, hier also das ”Wurfeln”mit X bezeichnet. Ein mogliches

Ergebnis, also die Augen, die das Wurfeln zeigt, mit xi), wie haufig es relativ zu den anderen

Ereignissen eintritt. Wenn also jede Seite des Wurfels gleich oft nach oben zeigt, dann betragt

die Wahrscheinlichkeit fur zum Beispiel die Zahl Zwei (X = x2 = 2) gemaß der Definition von

Laplace 16. Formal wird eine solche Wahrscheinlichkeit wie hier notiert:

f(2) = P (X = 2) =1

6

Allgemeiner wird die Wahrscheinlichkeitsfunktion so aufgeschrieben: (auch fur Nicht-Laplace-

Wahrscheinlichkeiten)

f(xi) = P (X = xi) ∀ i ∈ 1, . . . , N

Die Intuition fur diese allgemeine Formel wird im Folgenden an einem typischen Beispiel

erlautert, auf das wir auch spater noch haufiger zuruck greifen werden: Das betrachtete Zu-

fallsereignis ist dabei der gleichzeitige Wurf von zwei Wurfeln mit sechs Augen. Das uns in-

teressierende Ereignis (X) ist die Summe der gezeigten Augen beider Wurfel. Wie sich diese

Augensumme zusammensetzt, ist uns hingegen egal. Nur die Augensumme interessiert uns. Die

Menge aller moglichen Ereignisse ist jetzt Ω = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12: Der kleinste Wert

ist Zwei. (Beide Wurfel zeigen eine Eins.) Der hochste mogliche Wert ist die Zwolf. (Beide

Wurfel zeigen eine Sechs.) Durch geeignete Kombinationen konnen auch alle Werte dazwischen

erzielt werden. Zusammengefasst in einer Tabelle sind deshalb alle der folgenden Ergebnisse

moglich:

xi Augen der Wurfel Nr.1, Nr.2 Haufigkeit Kumuliert

2 1,1 1 1

3 1,2 2,1 2 3

4 1,3 3,1 2,2 3 6

5 1,4 2,3 3,2 4,1 4 10

6 1,5 2,4 3,3 4,2 5,1 5 15

7 1,6 2,5 3,4 4,3 5,2 6,1 6 21

8 2,6 3,5 4,4 5,3 6,2 5 26

9 3,6 4,5 5,4 6,3 4 30

10 4,6 5,5 6,4 3 33

11 5,6 6,5 2 35

12 6,6 1 36

Tabelle 1: Mogliche Ereignisse beim gemeinsamen Werfen mit zwei Wurfeln.

70

Wie es aus der obenstehenden Tabelle ersichtlich ist, sind die verschiedenen Ergebnisse fur die

Summe der Augen nun nicht mehr gleichwahrscheinlich wie es beim Werfen mit nur einem

Wurfel der Fall war. So ist die Augensumme Zwei beispielsweise nur mit einem Einserpasch

moglich. Eine Augensumme von Sieben ergeben hingegen sechs verschiedene Wurfelkombinationen,

weshalb wir beim Wurfeln eine Zwei viel seltener als die Sieben zu sehen bekommt.

Dass verschiedene Ereignisse nun unterschiedlich wahrscheinlich sind, liegt daran, dass wir ver-

schiedene Elementarereignisse nun zu komplexeren Ereignissen zusammengefasst haben. Kon-

kret haben wir die Elementarereignisse des Wurfelns mit einem Wurfel zu einem gemeinsamen

Wurf aggregiert. Diese Elementarereignisse ließen sich auch weiterhin mit einer Wahrschein-

lichkeit nach Laplace beschreiben, aber es ist schnell zu erkennen, dass diese Moglichkeit fur

viele Anwendungsgebiete außerst unpraktisch ist. Es ware zu schwierig, beispielsweise zur Be-

stimmung des Wetters, alle Grundfaktoren wie Windstarke, Sonneneinstrahlung etc. zu abstra-

hieren, um daraus nach Laplace eine Wahrscheinlichkeit fur den Regen abzuleiten. Und auch

in der VWL konnen viele Wahrscheinlichkeiten nicht durch Aggregation der Grundereignisse

bestimmt werden.

Deshalb prufen wir fur das Beispiel der beiden Wurfel zunachst die Regeln der axiomatischen

Wahrscheinlichkeit. Wie fur jedes Zufallsereignis gilt die Definition der drei genannte Bedinun-

gen: (1) Jedes Ereignis hat eine (individuelle) Wahrscheinlichkeit, einzutreten. (2) Die Wurfel

werden immer eine der Zahlen aus der Ereignismenge zeigen. (3) Und die Wahrscheinlichkeit,

dass eine von zwei beliebige Zahlen nach oben zeigt, entspricht der Summe der Einzelwahr-

scheinlichkeiten.

Damit wir aber weiterhin Wahrscheinlichkeiten fur Ereignisse in Zahlen fassen konnen und auch

einem Außenstehenden die Wahrscheinlichkeit eines Zufallsereignisses vermitteln konnen, ohne

ihn muhselig uber die Zusammensetzung aus Elementarereignissen zu informieren, (sofern das

uberhaupt moglich ist) ist deshalb die bereits angesprochene Wahrscheinlichkeitsfunktion not-

wendig, welche die Haufigkeiten einzelner Auspragungen des Zufallsereignisses zusammenfasst.

Fur das Werfen von zwei Wurfeln sieht diese Funktion beispielsweise folgendermaßen aus:

71

f(xi) =

136, xi ∈ 2, 12

236, xi ∈ 3, 11

336, xi ∈ 4, 10

436, xi ∈ 5, 9

536, xi ∈ 6, 8

636, xi = 7

Die Funktion sieht nur auf den ersten Blick umstandlich aus. Im Gegenteil aber kann mit Hil-

fe dieser Ausdrucksweise eine große Menge von Information auf wenig Platz zusammengefasst

werden. Dazu enthalt sie alle Informationen uber die Wahrscheinlichkeiten, die wir zuvor noch

in einer umstandlichen Tabelle abgefasst haben. So liest sich aus der ersten Zeile dieser Formel

zum Beispiel von links nach rechts, dass die Wahrscheinlichkeit fur eine Auspragung 136

betragt,

wenn diese Auspragung die Augensumme 2 oder 12 ist. (In diesem Zusammenhang bedeutet

”xi ∈ 2; 12“ so viel wie

”xi = 2 oder xi = 12“. Spater besprechen wir diese Art der Notation

noch etwas ausfuhrlicher.)

Eine in der VWL und Statistik noch viel haufigere Form, um Wahrscheinlichkeiten zu beschrei-

ben, ist die sogenannte (kumulierte) Verteilungsfunktion. Im Gegensatz zur Wahrscheinlichkeits-

funktion bringt diese zum Ausdruck, wie haufig ein Ereignis gemeinsam mit allen bisherigen

Ereignissen eintritt. Fur die Zahl Sieben gibt die Verteilungsfunktion also an, wie wahrscheinlich

die Zahl Sieben oder eine kleinere Zahl gewurfelt wird. Dazu werden einfach die Wahrschein-

lichkeiten aller Ereignisse in aufsteigender Reihenfolge aufaddiert:

F (xi) =

136, xi = 2

336, xi = 3

636, xi = 4

1036, xi = 5

1536, xi = 6

2136, xi = 7

2636, xi = 8

3036, xi = 9

3336, xi = 10

3536, xi = 11

1, xi = 12

72

Ublicherweise werden Wahrscheinlichkeitsfunktionen dabei immer mit einem Kleinbuchstaben,

Verteilungsfunktionen mit einem Großbuchstaben bezeichnet. Die Bedeutung dieser Ausdrucks-

form wird im folgenden Kapitel mit stetigen Zufallsvariablen aber noch von großerer Bedeutung.

Außerdem wird es einfacher zu verstehen, warum in vielen Fallen eine Verteilungsfunktion ein-

facher zu interpretieren ist als eine Wahrscheinlichkeitsfunktion.

8.3.3 Stetige Zufallsvariablen

Im Gegensatz zu einer diskreten Zufallsvariablen ist die Menge der moglichen Auspragungen,

die sich in einem stetigem Zufallsereignis ergeben konnen, nicht auf eine zahlbare Gruppe von

Ergebnissen beschrankt. Stetige Zufallsvariablen konnen innerhalb eines (festzulegenden) Inter-

valls jeden beliebigen Wert annehmen. Als Beispiel konnen Borsenkurse (X) genannt werden.

Eine Aktie notiert nicht zwingend mit einem nach oben hin beschranktem Preis (xi) ganzer

Euros. Wurde man jedenfalls versuchen, fur jeden moglichen Aktienpreis in Eurocent eine eige-

ne, diskrete Wahrscheinlichkeit zu bestimmen, wurde man damit zu keinem sinnvollen Ergebnis

kommen.

Darum werden stetige Zufallsereignisse vorzugsweise mit Hilfe einer Dichtefunktion beschrie-

ben. Diese Dichtefunktion gibt fur alle moglichen Wertbereiche einer Aktie an, wie wahrschein-

lich sich relativ zu anderen Ereignnissen ein bestimmter Kurs einstellt. Sie ist sozusagen das

Aquivalent zur Wahrscheinlichkeitsfunktion bei diskreten Zufallsvariablen. Tatsachlich werden

beide Begriffe haufig sogar synonym verwendet.

Auch lasst sich wie bei diskreten Zufallsvariablen eine Verteilungsfunktion errechnen, welche

die aufsummierten Wahrscheinlichkeiten bis zu einem bestimmten Wert angeben. Wurde man

in einem Model uber Aktienkurse zum Beispiel die Verteilungsfunktion zu einem Aktienpreis

von 20 Euro die folgende Formel finden:

F (x = 20) = P (0 ≤ x ≤ 20) =

∫ 20

0

f(x) dx = 0,7

Dann ließe sich hieraus ablesen, dass die Wahrscheinlichkeit fur einen Aktienkurs von 20 Eu-

ro oder kleiner genau 70 Prozent betragt. F (x) bezeichnet dabei - wie zuvor - bei diskreten

73

Zufallsvariablen die Verteilungsfunktion und f(x) die Dichtefunktion. Im Gegensatz zur Wahr-

scheinlichkeitsfunktion bei diskreten Zufallsvariablen erklart die Dichtefunktion nun allerdings

nicht mehr, wie wahrscheinlich ein bestimmtes Ereignis ist. Es gilt bei stetigen Zufallsereignissen

darum:

f(xi) = P (X = xi) = 0

Die Dichtefunktion lasst sich im Vergleich zur Wahrscheinlichkeitsfunktion deshalb nur schwer

interpretieren. Lieber verwenden viele Autoren daher die Verteilungsfunktion, um die bespro-

chenen Ereignisse sinnvoll zu beschreiben. Auch ist es wichtig, anzumerken, dass bei stetigen

Verteilungsfunktionen die Wahrscheinlichkeit, dass sich ein bestimmtes Ergebnis einstellt, im-

mer approximativ Null angenommen wird. Die Wahrscheinlichkeit. dass ein ganz bestimmter

Aktienkurs (mit einer Unzahl von Nachkommastellen) an der Borse notiert wird, ist also so

gering, dass sie nahe Null vermutet wird. Die Dichtefunktion kann hingegen sogar Werte großer

als Eins annehmen, was nur bedeutet, dass ein Wert relativ zu anderen Ereignissen haufiger

auftritt. Ein Aktienkurs von genau 20 Euro ist demnach zwar selten, aber immer noch wahr-

scheinlicher als ein Kurs von 1000 Euro.

8.4 Rechnen mit Zufallsvariablen

Im Folgenden wollen wir ein paar haufige Begriffe aus der Stochastik erlautern, die auch in

der VWL regelmaßigen Gebrauch finden. Allerdings werden wir weniger”rechnen“ als eine

Intuition fur die Begrifflichkeiten geben. Dazu werden wir formale Begriffe in einen verbalen

Kontext setzen und wollen so ein Gefuhl fur einige Begriffe der Stochastik vermitteln. Eine

ausfuhrliche Erlauterung der in diesem Kapitel besprochenen Inhalte findet in den Kursen zur

Statistik statt und bleibt hier deshalb außen vor.

8.4.1 Mengenlehre

Wir haben bereits festgestellt, dass jedem Zufallsexperiment eine Menge von Ereignissen zuge-

ordnet ist, die sich als Ergebnis einstellen konnen. Diese Mengen werden nach den Regeln der

sogenannten Mengenlehre miteinander verrechnet. Deshalb wollen wir die in der Mengenlehre

74

gebrauchte Notation in diesem Abschnitt kurz zusammenfassen.

Als Beispiel fur die Mengenlehre betrachten wir zwei Zufallsvariablen. Als A bezeichnen wir den

Wurf mit einem Wurfel. Dessen Ereignismenge ist, wie oben gezeigt, ΩA = 1, 2, 3, 4, 5, 6. Als

zweite Zufallsvariable betrachten wir B, einen Wurf mit zwei Wurfeln. Das uns interessierende

Ereignis ist wieder die Summe der Augenzahlen beider Wurfel ΩB = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.

Im Kontext der Mengenlehre interessieren wir uns dabei nicht fur die Eintrittswahrscheinlich-

keit der jeweiligen Zufallsvariablen. Im Folgenden sind ausschließlich die Mengen der moglichen

Ereignisse von Bedeutung. Wir wollen dabei verstehen lernen, wie man bestimmte verbale Aus-

drucke formal notiert.

Zunachst existieren in der Mengenlehre einige Symbole, mit deren Hilfe Zusammenhange zwi-

schen Mengen und Elementen lediglich beschrieben werden. So lasst sich zum Beispiel zum

Ausdruck bringen, dass eine Zahl ein Element einer Menge ist.

1 ∈ ΩA

Dieser Term ist richtig, da die Zahl 1 mit einem einzelnen Wurfelwurf erzielbar ist. Folglich ist

1 ein Element der moglichen Wurfelergebnisse. Hingegen gilt

1 /∈ ΩB

denn die Zahl 1 kann nicht die Augensumme zweier Wurfel sein. Beschreibt man hingegen die

Gemeinsamkeit zweier Mengen, so wird statt des Elementsymbols das Symbol fur die Teilmenge

zum Einsatz gebracht. Die Menge der Zahlen 4 und 5 ist beispielsweise vollstandig in ΩA

enthalten. Darum gilt

4, 5 ⊂ ΩA

als echte Teilmenge. Von einer unechten Teilmenge spricht man allerdings nur, wenn zwei Men-

gen eigentlich identisch sind. Zwar ist ein Menge in sich selbst vollstandig enthalten, allerdings

gilt dieser Zusammenhang auch umgekehrt. Notiert wird das so:

1, 2, 3, 4, 5, 6 ⊆ ΩA.

75

Allerdings ist bei der Notation Vorsicht geboten. Manchmal wird eine echte Teilmenge auch

mit ( markiert wahrend die (unechte) Teilmenge mit ⊂ notiert wird.

Mit Hilfe der Mengenlehre lassen sich Gemeinsamkeiten von ΩA und ΩB nicht nur beschreiben,

es konnen auch neue Mengen gebildet werden. Rechnerisch sind die meisten Begrifflichkeiten

trivial, allerdings ist die Notationsform ungewohnt. Zunachst ist

ΩA ∪ ΩB = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12

die Vereinigung zweier Mengen. Eine Vereinigung ergibt immer die Ereignisse, die sich aus A,

aus B oder aus beiden Zufallsvariabeln ergeben konnen. Dazu im Gegensatz steht die Schnitt-

menge. Mit

ΩA ∩ ΩB = 2, 3, 4, 5, 6

werden nur solche Ereignisse abgebildet, die sich sowohl aus A als auch aus B ergeben konnen.

Anders verhalt es sich mit der Differenzmenge. Diese ist

ΩA \ ΩB = 1

und enthalt all jene Elemente, die sich in ΩA aber nicht in ΩB befinden.

Zuletzt lernen wir noch das kartesische Produkt kennen. Im Vergleich zu den letzteren Berech-

nungen ist diese ein wenig komplexer. Mit dem kartesischen Produkt werden die moglichen

Ereignisse zweier Zufallsvariablen nicht zusammengefuhrt, sondern zu einem neuen Ereignis

kombiniert. Dadurch erhalt das Ergebnis eine neue Form. Fur das hier angefuhrte Beispiel

ergibt das kartesische Produkt alle moglichen Ergebnise fur beide Zufallsvariablen. Es gilt:

ΩB × ΩA = (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), . . . , (12, 6)

Dabei steht ein Wertpaar (2, 5) beispielsweise fur das Ergebnis, dass gleichzeitig B = 2 und

A = 5 gilt.

76

8.4.2 Bedingte Wahrscheinlichkeit

Wir stellen die Mengenlehre wieder zuruck und wenden uns wieder den Eintrittswahrschein-

lichkeiten von Ereignissen zu. Fur eine intuitive Erklarung der bedingten Wahrscheinlichkeit

kehren wir zu unserem Beispiel mit der Augensumme beim Werfen zweier Wurfel zuruck. Eine

bedingte Wahrscheinlichkeit bezeichnet dabei immer, dass eine Wahrscheinlichkeit bedingt, also

ein Teilereigniss vorausgesetzt, bereits eingetreten ist. Wurde man beispielsweise zunachst einen

der Wurfel werfen, der dann mit einer Drei nach oben zeigt, (Diese Teilereignis bezeichnen wir

mit X1 = 3.) dann ist eine Augensumme beider Wurfel von Zwei nicht mehr moglich - ganz

egal, welche Zahl der zweite Wurfel anschließend noch anzeigt. Darum gilt:

f(2|X1 = 3) = P (X = 2|X1 = 3) = 0.

Eine Funktion mit bedingter Wahrscheinlichkeit gibt also an, wie wahrscheinlich ein Zufallser-

eignis nach Erhalt neuer Informationen ist. Formal wird das bedingte, also bekannte Ereignis,

immer nach einem Laengsstrich notiert. (Diese Notation gilt nicht nur fur die Wahrscheinlich-

keit. Ein Laengsstrich lasst sich auch in anderem Kontext als”fur den Fall, dass“ interpretieren.)

Wenn sich die Wahrscheinlichkeit fur ein Zufallsereignis mit der Auspragung einer Kompo-

nente nicht verandert, spricht man weiter von einer Unabhangigkeit zweier Ereignisse. Die

Unabhangigkeit und die bedingte Wahrscheinlichkeit sind dabei mit Sicherheit Jedem unter

anderer Begrifflichkeit bereits bekannt und finden sich bereits im Gebrauch der Alltagssprache

haufig wieder. Dazu sei ein banales Beispiel aufgefuhrt. Auch wenn sich naturlich selbst hieruber

streiten lasst, so ist beispielsweise anzunehmen, dass die Wahrscheinlichkeit tagsuber beim Fah-

ren mit dem Auto einen Unfall zu erleiden, unabhangig von der Mondphase. Damit gilt, dass

das Risiko fur einen Unfall bei z.B. Neumond gleich dem Risiko bei jeder anderen Mondphase

ist. Die beiden”Ereignisse“ sind unabhangig. Darum gilt fur die bedingte Wahrscheinlichkeit:

f(Unfall |Mond = Neumond) = P (X = Unfall |Mond = Neumond) = P (X = Unfall).

Weiß man hingegen sicher, dass ein Fahrer bei schlechtem Wetter unterwegs ist, so wurde man

ihm hingegen eine hohere Wahrscheinlichkeit zuschreiben, mit dem Auto zu verunglucken, als

einem Fahrer bei”durchschnittlichem“, beliebigem Wetter.

77

f(Unfall) < f(Unfall |Wetter = Regen)

Nicht anders liest sich die bedingte Wahrscheinlichkeit in allen anderen Bereichen. Nur wird dies

dann zumeist etwas technischer zum Ausdruck gebracht, was aber niemanden weiter verwirren

sollte. An dieser Stelle genugt es, sich zu merken, was es in der Stochastik bedeutet, dass eine

Zufallsvariable bedingt eintritt.

8.4.3 Erwartungswert

Der Erwartungswert ist die mit Eintrittswahrscheinlichkeiten gewichtete Summe aller moglichen

Auspragungen eines Zufallsereignisses. Weniger technisch ausgedruckt: Der Erwartungswert ist

ein Durchschnitt, wobei die Auspragungen nicht gleichberechtigt, sondern zu ihren jeweiligen

Wahrscheinlichkeiten berucksichtigt werden. Als anschauliches Beispiel betrachten wir wieder

die Augenzahl beim Werfen mit zwei Wurfeln. Die Wahrscheinlichkeiten der jeweiligen Aus-

pragungen in Ω wurden dazu bereits bei der Besprechung diskreter Zufallsvariablen beschrie-

ben. Aus der Wahrscheinlichkeitsfunktion f(x) lasst sich fur den Erwartungswert also nach der

obigen Definition berechnen:

E(X) =1

36·2+

2

36·3+

3

36·4+

4

36·5+

5

36·6+

6

36·7+

5

36·8+

4

36·9+

3

36·10+

2

36·11+

1

36·12 = 7.

Die Zahl Sieben ist also der Erwartungswert fur dieses Zufallsereignis. Das ist dabei auch wenig

uberraschend, schließlich haben wir bereits festgestellt, dass dieser Wert auch der haufigste

ist. Allerdings muss der Erwartungswert nicht fur alle Zufallsereignisse den haufigsten Wert

wiedergeben. Betrachten wir beispielsweise wieder das Werfen eines einzelnen Wurfels, so ist

der Erwartungswert:

E(X) =1

6· 1 +

1

6· 2 +

1

6· 3 +

1

6· 4 +

1

6· 5 +

1

6· 6 = 3,5

Naturlich ist es klar, dass ein Wert von 3,5 niemals von diesem Wurfel gezeigt wird. Trotzdem

ist der Wert 3,5 moglichst nahe an allen moglichen, gleich wahrscheinlichen Ergebnissen des

78

Wurfes. Nicht anders ist ein Erwartungswert zu interpretieren: Werden die Ergebnisse des Zu-

fallsereignisses eher hoch sein, wachst auch der Erwartungswert mit. Bei tendenziell niedrigen

Auspragungen, schrumpft der Erwartungswert eines Zufallsereignisses in Richtung dieser Werte.

Fur stetige Zufallsvariablen ist die Interpretation des Erwartungswertes identisch, nur die Be-

rechnung erfolgt etwas anders, namlich durch das Berechnen eines Integrals. Allgemein gilt

daher fur den Erwartungswert diskreter und stetiger Zufallsereignisse:

Diskrete Zufallsvariable: E(X) =n∑

i=1

xi · f(xi)

Stetige Zufallsvariable: E(X) =

∫ ∞

−∞x · f(x) dx

Glucklicherweise lassen sich Erwartungswerte auch durch Rechenregeln umformen. Dabei gelten

leicht modifizierte Regeln wie beim Rechnen mit reelen Zahlen. Am Beispiel eines Wurfes mit

einem Wurfel X und zwei konstanten Werten a = 3 und b = 2 gilt:

E(a + b ·X) = E(a) + E(b) · E(X) = a + b · E(X).

Die Interpretation lasst sich wie folgt formulieren: Frage ich eine beliebige Person welchen Wert

er beim Wurfeln eines einzelnen Wurfels erwartet, wenn er das Ergebnis anschließend noch mit

Zwei multipliziert und den Wert Drei aufaddiert, dann entpricht dies der gleichen Zahl, die sich

ergibt, wenn ich denjenigen nur nach seiner Erwartung fur den gewurfelten Wert befrage und

die Rechnungen anschließend selbst durchfuhre.

Ganz ahnlich verhalt es sich fur das Addieren und Subtrahieren zweier Wurfe X und Y :

E(X + Y ) = E(X) + E(Y ) und E(X − Y ) = E(X) − E(Y ).

Wieder ergibt sich das gleiche Ergebnis, wenn direkt nach der Erwartung fur die Summe der

Wurfel gefragt wird oder wenn sich nach den jeweiligen Erwartungswerten der Wurfel X und

79

Y erkundigt wird und die Addition anschließend selbst durchgefuhrt wird.

Allerdings lassen sich Erwartungswerte nicht multiplizieren. Berechnen wir den Erwartungswert

fur das Produkt zweier Wurfe mit dem gleichem Wurfel X:

E(X2) =1

6· 12 +

1

6· 22 +

1

6· 32 +

1

6· 42 +

1

6· 52 +

1

6· 62 ≈ 15,16 = (3, 5)2 = 12,25.

Eine detailierte, mathematische Besprechung von Erwartungswerten findet innerhalb des Stu-

diums erstmals in den Verantaltungen zur Statistik statt. Hier wollen wir uns vor allem mit

einer Intuition fur das Rechnen mit Erwartungswerten zufrieden geben. Eine solche, intuitive

Auslegung von Erwartungswerten ist in der VWL ubrigens sehr viel ofter ein Thema als man

es zunachst vermuten wurde. Deswegen ist es oft hilftreich, sich zunachst an mogliche intuiti-

ve Erklarungen fur Erwartungswerte zu erinnern, als beim Anblick eines Erwartungsfunktion

sofort einen Taschenrechner zu zucken.

8.4.4 Die Momente einer Wahrscheinlichkeitsverteilung

Oftmals wird ein Erwartungswert mit dem sogenannten Mittelwert einer Verteilung gleich-

gesetzt. Das ist mathematisch aber nicht ganz korrekt. Zwar lasst sich der Mittelwert einer

Zufallsvariable X unmittelbar aus dem Erwartungswert berechnen. Allerdings leiten sich auch

hohere Momente von Verteilungen, die wir nur kurz ansprechen werden, aus dem Erwartungs-

wert ab. Die genaue Bedeutung der Momente einer Zufallsvariablen wird in den Veranstaltungen

zur Statistik besprochen.

Grund fur die haufige Gleichsetzung von Mittel- und Erwartungswert ist die Definition des

Ersteren. Denn fur das Werfen eines Wurfels mit sechs Seiten gilt fur den Mittelwert µX eine

einfache Definition. Dieser sogenanne erste Moment einer Wahrscheinlichkeitsverteilung ent-

spricht schlichtweg dem Erwartungswert von X:

µX = E(X) = 3,5

Genauso berechnen sich hohere Momente der Wahrscheinlichkeit. Die Varianz, der zweite Mo-

ment einer Wahrscheinlichkeitsverteilung, ist ebenso als Rechnung mit Erwartungswerten de-

finiert. Auch wird aus dieser Rechnung klarer, warum der Erwartungswert nur bedingt dem

80

Mittelwert entspricht. Ersterer ist namlich nicht an eine bestimmte Form der Zufallsvariablen

gebunden. Fur die Varianz σ2X eines Wurfelwurfs X gilt

σ2X = E[X−E(X)]2 =

1

6·[1−3,5]2+

1

6·[2−3,5]2+

1

6·[3−3,5]2+

1

6·[4−3,5]2+

1

6·[5−3,5]2+

1

6·[6−3,5]2

mit einem Ergebniss von σ2X ≈ 2,92. Und auch die hoheren Momente - Schiefe und Wolbung

einer Verteilung - berechnen sich mit Hilfe von Erwartungswerten. Die Formeln zur Berechnung

seien an dieser Stelle nur zur Vollstandigkeit aufgefuhrt:

Drittes Moment: E[X − E(X)]3 = 3,5

Viertes Moment: E[X − E(X)]4 = 3,5

An dieser Stelle wollen wir uns aber damit begnugen, den Unterschied zwischen dem Erwar-

tungswert und den vier Momenten einer Wahrscheinlichkeitsverteilung berechnen. Wichtig soll

es fur uns nur sein, zu begreifen, dass ein solcher Unterschied besteht und wie die Berechnung

funktioniert.

81

1 vorwort · tutorium mathematik in den wirtschaftswissenschaften 1 vorwort liebe kommilitoninnen...

Documents