1 vorwort · tutorium mathematik in den wirtschaftswissenschaften 1 vorwort liebe kommilitoninnen...
TRANSCRIPT
Tutorium Mathematik
in den Wirtschaftswissenschaften
1 Vorwort
Liebe Kommilitoninnen und Kommilitonen,
wer hat keine Angst davor, dass seine Mathematikkenntnisse aus der Schule nicht ausreichen,
um ein mathelastiges Studium zu bestreiten? Wer hat nicht schon einen Teil der Methodik
aus den ersten Semestern vergessen, die irgendwann einfach fehlt? Dieses Skript entstand, um
euch die Angst vor dem Mathematikanteil in BWL und VWL zu nehmen und soll als Lern-
und Nachschlagewerk - nicht nur fur Erstsemester - dienen. Zu diesem Zweck wurden zum
Wintersemester 09/10 auch freiwillige Mathematiktutorien eingefuhrt, die keine Erganzung zur
Vorlesung Mathematik fur Wirtschaftswissenschaftler bilden, sondern als separate Lerngruppen
dem Erwerb und der Auffrischung methodischer Kenntnisse dienen sollen. Sollten euch die ma-
thematischen Werkzeuge auf den folgenden Seiten nicht (mehr) gelaufig sein, bieten die Tutorien
eine gute Gelegenheit, eure Lucken ganz unproblematisch zu fullen, bevor diese zum Problem
werden. Wir haben versucht, dieses Skript als ein Leitfaden zu den Tutorien zu gestalten und al-
le gangigen Methoden, die ihr im Laufe eures Studiums benotigen werdet, darzustellen. Auf den
folgenden Seiten findet ihr deshalb die wichtigesten mathematischen Werkzeuge fur BWL und
VWL, angefangen bei den Grundrechenarten bis hin zur Stochastik. Trotz sorgfaltiger Arbeit
erheben wir allerdings nicht den Anspruch auf Vollstandigkeit oder vollkommene Fehlerfreiheit.
Vielmehr hoffen wir, dass dieses Skript im Laufe der Semester aktualisiert und immer weiter
verbessert wird. Im Gegenteil befinden sich einige Passagen noch in der Bearbeitung. Deshalb
begrußen wir Verbesserungen und Vervollstandigungen eurerseits, die dazu fuhren sollen, das
Skript zu einer immer nutzlicheren Hilfe fur moglichst viele Studentinnen und Studenten wer-
den zu lassen.
Eure Vertreter der Fachschaft VWL, Oktober 2009
Version v0.3: 16. Oktober 2010
1
Inhaltsverzeichnis
1 Vorwort 1
2 Grundrechenarten 5
2.1 Addition und Multiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Bruchrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.1 Gleicher Nenner: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 Ungleicher Nenner: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Potenzrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3.1”Ganze“ Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3.2 Rationale Exponenten: Wurzeln . . . . . . . . . . . . . . . . . . . . . . . 8
2.4 Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3 Gleichungen 10
3.1 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2 Aquivalenzumformungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3 Verschiedene Gleichungstypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3.1 Lineare Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3.2 Quadratische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3.3 Kubische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3.4 Bruchgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3.5 Wurzelgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3.6 Binomische Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3.7 Exponentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3.8 Logarithmusgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.4 Beispiel: Das IS-LM-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4 Differentialrechnung 24
4.1 Rechenregeln der Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2 Marginale und diskrete Wertanderungen . . . . . . . . . . . . . . . . . . . . . . 29
4.3 Extremwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4 Krummungsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5 Funktionen mit mehreren Variablen 33
5.1 Ableiten einer Funktion mit mehreren Variablen . . . . . . . . . . . . . . . . . . 33
5.2 Beispiel: Grenzprodukte und Skalenertrage . . . . . . . . . . . . . . . . . . . . . 34
5.3 Extremwerte bei Funktionen mehrerer Variablen . . . . . . . . . . . . . . . . . . 35
5.4 Das totale Differential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2
5.5 Methode nach Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
6 Integralrechnung 41
6.1 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.1.1 Fundamentalsatz der Analysis . . . . . . . . . . . . . . . . . . . . . . . . 42
6.1.2 Bilden von Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . 42
6.2 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.3 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6.4 Beispiel: Konsumentenrente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
7 Matrixalgebra 46
7.1 Warum Matrizen nutzlich sind . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.2 Rechnen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.2.1 Addition und Subtraktion . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.2.2 Matrizen-Multipikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.2.3 Multipikation einer Matrix mit einem Skalar . . . . . . . . . . . . . . . . 50
7.2.4 Transponieren einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.3 Besondere Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.3.1 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.3.2 Nullmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.3.3 Quadratische Matrix und Einheitsmatrix . . . . . . . . . . . . . . . . . . 52
7.4 Zusammenfassung der Rechenregeln der Matrixalgebra . . . . . . . . . . . . . . 53
7.5 Lineare Abhangigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
7.6 Determinanten quadratischer Matrizen . . . . . . . . . . . . . . . . . . . . . . . 55
7.7 Inverse einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
7.7.1 Formale Herleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.7.2 Gauß-Jordan Elimination . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.7.3 Cramer’sche Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
7.8 Beispiel: Herleitung des multivariaten OLS-Schatzers . . . . . . . . . . . . . . . 61
7.8.1 Ableiten der Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
7.8.2 Auflosen der Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8 Stochastik 66
8.1 Begriff der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
8.2 Definition von Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 67
8.2.1 Laplace-Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 67
8.2.2 Axiomatische Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . 68
3
8.3 Diskrete und stetige Zufallsvariablen:
Wahrscheinlichkeits-, Dichte- und Verteilungsfunktion . . . . . . . . . . . . . . . 69
8.3.1 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.3.2 Diskrete Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.3.3 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.4 Rechnen mit Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
8.4.1 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
8.4.2 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.4.3 Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.4.4 Die Momente einer Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . 80
4
2 Grundrechenarten
Da bei manchem Studienanfanger der Schulunterricht vielleicht schon eine Weile zuruck liegt,
wollen wir in diesem ersten einfuhrenden Kapitel zunachst mathematische Grundprinzipien
wiederholen. Wir wollen so jedem Nutzer dieses Skripts ermoglichen, sich die mathematische
Methode”von der Pike“ an in Erinnerung zu holen.
2.1 Addition und Multiplikation
Fur Addition und Multiplikation gelten drei Gesetze:
1. Kommutativgesetz: a + b = b + a
Beispiel: 1 + 2 = 2 + 1 = 3
2. Assoziativgesetz: (a + b) + c = a + (b + c)
Beispiel: (1 + 2) + 3 = 1 + (2 + 3) = 6
3. Distributivgesetz: (a + b) · c = c· a + c· bBeispiel: (2 + 5) · 2 = 2 · 2 + 5 · 2 = 14
2.2 Bruchrechnung
Ein Bruch ist eine Zahl der Form”mn
“. m ist der Zahler, n der Nenner. Ein Nenner n = 0 ist
nicht definiert. Sogenannte”Echte Bruche“ sind Bruche mit m < n. Fur
”unechte Bruche“ gilt
m > n. Bruche mit m = 1 sind Stammbruche. Der Kehrwert bildet sich durch die Vertauschung
von Zahler und Nenner.
Bruchoperationen:
• Erweitern: ab
= a·cb·c = ac
bc; c = 0
5
Beispiel: 23
= 2·53·5 = 10
15
• Kurzen: ab
= a÷cb÷c
Beispiel: 918
= 9÷918÷9
= 12
• Addieren/Subtrahieren
2.2.1 Gleicher Nenner:
ac
+ bc
= a+bc
Beispiel: 56
+ 16
= 11
= 1
2.2.2 Ungleicher Nenner:
Bruche mit ungleichen Nennern mussen auf den gleichen Nenner gebracht werden, bevor
eine Addition oder Subtraktion moglich ist. Hierbei bedient man sich des Erweiterns. Der
Hauptnenner ist das kleinste gemeinsame Vielfache der Nenner.ab
+ cd
= a·db·d + c·b
d·b = ad+cbbd
Beispiel: 14
+ 23
Hauptnenner: 4· 3 = 12
⇒ 1·3+4·24·3 = 11
12
• Multiplizieren: ab· cd
= acbd
• Dividieren: ab÷ c
d= a
b· dc
= adbc
Das Kurzen und Dividieren, sowie Multiplizieren und Erweitern sind zu unterscheiden!
2.3 Potenzrechnung
2.3.1”Ganze“ Exponenten
an: Potenz
n: Exponent
6
a: Basis
an sei eine Kurzschreibweise fur das Produkt∏n a = a · a · . . . · a
Es gelten folgende Definitionen:
• a(pq) = b ⇔ ap = bq
• a−n = 1an
• a1 = a
• a0 = 1
Zusatzlich gelten folgende Operationen:
• b · an + c · an = (b + c) · an
Diese Regel ist einfach eine Verallgemeinerung des Distributivgesetzes.
• am · an = a(m+n)
Wenn die Basen (die a’s) gleich sind, werden diese multipliziert, indem man einfach deren
Exponenten addiert.
• am
an= a(m−n)
Diese Regel lauft analog zur vorhergehenden Regel, nur dass bei einer Division gleicher
Basen die Hochzahlen subtrahiert werden.
• (ab)−n = ( b
a)n
Ist die Hochzahl negativ, so erhalt man einen positiven Exponenten, wenn man Zahler
und Nenner vertauscht. Dieses Ergebnis kann man sehr leicht selbst ausrechnen.
• an · bn = (ab)n
Sind die Basen unterschiedlich, aber die Exponenten gleich, so kann man den Exponenten
herausziehen. Umgekehrt gilt naturlich auch: Sollte man zwei zu multiplizierende Basen
umschreiben wollen, muss man selbstverstandlich bei jeder Basis an den Exponenten
denken.
• (an)m = anm
Und zum Schluss: Wird eine Potenz potenziert, so multipliziert man einfach die Expo-
nenten.
7
2.3.2 Rationale Exponenten: Wurzeln
Wurzeln sind Potenzen mit rationalen Exponenten. Somit ist das Rechnen mit Wurzeln nur
Rechnen mit Bruchen als Hochzahl.n√am = a(
mn)
Beispiele: √a2 = a(
22) = a1 = a
3√a4 = a(
43)√
5√ab3 =
√(ab)(
35) = (ab)(
35· 12) = (ab)(
310
)
Nebenbei: Rechnungen in dieser Ausfuhrlichkeit kosten zwar ein klein wenig mehr Zeit, aber
sie minimieren die Fehlerwahrscheinlichkeit drastisch. Zum Uben und in der Klausur ist diese
Ausfuhrlichkeit auf jeden Fall gerechtfertigt!
Nun sei noch auf das Rationalmachen der Nenner verwiesen:
a√b⇔ a
√b
b
Auch wenn es banal klingt: Ubt das Rechnen mit Wurzeln! Unsicherheiten mit solchen Grund-
operationen konnen in Klausuren viele Punkte kosten, die leicht verdient waren.
8
2.4 Logarithmen
Hier betrachten wir nun allein die Rechenregeln zum Logarithmus. Was ein Logarithmus kon-
kret ist oder woher die zunachst unverstandlichen Rechenregeln uberhaupt kommen, wird spater
noch erlautert. Hier beschranken wir uns zunachst nur auf den ”naturlichen Logarithmus”.
Die Gleichung ax = b ist nur durch den Logarithmus losbar:
ax = b| ln
⇒ x · ln a = ln b
⇔ x =ln b
ln a
Diese Regel ist manchen noch aus der Oberstufe gelaufig. Die Nutzlichkeit und seine Praktika-
bilitat gewinnt der Logarithmus durch diese Beziehung:
ln(bmcn) = m ln b + n ln c
ln(bm
cn) = m ln b− n ln c
Diese Beziehung bedeutet nichts anderes als den Ausdruck einer Multiplikation durch eine
Addition. Fur diejenigen, die sich an Rechengesetzte wie die”Produktregel“ in der Differenti-
alrechnung erinnern, wissen, wie wertvoll es sein kann, einen multiplikativen Zusammenhang
additiv ausdrucken zu konnen.
Der naturliche Logarithmus ist sehr eng mit der Eulerzahl e verbunden. Es gilt namlich:
ex = b ⇒ x = ln b
Es gilt vor allem ln e = 1.
9
3 Gleichungen
Durch Gleichungen lassen sich quantitative, also zahlbare, Beziehungen zwischen verschiedenen
Variablen beschreiben. Das Beschreiben solcher Zusammenhange spielt in den Wirtschaftswis-
senschaften eine große Rolle. Dazu betrachten wir ein einfaches Beispiel: Verkauft eine Eisdiele
an einem Tag y Kugeln Eis zu einem Preis von p, dann ist es nur logisch, dass sich der Umsatz
durch Multiplikation der beiden Großen berechnen lasst. Verkauft die Eisdiele also konkret 200
Kugel Eis fur je 0,5 Euro, so betragt der Umsatz 100 Euro. Der Umsatz ist also sowohl von Preis
und Verkaufsmenge abhangig. Eine Gleichung ist dabei nichts weiter als die”Ubersetzung“ ei-
nes solchen, beschriebenen Sachverhaltes in eine formale Notation. Im Beispiel unserer Eisdiele
konnen wir den Umsatz U folgendermaßen beschreiben:
U = p · y
Fur die zuvor gewahlten Zahlen betragt der Umsatz also U = 200 · 0,5 = 100 wie wir es bereits
verbal beschrieben haben. In den Wirtschaftswissenschaften werden naturlich haufig weitaus
komplexere Probleme analysiert. Allgemein erfreut sich die Beschreibung dieser Probleme mit
Hilfe mathematischer Schreibweisen großer Beliebtheit. Dies liegt an unter anderem an zwei
wesentlichen Vorteilen dieser Methodik, die sich aber auch in unserem einfachen Beispiel bereits
offenbaren:
• Formale Schreibweisen sind sehr kompakt: Die formale Notation lasst sich fur einen
geubten Leser deutlich schneller lesen als die Schilderung eines Sachverhalts durch einen
langen Aufsatz. Dazu erlaubt die Mathematik im Gegensatz zu einer verbalen Erlauterung
keine mehrdeutige Interpretation durch einen dritten Leser.
• Gleichungen haben trotzdem immer eine nichtmathematische Intention. In der Okonomie
mussen Gleichungen wie der Zusammenhang zwischen Umsatz, Preis und Verkaufsmenge
okonomisch und nur sehr selten mathematisch begrundet werden. Alle Zusammenhange,
die sich aus Kombination der zu Beginn als gegeben angenommenen Gleichungen durch
Anwendung der mathematischen Gesetze ableiten lassen sind ebenfalls richtig und haben
eine okonomische Bedeutung.
Bei der obigen Gleichung handelt es sich bereits um eine Funktion und damit um einen speziellen
Typen einer Gleichungen. Allgemein lassen sich Gleichungen in drei verschiedene Grundtypen
unterteilen, die im Folgenden kurz aufgefuhrt sind.
10
1. Identitaten: Bei Identitaten last sich durch Umformen einer Seite der Gleichung immer
der Inhalt der anderen Seite replizieren. Somit waren Gleichungen wie z.B. a = a eine
triviale Identitat. Andere Beispiele fur Identitaten sind:
• an · am = an+m
• ln(x · y) = ln x + ln y
• 3 + 4 = 7
2. Bestimmungen: Bei Bestimmungen lassen sich unbekannte Werte der Gleichung durch
Auflosen nach diesen Werten errechnen. Haufig ist dazu eine Umformung von Noten.
Beispiele sind:
• x + 1 = 7
• 4x = 5
• ln x = 1 + x
3. Funktionen: Mit Funktionen werden Werte einer abhangigen Variablen durch Werte von
anderen, unabhangigen Variablen beschrieben. So war es zum Beispiel mit dem Umsatz
der Fall. Der Umsatz, die abhangige Variable, ist durch die Werte von Preis und Verkaufs-
menge festgelegt, die wir hier als unabhangig angenommen haben. Somit ist Der Umsatz
eine Funktion von Preis und Verkaufsmenge. Wie das Beispiel schon naheliegt sind Funk-
tionen fur die Wirtschaftswissenschaften sehr wichtig. Wir werden Funktionen im folgen-
den Verlauf dieses Skriptes deshalb noch naher betrachten. Andere (nicht-okonomische)
Beispiele fur Funktionen sind:
• y = x2 + 2
• y = sin x
• y = ex2
+ x
3.1 Funktionen
Eine Funktion beschreibt immer eine Input-Output-Beziehung. So ist unser Umsatz U wie
bereits erwahnt, eine Funktion der Variablen Preis (p) und Verkaufsmenge (y). Die beiden
zuletztgenannten Variablen sind hierbei der (exogene, also von außen vorgegebene) Input.
Der Umsatz, das Ergebnis der Funktion, ist der (endogene, also durch Anwendung unseres
11
Modells beschriebene) Output, der sich aus diesem Input errechnen lasst. Man beschreibt eine
solche allgemeine Input-Output-Beziehung in der Mathematik auch mit
U = f(p, y)
wobei der Autor damit lediglich zum Ausdruck bringen will, dass U eine (bisher noch nicht
spezifizierte) Funktion (hier f) der Werte p und y ist. Eine solche allgemeine Funktion lasst
sich nun genauer definieren. Der Umsatz ist, wie uns bereits bekannt, einfach das Produkt der
beiden Variablen. Also setzen wir:
f(p, y) := p · y
Mit dem Doppelpunkt vor dem Gleichheitszeichen signalisieren wir dem Leser unserer Formel,
dass wir die obige, spezielle Funktionsform an dieser Stelle zum ersten Mal (selbst) definieren.
Wir mochten ihn dadurch darauf aufmerksam machen, dass dieser Zusammenhang zuvor noch
nicht bekannt war und insbesondere nicht nach den allgemeinen, mathematischen Gesetzen gilt.
In den Wirtschaftswissenschaften ist es dabei wichtig, sich den Unterschied zwischen einer
Funktion und einfachen (exogenen) Variablen immer vor Augen zu halten. In vielen Aufsatzen
und Skripten sind diese beiden Variablentypen namlich nicht immer in ihrer Notation zu unter-
scheiden. Wollte man zum Beispiel den Gewinn unserer Eisdiele errechnen, so ware der Gewinn
(π) widerum eine Funktion von Umsatz abzuglich der Kosten. Definieren wir die Kosten mit
K = g(x) := x2 so liese sich der Gewinn mit
π = h(U,K) := U −K
beschreiben. Hier ist der Gewinn aber nicht von zwei Variablen sondern von zwei Funktionen
abhangig, die selbst widerum durch (exogene) Variablen erklart werden. Sauberer konnte man
auch schreiben: π = h(U,K) := U(p, x) − K(x). Allerdings verzichten viele Autoren auf ei-
ne solche explizite Darstellung. Dass Funktionen hier mit Großbuchstaben markiert sind und
Variablen durch Kleinbuchstaben soll hier lediglich der einfacheren Lesbarkeit im weiteren Ver-
lauf des Skriptes dienen und wird in der Literatur in dieser Prazision selten befolgt. Außerdem
ist darauf zu achten, dass Funktionen nicht immer so deutlich wie oben dargestelt definiert
werden, sondern dass sich diese Eigenschaft manchmal lediglich aus dem Kontext verstehen
lasst. Wurden wir beispielsweise, wie zu Beginn dieses Kapitels, einfach behaupten, dass der
Umsatz durch ein Produkt aus Preis und Verkaufsmenge ist, hatten wir sinngemaß ebenfalls
eine Funktion definiert.
Formal korrekter werden Funktionen haufig auch als explizite Abbildung eines Werteraums auf
einen anderen Werteraum aufgeschrieben. Inhaltlich macht dies keinen Unterschied, allerdings
sind viele Studenten mit dem Lesen solcher Formalisierungen nicht vertraut. Aus diesem Grund
12
wollen wir an dieser Stelle bereits kurz auf die Mengenlehre, die in den spateren Kapiteln noch
im Detail beschrieben ist, vorgreifen. Hier soll zunachst nur kurz dargestellt werden, wie die
Beschreibung einer Abbildung allgemein zu interpretieren ist. Unsere als Beispiel genutzte,
allgemeine Funktion fur den Umsatz (U = f(p, x)) liese sich als Abbildung folgendermaßen
notieren:
f :R+0 × N+
0 → R+0
Diese Darstellung sieht auf den ersten Blick sehr kompliziert aus, ist aber eigentlich sehr trivial.
Diese Formel liest sich wie folgt: Die Funktion f kombiniert (×) jede beliebige, positive reele
Zahl (R+0 ) mit einer beliebigen positiven naturlichen Zahl (N+
0 ). Als Ergebnis (→) ergibt sich
daraus widerum eine beliebige, positive reele Zahl (R+0 ). An unserem Beispiel also konnte ein
Leser aus dieser Notation sinngemaß erkennen, dass sich aus der Funktion f der Preis mit der
Absatzmenge zu dem Umsatz als Ergebnis kombinieren lasst. Dass aber eine Multiplikation vor-
genommen wird oder welche andere spezielle Form die Funktion annimmt, lasst sich aus dieser
Schreibweise nicht erkennen. Allerdings sind die Wertbereiche der Variablen aus der Definition
einer Abbildung zu erkennen. Wir wissen also, dass fur die Verkaufsmenge nur Ganzzahlen
erlaubt sind. Dass Preis und Umsatz hingegen auch Kommastellen zulassen.
3.2 Aquivalenzumformungen
Existierende Gleichungen, nicht nur Funktionen, lassen sich grundsatzlich beliebig um neue
Elemente erweitern oder um bestehende Elemente kurzern. Dadurch wollen wir den Zusam-
menhang der Zahlen und Variablen kompakter darstellen oder Ergebnisse hervorheben. Die
eigentliche Aussage oder Gultigkeit einer Gleichung wird dabei nicht verandert. Dieses, vie-
len sicherlich noch aus der Schulmathematik bekannte, Konzept wird mit Hilfe sogenannter
Aquivalenzumformungen umgesetzt.
Als Beispiel betrachten wir den beliebig gewahlten Term: x − a = b. Um hieraus z.B. x zu
bestimmen greifen wir auf die Aquivalenzumformung zuruck: Wir wollen ein Ergebnis im Sinne
von: x = . . . erhalten.
x− a = b | + a
⇔ (x− a) + a = b + a
⇔ x = b + a
13
Mit Hilfe des Pfeilsymbols ⇔ verdeutlichen wir dabei, dass es sich um eine Aquivalenzumformung
handelt; wir also lediglich die Darstellung der Gleichung verandert haben und sich die vorherige
und aktuelle Zeile im eigentlichen Inhalt nicht unterscheiden. Wollen wir dem Leser außerdem
deutlich machen, welches Element wir in der nachsten Zeile auf beiden Seiten hinzufugen oder
entfernen, so schreiben wir die Rechenoperation hinter einen Lamngsstrich (|) an die rechte
Seite der Gleichung. Letzteres ist in der Literatur oder auch in Skripten allerdings unublich.
Analog funktionieren solche Aquivalenzumformungen fur die Subtraktion, was am folgenden
Beispiel verdeutlicht sein soll:
x + a = b | − a
⇔ (x + a) − a = b− a
⇔ x = b− a
Das Gleiche funktioniert naturlich auch bei multiplikativen Verknupfungen:
x
a= b | · a
⇔ x
a· a = b · a
⇔ x = b · a
Oder auch fur die Division:
a · x = b | : a
⇔ a · xa
=b
a
⇔ x =b
a
3.3 Verschiedene Gleichungstypen
Leider sind Gleichungen nur selten so einfach losbar wie wir es im vorherigen Abschnitt beschrie-
ben und gezeigt haben. Das Losen von komplexeren Gleichungen erfordert die im folgenden
beschriebenen Theorie, aber auch viel Ubung und ein Auge fur den nachsten Losungsschritt.
Macht euch aber keine Sorgen: Das Losen von Gleichungen ist keine rocket science sondern
14
erfordert lediglich Routine und kann von Jedem erlernt werden. Lasst euch deshalb bitte nicht
frustrieren, wenn ihr nicht von Anfang an selbststandig auf alle Losungen der in den Vorlesung
gerechneten Aufgaben kommt. Wie fast immer macht Ubung auch hier den Meister.
3.3.1 Lineare Gleichungen
Lineare Gleichungen sind die einfachste Form von Gleichungen. In solchen Gleichungen steht
die unbekannte Variable, nach der wir auflosen wollen und die wir hier immer mit x bezeichnen
wollen, mit der Hochzahl Eins. (x1 = x) Jede lineare Gleichung lasst sich deshalb in der Form
a ·x+ b = 0 beschreiben, wobei a und b beliebige reele Zahlen sind und a = 0. Die Losung einer
linearen Gleichung ist deshalb trivial immer: x = − ba. Wir verdeutlichen dies an folgendem
Beispiel:
5(x + 2) = −3(x− 6)
⇔ 5x + 10 = −3x + 18 | + 3x
⇔ 8x + 10 = 18 | − 10
⇔ 8x = 8 | : 8
⇔ x = 1
Wer sich, insbesondere bei komplexeren Gleichungen, unsicher ist, ob das Ergebnis stimmt,
kann abschließend eine Probe durchfuhren. Nur wenn das Einsetzen des Ergebnisses in jede
Seite der ursprunglichen Gleichung indentisch ist, stimmt das errechnete Ergebnis.
3.3.2 Quadratische Gleichungen
Quadratische Gleichungen sind algebraische Gleichungen, in denen hochstens die zweite Potenz
vorkommt. Die unbekannte Variable, auch hier wieder mit x bezeichnet, darf also Hochstens mit
der Hochzahl Zwei notiert sein. (x2) Gleichzeitig darf x aber auch mit der Hochzahl Eins in der
Gleichung vorkommen. Jede quadratische Gleichung lasst sich deshalb in der Form ax2+bx+c =
0 mit a = 0 aufschreiben.
15
Solche quadratische Gleichungen konnen einfach mit der sogenannten Mitternachtsformel oder
der p-q-Formel gelost werden. Beide Arten der Losung sind zur Losung quadratischer Gleichun-
gen geeignet. Die Mitternachtsformel lautet:
x1,2 =−b±
√b2 − 4ac
2a
Dazu betrachten wir beispielhaft eine beliebig gewahlte Gleichung:
3x2 − 18x + 13 = 4 + 2x
Diese Gleichung mussen wir zunachst auf eine der Seiten auflosen. Wir bringen deshalb durch
Subtraktion beziehungsweise Addition alle Terme auf die linke Seite. Es folgt:
3x2 − 18x + 23,25 = 4 + 2x | − 4 − 2x
⇔ 3x2 − 20x + 19,25 = 0
Zur Losung dieser quadratische Gleichung nach x lasst sich nun die Mitternachtsformel anwen-
den. Dazu lassen sich durch simples Ablesen die Werte fur a, b und c bestimmen. Diese sind
nach der obigen Gleichung a = 3, b = −20 und c = 19,25. Diese Werte setzen wir nun in die
Mitternachtsformel ein:
x1,2 =−(−20) ±
√(−20)2 − 4 · 3 · 19,25
2 · 3
⇔ =20 ±
√400 − 231
6
⇔ =10
3± 13
6
Diese Losung besagt, dass die quadratische Gleichung zwei Nullstellen besitzt. Fur die erste
Losung werden beide Ausdrucke addiert. Fur die zweite Losung wird der zweite Ausdruck vom
ersten Ausdruck subtrahiert. Damit hat die Gleichung Nullstellen an den Punkten:
x1 =10
3+
13
6≈ 5,5
x2 =10
3− 13
6≈ 1,167
Betrachten wir nun die selbe Gleichung mit der p-q Formel. Die p-q Formel lautet
x1,2 = −p
2±√
(p
2)2 − q
Um zu wissen, welche der beiden Formeln man anwenden soll, muss man zwischen allgemeiner
Form und Normalform unterscheiden. Eine quadratische Gleichung in allgemeiner Form wurde
16
oben bei der Mitternachtsformel behandelt (ax2 + bx + c = 0). Die Normalform erhalt man,
indem man die quadratische Gleichung in allgemeiner Form durch a dividiert. Also:
x2 +b
ax +
c
a= 0
. Fur die p-q Formel werden ba
= p und ca
= q gesetzt. Die Normalform ist also
x2 + px + q = 0.
Betrachtet man unsere quadratische Gleichung aus dem Beispiel, 3x2 − 20x + 19,25 = 0, so
muss hier zuerst die Gleichung durch das a geteilt werden. In diesem Fall ist a = 3, also ergibt
sich
x2 − 20
3+
19,25
3= 0.
Nun ist die quadratische Gleichung in Normalform und die p-q Formel kann verwendet werden.
Hier setzt man wieder sturr ein:
x1,2 = −−20
3
2±
√(−20
3
2)2 − 19,25
3
Selbstverstandlich sind die Ergebnisse fur x1 und x2 die selben wie bei Anwendung der Mit-
ternachtsformel. Welche Formel man verwendet, ist eine Frage der Gewohnung und des Ge-
schmacks.
Je nach Art der Gleichung konnen quadratische Terme auch keine Nullstellen besitzen. Das
ist immer dann der Fall wenn der Ausdruck unter der Wurzel der Mitternachtsformel negativ
ist und ein Ergebnis damit nicht definiert ist. Sofern der Term unter der Wurzel Null zum
Ergebnis hat, besitzt eine Gleichung nur eine Nullstelle. Mehr als zwei Nullstellen sind fur
einen quadratischen Ausdruck nicht moglich.
3.3.3 Kubische Gleichungen
Als kubische Gleichung bezeichnet man eine Gleichung, in der die unbekannte Varbiable x in
keiner hoheren Potenz als der dritten vorkommt. (x3) Sie haben also die folgende Form:
ax3 + bx2 + cx + d = 0, a = 0
Solche Gleichungen werden in der Praxis zumeist mit Hilfe von Computerprogrammen gelost. In
den Veranstaltungen unseres Studiums hingegen werden kubische Gleichungen zumeist vermie-
den. Der Grund hierfur ist, dass es kein einfaches Losungsverfahren fur Gleichungen dieser Art
gibt und die Mathematik viel Zeit verbrauchen wurde. Die einzigen manuellen Moglichkeiten
zur Losung sind die folgenden:
17
• Fur den Fall d = 0 wird schlichtweg ein x ausgeklammert. Somit reduziert sich die vormals
kubische Gleichung zu x · (ax2 + bx + c) = 0. Die erste triviale Losung der Gleichung ist
x = 0. Aus der Klammer erhalten wir weiterhin eine quadratische Gleichung, die nach dem
eben besprochenen Verfahren gelost werden kann. Alle Nullstellen dieser quadratischen
Gleichung sind auch Nullstellen der ursprunglichen, kubischen Gleichung.
• Ist d = 0 muss zur Bestimmung aller Nullstellen hingegen eine Losung bekannt sein.
Anschließend wird eine sogenannte Polynomdivision durchgefuhrt, die hier aber auf Grund
der geringen Relevanz nicht besprochen werden soll.
3.3.4 Bruchgleichungen
Wenn in einer Gleichung eine Variable im Nenner eines Ausdruckes auftritt, dann spricht man
von sogenannten Bruchgleichungen. Um solche Gleichungen zu losen mussen die Variablen
im Nenner einfach beseitigt werden. Deshalb wird die Gleichung auf beiden Seiten mit dem
sogenannten Hauptnenner multipliziert. Der Hauptnenner ist dabei derjenige Term, welcher
alle Ausdrucke der Gleichung enthalt fur die gilt, dass sie im Nenner stehen und die gesuchte
Variable beinhalten. Zur Veranschaulichung betrachten wir eine Beispielgleichung:
x + 1
x− 1=
2x− 1
x
Der Hauptnenner dieser Gleichung setzt sich, wie erklart, aus den Ausdrucken im Nenner beider
Seiten zusammen. Dieser Ausdruck ist:
x · (x− 1)
Multipliziert man nun den Hauptnenner mit beiden Seiten erhalt man die folgende Gleichung:
x · (x + 1) = (2x− 1) · (x− 1)
Losen wir die Klammer auf und bringen alle Ausdrucke auf eine Seite erhalten wir das folgende
Ergebnis:
x · (x + 1) = (2x− 1) · (x− 1)
⇔ x2 − 4x + 1 = 0
Das Losungsverfahren fur solche quadratische Losungen ist uns bereits bekannt. Unter Verwen-
dung der Mitternachtsformel konnen wir losen:
x1,2 = 2 ±√
4 − 1
x1 = 2 +√
3 ≈ 3,73
x2 = 2 −√
3 ≈ 0,27
18
Allerdings ist eine letzte Einschrankung fur diese Losung zu beachten. Es ist moglich, dass die
berechneten Ergebnisse in der Ursprungsgleichung eine Definitionslucke treffen. Das ware dann
der Fall wenn durch Verwenden der Losung in einem Bruch eine Division durch Null verursacht
wurde, welche bekanntlich nicht definiert ist. Dann ware das berechnete Ergebnis in Folge keine
gultige Losung. Das ist in unserer Beispielgleichung allerdings nicht der Fall.
3.3.5 Wurzelgleichungen
Eine Gleichung, bei der eine Variable unter einer Wurzel (oder mit einer anderen Hochzahl 0 <
p < 1 versehen) steht, ist eine sogenannte Wurzelgleichung. Zur Erlauterung des zugehorigen
Losungsverfahrens betrachten wir ein Beispiel:
5 +√x + 1 = 8
Um eine solche Gleichung zu losen, isolieren wir den Ausdruck mit der Variable unter der
Wurzel auf eine Seite:√x + 1 = 3
Anschließend quadrieren wir den Wurzelausdruck, um die Wurzel zu entfernen:
x + 1 = 32
⇔ x = 8
Allerdings ist auch hier wieder darauf zu achten, dass die errechneten Ergebnisse keine Losung
fur die Ursprungsgleichung sein mussen. Sofern das Ergebnis einen negativen Ausdruck unter
der Wurzel verursacht, ware die Nullstelle widerum nicht definiert.
Anmerkung: Wenn man eine Gleichung betrachtet, bei der die Seiten quadriert werden, muss
man eine wichtige Sache beachten, die, wie die Erfahrung gezeigt hat, oft falsch gemacht wird.
Betrachtet man zum Beispiel die Wurzelgleichung√x2 + 5 = x + 12.
Nun quadriert man die Gleichung und erhalt
(x2 + 5)12·2 = (x + 12)1·2
Leider wird die rechte Seite oftmals falsch umgeschrieben. Der Ausdruck ist namlich nicht
x2 + 122! (x + 12)2 ist per Definition (x + 12) · (x + 12). Eine solche Form muss eigentlich
ausmultipliziert werden. Um das nicht standig tun zu mussen (große Fehlerquelle!) hat wahr-
scheinlich jeder in der Schule die sogenannten binomischen Formeln auswendig lernen mussen,
die wir im nachsten Abschnitt zeigen.
19
3.3.6 Binomische Formeln
Binomische Formeln sind nutzliche Werkzeuge zum Losen und Vereinfachen von Termen in der
Form (a ± b)n. In den Wirtschaftswissenschaften sind diese Formeln fast ausschließlich in der
quadratischen Ausfuhrung zu finden. Die binomischen Formeln lauten hier:
1. (a + b)2 = a2 + 2ab + b2
2. (a− b)2 = a2 − 2ab + b2
3. (a− b)(a + b) = a2 − b2
Durch binomische Formeln lassen sich unter anderem auch hochdimensionale Gleichungen losen,
die andernfalls ein komplexeres Losungsverfahren erfordern wurden. Betrachten wir dazu als
Beispiel die folgende Gleichung.
4x4 − 8x2 − 5 = 0
Durch Anwendung der oben als zweites notierten binomischen Formel mit a = 2x2 und b = 2
konnen wir die folgende Umformung durchfuhren:
4x4 − 8x2 − 5 = 0
⇔ 4x4 − 8x2 + 4 − 9 = 0
⇔ (2x2 − 2)2 = 9
⇔ 2x2 − 2 =√
9
⇔ x2 = 52
⇔ x =√
2,5
Naturlich gibt es auch fur die n-te Potenz eine allgemeine Form der binomischen Formeln. Die
allgemeine Form wirkt allerdings sehr abschreckend, weswegen wir sie hier nicht zeigen.
3.3.7 Exponentialgleichungen
Gleichungen, in denen eine Variable im Exponenten steht, nennt man Exponentialgleichung.
Exponentialgleichungen lassen sich in aller Regel nie exakt losen, außer wenn die Variablen
ausschließlich in Exponenten vorkommen. In diesem Fall fuhrt am einfachsten eine Umformung
20
durch einen Logarithmus zum Erfolg. Dazu versucht man zunachst die Ausdrucke mit dem
Exponenten zu isolieren. Als Beispiel betrachten wir die folgende Gleichung:
5x + 1 = 3
⇔ x ln 5 = ln (3 − 1) | ÷ ln 5
⇔ x = ln 2ln 5
Eine Gleichung in denen die Variablen nicht ausschließlich in den Exponenten vorkommen,
lasst sich hingegen nicht nach dem vorgestellten Verfahren losen. Sucht man beispielsweise eine
Losung fur eine Gleichung wie
2x = x + 1
so lasst sich eine solche nur durch Naherungsverfahren wie z.B. das Newtonverfahren losen. Da
solche Verfahren in den Wirtschaftswissenschaften aber nur eine geringe Rolle spielen wollen
wir an dieser Stelle allerdings nicht naher auf diese Methoden eingehen.
3.3.8 Logarithmusgleichungen
Befindet sich eine Variable im Argument eines Logarithmus, dann betrachten wir eine Logarith-
musgleichung. Sind diese Ausdrucke nicht durch schlichte Umformungen auflosbar, so mussen
die Gleichungen durch geeignete Substitutionen, wie im folgenden besprochen, in eine losbare
Form gebracht werden. Treten Variablen hingegen nicht ausschließlich in den Logarithmen auf,
so ist die Gleichung wie zuvor nur durch Naherungsverfahren losbar, die hier nicht besprochen
werden. Wir betrachten zur Verdeutlichung des Losungsverfahrens ein Beispiel:
ln x2 = 2 ln (3x + 1)
⇔ lnx2 = ln (3x + 1)2
Da ein Logarithmus sogenannte injektive Eigenschaften1 mussen beide Ausdrucke fur den Loga-
rithmus ebenfalls gleich sein, damit die oben beschriebene Gleichheit erfullt sein kann. Daraus
folgt:
x2 = (3x + 1)2
⇔ x = −12
1Eine Funktion ist injektiv, wenn man von der Gleichheit der Funktionswerte darauf schließen kann hat,
dass die eingesetzten Werte die gleichen waren. Interessierte konnen sich den Begriff der Surjektivitat auch mal
naher anschauen
21
3.4 Beispiel: Das IS-LM-Modell
Der Großteil der Veranstaltung Makrookonomie I setzt ein gutes Grundverstandnis im Umgang
mit Gleichungen voraus. Deswegen wollen wir beispielhaft eine zentrale Gleichung aus einem
Modell der Veranstaltung diskutieren. Diese lautet:
Y = C + I + G
Diese Gleichung ist eine Identitat und besagt das Folgende: Das Einkommen einer Okonomie
(Y ) soll sich aus dem Konsum (C), den Investitionen (I) und den Staatsausgaben (G) zusam-
mensetzen. Diese Komponenten sind im Modell selbst widerum als Identitaten definiert. Der
Konsum sei C = c0+c1(Y −T ), die Investitionen seien I = b0+b1Y −b2i und die Staatsausgaben
seien G = g1Y = T , wobei T die Steuern reprasentieren. Es soll im Folgenden aber nicht die
Intuition der Gleichungen diskutiert werden, dafur wollen wir uns auf die algebraischen Eigen-
schaften der Gleichungen konzentrieren. Ziel der Ubung ist es, einen Wert fur Y zu bestimmen,
der nur von den exogenen Variablen erklart wird. Durch simples Einsetzen dieser Identitaten
konnen wir Y zunachst zu
Y = c0 + c1(Y − g1Y ) + b0 + b1Y − b2i + g1Y
auflosen. Bis auf den im IS-LM-Modell endogenen Zins i und das zu bestimmende Einkommen
Y sind all diese Variablen nach Aussage des Modells exogen bestimmt. Der Zins (i) wird dabei
auf dem Geldmarkt festgesetzt. Die Geldnachfrage sei durch
M
P= d1Y − d2i
gegeben. Diese Gleichung besagt inhaltlich: M ist die exogene Geldmenge, P das exogene Preis-
niveau. Die Variable d1 bezeichnet dabei die sogenannte Einkommensreagibilitat der Geldnach-
frage, d2 die Zinsreagibilitat. Auch diese Variablen sind exogen. Da wir bereits eine Gleichung
kennen, in welcher nur i und Y unbekannt sind konnen wir durch Einsetzen einer Gleichung in
die andere ein definitives Ergebnis fur diese Variablen bestimmen. Dafur wollen wir zunachst
die zweite Gleichung, die des Geldmarktes, nach i auflosen:
M
P= d1Y − d2i
⇔ d2i = d1Y − MP
| · 1
d2⇔ d2
d2i = 1
d2d1Y − 1
d2MP
⇔ i = d1d2Y − M
d2P
Somit haben wir einen Ausdruck fur i erhalten den wir im weitren Rechenvorgang verwenden
konnen. Es folgt durch Einsetzen in die zuerst besprochene Gleichung:
Y = c0 + c1(Y − g1Y ) + b0 + b1Y − b2(d1d2
Y − M
d2P) + g1Y
22
Dieser Term entspricht nun allerdings noch nicht dem gesuchten Ergebnis. Die unbekannte und
von uns zu bestimmende Variable Y steht namlich noch auf beiden Seiten der Gleichung. Diesen
Fehler wollen wir deshalb schrittweise beseitigen.
Zunachst multiplizieren wir die Klammern aus:
Y = c0 + c1Y − c1g1Y + b0 + b1Y − b2d1d2
Y + b2M
d2P+ g1Y
Nun bringen wir durch Addition beziehungsweise Subtraktion alle Y auf die linke Seite der
Gleichung:
Y − c1Y + c1g1Y − b1Y + b2d1d2
Y − g1Y = c0 + b0 + b2M
d2P
Nun konnen wir Y ausklammern:
Y (1 − c1 + c1g1 − b1 + b2d1d2
− g1) = c0 + b0 + b2M
d2P
Zum Schluss mussen wir nur noch Y isolieren also alle ubrigen Variablen auf die rechte Seite
bringen:
Y =1
1 − c1 + c1g1 − b1 + b2d1d2
− g1(c0 + b0 + b2
M
d2P)
Damit haben wir das sogenannte gesamtwirtschaftliche Gleichgewicht im IS-LM-Modell her-
geleitet: Wir haben also einen Wert fur Y bestimmt, der durch ausschließlich exogene Varia-
blen beschrieben wird. Dessen okonomische Bedeutung wird noch in der zugehorigen VWL-
Veranstaltung besprochen. An dieser Stelle sollte die rein algebraische Herleitung durch Ein-
setzen und Aufosen veranschaulicht werden.
23
4 Differentialrechnung
Mit der Differentialrechnung, vielen aus Schulzeiten sicher noch mit Bezeichnung das Ableiten
bekannt, lasst sich bestimmen wie sensibel das Ergebnis einer Funktion auf eine Veranderung
seiner Input-Werte reagiert. Anders gesagt lasst sich mit der Differentialrechnung also bestim-
men in welche Richtung und mit welcher Starke eine Variable y = f(x) sich andert wenn wir
den Eingabewert x variieren. Dabei ist y = f(x) eine zunachst noch unspezifizierte Funktion
mit einer einzigen unabhangigen Variable x, die den Wert von y bestimmt. Die Ableitung einer
solchen Funktion, haufig notiert mit f ′(x), zeigt dabei genauer gesagt an, in welchem relativen
Verhaltnis sich y bei einer Anderung des x-Wertes verandert. Es sind hierfur aber auch folgende
alternative Schreibweisen ublich:
f ′(x) =dy
dx= fx(x)
Alle diese Schreibweisen sind in den Wirtschaftswissenschaften gebrauchlich und bringen den
oben beschriebenen Zusammenhang gleichwertig zum Ausdruck. Zum naheren Verstandnis kon-
kretisieren wir nun unsere Funktion f(x), um zuerst die Intuition der Differentialrechnung zu
verstehen. Erst anschließend werden dann die zugehorigen Rechenregeln erlautert.
Wir betrachten deshalb die beliebig gewahlte Funktion y = f(x) mit f(x) := 4·x. Wie verandert
sich hier der Wert von y wenn wir den Wert von x um eine Werteinheit erhohen? Beim Betrach-
ten der Funktion zeigt sich schnell: Naturlich verandert sich y um genau 4 Werteinheiten wenn
x um 1 wachst. Erhoht man beispielsweise x von x = 1 auf x = 2 so wachst der Funktionswert
y von y = 4 · 1 = 4 auf y = 4 · 2 = 8 um eben jene 4 Werteinheiten. Damit wachst der Wert
von y also viermal so schnell wie der Wert von x. Diesen soeben verbal erklarten Zusammen-
hang wurde auch die Differentialrechnung anzeigen. Deshalb gilt aus unserer Intuition fur die
Ableitung:
f ′(x) = (+) 4
Naturlich ist dieser Anstieg nur bei einer solch trivialen Funktion mit dem bloßen Auge er-
kennbar. Außerdem sind die Wertanderungen fur eine nicht-lineare Funktion wie zum Beispiel
g(x) = x2 auch nicht mehr fur alle Werte von x konstant wie es in unserem einfachen Bei-
spiel der Fall war. Aus diesem Grund nutzen wir die Rechengesetze der Differentialrechnung,
um zuverlassig allgemeine Ableitungen fur komplexere Funktionen zu berechnen. Diese in den
Wirtschaftswissenschaften sehr haufig gebrauchten Rechengesetze wollen wir im folgenden Ka-
pitel wiederholen.
24
4.1 Rechenregeln der Differentialrechnung
Die Regeln zur Ableitung mochten wir hier kurz mit jeweils einem Beispiel vorstellen.
• Konstante Funktion
Wir betrachten eine Funktion f(x) = a wobei a hier einen fixierten Wert reprasentiert;
einen exogenen Wert also, der sich innerhalb der Funktion niemals andert. Der Wert x
kommt in der Funktion f(x) folglich uberhaupt nicht vor. Konsequenterweise ist auch die
Ableitung f ′(x) = 0. Dadurch wird nur naheliegendes zum Ausdruck gebracht: Wenn sich
x andert, verbleibt y bei seinem Ausgangswert. Die Variable y verandert sich also um das
nullfache von x. Beide Variablen stehen also in keinem Zusammenhang und die Ableitung
ist Null.
• Potenzfunktion
Diese Regel zahlt wohl zu einer der bekanntesten Regeln der Differentialrechnung. Diese
Regel besagt, dass eine Funktion differenziert wird, indem man bei jedem Argument
zunachst den Exponenten als Produkt vor die Zahl zieht und dann den verbleibenden
Exponenten um den Wert 1 vermindert. Eine Funktion f(x) = xa wird also mit f ′(x) =
a · xa−1 differenziert. Diese Regel lasst sich am vorherigem Beispiel einfach verdeutlichen.
Ist g(x) = x2, dann ist die Ableitung f ′(x) = 2 · x2−1 = 2 · x. Andert man den Wert
von x also um eine sehr kleine Einheit, so andert sich der Wert von y um das 2x-fache.
Damit wird bei dieser Ableitung dem Umstand Rechnung getragen, dass der Wert von
y bei großer werdenden x immer starker ansteigt. Andert man den Wert von x = 1 um
eine kleine Einheit so steigt der Wert von y also 2 · 1 = 2 mal schneller als der von x.
Ein Erhohung ausgehend von einem Wert x = 10 verursacht hingegen bereits ein relativ
2 · 10 = 20-faches Ansteigen von y.
• Summenregel
Sind die Variablen einer Funktion additiv verknupft, so lassen sich die Argumente jeweils
fur sich differenzieren. Eine Funktion der Form f(x) = 3 ·x2−5 ·x+9 ergibt als Ableitung
bei Anwendung der eben erlauterten Regeln damit beispielsweise f ′(x) = 6 · x − 5. Die
Vorzeichen der Verknupfungen bleiben naturlich erhalten.
• Produktregel
Will man eine Funktion differenzieren, die selbst widerum ein Produkt aus Funktionen
reprasentiert, dann benotigen wir hierfur die Produktregel. Betrachten wir fur eine an-
schaulichere Darstellung dazu zwei beliebige Funktionen, die jeweils nur von einer exoge-
25
nen Variablen x abhangen.
u(x) = x2 − 7x
v(x) = x3 − 2x2
Es ist uns nun ohne weiteres moglich eine weitere Funktion zu definieren, deren Ergebnis
sich aus dem Produkt von u(x) und v(x) bestimmen lasst. Wir definieren hierzu:
f(x) = u(x) · v(x) = (x2 − 7x) · (x3 − 2x2)
Die Produktregel besagt dann, dass sich das Ergebnis der Ableitung dieses Produkts
allgemein wie folgt berechnen lasst:
f ′(x) = u′(x) · v(x) + u(x) · v′(x)
Wir Berechnen aus Grunden der Ubersichtlichkeit zunachst:
u′(x) = 2x− 7
v′(x) = 3x2 − 4x
Mit diesen Zwischenergebnissen lasst sich nun die Ableitung der ursprunglichen Funktion
nach der Produktregel berechnen:
f ′(x) = u′(x) · v(x) + u(x) · v′(x)
⇔ f ′(x) = (2x− 7) · (x3 − 2x2) + (x2 − 7x) · (3x2 − 4x)
⇔ f ′(x) = 2x4 − 4x3 − 7x3 + 14x2 + 3x4 − 4x3 − 21x3 + 28x2
⇔ f ′(x) = 5x4 − 36x3 + 42x2
Naturlich liese sich diese Ableitung auch durch einfaches Ausmultiplizieren der Ursprungs-
funktion errechnen. Anschließend waren die Argumente dieser Funktion additiv verknupft
und liesen sich einzeln differenzieren. Allerdings ist die Produktregel haufig deutlich zeit-
sparend und gestattet außerdem allgemeiner notierte Differenzierungen.
• Quotientenregel
Die Quotientenregel wird bei sogenannten rationalen Funktionen angewendet. Eine ra-
tionale Funktion setzt sich, ahnlich wie im Beispiel zur Produktregel, selbst wieder aus
zwei Funktionen zusammen. Es gilt also: f(x) = u(x)v(x)
. Verwenden wir die spezifizier-
ten Teilfunktionen u(x) und v(x) aus dem vorherigen Beispiel, dann ware zum Beispiel
f(x) = x2−7xx3−2x2 zu differenzieren. Die darauf anzuwendende Quotientenregel lautet nun:
f ′(x) =u′(x) · v(x) − u(x) · v′(x)
(v(x))2
26
Hier ist starker noch als bei der Produktregel auf die Reihenfolge der Ableitungen im
Zahler und Nenner zu achten. Wir machen uns bei der anfolgenden Berechnung die bis-
herigen Zwischenergebnisse zu nutze.
f ′(x) =u′(x) · v(x) − u(x) · v′(x)
(v(x))2
⇔ f ′(x) =(2x− 7) · (x3 − 2x2) − (x2 − 7x) · (3x2 − 4x)
(x3 − 2x2)2
⇔ f ′(x) =2x4 − 4x3 − 7x3 + 14x2 − 3x4 + 4x3 + 21x3 − 28x2
x6 − 4x5 + 4x4
• Kettenregel
Die Kettenregel kommt immer dann zum Einsatz wenn zwei Funktionen ineinander ver-
schachtelt sind. Man unterscheidet dabei zwischen einer inneren Funktion und einer
außeren Funktion. Diese Unterscheidung ist am einfachsten an einem Beispiel erklart:
Wir betrachten deshalb eine innere Funktion v(x) = x2 + 1 und eine außere Funktion
u(x) = (v(x))3. Die Bezeichnungen bestehen deshalb, weil die außere Funktion u(x) die
innere Funktion v(x) vollstandig umschließt.
Die zugehorige Kettenregel zur Differenzierung solcher Funktionen f(x) = u(v(x)) ist
gemeinhin mit dem Merkspruch Außere mal innere Ableitung bekannt. Formal notiert
gilt also:
f ′(x) = u′(v(x)) · v′(x)
Auch zum Ableiten dieser Beispielfunktion f(x) = u(v(x)) = (x2 + 1)3 betrachten wir
zunachst die Teilergebnisse der jeweiligen Ableitungen von v(x) und u(x). Im Unterschied
zu den bisherigen Ableitungen wird die außere Funktion aber nach ihrer inneren Funktion
anstatt nach x differenziert. Wir suchen also:
u′(v(x)) =du(v(x))
dv(x)= 3(v(x))3−1 = 3(v(x))2
v′(x) =dv(x)
dx= 2x2−1 + 0 = 2x
Bei Berucksichtigung der Kettenregel und der bisherigen Zwischenergebnisse lasst sich
nun auch das Ergebnis von f ′(x) errechnen. Es gilt:
f ′(x) = u′(v(x)) · v′(x)
⇔ f ′(x) = 3(x2 + 1)2 · 2x
⇔ f ′(x) = 6x(x4 + 2x2 + 1)
⇔ f ′(x) = 6x5 + 12x3 + 6x
27
• Exponentialfunktion
Bei Exponentialfunktionen befindet sich die abzuleitende Variable naheliegenderweise im
Exponenten der Funktion. Wir betrachten also eine Funktion des Typen f(x) = eg(x)
wobei als Basis e = 2,718 . . . die sogenannte Euler’sche Zahl bezeichnet. Bei solchen Ex-
ponentialfunktionen wird zur Ableitung der differenzierte Exponent vor den Term gezo-
gen; der ursprungliche Term bleibt dabei allerdings unverandert. Die Ableitung ist damit
allgemein:
f ′(x) = g′(x) · eg(x)
Fur eine konkrete Funktion f(x) = e3x ware die Ableitung beispielsweise f ′(x) = 3 ·e3x. Diese Form der Ableitung reflektiert den Umstand, dass Funktionen solcher Art
exponentiell, also immer starker, ansteigen. Die Wachstumsrate ist dabei auf Grund der
Euler’schen Zahl konstant was diese Funktionsform in den Wirtschaftswissenschaften sehr
popular macht. Steht in der Basis allerdings eine andere als die Euler’sche Zahl ist diese
Rechenregel nicht mehr anwendbar. Da solche Varianten in den Wirtschaftswissenschaften
allerdings außerst selten vorkommen, soll die Weiterfuhrung dieser Rechenregel an dieser
Stelle aber nicht besprochen werden.
• Logarithmusfunktion
Bei Logarithmusfunktionen wird ahnlich wie bei der Kettenregel zwischen einer inneren
und einer außeren Funktion unterschieden. Der Logarithmus selbst ist dabei die außere
Funktion, sein Inhalt die innere Funktion. Fur eine Funktion des Typen f(x) = ln(g(x))
ist die Ableitungsregel wie folgt definiert:
f ′(x) =g′(x)
g(x)
Betrachten wir zur Veranschaulichung eine Beispielfunktion f(x) = ln(x3 + 4) so lautet
die Ableitung unter Verwendung dieser Regel:
f ′(x) =g′(x)
g(x)
⇔ f ′(x) =3x2
x3 + 4
Auch hier wurde wie bei der vorherigen Regel der sogenannte naturliche Logarithmus zur
Basis e betrachtet. (ln = loge) Fur Logarithmen zu einer anderen Basis muss diese Ablei-
tungsregel wieder verallgemeinert werden. Da derartige Ableitungen in den Wirtschafts-
wissenschaften allerdings ebenfalls außerst selten sind, wollen wir diese Verallgemeinerung
hier nicht betrachten.
28
Abschlussbemerkung: Das Beherrschen dieser Ableitungsregeln ist ein außerst zentrales Kon-
zept in den Wirtschaftswissenschaften weshalb es sich lohnt selbige gut zu trainieren. In vielen
Fallen sind dabei verschiedene Regel zu kombinieren was erst nach ausreichend Ubung flussig
gelingt.
4.2 Marginale und diskrete Wertanderungen
Haufig versuchen Studenten Ableitungen falschlicherweise dazu zu nutzen, um zu bestimmen
wie stark ein Funktionswert y = f(x) bei einer diskreten Wertanderung von x ansteigt. Mit
einer diskreten Wertanderung ist dabei eine reale, zahlbare Wertanderung gemeint. So ware
eine Wertamnderung von x = 1 auf x = 2 eine solche diskrete Wertanderung. Eine mar-
ginale Wertanderung meint hingegen eine Wertanderung von beispielsweise x = 1 auf einen
kleinstmoglich großeren Wert x = 1 + ϵ wobei ϵ ≈ 0 ist. Die Wertveranderung ϵ ist also beinahe
Null.
Wie wir soeben gelernt haben, gibt eine Ableitung immer das relative Wachstum von y = f(x)
im Verhaltnis zu x an. Dieses relative Wachstum kann sich von marginaler Einheit zu marginaler
Einheit allerdings drastisch verandern. Betrachten wir zum Verstandnis dieses Unterschieds eine
Beispielfunktion y = f(x) := x2 und f ′(x) = 2x. Erhohen wir den Wert von x = 1 auf x = 2 so
wachst y von f(x = 1) = 1 auf f(x = 2) = 4. Der Funktionswert wachst also um drei Einheiten
wahrend die Ableitung f ′(x = 1) = 2 lediglich eine Verdopplung, also ein Wachstum um zwei
Einheiten, vermuten lasst.
Das liegt in der Tatsache begrundet, dass die Ableitung f ′(x) weiter von x abhangig ist, der
Funktionswert y auf dem Weg von x = 1 zu x = 2 also immer starker ansteigt. So verdoppelt
sich y bei einem Anstieg von x = 1 auf x = 1 + ϵ zwar noch, bei einem Anstieg ausgehend
von beispielsweise x = 1,5 betragt die Ableitung hingegen bereits f ′(x = 1,5) = 3. Der Funk-
tionswert von y verdreifacht sich auf halbem Weg also bereits. Als Konsequenz lasst sich die
absolute Wertdifferenz von y = f(x) zwischen zwei diskreten x nur noch sehr muhevoll aus der
Ableitung bestimmen, da sich das relative Wachstum bestandig andert.
Eine Ausnahme bilden lineare Funktionen. Hier ist die Ableitung f ′(x) nicht mehr von x
abhangig sondern bleibt fur alle Wertanderungen gleich. Will man aus der Ableitung zu y =
g(x) := 3x mit g′(x) = 3 also bestimmen wie stark der Funktionswert y mit einer Veranderung
von x = 1 auf x = 2 ansteigt, so lasst sich dies aus der Ableitung ersehen: y wird um 3 Einheiten
29
wachsen, da das relative Wachstum auf dem Weg von 1 zu 2 unverandert bleibt.
4.3 Extremwerte
In den Wirtschaftswissenschaften ist es ein bestandiges Ziel Werte entweder zu minimieren
oder zu maximieren: Sei dies der Nutzen eines Individiums, die Kosten einer Firma oder die
Wohlfahrt Aller. Solche Extremwerte konnen wir mit unserem bisherigen Wissen sehr einfach
bestimmen: Sie ergeben sich aus Anwendung der eben besprochenen Differentialrechnung.
Betrachten wir dazu das einfache Beispiel einer Firma. Selbige kann auf einem Konkurenzmarkt
ein Produkt x fur einen festen Preis von p = 3 verkaufen. Bei der Herstellung fallen allerdings
Kosten von K(x) = x2 an. Aus Intuition ergibt sich daher eine Gewinnfunktion π(x), die wir
maxmimieren wollen:
π(x) = 3x− x2
Wie wir im vorherigen Kapitel gelernt haben, zeigen positive Ableitungen ein relatives Wachs-
tum an wahrend negative Ableitungen ein Abfallen von Funktionswerten darstellen. Ein Ma-
ximum, sofern ein solches existiert, muss also an einem Punkt liegen, bis zu dem die Funktion
mit x angestiegen ist und von dem aus die Funktion mit noch großeren x wieder abfallt. Das
Maximum selbst wurde demnach den Gipfelpunkt zwischen positiver und negativer Ableitung
reprasentieren: Wir suchen also einen Punkt, in dem weder positives noch negtives Wachstum
stattfindet, einen Punkt also in dem die Ableitung π′(x) = 0 ist. Ein solcher Punkt ist leicht
zu ermitteln, indem wir die Ableitung unserer Funktion nullsetzen:
π′(x) = 3 − 2x = 0
⇔ 3 = 2x
⇔ x = 1,5
Dass ein solcher Punkt mit der Ableitung gleich Null existiert ist die sogenannte Bedingung
erster Ordnung fur einen Extrempunkt. Es ist fur ein Maximum oder Minimum eine notwen-
dige (also zwingend erforderliche) Bedingung, zur Bestimmung eines Extremwerts allerdings
noch nicht hinreichend (wir konnten einen Extrempunkt also noch nicht eindeutig nachweisen).
Denn bisher konnten wir lediglich zeigen, dass die Ableitung im Punkt x = 1,5 gleich Null
ist. Wir wissen hingegen noch nicht, dass der Funktionswert bei einen marginal kleineren Wert
ansteigt und bei einem marginal großerem Wert abfallt wie wir zuvor argumentiert hatten.
Hinreichend ist lediglich die sogenannte Bedingung zweiter Ordnung, die im Abschluss des
Folgekapitels, dem Krummungsverhalten, erlautert wird.
30
4.4 Krummungsverhalten
Die Krummung einer Funktion wird durch deren zweite Ableitung angezeigt. Diese wird mit:
f ′′(x) =d2y
dx2= fxx(x)
notiert. Man unterscheidet dabei zwischen rechtsgekrummten (konvexen, f ′′(x) > 0), links-
gekrummten (konkaven, f ′′(x) < 0) und flachen (gleichzeitig konvex und konkav, f ′′(x) = 0)
Funktionen oder Funktionsabschnitten. Man teilt eine Funktionskurve in konvexe und konka-
ve Intervalle ein: Eine Funktion kann also in bestimmten Wertebereichen konvex, in anderen
hingegen konkav sein.
Aus der Krummung einer Kurve lasst sich die Bedingung zweiter Ordnung fur einen Extremwert
bestimmen. Hierfur uberlegen wir uns aber zunachst was die Krummung einer Kurve impliziert.
• Bei einer konvexen Funktion ist die zweite Ableitung, wie zuvor angefuhrt, großer Null.
Wie wir bereits argumentiert haben zeigt das Vorzeichen der ersten Ableitung immer an,
ob eine Funktion steigt oder fallt. Wenn wir mit der zweiten Ableitung also ein positi-
ves Vorzeichen erhalten, wissen wir, dass die (positive) Steigung mit marginal großeren
Werten wachst. (Oder dass die Funktion bei negativem Wachstum mit großer werdenden
x immer weniger abfallt.) Denn die zweite Ableitung beschreibt die Eigenschaften der
ersten Ableitung nicht anders als die erste Ableitung die Ursprungsfunktion beschreibt.
Folglich der Definition konvexer Funktionen beschleunigt sich das Wachstum einer kon-
vexen Funktion deshalb mit großeren x-Werten. Betrachten wir dazu als Beispiel die
Funktion y = f(x) := x3. Die erste Ableitung dieser Funktion lautet f ′(x) = 3x2. Die
zweite Ableitung ist f ′′(x) = 6x. Aus dem Vorzeichen der zweiten Ableitung konnen wir
algebraisch folgern, dass die Funktion fur x > 0 konvex ist, sich das Wachstum mit großer
werdenden x also immer starker beschleunigt.
• Bei einer konkaven Funktion ist hingegen gegenteiliges der Fall. Die Steigung wird mit
großer werdenden x nun immer schwacher was durch das negative Vorzeichen der zweiten
Ableitung angezeigt wird. Betrachten wir wieder die Funktion f(x) = x3. Fur x < 0 ist
die zweite Ableitung negativ, weshalb wir folgern konnen, dass die Funktion mit großeren
x immer schwacher wachst.
• Bei gleichzeitig konkaven und konvexen Funktionen ist die zweite Ableitung gleich Null.
Das bedeutet analog zur ersten Ableitung, dass die Steigung unverandert stark ist. Folglich
ist die Steigung konstant. Dies ist fur f(x) = x3 an der Stelle x = 0 der Fall.
31
Mit diesem Wissen uber das Krummungsverhalten lasst sich nun spezifizieren, ob ein Extrem-
wert ein Minimum, Maximum oder Flachpunkt ist. Betrachten wir dazu wieder die vorherige
Gewinnfunktion π(x) = 3x− x2. Die erste Ableitung ist π′(x) = 3 − 3x. Die zweite Ableitung
lautet π′′(x) = −3. Folglich ist die Funktion konkav. Aus obiger Argumentation wissen wir
also, dass das (positive) Wachstum der Funktionskurve in jedem Punkt schwacher wird. Das ist
auch am Extrempunkt x = 1,5 der Fall. In Folge dessen wissen wir, dass der Funktionswert fur
marginal kleinere x immer weniger wachst. Fur marginal großere x hingegen fallt die Funktion
immer starker ab. Nur falls dies der Fall ist, konnen wir uns gleichzeitig in einem Extrempunkt
befinden und die Bedingung der Konkavitat erfullen. Folglich muss es sich bei dem Extrem-
punkt um ein Maximum handeln. Bis zu diesem x-Wert war die Funktion gewachsen. Fur noch
großere x fallt die Funktion hingegen wieder ab. Ist eine Funktion in einem Extrempunkt also
konkav befinden wir uns in einem Maximum. Man sagt auch: Die Bedinung zweiter Ordnung
fur ein Maximum ist erfullt.
32
5 Funktionen mit mehreren Variablen
In den Wirtschaftswissenschaften sind Funktionen haufig nicht nur von einer einzelnen Inputva-
riablen abhangig. Wollen wir beispielsweise eine Abhangigkeitsbeziehung fur die Verkaufsmenge
(y) zu Preis (p) und Werbeausgaben (m) darstellen, mussten wir bereits zwei Variablen in die
Funktion integrieren. Dies wurde formal durch y = f(p,m) geschehen. Man spricht dabei auch
von einer multivariaten Funktion. Bisher waren alle betrachteten Funktionen hingegen uni-
variat. Die zuvor vorgestellten Rechengesetzte der Differentialrechnung sind auch fur solche
Funktionen gultig. Allerdings mussen beispielweise zur Bestimmung eines Maximums abwei-
chende Bedingungen uberpruft werden.
5.1 Ableiten einer Funktion mit mehreren Variablen
Zur Veranschaulichung der Ableitungsregeln betrachten wir eine beliebige Beispielfunktion mit
zwei Variablen. In diesem Fall die Funktion eines sogenannten Paraboloiden:
y = f(x1, x2) := x21 + x2
2
Wollen wir nun untersuchen wie sich der abhangige y-Wert bei marginalem Wachstum eines
einzelnen Inputwerts andert, so bilden wir die sogenannte partielle Ableitung. Diese wird
nach den zuvor besprochenen Rechenregeln der Differentialrechnung gebildet. Dabei ist die
nicht abzuleitende Variable einfach als Konstante anzusehen. Anstelle eines Delta-Symbols (d)
wird zur Kenntlichmachung das Symbol der partiellen Ableitung (∂) verwendet. Selbige ist
formal wie folgt definiert:
∂f(x1, x2, . . . , xn)
∂xi
=d f(x1, x2, . . . , xn)
dxi
|dx−i=0
Diese Definition besagt nichts anderes als das eben erklarte: In einer Funktion mit n un-
abhangigen Variablen ist die partielle Ableitung nach einer einzelnen der Variablen in der
Funktion xi (linke Seite) nichts weiter als das Differential (rechte Seite) unter der Bedingung,
dass alle Variablen, die nicht xi sind (x−i), unverandert bleiben (dx−i = 0). Die partiellen
Ableitungen unseres Paraboloiden sind also:
∂f(x1, x2)
∂x1
= 2x1 x2 als Konstante
∂f(x1, x2)
∂x2
= 2x2 x1 als Konstante
33
Auch die Interpretation der partiellen Ableitung verhalt sich analog zur Ableitung mit einer
Variablen. Steigt eine der Variablen um einen marginalen Wert an, so wachst y relativ um das
2x1- beziehungsweise 2x2-fache.
5.2 Beispiel: Grenzprodukte und Skalenertrage
Wir betrachten die sogenannte aggregierte Produktionsfunktion einer Volkswirtschaft. Dabei
sei Y die Produktionsmenge. Diese ist von der Menge des eingesetzten Kapitals K und der
eingesetzten Arbeitskraft N abhangig. Die Produktionsfunktion sei dabei wie folgt definiert:
Y = F (K,N) := KαN1−α
Wenn die Variable α zwischen 0 und 1 liegt (0 < α < 1), handelt es sich bei der Produktions-
funktion um eine sogenannte Cobb-Douglas-Funktion. Von selbiger wollen wir die sogenannten
Grenzproduktivitat bestimmen. Diese Grenzprodukte sollen zum Ausdruck bringen wie stark
sich die Produktion andert wenn man einen Inputfaktor marginal variiert. Dies wird mathema-
tisch, wie zuvor besprochen, durch die partielle Ableitung zum Ausdruck gebracht. Fur unsere
Beispielfunktion betragen die Grenzprodukte:
∂Y
∂N= (1 − α)KαN (1−α)−1 = (1 − α)KαN−α
∂Y
∂K= αKα−1N1−α
Zunachst ist festzustellen, dass die partiellen Ableitungen weiterhin von beiden Input-Variablen
abhangig sind. Dass dies der Fall sein muss, ergibt sich intuitiv bereits aus der Ursprungsglei-
chung. Denn die beiden Variablen der Funktion sind multiplikativ verknupft. Wurden zur Pro-
duktion Y beispielsweise Null Einheiten Arbeit N eingesetzt ware die Produktion immer Null,
unabhangig vom verwendeten Kapital K. Ist das Niveau der eingesetzten Arbeit N hingegen
sehr hoch ist der Einsatz einer weiteren Einheit Kapitals K fur die Produktion Y hingegen sehr
rentabel.
Weiterhin sind beide Ableitungen und damit die Grenzertrage fur alle Werte von N > 0 und
K > 0 positiv. Das bedeutet, dass eine zusatzliche Einheit Arbeit N oder Kapital K den
Output Y immer erhohen. (Und ihn nicht veringern was sich aus einer negativen Ableitung
folgern liese.) Wie sich diese Wertsteigerung fur immer großeren Einsatz der Inputfaktoren
verandert (steigende oder fallende Grenzertrage), gibt die zweite partielle Ableitung an:
∂2Y
∂N2= −α(1 − α)KαN−α−1
∂2Y
∂K2= α(α− 1)Kα−2N1−α
34
Die Ausdrucke am vorderen Ende der Ableitungen (−α) und (α − 1) sind jeweils negativ.
Damit ist der Grenzertrag fur beide Inputvariablen fallend. Dies bedeutet inhaltlich, dass eine
zusatzliche Einheit Arbeit N oder Kapital K den Output Y zwar ansteigen lassen, aber die
Produktivitatssteigerungen mit immer großeren Werten kontinuierlich abfallen.
Betrachten wir zum Abschluss noch die sogenannten Skalenertrage dieser Funktion. Man un-
tersucht mit solchen, in welchem Verhaltnis eine Erhohung (bzw. Veringerung) beider Input-
werte zu einer Erhohung (bzw. Verminderung) des Outputs fuhrt. Hierzu multipliziert man
jeden Faktor der Funktion Y = F (K,N) mit einer einzufuhrenden Konstanten c. Es gilt al-
so Y = F (cK, cN). Setzt man diese Werte in die gegebene Funktion ein und berechnet den
resultierenden Exponenten des auszuklammernden c, so erhalt man ein Ergebnis fur die Skale-
nertrage:
(cK)α(cN)1−α = cαKαc1−αN1−α
= cαcα−1KαN1−α
= cα+(1−α)KαN1−α
= c1KαN1−α
= c1Y
Fur Skalenertrage gilt: Wenn der Exponent von c kleiner als 1 ist, so sind die Skalenertrage
der Funktion fallend. Ist der Exponent gleich 1, so sind die Skalenertrage der Funktion kon-
stant. Und fur einen Exponenten großer 1 gelten steigende Skalenertrage. Zusammenfassend:
Positive, allerdings abnehmende Grenzertrage mit konstanten Skalenertragen sind die Eigen-
schaften, welche sich fur die Cobb-Douglas-Produktionsfunktion ergeben. All dies wird in den
Vorlesungen unseres Studiums noch im Detail besprochen. In diesem Abschnitt sollte lediglich
ein Beispiel fur die zuvor erlernte Methodik gegeben werden.
5.3 Extremwerte bei Funktionen mehrerer Variablen
Betrachten wir nochmals unseren Paraboloiden f(x1, x2) = x21 + x2
2 mit den ersten partiellen
Ableitungen fx1 = 2x1 und fx2 = 2x2. Solche Werte, an denen beide partiellen Ableitungen
gleich Null sind, heißen stationare Stellen. Fur einen Extrempunkt ist es anschließend noch
wichtiger als bei univariaten Funktionen, die zweite, hinreichende Bedingung fur einen solchen
Punkt zu uberprufen. Bevor wir hierauf aber naher eingehen, wollen wir aber zunachst die
stationaren Stellen unseres Paraboloiden bestimmen. Beide Ableitungen sind trivialerweise bei
x1 = 0 und x2 = 0 gleich Null. Es handelt sich hierbei um die einzige stationare Stelle unserer
35
Funktion.
Als hinreichende Bedingung fur einen Extremwert gilt bei multivariate Funktionen die erwei-
terte zweite Bedingung, dass das Produkt der zweiten partiellen Ableitung jeder Variablen an
allen Punkten fur x1 und x2 großer sein muss, als der Funktionswert der sogenannten gemischten
partiellen zweiten Ableitung zum Quadrat. Einfacher ist diese Bedingung formal ausgedruckt:
fx1x1(x1, x2) · fx2x2(x1, x2) > (fx1x2(x1, x2))2
Bilden wir also die zur Uberprufung der hinreichenden Bedingung geforderten Ableitungen:
fx1x1 = 2
fx2x2 = 2
Die Berechnung von fx1x2 ist auch nicht schwieriger durchzufuhren. Hierzu mussen wir ledig-
lich das Ergebnis der ersten partiellen Ableitung nach x1 nochmal nach x2 differenzieren. Die
Reihenfolge des Ableitens ist dabei nicht von Bedeutung, da das Ergebnis beider Reihenfolgen
in jedem Fall identisch ist. Wir erhalten fur unsere Beispielfunktion:
fx1x2 = 0
Nun setzen wir unsere Ergebnisse nur noch in die besprochene Bedingung ein:
2 · 2 > 02
Diese Bedingung ist selbstverstandlich erfullt. Wir haben also einen potentiellen Extremwert
gefunden. Es bleibt die Frage, ob es sich bei selbigem um ein Minimum oder ein Maximum
handelt. Diese Frage ist leicht zu beantworten: Sind beide zweiten partiellen Ableitungen nach
x1 und x2 positiv, so handelt es sich bei dem Punkt um ein Minimum. Sind beide Ableitungen
hingegen negativ, so haben wir ein Maximum gefunden. Haben beide Ableitungen verschiedene
Vorzeichen, liegt kein Extrempunkt vor. In unserem Beispiel sind beide partiellen Ableitungen
positiv. Das bedeutet der gefundene Punkt ist ein Minimum.
5.4 Das totale Differential
Das totale Differential ist ein Werkzeug mit dem wir allgemein uberprufen konnen wie sich das
Ergebnis einer Funktion y = f(x1, x2, . . . , xn) mit beliebig vielen Input-Variablen andert, wenn
wir beliebig viele dieser Eingabewerte variieren. Formal ist das totale Differential folgenderma-
ßen definiert:
df(x1, x2, . . . , xn) =n∑
i=1
∂f(x1, x2, . . . , xn)
∂xi
· dxi
36
Dieser Ausdruck ist einfach zu ubersetzen. Das Sigma-Symbol (∑
) gibt eine Summe an. Diese
Summe lauft uber alle Variablen der Funktion von den Indizes 1 bis n. Summiert werden dabei
alle partiellen Ableitungen der Funktion, welche mit der jeweiligen Anderung”(dxi) multipliziert
werden. Betrachten wir zunachst das triviale Beispiel einer Funktion mit einer unabhangigen
Variablen: y = f(x) := x2. Das totale Differential fur diese Funktion lautet: dy = ∂f(x)∂x
· dx =
2x · dx. Wollen wir also bestimmen wie sich ausgehend von einem bestimmten x der y-Wert
bei einer Variation von x verandert, konnen wir durch das totale Differntial eine approximative
Anderung bestimmen. Befinden wir uns beispielsweise an einem Punkt x = 4 und erhohen
diesen x-Wert auf x = 6 (dx = 2), so ergibt das totale Differential:
∆
Betrachten wir als Beispiel fur den Fall zweier Variablen:
df
dx=
δf
δx1
dx1 +δf
δx2
dx2
Betrachten wir nochmal den Ausdruck fur das Gesamtwirtschaftliche Gleichgewicht
Y =1
1 − c1 + c1g1 − b1 + b2d1d2
− g1(c0 + b0 + b2
M
d2P)
Wir wollen nun untersuchen, wie eine marginale Erhohung der Geldmenge den Output verandert.
Hierzu bilden wir das Differential von Y
dY =1
1 − c1 + c1g1 − b1 + b2d1d2
− g1
b2d2
(d(M
P))
Teilt man nun durch d(MP
), erhalt man
dY
d(MP
)=
b2
(1 − c1 + c1g1 − b1 + b2d1d2
− g1)d2
Da eine Anderung von c0 und b0 nicht betrachtet wird, werden diese Komponenten mit 0 mul-
tipliziert, sind also gleich 0. Was bedeutet dieser Term nun? Wir haben so den Geldmengen-
multiplikator fur diese Volkswirtschaft hergeleitet. Dieser gibt an, um wieviel sich der Output
Y verandert, wenn die Geldmenge um eine Einheit erhoht wird.
37
5.5 Methode nach Lagrange
Bei der Behandlung des Lagrange mochten wir die okonomische Interpretation außen vor las-
sen. Diese wird in der Veranstaltung ”Mathematische Methodenausgiebig diskutiert. Ebenso
nehmen wir an, dass die hinreichende Bedingung bei der Maximierung/Minimierung unter Ne-
benbedingungen bereits erfullt ist.
Betrachten wir also den in der Mikro 1 klassischen Fall2. U(x1, x2) = 6x121 x2 ist gegeben, dazu
die Budgetbeschrankung fur den Zwei - Guter - Fall p1x1 + p2x2 = m.
Erster Schritt ist immer das Aufstellen der Lagrange-Funktion.
L = 6x121 x2 − λ(p1x1 + p2x2 −m)
Hierbei ist es (noch) egal, ob ihr die durch das λ gewichtete Nebenbedingung addiert oder
subtrahiert, was man an den nun folgenden Rechenschritten auch sehen wird.
Da wir hier den Nutzen eines Individuums maximieren, gilt ebenso das Prinzip, partielle Ab-
leitungen zu bilden und Null zu setzen. Beim Lagrange-Verfahren differenzieren wir nach allen
Variablen und λ, wobei die Differenzierung nach λ uns wieder die Nebenbedingungen gibt.
δ L
δx1
= 3x− 1
21 x2 − λp1 = 0
δ L
δx2
= 6x121 − λp2 = 0
δ L
δλ= −p1x1 − p2x2 + m
Nun losen wir geschickt nach einer der beiden Variablen x1 oder x2 auf. Als erster Schritt bietet
sich an, λp1 und λp2 auf die rechte Seite zu bringenund die erste Gleichung durch die zweite
Gleichung zu dividieren, da sich so das λ eliminiert.
3x− 1
21 x2
6x121
=p1p2
Aufgrund der Rechenregeln fur Exponenten bei gleichen Basen (s. Grundlagenkapitel) folgt
3x2
6x121 x
121
=p1p2.
Kurzen und Anwenden der Potenzregeln fuhrt zu
x2
2x1
=p1p2
2Klausuraufgabe SS09
38
Nun empfiehlt es sich, nach x2 aufzulosen:
x2 =2p2x1
p2
Diesen Ausdruck setzt man nun in die Nebenbedingung ein und lost nach x1 auf, um die
optimale Menge von x1 zu erhalten:
p1x1 + p2(2p2x1
p2) = m
3p1x1 = m
x∗1 =
m
3p1
Analog rechnet man nun fur x2 und erhalt fur x2
x∗2 =
2m
3p2
Um zu zeigen, wie einfach die Methode funktioniert, rechnen wir im Folgenden nicht mit zwei
Variablen, sondern mit dreien.
Wir betrachten als erstes einen beliebigen Studenten Hubert. Hubert will ein moglichst beque-
mes Semester haben. Seine Zufriedenheit lasst sich funktional darstellen aus einer Verknupfung
der ”Guter”Lernen (L), Schlaf (S) und Freizeit (F).
Z(L, S,B) = L2 + S2 + F 2
Allerdings hat der Tag nur 24 Stunden, unser Maximierungsproblem unterliegt also einer Re-
striktion: R := L + S + F = 24. Hieraus bilden wir nun die Lagrangefunktion L = Z − λR:
L(L, S,B) = L2 + S2 + F 2 − λ(L + S + F − 24)
Beim Lagrange geht es schlichtweg nur um Maximierung unter Nebenbedingungen. Das erste,
was man beim Wort ”Maximierung”denken muss, ist erste Ableitung!”. Das gilt auch hier.
1.) Bilde alle partiellen Ableitungen erster Ordnung und setze sie Null!
d L
dL= 2L− λ = 0
d L
dS= 2S − λ = 0
d L
dF= 2F − λ = 0
d L
dλ= −L− S − F + 24 = 0
39
2.) Lose geschickt nach den Variablen auf!
In diesem Beispiel ist es recht einfach. Man sieht, dass alle drei Variablen die gleiche Gewichtung
haben. Daraus folgert man, dass L = S = F = 6. Leider gibt es kein”Universal-Rezept“ hierfur,
weshalb das Losen manchmal etwas mehr Denken erfordert.
40
6 Integralrechnung
Die Integralrechnung nutzt man zur Bestimmung der Flache zwischen dem Graphen einer Funk-
tion und der x-Achse. Die okonomischen Anwendungen sind zahlreich, die erste Anwendung im
VWL-Studium ist die der”Rente“ sein. Zunachst werden Rechenregeln fur unbestimmte In-
tegrale erlautert und im zweiten Teil fur bestimmte Integrale gezeigt, wie man ein Integral
uberhaupt berechnet.
6.1 Stammfunktionen
Gegeben sei eine Funktion f : D −→ ℜ, wobei D ein Intervall sei. Gesucht wird eine differen-
zierbare Funktion mit F ′ = f . Wir betrachten hier der Einfachkeit halber nur stetige f . Um
eine Verbindung zwischen der Flache zwischen Graph und x-Achse und der Differentialrechnung
herzustellen, sei auf den Mittelwertsatz der Integralrechnung hingewiesen:
Sei f eine stetige Funktion auf [a,b] mit a¡b, dann gibt es eine Stelle ξ, mit a < ξ, b, sodass∫ b
af(x)dx = (b− a)f(ξ).
Der Beweis hierzu ist nicht so kompliziert:3
Sei w der kleinste und W der großte Wert, den f im Intervall [a, b] annehmen kann. Dann gilt
w(b− a) ≤∫ b
af(x)dx ≤ W (b− a).
Deswegen liegt 1b−a
∫ b
af(x)dx zwischen w und W . Einen Zwischenwertsatz gibt es auch fur
stetige Funktionen.4 Nach diesem kann auch jeder Wert zwischen w und W als Funktionswert
f(ξ) angenommen werden.
3Zu Beweisen gilt generell: Sie mogen vielleicht in einer Vorlesung oder Ubungsrunde schnell hingeschrieben
sein. Aber: Dahinter steht oftmals tagelanges, in vielen Fallen sogar jahrelanges (jahrhundertelanges) Uberlegen
und Probieren. Von daher: Sich nicht verruckt machen lassen, wenn man so etwas nicht sofort nachvollziehen
kann.4Ubrigens auch auf Lagrange zuruck zu fuhren.
41
6.1.1 Fundamentalsatz der Analysis
Sei f : D −→ ℜ, D ein Intervall, eine stetige Funktion und aϵD ein Punkt. Dann ist die
Funktion
F (x) :=
∫ x
a
f(t)dt(xϵD)
eine Stammfunktion von f .
Auch hier gehen wir wieder uber den Differenzenquotienten im Intervall D, bezeichnet mit x0:
F (x) − F (x0)
x− x0
=1
x− x0
∫ x
x0
f(t)dt
Nach dem vorhergehenden Mittelwertsatz gelte∫ x
x0f(t)dt = (x−x0)f(ξ), mit ξ = ξ(x) zwischen
x und x0. Daraus folgt nun:
F (x) − F (x− 0)
x− x0
= f(ξ)
Wenn x nach x0 strebt, strebt ξ auch nach x0. Wegen der Stetigkeit von f strebt auch f(ξ)
gegen f(x0). Somit ist:
F ′(x0) = f(x0)
6.1.2 Bilden von Stammfunktionen
Das Bilden von Stammfunktionen (unschon auch als”Aufleiten“ bezeichnet.5) ist zentraler Be-
standteil der Integralrechnung.
Generell bildet man fur eine Funktion der Gestalt f(x) = xn die Stammfunktion mit der Formel
1
n + 1xn+1
5Denn eine Stammfunktion ist nicht einfach nur eine Umkehrung der Ableitung.
42
6.2 Das unbestimmte Integral
• Konstante
Eine Konstante kann aus dem Integral”herausgezogen“ werden:∫
cf(x)dx = c
∫f(x)dx
• Summen
∫(f(x) + g(x))dx =
∫f(x)dx +
∫g(x)dx
• Bruch, indem Zahler die erste Ableitung des Nenners ist
∫f ′(x)
f(x)dx = ln f(x) + c
• Partielle Integration
Ist eine Funktion f(x) das Produkt zweier Funktionen g(x) = u(x) und h(x) = v′(x) -
somit f(x) = u(x) · v′(x) , dann gelte∫u(x)v′(x)dx = u(x)v(x) −
∫u′(x)v(x)dx
Hier kann ein Beispiel hilfreich sein:
Betrachten wir das Integral∫xexdx.
Setzt man u(x) = x und v′(x) = ex, folgt u′(x) = 1 und v(x) = ex.∫xexdx = xex −
∫1 · exdx = xex − ex + c = (x− 1)ex + c
• Substitution
Durch die Substitution x = ς(k) der unabhangigen Variable einer Funktion y = f(x), ist
das unbestimmte Integral ∫f(x)dx =
∫f(ς(k))ς ′(k)dk
Beispiel:
Betrachten wir das Integral∫
(1 + x)n. Substitutiert man x = ς(k) = k + 2, erhalt man
ς ′(k) = 1. Daraus folgt nun:∫(1 + x)ndx =
∫kndk =
kn+1
n + 1+ x
=(x + 1)n+1
n + 1+ c
43
6.3 Das bestimmte Integral
Aus dem Fundamentalsatz der Analysis lasst sich recht schnell die Verbindung zwischen unbe-
stimmten und bestimmten Integralen folgern:
Sei F eine differenzierbare Funktion auf dem Intervall D mit stetiger Ableitung f ′. Dann gilt∫ b
a
f(x)dx = F (b) − F (a)
(a und b sind Elemente des Intervalls)
Auf einen Beweis verzichten wir an dieser Stelle.
Beispiel: ∫ 3
1
xdx = [1
2x2]31 = [(
1
2· 32) − (
1
212)] = 4
Nun zu einigen Eigenschaften bestimmter Integrale:
• Integrationsintervalle zusammenfassen:∫ b
a
f(x)dx +
∫ c
b
f(x)dx =
∫ c
a
f(x)dx
• Sind untere und obere Integrationsgrenzen gleich, so ist ”die Flache unter dem Graphen”=
0. ∫ a
a
f(x)dx = 0
• Vertauschen der Integrationsgrenzen∫ a
b
f(x)dx = −∫ b
a
f(x)dx
6.4 Beispiel: Konsumentenrente
In der Veranstaltung”Mikrookonomie I
”lernt man, dass die Konsumentenrente beschreibt, wie
sehr die Konsumenten von einem Gut profitieren. Diese Konsumentenrente wird nicht selten
44
mit Hilfe von Integralen beschrieben. Die Konsumentenrente bezeichnet dabei die aggregierte
Differenz zwischen maximaler Zahlungsbereitschaft und zu zahlendem Preis.
Betrachten wir wieder ein Munchner Grundnahrungsmittel: Bier. Der Preis fur Bier sei 2, 50,
die inverse Nachfrage durch p = 6−0, 001B gegeben. Als erstes berechne man den Schnittpunkt
der beiden (linearen) Kurven, um die Integrationsgrenzen zu erhalten:
6 − 0, 001B = 2, 50
B = 3500
Nicht vergessen: Die Differenz zwischen Prohibitivpreis und Preis betragt 3, 5, was wir in die
Funktion einbeziehen mussen. Nun bilde man die Stammfunktion:
p(B) = 3, 5 − 0, 001B
P (B) = 6B − 0, 0005B2
Mit dieser Vorbereitung konnen wir die Konsumentenrente berechnen:
KR =
∫ Bd
0
p(B) dB
KR =
∫ 3500
0
3, 5 − 0, 001B dB
= [3, 5B − 0, 0005B2]35000
= [3, 5 · 3500 − 0, 0005 · 35002]
= 6125
45
7 Matrixalgebra
In vielen Feldern der Volkswirtschaftslehre spielen lineare Gleichungssysteme eine wichtige Rol-
le. Insbesonders in der Okonometrie wird haufig eine Notation in Form von Vektoren und
Matrizen verwendet. Deshalb ist fur ein erfolgreiches Studium ein gutes Verstandnis der Matri-
xalgebra außerst hilfreich. Im Folgenden wollen wir dazu einige Konzepte der linearen Algebra,
das Rechnen mit Vektoren und Matrizen, verstehen lernen und uben.
Eine Matrix ist dabei zunachst nicht viel mehr als eine rechteckige Anordnung von Zahlen oder
Variablen. Man spricht dabei von einer N×K (Sprich: N-Kreuz-K) Matrix. Das N reprasentiert
dabei die Zahl der Zeilen einer Matrix, das K steht fur die Anzahl der Spalten. Man sagt auch:
Eine Matrix besitzt die Ordnung oder Dimension N ×K. Ein Vektor entspricht einer Matrix
mit nur einer Spalte oder Zeile und ist somit nichts weiter als eine Sonderform der Matrix, wie
spater noch ausfuhrlicher erlautert wird.
In der Mathematik wird eine Matrix der Dimension N ×K folgendermaßen notiert:
M =
m11 m12 · · · m1K
m21 m22 · · · m2K
......
. . ....
mN1 mN2 · · · mNK
M bezeichnet dabei die gesamte Matrix. Die Werte mij stehen fur ihre jeweiligen Elemente in
der i-ten Zeile und j-ten Spalte. Das Element m21 steht dabei beispielsweise fur das Element
in der zweiten Zeile und der ersten Spalte obiger Matrix. Die Buchstaben i und j sind dabei
typisch verwendete Zahlindikatoren, wobei mit i eine beliebige Zeile einer Matrix und mit j
eine beliebige Spalte bezeichnet wird.
Es ist eine Konvention, dass Matrizen mit fettgedruckten Großbuchstaben, Vektoren mit fett-
gedruckten Kleinbuchstaben gekennzeichnet werden. Die Notation mit einem Pfeil uber dem
Buchstaben, wie sie vielen sicherlich aus dem Schulunterricht noch bekannt ist, wird in wissen-
schaftlichen Aufsatzen und in Lehrbuchern hingegen kaum verwendet.
46
7.1 Warum Matrizen nutzlich sind
Bei der Arbeit mit Matrizen fragen sich viele Studenten zunachst haufig wie das Rechnen mit
Matrizen Vorteile mit sich bringt. Anders als bei zum Beispiel einfachen Funktionsbeziehun-
gen ist es bei Matrizen verstandlicherweise schwieriger sich vorzustellen was solche Konstrukte
denn eigentlich bedeuten. Im Gegenteil zum abstrakten Anschein sind Matrizen allerdings ein
sehr nutzliches Werkzeug zum einfachen Losen vieler wirtschaftswissenschaftlicher Aufgaben-
stellungen. Betrachten wir beispielsweise ein System von Gleichungen, das gleichzeitig erfullt
sein muss:
2a + 5b− 2c = 4
6a + 3b = 3
5b + 1c = 19
Naturlich liese sich durch schrittweises inneinander Einsetzen der Gleichungen ein Ergebnis
finden. Mit Hilfe einer Matrix lasst sich gleiche Anforderung an die linke Seite der Gleichungen
allerdings auch viel einfacher notieren: 2 5 −2
6 3 0
0 5 1
Schreibt man die rechte Seite der Gleichung nun in eine weitere Matrix, so liese sich mit Hilfe
einfacher Rechenoperationen schnell und zuverlassig ein Ergebnis fur das Gleichungssystem
finden. Diese Rechengesetze wollen wir im Folgenden ausfuhrlich erlautern, da sie in weiten
Teilen der Wirtschaftswissenschaften von Bedeutung sind.
7.2 Rechnen mit Matrizen
7.2.1 Addition und Subtraktion
Um eine Addition oder Subtraktion zweier Matrizen durchzufuhren ist es zwingend erforderlich,
dass diese die gleiche Dimension besitzen. Eine Matrix der Dimension 3× 3 kann beispielsweise
nur mit einer Matrix addiert werden, die ebenfalls die Dimension 3 × 3 besitzt. Dabei werden
jeweils die Elemente addiert, die sich in beiden Matrizen an gleicher Zeilen- und Spaltenposition
47
befinden. Ausgehend von zwei 3 × 3-Matrizen A und B :
A =
19 8 12
8 117 12
−4 12 37
B =
24 5 50
19 2 34
109 0 −1
gilt:
A + B =
19 8 12
8 117 12
−4 12 37
+
24 5 50
19 2 34
109 0 −1
=
19 + 24 8 + 5 12 + 50
8 + 19 117 + 2 12 + 34
−4 + 109 12 + 0 37 + (−1)
=
43 13 62
27 119 46
105 12 36
Die Subtraktion funktioniert nach dem gleichen Prinzip, nur dass hierbei die jeweiligen Elemente
der zwei Matrizen voneinander subtrahiert werden:
A−B =
19 8 12
8 117 12
−4 12 37
−
24 5 50
19 2 34
109 0 −1
=
19 − 24 8 − 5 12 − 50
8 − 19 117 − 2 12 − 34
−4 − 109 12 − 0 37 − (−1)
=
−5 3 −38
−11 115 −22
−113 12 38
Durch das Verrechnen der beiden Matrizen entsteht dabei wieder eine Matrix mit selber Dimen-
sion N×K der beiden Ausgangsmatrizen. Bei Betrachten des Ergebnisses fallt auch sogleich ins
Auge, warum nur Matrizen mit den gleichen Dimensionen verrechnet werden konnen: Andern-
falls ware eine Addition oder Subtraktion der jeweiligen Elemente nicht moglich - das Ergebnis
einer solchen Rechnung ist daher nicht definiert.
7.2.2 Matrizen-Multipikation
Ein wenig anders funktioniert die Multiplikation zweier Matrizen. Im Unterschied zur Addition
oder Subtraktion ist es nun nicht mehr notwendig, dass diese die gleiche Dimension besitzen.
Vielmehr ist es erforderlich, dass die Zahl der Spalten in der Matrix A (Dimension: NA ×KA)
der Zahl der Zeilen in Matrix B (Dimension: NB ×KB) entspricht. Dagegen muss gelten, dass
KA = NB, also dass die Zahl der Spalten in Matrix A der Zahl der Zeilen in Matrix B entspricht.
Die Ergebnismatrix besitzt anschließend gleiche Dimension NB × KA der Ausgangsmatrizen.
48
Die Werte von NA und KB sind fur die Durchfuhrbarkeit einer solchen Multiplikation dagegen
irrelvant.
Die Funktionsweise einer Multiplikation sei an einem einfachen Beispiel veranschaulicht. Wir
verwenden dabei wieder gleiche Matizen A und B wie zuvor. Da es sich um zwei 3 x 3-Matrizen
handelt, ist die Bedingung KA = NB mit 3 = 3 erfullt. Im Ergebniss wollen wir eine Matrix C
berechnen.
C = A ·B ⇔
c11 c12 c13
c21 c22 c23
c31 c32 c33
=
a11 a12 a13
a21 a22 a23
a31 a32 a33
·
b11 b12 b13
b21 b22 b23
b31 b32 b33
Dabei berechnet sich ein Element cij nicht durch Multiplikation der jeweiligen Elemente aij
und bij. Um ein Element cij zu berechnen, multiplizieren wir stattdessen jedes Element der
i-ten Zeile von A mit dem entsprechenden Element der j-ten Spalte von B und addieren dann
alle Produkte auf.
Intuitiver kann dies an unserem Beispiel erlautert werden. Wir betrachten dabei zunachst die
allgemeine Form der Matrizen und berechnen erst im Anschluss die Ergebnisse mit den eigent-
lichen Zahlen.
Fur die Berechnung des Elements c21 betrachten wir beispielsweise alle Elemente aus der zweiten
Spalte der Matrix A und alle Elemente aus der ersten Zeile der Matrix B. Wir erhalten dadurch
zwei”Reihen
”mit jeweils drei Elementen:
a11 a12 a13
a21 a22 a23
a31 a32 a33
b11 b12 b13
b21 b22 b23
b31 b32 b33
Diese sind a21, a22 und a23 fur die Matrix A. Fur die Matrix B erhalten wir (geordnet von oben
nach unten) die Elemente b11, b21 und b31. Um nun unser Ergebnis zu berechnen, multiplizieren
wir die Elemente an den jeweils gleichen Positionen unserer beiden “Reihen”
miteinander und
addieren die dadurch erhaltenen Ergebnisse. c21 entspricht also a21 · b11 + a22 · b21 + a32 · b31.
Mit den tatsachlichen Werten erhalten wir die”Reihen“ 8, 117 und 12 aus der Matrix A.
Aus B erhalten wir 24, 19 und 109. Fur c21 erhalten wir damit: 8 · 24 + 117 · 19 + 12 · 109 =
192 + 2.223 + 1.308 = 3.723
In einer allgemeinen Form lasst sich jedes Element cij einer Matrix C folgendermaßen definieren:
49
(Wobei Q = KA = NB)
cij =
Q∑q=1
aiq · bqj = ai1 · b1j + ai2 · b2j + . . . + aiQ · bQj
Um solche Matrizenmultiplikationen im Studienalltag schneller durchfuhren zu konnen, gibt es
einen einfachen grafischen Trick, um schnell und einfach zu einem Ergebnis zu kommen. Man
schreibt, wie untenstehend veranschaulich, die Matrix A links neben die Ergebnismatrix und
setzt die Matrix B daruber. 24 5 50
19 2 34
109 0 −1
19 8 12
8 117 12
−4 12 37
c11 c12 c13
c21 c22 c23
c31 c32 c33
=
1916 111 1210
3723 274 4366
4165 4 171
Um das Ergebnis fur eine Feld der Ergebnismatrix C zu erhalten, werden nun jeweils die linksste-
henden Zeilen-Elementen der Matrix A mit den obenstehenden Spalten-Elementen der Matrix
B multipliziert und die errechneten Werte wie oben erklart aufaddiert.
Achtung: Das Kommutativgesetz gilt bei der Multiplikation von Matrizen nicht! Es gilt also,
dass A · B = B · A. Es muss deshalb zwischen Vor- und Nachmultiplikation unterschieden
werden. Suchen wir also die Matrix C = B · A, so erhalten wir nicht das oben errechneten
Ergebnis:
19 8 12
8 117 12
−4 12 37
24 5 50
19 2 34
109 0 −1
c11 c12 c13
c21 c22 c23
c31 c32 c33
=
296 1377 2198
241 794 1510
2075 860 1271
7.2.3 Multipikation einer Matrix mit einem Skalar
Ein sogenanntes Skalar ist eine einfache Zahl, die keine Dimension besitzt. (Beziehungsweise
eine Dimension der Große 1× 1) Damit stellt sie keinen Vektor oder eine Matix dar. Trotzdem
lasst sich ein Skalar einfach mit einer Matrix multiplizieren. Eine Addition eines Skalars mit
einer Matrix ist hingegen nicht moglich.
50
So lasst sich zum Beispiel die Matrix A mit dem Skalar (also der Zahl) 2 multiplizieren:
2 ·A = 2 ·
a11 a12 a13
a21 a22 a23
a31 a32 a33
=
2 · a11 2 · a12 2 · a132 · a21 2 · a22 2 · a232 · a31 2 · a32 2 · a33
=
2 · 19 2 · 8 2 · 12
2 · 8 2 · 117 2 · 12
2 · (−4) 2 · 12 2 · 37
=
38 16 24
16 234 24
−8 24 74
7.2.4 Transponieren einer Matrix
Das Transponieren einer Matrix entspricht einer Umkehrung der Anordnung der Elemente in
einer Matrix. Die jeweiligen Werte der Elemente bleiben dabei unverandert, lediglich deren
Position in der Matrix verandert sich: Aus ei ner N ×K-Matrix soll eine K × N -Matrix ent-
stehen. Jedes Element mij findet sich nach einer Transponierung dann an Position mji wieder.
Bezeichnet wir eine transponierte Matrix mit M′.
Konkret bedeutet dies am Beispiel der Matrix B:
B′ =
24 19 109
5 2 0
50 34 −1
7.3 Besondere Matrizen
7.3.1 Vektoren
Eine Matrix mit nur einer Spalte (Eine N×1-Matrix) wird als Spaltenvektor bezeichnet. Dies ist
die gebrauchlichste Form, einen Vektor zu notieren. Eher unublich ist eine Matrix mit nur einer
Zeile (Eine 1×K-Matrix) welche entsprechend ein Zeilenvektor genannt wird. Wie bereits an-
gesprochen, werden solche Vektoren haufig mit einem Kleinbuchstaben gekennzeichnet. Haufige
auftretende Rechenformulierungen von Vektoren sind das innere und das außere Produkt. Sei
dazu ein Vektor v ein Spaltenvektor mit N Zeilen.
51
Das außere Produkt ist dann definiert als:
v · v′ =
v1
v2...
vN
·(
v1 v2 · · · vN
)=
v21 v1 · v2 · · · v1 · vN
v2 · v1 v22 · · · v2 · vN...
.... . .
...
vN · v1 vN · v2 · · · v2N
Das innere Produkt hingegen ist:
v′ · v =(
v1 v2 · · · vN
)·
v1
v2...
vN
= v21 + v22 + . . . + v2N =N∑i=1
v2i
Zu den Ergebnissen ist anzumerken, dass bei Bildung des außeren Produktes eine quadratische
Matrix der Dimension N ×N entsteht. Das innere Produkt ergibt hingegen immer ein Skalar.
(Was einer 1 × 1-Matrix entspricht.)
7.3.2 Nullmatrix
Eine Nullmatrix ist eine Matrix der Dimension N × K, die fur jedes Element die Zahl Null
(0) annimmt. Sie wird haufig mit einer fettgedruckten Null (0) angezeigt. Dabei ist wichtig,
sich vor Augen zu halten, dass eine Nullmatrix nicht dem Skalar (also der reelen Zahl) Null
enstspricht! Eine Nullmatrix enthalt zwar ausschließlich solche Nullen, verfugt aber weiterhin
uber eine Dimension.
0 =
0 0 · · · 0
0 0 · · · 0...
.... . .
...
0 0 · · · 0
7.3.3 Quadratische Matrix und Einheitsmatrix
Eine andere besondere Form einer Matrix ist die quadratische Matrix. Eine solche Matrix besitzt
eine gleiche Anzahl an Spalten und an Zeilen. Formal gesprochen gilt also dass N = K, wie
auch bei unseren beiden Matrizen A und B, die wir fur unsere bisherigen Beispielrechnungen
verwendet haben.
52
Eine noch speziellere Form der eben erwahnten quadratischen Matrix ist die sogenannte Ein-
heitsmatrix. Eine solche Matrix besteht bis auf eine Linie aus Einsen entlang ihrer sogenannten
Hauptdiagonalen lediglich aus Nullen. Sie hat folgende Form und wir haufig mit dem Buchsta-
ben I kenntlich gemacht:
I =
1 0 · · · 0
0 1 · · · 0...
.... . .
...
0 0 · · · 1
Eine Multiplikation mit der Einheitsmatrix enspricht einer Multiplikation mit der Zahl 1 im
System der reelen Zahlen, denn es gilt:
I ·M = M · I = M
Die Gultigkeit dieser Rechenregel lasst sich auch durch einfaches Ausprobieren nach den oben
stehenden Rechenregeln zur Matrizen-Multiplikation schnell uberprufen. Auch wenn wir den
Beweis dazu an dieser Stelle aussparen wollen, ist es oft hilfreich, sich daran zu erinnern.
7.4 Zusammenfassung der Rechenregeln der Matrixalgebra
Fur gleichdimensionierte Matrizen gilt: (Matrizen sind dabei fettgedruckt. Skalare sind in ein-
fachem Druck gekennzeichnet.)
1. (A + B) + C = A + (B + C)
2. A + (-A) = 0 = 0
3. A + B = B + A
4. A + 0 = 0 + A = A
5. (x1 + x2) ·A = x1 ·A + x2 ·A
6. x · (A + B) = x ·A + x ·B
7. (A′)′ = A
8. (A + B) = A + B
9. (A ·B)′ = B′ ·A′
53
10. I′ = I
11. x = x sowie (x ·A)′ = x ·A′
Fur Matrizen, welche die Eigenschaft KA = NB erfullen, gilt:
1. Das Assoziativgesetz : (A ·B) ·C = A · (B ·C)
2. Das Distributivgesetz : A · (B + C) = A ·B + A ·C
3. Nicht das Kommutativgesetz : A ·B = B ·A
7.5 Lineare Abhangigkeit
Eine Gruppe gleichdimensionierter Vektoren sind linear voneinander abhangig, wenn sich min-
destens einer dieser Vektoren durch eine beliebige Kombination der anderen abbilden lasst.
Diese Eigenschaft lasst sich einfach an einem Beispiel verdeutlichen: Angenommen es existieren
drei Zeilenvektoren v, w und z der Dimension 4 × 1.
v =
17
9
−3
12
w =
9
15
7
12
z =
15
−33
−37
−12
Dann muss es bei linearer Abhangigkeit moglich sein, eine Losung fur beliebige Skalare x1, x2
und x3 (außgenommen der Zahl Null) zu finden, sodass:
x1 · v + x2 ·w + x3 · z = 0
In unserem Beispiel gilt fur die Werte x1 = 3, x2 = −2 und x3 = 1:
3 ·
17
9
−3
12
+ (−2) ·
9
15
7
12
+ 1 ·
15
−33
−37
−12
=
3 · 17 − 2 · 9 + 1 · 15
3 · 9 − 2 · 15 + 1 · (−33)
3 · (−3) − 2 · 7 + 1 · (−37)
3 · 12 − 2 · 12 + 1 · (−12)
=
0
0
0
0
= 0
Die drei Vektoren v, w und z sind demnach linear voneinander abhangig.
54
7.6 Determinanten quadratischer Matrizen
Als Determinante einer quadratischen Matrix wird eine reele Zahl bezeichnet, die sich aus
den Elementen der Matrix errechnen lasst. Interpretieren lasst sich diese Determinante als eine
geometrische Flache, wobei mit den Elementwerten die Eckpunkte dieser Flache gesetzt werden.
Da die Interpretation ein tieferes Verstandnis der linearen Algebra voraussetzt, soll an dieser
Stelle nicht darauf eingegangen werden. Trotzdem ist es wichtig, zu wissen, dass sich solche
Determinanten errechen lassen, da sie Voraussetzung fur einige Rechenoperationen innerhalb
der Matrixalgebra ist.
Fur eine 2 × 2-Matrix ist die Determinante noch einfach zu berechnen. Fur großere Matizen
sind kompliziertere Rechnungen (zum Beispiel mit Hilfe der sogenannten Laplace Expansion)
notwendig, auf die an dieser Stelle ebenfalls nicht eingegangen wird.
Die Determinante einer Matrix wird notiert wie folgt und lasst sich im Fall einer 2×2-Dimension
folgendermaßen errechnen:
|M| =m11 m12
m21 m22
= m11 ·m22 −m12 ·m21
Aus einer Beispielmatrix A losst sich zum Beispiel ausrechnen:
|A| =19 4
10 3= 19 · 3 − 4 · 10 = 57 − 40 = 17
Aus dem Wert der Determinanten einer Matrix lasst sich eine weitere wichtige Eigenschaft
der Matrix ablesen. So ist der Wert einer Determinate immer Null, wenn zwischen den Zeilen
oder den Spalten der Matrix eine lineare Abhangigkeit (wie wir sie zuvor kennen gelernt ha-
ben) besteht. Eine Matrix mit einer Determinanten von Null wird auch als singulare Matrix
bezeichnet.
|B| =2 4
3 6= 2 · 6 − 3 · 4 = 12 − 12 = 0
In obigem Fall ist die zweite Zeile schlichtweg das 1,5-fache der ersten Zeile. Die beiden Zeilen
der Matrix sind demnach voneinander abhangig und die Determinante ergibt Null.
Fur Matrizen großerer Dimension gibt es auch ahnlich einfache Regeln, die lediglich etwas
mehr Wiederholungen beim Uben brauchen. Fur 3 × 3 Matrizen nutzt die Regel von Sarrus6.
6Pierre FrŸedŸeric Sarrus, franzosischer Mathematiker. Aus gegebenem Anlass bitten wir, den Nachnamen auch
korrekt auszusprechen (Sarru).
55
Betrachtet man eine 3 × 3 Matrix
A =
14 15 4
21 9 12
14 6 8
so gibt die Regel von Sarrus einen graphischen Trick vor, zuerst die erste und zweite Spalte (in
dieser Reihenfolge) rechts neben die Matrix zu schreiben:14 15 4 14 15
21 9 12 21 9
14 6 8 14 6
Nun multipliziert man die Hauptdiagonalen miteinander:
14 · 9 · 8 = 1008oben
15 · 12 · 14 = 2520oben
4 · 21 · 6 = 504oben
14 · 9 · 4 = 504unten
6 · 12 · 14 = 1008unten
8 · 21 · 15 = 2520unten
Die Ergebnisse oben werden addiert und die Ergebnisse unten subtrahiert.
1008 + 2520 + 504 − 504 − 1008 − 2520 = 0
So erhalt man die Determinante der 3× 3 Matrix. In unserem Fall ist die Determinante 0, was
kein ungewohnlicher Fall ist.
Die Methode zur Determinantenberechnung fur beliebig große Matrizen wird aufgrund der
geringen (oder sogar nicht vorhandenen) Relevanz im Bachelor nicht behandelt. Trotzdem soll
zum Selbststudium fur Interessierte zumindest auf die gangige Methode hingewiesen werden,
den Entwicklungssatz nach Laplace.
7.7 Inverse einer Matrix
Mit Hilfe der Determinanten einer Matrix lasst sich die Inverse einer Matrix errechnen. Eine
quadratische Matrix der Dimension K × K hat immer dann eine Inverse, wenn eine Losung
existiert, sodass: A ·A−1 = I. (I bezeichnet dabei wieder die Einheitsmatrix.)
56
7.7.1 Formale Herleitung
Betrachten wir im Folgenden eine 2×2-Matrix A und definieren dabei die (unbekannten) Werte
der Inversen der Matrix mit dem griechischen Buchstaben α, muss fur das Produkt A · A−1
gelten: (a11 a12
a21 a22
)·
(α11 α12
α21 α22
)=
(1 0
0 1
)Multiplizieren wir dies aus, erhalten wir:(
a11 · α11 + a12 · α21 a11 · α12 + a12 · α22
a21 · α11 + a22 · α21 a21 · α12 + a22 · α22
)=
(1 0
0 1
)Anders notiert lassen sich die Losungen fur obigen Ergebnisvektor in einem Gleichungssystem
festhalten:
a11 · α11 + a12 · α21 = 1
a11 · α12 + a12 · α22 = 0
a21 · α11 + a22 · α21 = 0
a21 · α12 + a22 · α22 = 1
Lost man nun alle Gleichungen nach den unbekannten Werten fur α auf und uberfuhrt das
Ergebnis wieder in die Matrizenschreibweise, so erhalt man:(α11 α12
α21 α22
)=
1
a11 · a22 − a12 · a21·
(a22 −a12
−a21 a11
)=
1
|A|·
(a22 −a12
−a21 a11
)= A−1
Fur Matrizen mit einer großeren Dimension ist der Rechenweg wieder ungleich komplizierter,
denn hierzu muss die sogenannte adjunkte Matrix berechnet werden, was viel Zeit in Anspruch
nimmt. Dafur werden wir eine Methode zur Errechnung der Inversen besprechen, die handisch
einfacher ist und trotzdem zum Ergebnis fuhrt.
7.7.2 Gauß-Jordan Elimination
Die Erfahrung hat gezeigt, dass bei dem sogenannten Gauß - Algorithmus7 vielen ein ”roter
Faden”fehlt. Deswegen mochten wir den Algorithmus zuerst aus der Ferneangehen.
7Hier mochten wir darauf hinweisen, dass Carl Friedrich Gauß nicht wegen dieses Eliminationsverfahrens
als einer der genialsten Kopfe der Mathematik gilt, sondern wegen weitaus tiefergehenden Ideen. Eine weitere
von ihm eingefuhrte Methode, die Kleinste-Quadrate-Schatzung, findet in der Okonomie und in vielen anderen
Wissenschaften eine populare Anwendung. Der Abschnitt 7.8 fuhrt in diese Idee ein.
57
Eine Matrix nennt man in Zeilen-Stufen Form, wenn jede Zeile einer Matrix mit einer fuhrenden
1 beginnt. Dies konnte so aussehen:
A =
0 1 4 999999 72684 π
0 0 1 0 847 84
0 0 0 0 0 0
Wichtig ist hier zu erkennen, dass jede Zeile mit einer 1 beginnt, links von dieser 1 nur Nullen
stehen und falls keine 1 in einer Zeile zu finden ist, erhalt man die Nullzeile. Zusatzlich ist es
in der Zeilen-Stufen Form vollkommen egal, was rechts von der fuhrenden 1 steht.
Bei der Gauß - Jordan Elimination ist das Herstellen der Zeilen-Stufen Form der erste Schritt.
Die Reduzierte Zeilen-Stufen Form (RZF) fordert gegenuber der Zeilen-Stufen Form zusatzlich,
dass in jeder Spalte mit fuhrender 1 keine anderen Zahlen (bzw. allgemeiner gesagt: Elemente)
stehen als 0 und die fuhrende 1 selbst. Diese konnte so aussehen:
A =
1 0 0
0 2 0
0 0 0
Dieses Beispiel durfte wohl das Paradebeispiel fur eine Matrix in RZF sein. Folgende Matrix
ist ebenso in RZF:
A =
1 0 0 14 0 0
0 1 0 0 9 0
0 0 1 0 0 8
Wie wahrscheinlich schon erwartet, ist die RZF das Ziel der Gauß - Elimination. Man verwendet
hierzu Elementare Zeilenumformungen. Diese sind Regeln, die darauf bauen, dass jede Matrix
aquivalent zu ihrer Zeilen - Stufen Form ist und diese wiederum aquivalent zu ihrer Redu-
zierten Zeilen Stufen Form ist. Der soeben eingefuhrte Algorithmus sagt nur, dass man durch
Elementare Zeilenumformungen die RZF herstellen kann. Elementare Zeilenumformungen sind
• Das Addieren einer Zeile zu einer anderen Zeile
• Die Multiplikation einer Zeile mit einem Skalar (welcher auch ein Bruch sein kann)
• Vertauschen zweier Zeilen
• Die Addition einer Linearkombination zu einer Zeile
58
Nun wollen wir ein Beispiel rechnen. Wir betrachten eine 4 × 4 Beispielmatrix A. Diese sei
A =
1 1 1 1
0 1 1 1
0 0 1 1
1 1 1 2
Bei der Gauß-Jordan Elimination wird ein grafischer Trick angewandt8: Man schreibt die Ein-
heitsmatrix neben die zu invertierende Matrix:
A =
1 1 1 1 1 0 0 0
0 1 1 1 0 1 0 0
0 0 1 1 0 0 1 0
1 1 1 2 0 0 0 1
Man sieht, dass diese Matrix bereits in Zeilen-Stufen Form vorliegt. Nun gilt es, die reduzierte
Zeilen-Stufen Form herzustellen. Eine Moglichkeit ist, von der vierten Gleichung die erste Glei-
chung zu subtrahieren. Hierfur schreiben wir wieder die unveranderten Zeilen auf und bilden
die Matrix, indem wir die ursprungliche vierte Zeile durch die modifizierte vierte Zeile ersetzen.
Wir erhalten also die Matrix
A =
1 1 1 1 1 0 0 0
0 1 1 1 0 1 0 0
0 0 1 1 0 0 1 0
0 0 0 1 −1 0 0 1
Nach dieser elementaren Zeilenumformung sind wir schon ein Stck voran gekommen, denn
immerhin steht in der ersten Spalte nur noch eine fuhrende 1 und sonst nur 0. Wir gehen
nun Spalte fur Spalte vor. In der zweiten Spalte erhalten wir die gewunschte Form, indem wir
einfach von der ersten Zeile die zweite Zeile subtrahieren.
A =
1 0 0 0 1 −1 0 0
0 1 1 1 0 1 0 0
0 0 1 1 0 0 1 0
0 0 0 1 −1 0 0 1
8Allgemeiner Hinweis: In vielen mathematischen Strukturen tauchen Begriffe wie neutrales Element und
Inverse auf. Ein neutrales Element ist zum Beispiel die Zahl 1 in der Multiplikation, da eine Zahl a mit 1
multipliziert immer noch gleich a ist. Um das neutrale Element in der Multiplikation herzustellen, dividiert
man a durch a selbst. Oder anders ausgedruckt: Man multipliziert a mit 1a bzw. 1
a = a−1 und erhalt so das
neutrale Element der Multiplikation, 1.
59
Das Prinzip durfte langsam klar sein. Im nachsten Schritt wird die dritte Zeile von der zweiten
Zeile subtrahiert.
A =
1 0 0 0 1 −1 0 0
0 1 0 0 0 1 −1 0
0 0 1 1 0 0 1 0
0 0 0 1 −1 0 0 1
Der letzte Teil ist nicht uberraschend. Nachdem man nun von der dritten Zeile die vierte sub-
trahiert hat, ist die Inverse in diesem Schema auf der rechten Seite ablesbar. Die Einheitsmatrix
hat sozusagen den Platz getauscht.
A =
1 0 0 0 1 −1 0 0
0 1 0 0 0 1 −1 0
0 0 1 0 1 0 1 −1
0 0 0 1 −1 0 0 1
Dieses Beispiel ist aber mit Vorsicht zu genießen. Wir haben uns fur ein eingangiges Beispiel
entschieden, um den Algorithmus leicht nachvollziehbar zu halten. Es sei davor gewarnt, einfach
sturr die die untere Zeile von der oberen zu subtrahieren und so irgendwann zu einer RZF zu
kommen. Der Gauß benotigt Ubung, um den Losungsweg sehen zu konnen.
7.7.3 Cramer’sche Regel
Zur Losung nicht-homogener Gleichungssysteme existiert eine weitere einfache Losungsmethode:
Die Cramer’sche Regel. Nach dieser Regel sind Gleichungssysteme der Form
M · x = y
einfach losbar. Die Matrix M besitzt dabei eine Dimension N ×K (und wird in diesem Zusam-
menhang haufig als Koeffizientenmatrix bezeichnet), x ist ein 1×K-Spaltenvektor, wohingegen
y ein 1 ×N -Spaltenvektor ist. Unsere Unbekannte sei in diesem Fall der Vektor x. Damit gilt:m11 m12 · · · m1K
m21 m22 · · · m2K
......
. . ....
mN1 aN2 · · · mNK
·
x1
x2
...
xK
=
y1
y2...
yN
60
Eine Moglichkeit zur Losung des Gleichungssystems ware nur das Bilden der Inversen von A,
wodurch der Vektor x mit x = A−1 · y errechnet werden konnte. Mit der Cramer’schen Regel
ist die Gleichung allerdings unter Umstanden einfacher zu losen.
Zur Losung fur ein beliebiges xj muss zunachst die Matrix Mj zu aus der Koeffizientenmatrix
M gebildet werden. Dazu wird einfach die j -te Spalte der Matrix M durch den Vektor y ersetzt.
Somit gilt zum Beispiel fur M2:
M2 =
m11 y1 · · · m1K
m21 y2 · · · m2K
......
. . ....
mN1 yN · · · mNK
Die Losung fur den Wert x2 ist nach der Cramer’schen Regel nun einfach als der Quotient
zweier Determinanten definiert. Fur den Wert x2 ist dieser beispielsweise der Quotient aus den
Determinanten obiger Matrix M2 und der Koeffizientenmatrix M selbst. Allgemein gilt fur ein
beliebiges xj:
xj =|Mj||M|
7.8 Beispiel: Herleitung des multivariaten OLS-Schatzers
In der Statistik ist die Methode der Kleinsten Quadrate (Ordinary Least Squares = OLS ) eine
haufig verwendete Analysemethode. Sie dient dazu, lineare Strukturen in zusammengehorigen
Beobachtungen zu prufen und zu beschreiben. Abstrakt gesprochen unterstellt dieses statisti-
sche Modell, dass ein linearer Zusammenhang zwischen einer abhangigen und einer oder mehre-
ren unabhangigen Variablen besteht. So ließe sich mit dieser Methode zum Beispiel uberprufen,
ob gilt, dass:
(Punktzahl in einer Klausur) = a + b1· (Lernzeit) +b2· (Intelligenzquotient)
Das Verstehen dieser Methode soll aber nicht Sinn der folgenden Ubung werden. Vielmehr
wollen wir den OLS-Schatzer herleiten, was nichts anderes bedeutet als die zuvor besproche-
nen mathematischen Methoden zur Matrixalgebra anzuwenden. Betrachten wir also zunachst
folgende Matrizen als gegeben:
61
X =
x11 x12 · · · x1K
x21 x22 · · · x2K
......
. . ....
xN1 xN2 · · · xNK
y =
y1
y2...
yN
Dabei wollen wir am Ende einen (noch unbekannten) Vektor b der Dimension K × 1 finden,
(also untenstehende Gleichung so Auflosen, dass wir eine Form von b = . . . erhalten) fur den
gilt, dass:
y = X · b + u ⇔ u = y−X · b
In ausgedehnter Schreibweise nehmen wir demnach also das folgende Gleichungssystem als
gegeben: (Wobei die Vektoren b und u unbekannt sind. Mehr dazu gleich im Folgenden.)u1
u2
...
uK
=
y1
y2...
yN
−
x11 x12 · · · x1K
x21 x22 · · · x2K
......
. . ....
xN1 xN2 · · · xNK
·
b1
b2...
bK
Die Methode der Kleinsten Quadrate sieht nur vor, die quadrierte Summe der Elemente des
Vektors u zu minimieren. (Auch darauf wollen wir an dieser Stelle nicht eingehen. Im Fokus
dieser Ubung stehen nach wie vor die mathematischen Methoden, die im Folgenden angewandt
werden. Die Bedeutung des OLS-Schatzers wird im Verlauf des Studiums noch detailiert be-
sprochen. Ein Verstandnis der tatsachlichen Bedeutung der Matrizen ist hier also nicht von
Bedeutung.) Die Summe der Elemente eines Vektors ist, wie wir bei der Besprechung der
mathematischen Methoden zuvor gezeigt haben, nichts weiter als sein inneres Produkt. Wir
berechnen im Folgenden also das Ergebnis fur den Ausdruck:
minb
u′ · u ⇔ minb
(y−X · b)′ · (y−X · b)
Ausgehend von all diesen Annahmen wollen wir nun einige unserer Rechenmethoden erproben.
7.8.1 Ableiten der Matrizen
Um eine Matrix oder einen Vektor abzuleiten, sind keine speziellen Rechenregeln anwendbar.
Vielmehr ist einzeln zu prufen, was bei einer zeilenweisen Ableitung nach Methodik der be-
kannten Ableitungsregeln heraus kommt. Dazu multiplizieren wir zunachst obige Gleichung
aus:
62
u′ · u = (y−X · b)′ · (y−X · b)
= (y′ − b′ ·X′) · (y−X · b)
= y′ · y− b′ ·X′ · y− y′ ·X · b + b′ ·X′ ·X · b
Nun lasst sich mit Hilfe eines kleinen Tricks die eben errechnete Gleichung weiter vereinfachen.
Es gilt, dass b′ ·X′ · y′ = (y′ · b ·X)′ = y′ ·X · b, denn bei dem Ergebnis des obigen Ausdrucks
handelt es sich um ein Skalar. (Dies ergibt sich aus den oben angezeigten Dimensionen der Ma-
trizen. Durch Multiplikation erhalten wir eine 1 x 1-Matrix, also eine reele Zahl.) Denn wie bei
Besprechung der Methoden gezeigt, behalt ein transponierter Skalar auch bei Transponierung
seinen ursprunglichen Wert. So konnen wir letzteres Ergebnis in die obige Gleichung einsetzen,
sodass wir erhalten:
u′ · u = y′ · y− 2 · b′ ·X′ · y + b′ ·X′ ·X · b
Wir erhalten also drei durch Summenoperatoren verbundene Teilgleichungen, die wir nach b
ableiten mussen.
1. y′ · y
2. 2 · b′ ·X′ · y
3. b′ ·X′ ·X · b
Die Ableitung fur den ersten Teil der Gleichung (1 ) ist Null, da b in ihr nicht vorkommt. Die
beiden anderen Gleichungen mussen wir hingegen im Detail betrachten. Zunachst losen wir die
Ableitung fur den 2. Teil der Gleichung:
Da X eine Matrix der Dimension N ×K ist und y ein N × 1-Spaltenvektor, ist das Ergebnis
von X′ · y ein K × 1-Spaltenvektor. Aus Grunden der Einfachheit in der Notation bezeichnen
wir dieses Produkt aus X′ und y im Folgenden mit (klein) x = X′ · y.
Dieses Produkt aus b’ und x lasst sich berechnen als:
63
b′ ·X′ · y = b′ · x =(
b1 b2 · · · bK
)·
x1
x2
...
xK
= b1 · x1 + b2 · x2 + . . . + bK · xK
Da wir als Ergebnis ein Skalar erhalten, folgt fur die Ableitung nach einem beliebigen Wert bj
des Vektors b:
∂(b′ · x)
∂bj= xj
Womit gilt, dass: (Im Fall der oben beschriebenen Matrixdimensionen)
∂(b′ · x)
∂b= x = X′ · y
Eine ahnliche Vorgehensweise nutzen wir bei Berechnung der partiellen Ableitung der dritten
Gleichung. Wieder fassen wir aus Grunden der Einfachheit das Produkt aus X’ und X in der
Matrix Z zusammen. Also Z = X′ ·X. Da es sich bei X um eine N ×K-Matrix handelt, ergibt
das Produkt aus transponierter Matrix und Matrix X fur Z eine quadratische Dimension K×K.
Wir suchen also eine Losung fur:
b′ · Z · b =(
b1 b2 · · · bK
)·
z11 z12 · · · z1K
z21 z22 · · · z2K...
.... . .
...
zK1 zK2 · · · zKK
·
b1
b2...
bK
= (∑K
j=1 bj · zj1 +∑K
j=1 bj · zj2 + . . . +∑K
j=1 bj · zjK) ·
b1
b2...
bK
= b1 ·
∑Kj=1 bj · zj1 + b2 ·
∑Kj=1 bj · zj2 + . . . + bK ·
∑Kj=1 bj · zjK
Das eben ausgerechnete Ergebnis lasst sich ebenfalls (aus-)schreiben als:
64
b′ · Z · b = b1 · b1 · z11 + b1 · b2 · z12 + . . . + b1 · bK · z1K +
b2 · b1 · z21 + b2 · b2 · z22 + . . . + b2 · bK · z2K +...
.... . .
...
bK · b1 · zK1 + bK · b2 · zK2 + . . . + bK · bK · zKK
Fur die folgende Ableitung ist es wichtig, sich vor Augen zu halten, dass die Matrix Z symme-
trisch ist, d.h. es gilt: zij = zji. Damit gilt fur die partiellen Ableitungen beispielswiese nach
b1.
∂b′·Z·b∂b1
= 2 · b1 · z11 + b2 · z12 + . . . + bK · z1K + b2 · z21 + . . . + bK · zK1
= 2 · b1 · z11 + 2 · b2 · z12 + . . . + 2 · bK · z1K= 2 ·
∑Kj=1 ·bj · z1j
Oder kurzer: (und in Matrizenschreibweise)
∂b′ · Z · b∂b
= 2 · Z · b = 2 ·X′ ·X · b
Wir sehen also: Das Ableiten von Matrizen ist prinzipiell genau so moglich wie fur reele Zahlen.
Allerdings spielen die Dimensionen der abzuleitenden Matrizen eine entscheidende Rolle fur das
Ergebnis, weshalb unter Umstanden umstandlichere Rechenvorgange vonnoten sind.
7.8.2 Auflosen der Gleichung
Wie wir soeben gezeigt haben, gilt:
∂u′ · u∂b
= 0− 2 ·X′ · y + 2 ·X′ ·X · b != 0
Durch einfaches Umstellen erhalt man:
2 ·X′ ·X · b = 2 ·X′ · y ⇔ b = (X′ ·X)−1 ·X′ · y
65
8 Stochastik
In diesem Kapitel werden einige Konzepte der Stochastik, wie sie aus dem Schulunterricht
bekannt sind, wiederholt. Eine detailierte Besprechnung dieser Materie findet innerhalb des
Studiums allerdings erstmalig in den Statistik-Kursen statt. Vorweg sei gesagt: Die nachfolgen-
den Kapitel ersetzen keinesfalls den Besuch der Statistik-Veranstaltungen! Wir wollen lediglich
versuchen, einige Basiskonzepte zu wiederholen, ohne dass wir auf statistische Testverfahren
eingehen. Wir wollen lediglich sicherstellen, dass ihr uber ein Fundament verfugt, um spater
sicher mit Mengen und Wahrscheinlichkeiten zu rechnen. Außerdem wollen wir spater einige
der wichtigsten Begrifflichkeiten der Statistik moglichst intuitiv erlautern, um insbesondere
Studenten im Nebenfach, die keine Statistikveranstaltungen besuchen, das Verstehen solcher
Thematiken zu erleichtern. Wenn euch das ein oder andere Thema allerdings vollkommen neu
ist: Keine Sorge! Ihr werdet im Verlauf eueres Studiums noch viel Gelegenheit bekommen, diese
zu verstehen.
8.1 Begriff der Wahrscheinlichkeit
Eine Wahrscheinlichkeit im Kontext der Mathematik ist das Maß zur Quantifizierung von Si-
cherheit oder Unsicherheit bei einem Zufallsereignis. Auch wenn dies zunachst sehr kompliziert
klingt, ist das Gemeinte aber bereits aus dem Alltagsgebrauch des Wortes Wahrscheinlichkeit
erschließbar. Denn auch wenn dies aus Sicht einer mathematischen Definition wenig korrekt
ist, versteht man unter einer Wahrscheinlichkeit zumeist eine Zahl, die angibt, ob ein Ereignis
haufig oder weniger haufig im Vergleich zu anderen Ereignissen auftritt.
Verdeutlicht sei dies am Beispiel eines geubten und eines ungeubten Sportlers. Wenn beide Spie-
ler die Chance bekommen, einen Basketball in einen Korb zu werfen, wurden wir vermuten,
dass es wahrscheinlicher ist, dass der geubte Sportler trifft, als dies beim ungeubten Sportler
der Fall ist. Trifft der geubte Sportler beispielsweise in acht von zehn Fallen, so betragt die
(quantitative) Wahrscheinlichkeit fur einen Treffer 0,8 = 80%. Beim ungeubten Sportler ist
diese, wenn er nur bei zwei von zehn Wurfen einen Korb macht, nur 0,2 = 20%.
Solche Zufallsereignisse spielen auch in der VWL eine tragende Rolle. Mit dem Wissen daruber,
ob eine Aktie”wahrscheinlich“ an Wert gewinnen wird oder nicht, lasst sich an der Borse viel
66
Geld verdienen (und verlieren). Im Gegensatz zu zwei verschieden starken Basketballspielern
ist eine solche Wahrscheinlichkeit aber oft ungleich komplexer, weshalb wir es nicht bei dieser
einfachen Begrifflichkeit belassen konnen.
8.2 Definition von Wahrscheinlichkeit
So wenig sich Manchem die Notwendigkeit dafur offenbaren mag: In der Mathematik existieren
verschiedene Definitionen der Wahrscheinlichkeit. Mit der Wahrscheinlichkeitstheorie existiert
sogar ein eigenes Teilgebiet, in dem daruber nachgedacht wird, was eine Wahrscheinlichkeit
tatsachlich bedeutet. Das zu wissen, ist zu einem kleinen Teil auch fur Volkswirte von Bedeu-
tung, da wir, wie oben angesprochen, viel uber Zufallsereignisse nachdenken und diese dann
oft unterschiedlich modelliert werden. Deshalb wollen wir zunachst zwei haufige”Typen“ von
Wahrscheinlichkeiten kennen lernen, bevor wir mit dem Rechnen beginnen.
8.2.1 Laplace-Wahrscheinlichkeit
Die Wahrscheinlichkeit nach dem Mathematiker Laplace ist eine der altesten Definitionen von
Wahrscheinlichkeit. Deshalb wird sie haufig auch als die klassische Definition der Wahrschein-
lichkeit bezeichnet. Nach Laplace definiert sich Wahrscheinlichkeit sehr einfach. Zunachst exi-
sitert eine Menge moglicher Ereignisse Ω. Und jedes Ereignis innerhalb von Ω gilt als gleich
wahrscheinlich. Mit einer Ereignismenge
Ω = Regen,Kein Regen
wurde dies nach Laplace bedeuten, dass es nur zwei mogliche Auspragungen des Zufallsereignis
Wetter gibt. Entweder regnet es morgen oder nicht. Das ist soweit naturlich kaum abzustreiten.
Nur unterstellt Laplace auch, dass beide Ereignisse gleich wahrscheinlich sind. Das heißt, die
Wahrscheinlichkeit (P fur probability) fur Regen betragt zum Beispiel:
P (Regen) = ”Zahl der gunstigen Ereignisse“
”Zahl der moglichen Ereignisse“
=|Regen|
|Regen,Kein Regen|=
1
2= 0,5
67
8.2.2 Axiomatische Wahrscheinlichkeit
Obige Annahme gleicher Wahrscheinlichkeit ist in vielen Anwendungsfallen problematisch.
Denn naturlich ist es Unsinn zu glauben, dass Regen und kein Regen zu jeder Zeit gleich-
wahrscheinliche Ereignisse sind. Auf Grund dieser Einschrankung hat die axiomatische Wahr-
scheinlichkeitstheorie in der Praxis oft eine hohere Bedeutung. Diese geht auf den Mathematiker
Kolmogorow zuruck. Der große Unterschied zur Definition nach Laplace ist, dass nach dieser
Theorie nicht versucht wird, die Wahrscheinlichkeit in eine besondere Form zu fassen, sondern
dass sehr allgemeine Eigenschaften von Wahrscheinlichkeit zusammengefasst wurden. Mit Hilfe
dieser Annahmen, lassen sich Wahrscheinlichkeiten dann einfacher ableiten. Diese Annahmen
sind:
1. Jedes Ereignis aus der Menge Ω hat eine Wahrscheinlichkeit. Diese kann nicht großer als
Eins (sicheres Ereignis = 100%) und nicht kleiner als Null (unmogliches Ereignis = 0%)
sein. Fur ein beliebiges Ereignis A gilt also:
0 ≤ P (A) ≤ 1
2. Die Wahrscheinlichkeit, dass ein beliebiges, aber kein bestimmtes Ereignis aus der Menge
Ω eintritt, betragt Eins. Im Klartext also: Irgendetwas passiert immer.
3. Wenn sich zwei Ereignisse gegenseitig ausschließen (zum Beispiel kann ein Wurfel nicht
gleichzeitig eine Zwei und eine Drei zeigen), dann entspricht die Wahrscheinlichkeit, dass
eines der beiden Ereignisse auftitt, gleich der Summe der Einzelwahrscheinlichkeiten, dass
eines von ihnen eintritt.
Aufbauend auf diesen Annahmen lassen sich, wie wir gleich sehen werden, durch Wahrscheinlichkeits-
, Dichte- und Verteilungsfunktionen komplexere Wahrscheinlichkeiten formulieren.
68
8.3 Diskrete und stetige Zufallsvariablen:
Wahrscheinlichkeits-, Dichte- und Verteilungsfunktion
8.3.1 Zufallsvariablen
Unter einer Zufallsvariablen verstehen wir eine Variable, die in der Mathematik fur ein Ereignis
mit nicht bekanntem Ausgang den Platz halt. Ihr Gegenstuck, die deterministische Variable,
ist einem jedem sicherlich noch bestens aus dem Schulunterricht bekannt. Man konnte mit ihr
einen Platzhalter fur einen unbekannten Wert setzen und so statt mit Zahlen mit dieser Unbe-
kannten weiterrechnen.
Eine Zufallsvariable ist im Grunde genommen nichts anderes als eine solche Unbekannte. Eine
Zufallsvariable kommt immer dann zum Einsatz, wenn wir mit einem Ereignis arbeiten mussen,
dessen Ergebnis noch offen steht. Steht uns beispielsweise frei, einen Betrag M entweder auf
einem Sparkonto mit Zinssatz a = 3% zu anzulegen oder in einer Wette (b) bei einem Sieg das
Geld zu verdoppeln oder bei Verlust alles zu verlieren, so lasst sich das Resultat der ersten
Option durch eine deterministische Variable beschreiben, das Resultat der letzteren aber nur
durch eine Zufallsvariable. Formal notiert wurde fur die Auszahlung Z jeweils gelten:
Sparkonto: Z = M · a
Wette: Z = M · b
Den Betrag auf dem Sparkonto konnen wir nun sehr einfach mit den uns bekannten Regeln
errechnen. Fur die vom Zufall abhangige Wette allerdings benotigen wir spezielle Rechenregeln.
Oft lassen sich Ergebnisse hier namlich nur als Erwartung oder Verteilung darstellen. Denn
welchen Wert b letzendlich annimmt, wissen wir zu diesem Zeitpunkt nocht nicht. Das hierzu
notige Grundwerkzeug lernen wir in den folgenden Kapiteln kennen.
8.3.2 Diskrete Zufallsvariablen
Man spricht von einer diskreten Zufallsvariablen, wenn ein Ereignis nur eine begrenzte Zahl von
Auspragungen annehmen kann. Ein Wurfel kann zum Beispiel nur die Seiten Eins bis Sechs
zeigen. Die Menge der moglichen Ergebnisse ist also Ω = 1, 2, 3, 4, 5, 6 und damit begrenzt. Die
Wahrscheinlichkeitsfunktion gibt dabei fur jede Auspragung xi des Zufallsereignisses Wurfeln
69
an (Im Folgenden wird das Ereignis, hier also das ”Wurfeln”mit X bezeichnet. Ein mogliches
Ergebnis, also die Augen, die das Wurfeln zeigt, mit xi), wie haufig es relativ zu den anderen
Ereignissen eintritt. Wenn also jede Seite des Wurfels gleich oft nach oben zeigt, dann betragt
die Wahrscheinlichkeit fur zum Beispiel die Zahl Zwei (X = x2 = 2) gemaß der Definition von
Laplace 16. Formal wird eine solche Wahrscheinlichkeit wie hier notiert:
f(2) = P (X = 2) =1
6
Allgemeiner wird die Wahrscheinlichkeitsfunktion so aufgeschrieben: (auch fur Nicht-Laplace-
Wahrscheinlichkeiten)
f(xi) = P (X = xi) ∀ i ∈ 1, . . . , N
Die Intuition fur diese allgemeine Formel wird im Folgenden an einem typischen Beispiel
erlautert, auf das wir auch spater noch haufiger zuruck greifen werden: Das betrachtete Zu-
fallsereignis ist dabei der gleichzeitige Wurf von zwei Wurfeln mit sechs Augen. Das uns in-
teressierende Ereignis (X) ist die Summe der gezeigten Augen beider Wurfel. Wie sich diese
Augensumme zusammensetzt, ist uns hingegen egal. Nur die Augensumme interessiert uns. Die
Menge aller moglichen Ereignisse ist jetzt Ω = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12: Der kleinste Wert
ist Zwei. (Beide Wurfel zeigen eine Eins.) Der hochste mogliche Wert ist die Zwolf. (Beide
Wurfel zeigen eine Sechs.) Durch geeignete Kombinationen konnen auch alle Werte dazwischen
erzielt werden. Zusammengefasst in einer Tabelle sind deshalb alle der folgenden Ergebnisse
moglich:
xi Augen der Wurfel Nr.1, Nr.2 Haufigkeit Kumuliert
2 1,1 1 1
3 1,2 2,1 2 3
4 1,3 3,1 2,2 3 6
5 1,4 2,3 3,2 4,1 4 10
6 1,5 2,4 3,3 4,2 5,1 5 15
7 1,6 2,5 3,4 4,3 5,2 6,1 6 21
8 2,6 3,5 4,4 5,3 6,2 5 26
9 3,6 4,5 5,4 6,3 4 30
10 4,6 5,5 6,4 3 33
11 5,6 6,5 2 35
12 6,6 1 36
Tabelle 1: Mogliche Ereignisse beim gemeinsamen Werfen mit zwei Wurfeln.
70
Wie es aus der obenstehenden Tabelle ersichtlich ist, sind die verschiedenen Ergebnisse fur die
Summe der Augen nun nicht mehr gleichwahrscheinlich wie es beim Werfen mit nur einem
Wurfel der Fall war. So ist die Augensumme Zwei beispielsweise nur mit einem Einserpasch
moglich. Eine Augensumme von Sieben ergeben hingegen sechs verschiedene Wurfelkombinationen,
weshalb wir beim Wurfeln eine Zwei viel seltener als die Sieben zu sehen bekommt.
Dass verschiedene Ereignisse nun unterschiedlich wahrscheinlich sind, liegt daran, dass wir ver-
schiedene Elementarereignisse nun zu komplexeren Ereignissen zusammengefasst haben. Kon-
kret haben wir die Elementarereignisse des Wurfelns mit einem Wurfel zu einem gemeinsamen
Wurf aggregiert. Diese Elementarereignisse ließen sich auch weiterhin mit einer Wahrschein-
lichkeit nach Laplace beschreiben, aber es ist schnell zu erkennen, dass diese Moglichkeit fur
viele Anwendungsgebiete außerst unpraktisch ist. Es ware zu schwierig, beispielsweise zur Be-
stimmung des Wetters, alle Grundfaktoren wie Windstarke, Sonneneinstrahlung etc. zu abstra-
hieren, um daraus nach Laplace eine Wahrscheinlichkeit fur den Regen abzuleiten. Und auch
in der VWL konnen viele Wahrscheinlichkeiten nicht durch Aggregation der Grundereignisse
bestimmt werden.
Deshalb prufen wir fur das Beispiel der beiden Wurfel zunachst die Regeln der axiomatischen
Wahrscheinlichkeit. Wie fur jedes Zufallsereignis gilt die Definition der drei genannte Bedinun-
gen: (1) Jedes Ereignis hat eine (individuelle) Wahrscheinlichkeit, einzutreten. (2) Die Wurfel
werden immer eine der Zahlen aus der Ereignismenge zeigen. (3) Und die Wahrscheinlichkeit,
dass eine von zwei beliebige Zahlen nach oben zeigt, entspricht der Summe der Einzelwahr-
scheinlichkeiten.
Damit wir aber weiterhin Wahrscheinlichkeiten fur Ereignisse in Zahlen fassen konnen und auch
einem Außenstehenden die Wahrscheinlichkeit eines Zufallsereignisses vermitteln konnen, ohne
ihn muhselig uber die Zusammensetzung aus Elementarereignissen zu informieren, (sofern das
uberhaupt moglich ist) ist deshalb die bereits angesprochene Wahrscheinlichkeitsfunktion not-
wendig, welche die Haufigkeiten einzelner Auspragungen des Zufallsereignisses zusammenfasst.
Fur das Werfen von zwei Wurfeln sieht diese Funktion beispielsweise folgendermaßen aus:
71
f(xi) =
136, xi ∈ 2, 12
236, xi ∈ 3, 11
336, xi ∈ 4, 10
436, xi ∈ 5, 9
536, xi ∈ 6, 8
636, xi = 7
Die Funktion sieht nur auf den ersten Blick umstandlich aus. Im Gegenteil aber kann mit Hil-
fe dieser Ausdrucksweise eine große Menge von Information auf wenig Platz zusammengefasst
werden. Dazu enthalt sie alle Informationen uber die Wahrscheinlichkeiten, die wir zuvor noch
in einer umstandlichen Tabelle abgefasst haben. So liest sich aus der ersten Zeile dieser Formel
zum Beispiel von links nach rechts, dass die Wahrscheinlichkeit fur eine Auspragung 136
betragt,
wenn diese Auspragung die Augensumme 2 oder 12 ist. (In diesem Zusammenhang bedeutet
”xi ∈ 2; 12“ so viel wie
”xi = 2 oder xi = 12“. Spater besprechen wir diese Art der Notation
noch etwas ausfuhrlicher.)
Eine in der VWL und Statistik noch viel haufigere Form, um Wahrscheinlichkeiten zu beschrei-
ben, ist die sogenannte (kumulierte) Verteilungsfunktion. Im Gegensatz zur Wahrscheinlichkeits-
funktion bringt diese zum Ausdruck, wie haufig ein Ereignis gemeinsam mit allen bisherigen
Ereignissen eintritt. Fur die Zahl Sieben gibt die Verteilungsfunktion also an, wie wahrscheinlich
die Zahl Sieben oder eine kleinere Zahl gewurfelt wird. Dazu werden einfach die Wahrschein-
lichkeiten aller Ereignisse in aufsteigender Reihenfolge aufaddiert:
F (xi) =
136, xi = 2
336, xi = 3
636, xi = 4
1036, xi = 5
1536, xi = 6
2136, xi = 7
2636, xi = 8
3036, xi = 9
3336, xi = 10
3536, xi = 11
1, xi = 12
72
Ublicherweise werden Wahrscheinlichkeitsfunktionen dabei immer mit einem Kleinbuchstaben,
Verteilungsfunktionen mit einem Großbuchstaben bezeichnet. Die Bedeutung dieser Ausdrucks-
form wird im folgenden Kapitel mit stetigen Zufallsvariablen aber noch von großerer Bedeutung.
Außerdem wird es einfacher zu verstehen, warum in vielen Fallen eine Verteilungsfunktion ein-
facher zu interpretieren ist als eine Wahrscheinlichkeitsfunktion.
8.3.3 Stetige Zufallsvariablen
Im Gegensatz zu einer diskreten Zufallsvariablen ist die Menge der moglichen Auspragungen,
die sich in einem stetigem Zufallsereignis ergeben konnen, nicht auf eine zahlbare Gruppe von
Ergebnissen beschrankt. Stetige Zufallsvariablen konnen innerhalb eines (festzulegenden) Inter-
valls jeden beliebigen Wert annehmen. Als Beispiel konnen Borsenkurse (X) genannt werden.
Eine Aktie notiert nicht zwingend mit einem nach oben hin beschranktem Preis (xi) ganzer
Euros. Wurde man jedenfalls versuchen, fur jeden moglichen Aktienpreis in Eurocent eine eige-
ne, diskrete Wahrscheinlichkeit zu bestimmen, wurde man damit zu keinem sinnvollen Ergebnis
kommen.
Darum werden stetige Zufallsereignisse vorzugsweise mit Hilfe einer Dichtefunktion beschrie-
ben. Diese Dichtefunktion gibt fur alle moglichen Wertbereiche einer Aktie an, wie wahrschein-
lich sich relativ zu anderen Ereignnissen ein bestimmter Kurs einstellt. Sie ist sozusagen das
Aquivalent zur Wahrscheinlichkeitsfunktion bei diskreten Zufallsvariablen. Tatsachlich werden
beide Begriffe haufig sogar synonym verwendet.
Auch lasst sich wie bei diskreten Zufallsvariablen eine Verteilungsfunktion errechnen, welche
die aufsummierten Wahrscheinlichkeiten bis zu einem bestimmten Wert angeben. Wurde man
in einem Model uber Aktienkurse zum Beispiel die Verteilungsfunktion zu einem Aktienpreis
von 20 Euro die folgende Formel finden:
F (x = 20) = P (0 ≤ x ≤ 20) =
∫ 20
0
f(x) dx = 0,7
Dann ließe sich hieraus ablesen, dass die Wahrscheinlichkeit fur einen Aktienkurs von 20 Eu-
ro oder kleiner genau 70 Prozent betragt. F (x) bezeichnet dabei - wie zuvor - bei diskreten
73
Zufallsvariablen die Verteilungsfunktion und f(x) die Dichtefunktion. Im Gegensatz zur Wahr-
scheinlichkeitsfunktion bei diskreten Zufallsvariablen erklart die Dichtefunktion nun allerdings
nicht mehr, wie wahrscheinlich ein bestimmtes Ereignis ist. Es gilt bei stetigen Zufallsereignissen
darum:
f(xi) = P (X = xi) = 0
Die Dichtefunktion lasst sich im Vergleich zur Wahrscheinlichkeitsfunktion deshalb nur schwer
interpretieren. Lieber verwenden viele Autoren daher die Verteilungsfunktion, um die bespro-
chenen Ereignisse sinnvoll zu beschreiben. Auch ist es wichtig, anzumerken, dass bei stetigen
Verteilungsfunktionen die Wahrscheinlichkeit, dass sich ein bestimmtes Ergebnis einstellt, im-
mer approximativ Null angenommen wird. Die Wahrscheinlichkeit. dass ein ganz bestimmter
Aktienkurs (mit einer Unzahl von Nachkommastellen) an der Borse notiert wird, ist also so
gering, dass sie nahe Null vermutet wird. Die Dichtefunktion kann hingegen sogar Werte großer
als Eins annehmen, was nur bedeutet, dass ein Wert relativ zu anderen Ereignissen haufiger
auftritt. Ein Aktienkurs von genau 20 Euro ist demnach zwar selten, aber immer noch wahr-
scheinlicher als ein Kurs von 1000 Euro.
8.4 Rechnen mit Zufallsvariablen
Im Folgenden wollen wir ein paar haufige Begriffe aus der Stochastik erlautern, die auch in
der VWL regelmaßigen Gebrauch finden. Allerdings werden wir weniger”rechnen“ als eine
Intuition fur die Begrifflichkeiten geben. Dazu werden wir formale Begriffe in einen verbalen
Kontext setzen und wollen so ein Gefuhl fur einige Begriffe der Stochastik vermitteln. Eine
ausfuhrliche Erlauterung der in diesem Kapitel besprochenen Inhalte findet in den Kursen zur
Statistik statt und bleibt hier deshalb außen vor.
8.4.1 Mengenlehre
Wir haben bereits festgestellt, dass jedem Zufallsexperiment eine Menge von Ereignissen zuge-
ordnet ist, die sich als Ergebnis einstellen konnen. Diese Mengen werden nach den Regeln der
sogenannten Mengenlehre miteinander verrechnet. Deshalb wollen wir die in der Mengenlehre
74
gebrauchte Notation in diesem Abschnitt kurz zusammenfassen.
Als Beispiel fur die Mengenlehre betrachten wir zwei Zufallsvariablen. Als A bezeichnen wir den
Wurf mit einem Wurfel. Dessen Ereignismenge ist, wie oben gezeigt, ΩA = 1, 2, 3, 4, 5, 6. Als
zweite Zufallsvariable betrachten wir B, einen Wurf mit zwei Wurfeln. Das uns interessierende
Ereignis ist wieder die Summe der Augenzahlen beider Wurfel ΩB = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.
Im Kontext der Mengenlehre interessieren wir uns dabei nicht fur die Eintrittswahrscheinlich-
keit der jeweiligen Zufallsvariablen. Im Folgenden sind ausschließlich die Mengen der moglichen
Ereignisse von Bedeutung. Wir wollen dabei verstehen lernen, wie man bestimmte verbale Aus-
drucke formal notiert.
Zunachst existieren in der Mengenlehre einige Symbole, mit deren Hilfe Zusammenhange zwi-
schen Mengen und Elementen lediglich beschrieben werden. So lasst sich zum Beispiel zum
Ausdruck bringen, dass eine Zahl ein Element einer Menge ist.
1 ∈ ΩA
Dieser Term ist richtig, da die Zahl 1 mit einem einzelnen Wurfelwurf erzielbar ist. Folglich ist
1 ein Element der moglichen Wurfelergebnisse. Hingegen gilt
1 /∈ ΩB
denn die Zahl 1 kann nicht die Augensumme zweier Wurfel sein. Beschreibt man hingegen die
Gemeinsamkeit zweier Mengen, so wird statt des Elementsymbols das Symbol fur die Teilmenge
zum Einsatz gebracht. Die Menge der Zahlen 4 und 5 ist beispielsweise vollstandig in ΩA
enthalten. Darum gilt
4, 5 ⊂ ΩA
als echte Teilmenge. Von einer unechten Teilmenge spricht man allerdings nur, wenn zwei Men-
gen eigentlich identisch sind. Zwar ist ein Menge in sich selbst vollstandig enthalten, allerdings
gilt dieser Zusammenhang auch umgekehrt. Notiert wird das so:
1, 2, 3, 4, 5, 6 ⊆ ΩA.
75
Allerdings ist bei der Notation Vorsicht geboten. Manchmal wird eine echte Teilmenge auch
mit ( markiert wahrend die (unechte) Teilmenge mit ⊂ notiert wird.
Mit Hilfe der Mengenlehre lassen sich Gemeinsamkeiten von ΩA und ΩB nicht nur beschreiben,
es konnen auch neue Mengen gebildet werden. Rechnerisch sind die meisten Begrifflichkeiten
trivial, allerdings ist die Notationsform ungewohnt. Zunachst ist
ΩA ∪ ΩB = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
die Vereinigung zweier Mengen. Eine Vereinigung ergibt immer die Ereignisse, die sich aus A,
aus B oder aus beiden Zufallsvariabeln ergeben konnen. Dazu im Gegensatz steht die Schnitt-
menge. Mit
ΩA ∩ ΩB = 2, 3, 4, 5, 6
werden nur solche Ereignisse abgebildet, die sich sowohl aus A als auch aus B ergeben konnen.
Anders verhalt es sich mit der Differenzmenge. Diese ist
ΩA \ ΩB = 1
und enthalt all jene Elemente, die sich in ΩA aber nicht in ΩB befinden.
Zuletzt lernen wir noch das kartesische Produkt kennen. Im Vergleich zu den letzteren Berech-
nungen ist diese ein wenig komplexer. Mit dem kartesischen Produkt werden die moglichen
Ereignisse zweier Zufallsvariablen nicht zusammengefuhrt, sondern zu einem neuen Ereignis
kombiniert. Dadurch erhalt das Ergebnis eine neue Form. Fur das hier angefuhrte Beispiel
ergibt das kartesische Produkt alle moglichen Ergebnise fur beide Zufallsvariablen. Es gilt:
ΩB × ΩA = (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), . . . , (12, 6)
Dabei steht ein Wertpaar (2, 5) beispielsweise fur das Ergebnis, dass gleichzeitig B = 2 und
A = 5 gilt.
76
8.4.2 Bedingte Wahrscheinlichkeit
Wir stellen die Mengenlehre wieder zuruck und wenden uns wieder den Eintrittswahrschein-
lichkeiten von Ereignissen zu. Fur eine intuitive Erklarung der bedingten Wahrscheinlichkeit
kehren wir zu unserem Beispiel mit der Augensumme beim Werfen zweier Wurfel zuruck. Eine
bedingte Wahrscheinlichkeit bezeichnet dabei immer, dass eine Wahrscheinlichkeit bedingt, also
ein Teilereigniss vorausgesetzt, bereits eingetreten ist. Wurde man beispielsweise zunachst einen
der Wurfel werfen, der dann mit einer Drei nach oben zeigt, (Diese Teilereignis bezeichnen wir
mit X1 = 3.) dann ist eine Augensumme beider Wurfel von Zwei nicht mehr moglich - ganz
egal, welche Zahl der zweite Wurfel anschließend noch anzeigt. Darum gilt:
f(2|X1 = 3) = P (X = 2|X1 = 3) = 0.
Eine Funktion mit bedingter Wahrscheinlichkeit gibt also an, wie wahrscheinlich ein Zufallser-
eignis nach Erhalt neuer Informationen ist. Formal wird das bedingte, also bekannte Ereignis,
immer nach einem Laengsstrich notiert. (Diese Notation gilt nicht nur fur die Wahrscheinlich-
keit. Ein Laengsstrich lasst sich auch in anderem Kontext als”fur den Fall, dass“ interpretieren.)
Wenn sich die Wahrscheinlichkeit fur ein Zufallsereignis mit der Auspragung einer Kompo-
nente nicht verandert, spricht man weiter von einer Unabhangigkeit zweier Ereignisse. Die
Unabhangigkeit und die bedingte Wahrscheinlichkeit sind dabei mit Sicherheit Jedem unter
anderer Begrifflichkeit bereits bekannt und finden sich bereits im Gebrauch der Alltagssprache
haufig wieder. Dazu sei ein banales Beispiel aufgefuhrt. Auch wenn sich naturlich selbst hieruber
streiten lasst, so ist beispielsweise anzunehmen, dass die Wahrscheinlichkeit tagsuber beim Fah-
ren mit dem Auto einen Unfall zu erleiden, unabhangig von der Mondphase. Damit gilt, dass
das Risiko fur einen Unfall bei z.B. Neumond gleich dem Risiko bei jeder anderen Mondphase
ist. Die beiden”Ereignisse“ sind unabhangig. Darum gilt fur die bedingte Wahrscheinlichkeit:
f(Unfall |Mond = Neumond) = P (X = Unfall |Mond = Neumond) = P (X = Unfall).
Weiß man hingegen sicher, dass ein Fahrer bei schlechtem Wetter unterwegs ist, so wurde man
ihm hingegen eine hohere Wahrscheinlichkeit zuschreiben, mit dem Auto zu verunglucken, als
einem Fahrer bei”durchschnittlichem“, beliebigem Wetter.
77
f(Unfall) < f(Unfall |Wetter = Regen)
Nicht anders liest sich die bedingte Wahrscheinlichkeit in allen anderen Bereichen. Nur wird dies
dann zumeist etwas technischer zum Ausdruck gebracht, was aber niemanden weiter verwirren
sollte. An dieser Stelle genugt es, sich zu merken, was es in der Stochastik bedeutet, dass eine
Zufallsvariable bedingt eintritt.
8.4.3 Erwartungswert
Der Erwartungswert ist die mit Eintrittswahrscheinlichkeiten gewichtete Summe aller moglichen
Auspragungen eines Zufallsereignisses. Weniger technisch ausgedruckt: Der Erwartungswert ist
ein Durchschnitt, wobei die Auspragungen nicht gleichberechtigt, sondern zu ihren jeweiligen
Wahrscheinlichkeiten berucksichtigt werden. Als anschauliches Beispiel betrachten wir wieder
die Augenzahl beim Werfen mit zwei Wurfeln. Die Wahrscheinlichkeiten der jeweiligen Aus-
pragungen in Ω wurden dazu bereits bei der Besprechung diskreter Zufallsvariablen beschrie-
ben. Aus der Wahrscheinlichkeitsfunktion f(x) lasst sich fur den Erwartungswert also nach der
obigen Definition berechnen:
E(X) =1
36·2+
2
36·3+
3
36·4+
4
36·5+
5
36·6+
6
36·7+
5
36·8+
4
36·9+
3
36·10+
2
36·11+
1
36·12 = 7.
Die Zahl Sieben ist also der Erwartungswert fur dieses Zufallsereignis. Das ist dabei auch wenig
uberraschend, schließlich haben wir bereits festgestellt, dass dieser Wert auch der haufigste
ist. Allerdings muss der Erwartungswert nicht fur alle Zufallsereignisse den haufigsten Wert
wiedergeben. Betrachten wir beispielsweise wieder das Werfen eines einzelnen Wurfels, so ist
der Erwartungswert:
E(X) =1
6· 1 +
1
6· 2 +
1
6· 3 +
1
6· 4 +
1
6· 5 +
1
6· 6 = 3,5
Naturlich ist es klar, dass ein Wert von 3,5 niemals von diesem Wurfel gezeigt wird. Trotzdem
ist der Wert 3,5 moglichst nahe an allen moglichen, gleich wahrscheinlichen Ergebnissen des
78
Wurfes. Nicht anders ist ein Erwartungswert zu interpretieren: Werden die Ergebnisse des Zu-
fallsereignisses eher hoch sein, wachst auch der Erwartungswert mit. Bei tendenziell niedrigen
Auspragungen, schrumpft der Erwartungswert eines Zufallsereignisses in Richtung dieser Werte.
Fur stetige Zufallsvariablen ist die Interpretation des Erwartungswertes identisch, nur die Be-
rechnung erfolgt etwas anders, namlich durch das Berechnen eines Integrals. Allgemein gilt
daher fur den Erwartungswert diskreter und stetiger Zufallsereignisse:
Diskrete Zufallsvariable: E(X) =n∑
i=1
xi · f(xi)
Stetige Zufallsvariable: E(X) =
∫ ∞
−∞x · f(x) dx
Glucklicherweise lassen sich Erwartungswerte auch durch Rechenregeln umformen. Dabei gelten
leicht modifizierte Regeln wie beim Rechnen mit reelen Zahlen. Am Beispiel eines Wurfes mit
einem Wurfel X und zwei konstanten Werten a = 3 und b = 2 gilt:
E(a + b ·X) = E(a) + E(b) · E(X) = a + b · E(X).
Die Interpretation lasst sich wie folgt formulieren: Frage ich eine beliebige Person welchen Wert
er beim Wurfeln eines einzelnen Wurfels erwartet, wenn er das Ergebnis anschließend noch mit
Zwei multipliziert und den Wert Drei aufaddiert, dann entpricht dies der gleichen Zahl, die sich
ergibt, wenn ich denjenigen nur nach seiner Erwartung fur den gewurfelten Wert befrage und
die Rechnungen anschließend selbst durchfuhre.
Ganz ahnlich verhalt es sich fur das Addieren und Subtrahieren zweier Wurfe X und Y :
E(X + Y ) = E(X) + E(Y ) und E(X − Y ) = E(X) − E(Y ).
Wieder ergibt sich das gleiche Ergebnis, wenn direkt nach der Erwartung fur die Summe der
Wurfel gefragt wird oder wenn sich nach den jeweiligen Erwartungswerten der Wurfel X und
79
Y erkundigt wird und die Addition anschließend selbst durchgefuhrt wird.
Allerdings lassen sich Erwartungswerte nicht multiplizieren. Berechnen wir den Erwartungswert
fur das Produkt zweier Wurfe mit dem gleichem Wurfel X:
E(X2) =1
6· 12 +
1
6· 22 +
1
6· 32 +
1
6· 42 +
1
6· 52 +
1
6· 62 ≈ 15,16 = (3, 5)2 = 12,25.
Eine detailierte, mathematische Besprechung von Erwartungswerten findet innerhalb des Stu-
diums erstmals in den Verantaltungen zur Statistik statt. Hier wollen wir uns vor allem mit
einer Intuition fur das Rechnen mit Erwartungswerten zufrieden geben. Eine solche, intuitive
Auslegung von Erwartungswerten ist in der VWL ubrigens sehr viel ofter ein Thema als man
es zunachst vermuten wurde. Deswegen ist es oft hilftreich, sich zunachst an mogliche intuiti-
ve Erklarungen fur Erwartungswerte zu erinnern, als beim Anblick eines Erwartungsfunktion
sofort einen Taschenrechner zu zucken.
8.4.4 Die Momente einer Wahrscheinlichkeitsverteilung
Oftmals wird ein Erwartungswert mit dem sogenannten Mittelwert einer Verteilung gleich-
gesetzt. Das ist mathematisch aber nicht ganz korrekt. Zwar lasst sich der Mittelwert einer
Zufallsvariable X unmittelbar aus dem Erwartungswert berechnen. Allerdings leiten sich auch
hohere Momente von Verteilungen, die wir nur kurz ansprechen werden, aus dem Erwartungs-
wert ab. Die genaue Bedeutung der Momente einer Zufallsvariablen wird in den Veranstaltungen
zur Statistik besprochen.
Grund fur die haufige Gleichsetzung von Mittel- und Erwartungswert ist die Definition des
Ersteren. Denn fur das Werfen eines Wurfels mit sechs Seiten gilt fur den Mittelwert µX eine
einfache Definition. Dieser sogenanne erste Moment einer Wahrscheinlichkeitsverteilung ent-
spricht schlichtweg dem Erwartungswert von X:
µX = E(X) = 3,5
Genauso berechnen sich hohere Momente der Wahrscheinlichkeit. Die Varianz, der zweite Mo-
ment einer Wahrscheinlichkeitsverteilung, ist ebenso als Rechnung mit Erwartungswerten de-
finiert. Auch wird aus dieser Rechnung klarer, warum der Erwartungswert nur bedingt dem
80
Mittelwert entspricht. Ersterer ist namlich nicht an eine bestimmte Form der Zufallsvariablen
gebunden. Fur die Varianz σ2X eines Wurfelwurfs X gilt
σ2X = E[X−E(X)]2 =
1
6·[1−3,5]2+
1
6·[2−3,5]2+
1
6·[3−3,5]2+
1
6·[4−3,5]2+
1
6·[5−3,5]2+
1
6·[6−3,5]2
mit einem Ergebniss von σ2X ≈ 2,92. Und auch die hoheren Momente - Schiefe und Wolbung
einer Verteilung - berechnen sich mit Hilfe von Erwartungswerten. Die Formeln zur Berechnung
seien an dieser Stelle nur zur Vollstandigkeit aufgefuhrt:
Drittes Moment: E[X − E(X)]3 = 3,5
Viertes Moment: E[X − E(X)]4 = 3,5
An dieser Stelle wollen wir uns aber damit begnugen, den Unterschied zwischen dem Erwar-
tungswert und den vier Momenten einer Wahrscheinlichkeitsverteilung berechnen. Wichtig soll
es fur uns nur sein, zu begreifen, dass ein solcher Unterschied besteht und wie die Berechnung
funktioniert.
81