libro matematicas para economistas

270
Apuntes de matem´aticas para econom´ ıa (V2005) Jorge Rivera 1 1 de marzo de 2005 1 Departamento de Econom´ ıa, Universidad de Chile, Diagonal Paraguay 257, Torre 26, Of. 1502, San- tiago, Chile. email: [email protected]. Se agradece enormemente la colaboraci´on de Sergio ´ Urzua en el desarrollo de este documento, como as´ ı la colaboraci´on de los alumnos del curso en diversos a˜ nos.

Upload: newtonix

Post on 14-Dec-2014

309 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Libro Matematicas Para Economistas

Apuntes de matematicas para economıa(V2005)

Jorge Rivera 1

1 de marzo de 2005

1Departamento de Economıa, Universidad de Chile, Diagonal Paraguay 257, Torre 26, Of. 1502, San-tiago, Chile. email: [email protected]. Se agradece enormemente la colaboracion de Sergio Urzua enel desarrollo de este documento, como ası la colaboracion de los alumnos del curso en diversos anos.

Page 2: Libro Matematicas Para Economistas

Indice general

1. Introduccion: conjuntos, numeros y funciones. 51.1. Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.1. Producto cartesiano de conjuntos . . . . . . . . . . . . . . . . . . . . . . . 81.1.2. Familias de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.1.3. Cuatificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2. Conjuntos numericos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3. Numeros complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.4. Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.4.1. Curvas de nivel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.4.2. Crecimiento y convexidad de funciones . . . . . . . . . . . . . . . . . . . . 24

2. Introduccion al algebra lineal 292.1. Vectores en IRn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292.2. Un poco de geometrıa en IRn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.3. Conceptos basicos de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.4. Nucleo e imagen de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.4.1. Aspectos numericos de los sistemas de ecuaciones . . . . . . . . . . . . . . 522.5. Formas cuadraticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2.5.1. Valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . 612.5.2. Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632.5.3. Calculo de valores y vectores propios usando determinantes . . . . . . . . 672.5.4. Positividad de matrices, valores propios y descomposicion ortogonal de

matrices simetricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682.5.5. Funciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3. Topologıa y continuidad 753.1. Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 753.2. Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 813.3. Lımite de funciones y continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

4. Diferenciacion de funciones 974.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.2. Definiciones basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3. Aplicaciones de la derivada y resultados complementarios . . . . . . . . . . . . . 102

4.3.1. El Teorema de la Funcion implıcita . . . . . . . . . . . . . . . . . . . . . . 1024.3.2. El Teorema del Valor Medio . . . . . . . . . . . . . . . . . . . . . . . . . . 1034.3.3. Funciones Lipschitzianas y punto fijo . . . . . . . . . . . . . . . . . . . . . 104

1

Page 3: Libro Matematicas Para Economistas

2 INDICE GENERAL

4.3.4. Resolucion numerica de ecuaciones . . . . . . . . . . . . . . . . . . . . . . 1064.3.5. Analisis de crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1064.3.6. Condiciones de optimalidad . . . . . . . . . . . . . . . . . . . . . . . . . . 1074.3.7. Polinomio de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1094.3.8. Reglas de L’Hopital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

4.4. Ejemplos y ejercicios adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . 1114.4.1. El problema de los costos: caso simple . . . . . . . . . . . . . . . . . . . . 1114.4.2. El problema de la maximizacion de beneficios . . . . . . . . . . . . . . . . 1124.4.3. La maximizacion de la utilidad y la demanda de mercado . . . . . . . . . 113

5. Convexidad y temas afines 1155.1. Conjuntos convexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1165.2. Convexidad de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1185.3. Propiedades complementarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.3.1. Convexas y optimizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1245.3.2. Teorema de Hahn - Banach . . . . . . . . . . . . . . . . . . . . . . . . . . 1255.3.3. Propiedades geometricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

6. Optimizacion estatica 1276.1. Introduccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1276.2. Problema de optimizacion sin restricciones . . . . . . . . . . . . . . . . . . . . . . 1306.3. Problema de optimizacion con restricciones de igualdad . . . . . . . . . . . . . . 1326.4. Problema de optimizacion con restricciones de desigualdad . . . . . . . . . . . . . 1366.5. Analisis de sensibilidad y temas relacionados . . . . . . . . . . . . . . . . . . . . 1416.6. Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

7. Ecuaciones diferenciales y en diferencia 1497.1. Ecuaciones diferenciales: introduccion . . . . . . . . . . . . . . . . . . . . . . . . 1497.2. Resolucion de EDOLCC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

7.2.1. Solucion de la homogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . 1547.2.2. Solucion particular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

7.3. Sistemas de ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . 1637.4. Breve introduccion a las ecuaciones en diferencia . . . . . . . . . . . . . . . . . . 1687.5. Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

8. Diagramas de Fase 1758.1. Nociones basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1758.2. Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

9. Calculo Variacional 1839.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1839.2. Condiciones necesarias de optimalidad del problema de CV . . . . . . . . . . . . 186

9.2.1. Nociones basicas de integracion. . . . . . . . . . . . . . . . . . . . . . . . 1869.2.2. Las condiciones de optimalidad de primer orden . . . . . . . . . . . . . . 190

9.3. Casos mas generales: condiciones de transversalidad. . . . . . . . . . . . . . . . . 1949.4. El problema de CV con varias variables . . . . . . . . . . . . . . . . . . . . . . . 1979.5. Problema isoperimetrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1999.6. CV con restricciones de igualdad . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

Page 4: Libro Matematicas Para Economistas

INDICE GENERAL 3

9.7. CV con restricciones de desigualdad . . . . . . . . . . . . . . . . . . . . . . . . . 2009.8. Condiciones suficientes y de segundo orden . . . . . . . . . . . . . . . . . . . . . 2019.9. El caso de horizonte infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2029.10. Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

10.Control optimo 20710.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20710.2. Condiciones de optimalidad; principio del maximo . . . . . . . . . . . . . . . . . 20810.3. El problema de CO en varias variables . . . . . . . . . . . . . . . . . . . . . . . . 21410.4. El problema autonomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21510.5. Condiciones suficientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21510.6. El problema de Control Optimo con restricciones . . . . . . . . . . . . . . . . . . 21610.7. Ejemplo: problema neoclasico de crecimiento. . . . . . . . . . . . . . . . . . . . . 21710.8. Ejemplo: el Modelo de Ramsey . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22110.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

11.Programacion Dinamica 22911.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22911.2. Las condiciones de optimalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23011.3. Principio de optimalidad y ecuacion de Bellman . . . . . . . . . . . . . . . . . . . 23211.4. Horizonte infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23511.5. Problemas estocasticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23611.6. Ejemplos y problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . 23711.7. Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

12.Correspondencias 24512.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24512.2. Problema general de eleccion y puntos fijos . . . . . . . . . . . . . . . . . . . . . 24912.3. Ejercicios Adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

13.Respuestas y Comentarios a Ejercicios 25313.1. Sobre Capıtulo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25313.2. Sobre Capıtulo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25813.3. Sobre Capıtulo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26113.4. Sobre Capıtulo 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26413.5. Sobre Capıtulo 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

Page 5: Libro Matematicas Para Economistas

4 INDICE GENERAL

Page 6: Libro Matematicas Para Economistas

Capıtulo 1

Introduccion: conjuntos, numeros yfunciones.

En este capıtulo vamos a introducir una serie de conceptos basicos de matematicas, que tantopor notacion como por un valor en sı mismo tienen importancia para todo lo que sigue en esteapunte de curso.

1.1. Conjuntos

En matematicas, los conceptos de conjunto y pertenencia no se definen, asumiendose unaconcepcion tacita de los mismos. Para el caso de conjunto, la idea es obviamente aquella de colec-cion o agrupacion de entes. La pertenencia se refiere al hecho de estar o no en un determinadoconjunto.

El conjunto vacıo corresponde a un conjunto que no tiene elementos y se representa por φ.El conjunto universo representa todo el mayor conjunto en un contexto especıfico de analisis yse representara por U1.

Cuando un elemento a pertenece a un conjunto A denotaremos a ∈ A, en caso contrario sedenotara a /∈ A. Con esto, podemos definir la nocion de inclusion de conjuntos de la siguienteforma.

Definicion 1.1.1 Diremos que un conjunto B es subconjunto del conjunto A si y solo si todoelemento de B es un elemento de A, es decir, si ∀ b ∈ B se tiene que b ∈ A. Denotaremos en talcaso B ⊆ A. 2

Indistintamente diremos que B es subconjunto de A o que A contiene a B. Propiedadeselementales de la inclsion de conjuntos son las siguientes.

Proposicion 1.1.1 Dados los conjuntos A, B y C se tiene que:

a.- A ⊆ A

b.- Si A ⊆ B y B ⊆ C entonces A ⊆ C.

c.- Si A ⊆ B y B ⊆ A entonces A = B.1La idea de conjunto universal es relativa al contexto en que se trabaje. Por ejemplo, para el caso de las personas,

el conjunto universo serıa de los habitantes del planeta. Sin embargo, si estamos analizandon especıficamente unasituacion relacionada con Chile, el conjunto universo puede ser el de los habitantes de Chile.

5

Page 7: Libro Matematicas Para Economistas

6 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

d.- φ ⊆ A y ademas A ⊆ U .

En palabras, la inclusion de conjuntos es una relacion refleja (a.-), transitiva (b.-) y anti-simetrica (c.-). La propiedad (d.-) nos dice que el conjunto vacıo es subconjunto de cualquierconjunto y que cualquier conjunto es subconjunto del conjunto universo.

Nota 1.1.1 Una cuestion importante de la inclusion es que, en general, dados dos conjuntoscualquiera A y B no siempre es cierto que A ⊆ B o que B ⊆ A. En otras palabras, la relacionde inclusion no es completa ya que no siempre se pueden comparar dos conjuntos cualquiera,en el sentido de la inclusion. Por esta razon se dice que la inclusion es un orden parcial y nototal.

Ejemplo 1.1.1 Dado el conjunto A = a, 2,4, se tiene que 4 ∈ A pero 4 /∈ A. Sinembargo, es cierto que 4 ⊆ A. Por otro lado, dados B1 = a, 2 y B2 = 4, ni B1 ⊆ B2 niB2 ⊆ B1.

Definicion 1.1.2 Dado un conjunto A, definimos el conjunto de las partes de A como elconjunto formado por todos los subconjuntos de A, es decir:

P(A) := C | C ⊆ A.

Otra forma de denotar el conjunto de las partes de A es 2A. La justificacion de esta notacionviene de la nocion de cardinal de un conjunto.

Ejemplo 1.1.2 Para el conjunto A anterior, se cumple que

P(A) := φ,A, a, 2, 4, a,4, 2,4, a, 2.Note que a ∈ P(A), pero a /∈ P(A).

Definicion 1.1.3 Dado un conjunto A cualquiera, su cardinal se define como el numero deelementos del conjunto y se denota por #A o por card(A). Diremos ademas que un conjuntoes finito si su cardinal es finito e infinito en caso contrario.

Ejemplo 1.1.3 Dado el conjunto de los numeros naturales IN = 0, 1, 2, 3, ..., su cardinal esinfinito y se denota ℵ0: aleph cero. Dado el conjunto de los reales IR, su cardinal tambien esinfinito y se denota por c: cardinal del continuo. Cuando un conjunto tiene cardinal infinito y escomparable al de los naturales se dice que es un conjunto infinito numerable, mientras que sisu cardinal es infinito y comparable a aquel de los reales, se dice que es un conjunto infinito nonumerable o que tiene cardinal del continuo. El conjunto formado por todos los numerosenteros pares y aquel de los racionales tiene cardinal numerable. El conjunto de los numerosreales del intervalo [0, 1] tiene cardinal del continuo2.

Ejemplo 1.1.4 Dado un conjunto finito A, para el cual #A = n, se tiene entonces que (Ejer-cicio)

#P(A) = 2n.

Esto justifica la notacion 2A para el conjunto de las partes de A.2En la seccion siguiente entramos en mas detalle respecto de los diversos conjuntos de numeros.

Page 8: Libro Matematicas Para Economistas

1.1. CONJUNTOS 7

Ejercicio 1.1.1 Dados el conjunto A = a, b, 2,♣, se pide determinar 2A y #2A.

Dados dos conjunto A, B cualquiera, una forma de crear nuevos conjuntos a partir de los mismoses por medio de operaciones sobre ellos, algunas de las cuales pasamos a definir.

Definicion 1.1.4 Dados los conjuntos A y B ⊆ U , se define

a.- A union B: A⋃

B := c | c ∈ A ∨ c ∈ B (todos los elementos de A y B),

b.- A interseccion B: A⋂

B := c | c ∈ A ∧ c ∈ B (todos los elementos comunes entreambos),

c.- diferencia de conjuntos de A con B: A \B = c |c ∈ A ∧ c /∈ B (elementos que estan enA pero no en B),

d.- Ac = U \ A: complemento de A relativo al universo U (los elementos del universo que noestan en A).

Si los conjuntos A y B son tales que es posible definir una operacion algebraica entre suselementos (digamos, una suma, producto, cociente, etc.), podemos entonces extender la mismaoperacion a los conjuntos de la siguiente forma: si la operacion es 2 (2 = +, 2 = −, 2 = ∗,etc.) entonces

e.- A2B = c | c = a2b, a ∈ A, b ∈ B.Nota 1.1.2 Note que A \B (diferencia de conjuntos) es muy distinto (cuando se puede definir)al conjunto A−B. Justifique Ud. con un ejemplo.

Nota 1.1.3 Es interesante notar que la union de dos conjuntos es el menor conjunto quecontiene simultaneamente a ambos3, mientras que la interseccion de ellos es el mayor conjuntoque esta contenido en ambos simultaneamente4.

Definicion 1.1.5 Diremos que dos conjuntos A,B son disjuntos si

A⋂

B = φ.

Ejercicio 1.1.2

(i) Dados A = 2, 4, 6, 7, 8, 10 y B = 1, 2, 3, 4, 5, 6, 7, determine A∪B, A∩B, A \B, A−B, A + B.

(ii) Dados conjuntos A, B, C cualquiera, muestre que

ii.1 A ∪ (A ∩B) = (A ∪B) ∩ (A ∪B),ii.2 A ∩ (A ∪B) = (A ∩B) ∪ (A ∩B),ii.3 A ∩B ⊆ A

ii.4 Si A y B son disjuntos y B y C tambien lo son, es cierto que A y C deben serlo?,ii.5 (A ∩B)c = Ac ∪Bc, (A ∪B)c = Ac ∩Bc.

(iii) A ∩B = B ∩A, A ∪B = B ∪A, A ∩ φ = φ, A ∪ φ = A, φc = U , Uc = φ.3Esto en el siguiente sentido: si dados A y B, y dado C tal que A ⊆ C y B ⊆ C entonces necesariamente

(A ∪B) ⊆ C.4Es decir, dado cualquier conjunto C ⊆ A, B entonces C ⊆ (A ∩B).

Page 9: Libro Matematicas Para Economistas

8 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

1.1.1. Producto cartesiano de conjuntos

Es obvio que de las definiciones ya hechas, los conjuntos A = 2,4 y B = 4, 2 soniguales: en la igualdad de conjuntos, el orden en que aparecen los elementos no es relevante.Sin embargo, si por ejemplo uno recibe una direccion donde se indica que el piso es el 7 y eldepartamento es el 9, un olvido nos podrıa costar muy caro, pues si confundimos el piso con eldepartamento (piso 9, departamento 7) seguramente no llegaremos a destino. Si las intruccionesnos fuesen entregadas en forma codificada, digamos, un papel con los dos numeros, entonces esclaro que 7 − 9 serıa muy distinto a 9 − 7.

Toda vez que sea relevante el orden de los objetos a considerar, estamos entonces hablandode pares ordenados (o tuplas ordenadas como caso mas general).

Definicion 1.1.6 Dados dos elementos a, b de conjuntos cualesquiera, el par ordenado (a, b) sedefine como

(a, b) = a, a, b

En otras palabras, un par ordenado corresponde a un elemento donde claramente quedaidentificado un primer elemento y un segundo elemento, donde el orden de los mismos esrelevante. De hecho, no es lo mismo a, b que (a, b). En el primer caso, se trata del conjuntoformado por a y b, donde el orden de los elementos no es relavante en el sentido que a, b =b, a. En el caso del par ordenado, el orden es lo importante y claramente (a, b) 6= (b, a). Dehecho, se puede demostrar facilmente a partir de la definicion que5

(a, b) = (c, d) ⇔ a = c ∧ b = d.

Con la definicion de par ordenado, tenemos el siguiente concepto.

Definicion 1.1.7 Dados los conjuntos A y B definimos el producto cartesiano de A con B,que se denota A×B, como

A×B := (a, b), a ∈ A, b ∈ B.

En otras palabras, el producto cartesiano (o simplemente producto) de A con B es elconjunto de todos los pares ordenados, cuyos primeros elementos son los de A y cuyos segundoselementos son los de B.

Es claro que en general A×B 6= B×A. De hecho, el unico caso no trivial6 en que A×B = B×Aes cuando A = B, en cuyo caso se nota A×A = A2.

A partir de lo anterior, en forma recursiva podemos definir las k-tuplas ordenadas deelementos de A como

Ak := A×A× ...×A︸ ︷︷ ︸k veces

.

5La igualdad que sigue se emplea en forma equivalente para la definicion de par ordenado.6Obviamente si alguno de ellos es vacıo, el producto es vacıo.

Page 10: Libro Matematicas Para Economistas

1.1. CONJUNTOS 9

Proposicion 1.1.2 Dados los conjuntos A, B, C, se tiene que

(i.) A× φ = φ×A = φ,

(ii.) A×B 6= B ×A, salvo que A = B,

(iii.) A× (B⋃

C) = (A×B)⋃

(A× C); A× (B⋂

C) = (A×B)⋂

(A× C).

Prueba. La demostracion queda como ejercicio. 2

Ejercicio 1.1.3 Dados A = 2, 4, 6, B = a, b, c y C = x, y, verifique las propiedades (i). -(iii). segun corresponda. Muestre ademas que, salvo A = φ, nunca se sumplira que A ⊆ A×A.

Ejercicio 1.1.4 Dados los conjuntos A y B tales que #A = m y #B = n, determine #(A×B),#(Ak). Determine ademas #P(A×B). Finalmente, muestre que

#(A⋃

B) = #A + #B −#(A⋂

B).

1.1.2. Familias de conjuntos

La idea es definir conjuntos indexados de manera arbitraria y definir operaciones con losmismos. Ası, consideremos un conjunto S cualquiera, que llamaremos conjunto de ındices,y supongamos que a cada ındice s ∈ S le podemos asociar un conjunto, digamos, As. Esto esprecisamente lo que define una familia de conjuntos indexada por S.

El conjunto S anterior puede ser de cualquier naturaleza. Por ejemplo, S = 1, 2, 3 o S =[0, 1]. En el primer caso, la familia resultante tendra tres elementos, mientras que en el segundocaso habra una infinidad de conjuntos indexados por los valores reales en el intervalo [0, 1]. Otroejemplo: si S corresponde al conjunto de individuos de Chile (por ejemplo, identificados a travesde su numero de RUT), dado s ∈ S (es decir, un individuo), el conjunto As podrıa correspondera las estrategias del individuo en un determinado juego, o bien al conjunto de todas las personasemparentas con el individuo s ∈ S, o bien a las propiedades de las cuales dicha persona espropietaria (en muchos casos vacıo...), etc. De esta manera,

s∈S

As

representa el conjunto de las estrategias globales de los individuos (todas las estrategias posi-biles), el conjunto de todos los chilenos o el conjunto de todas las viviendas que hay en Chile,respectivamente. Mientras que ⋂

s∈S

As

corresponde a las estrategias comunes de todos los individuos, al conjunto vacıo (nadie es parientede todas las personas en forma simultanea) y al vaciıo tambien (no hay ninguna propiedadprivada que sea comun a todos los individuos).

Dado todo lo anterior, podemos entonces definir la union e interseccion de familias de con-juntos como sigue.

Definicion 1.1.8 Dada la familia de conjuntos As, s ∈ S se tiene que

(i)⋃

s∈S As es la union de todos los conjuntos As cuando el indice s recorre el conjunto S,

Page 11: Libro Matematicas Para Economistas

10 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

(i)⋂

s∈S As es la interseccion de todos los conjuntos As cuando el indice s recorre el conjuntoS.

Note que

z1 ∈⋂

s∈S

As, z2 ∈⋃

s∈S

As

equivale a decir que para todo s ∈ S, se cumple que z1 ∈ As, mientras que para al menos alguns∗ ∈ S se cumple que z2 ∈ As∗ (es decir, existe s∗ ∈ S tal que z2 ∈ As∗).

Ejercicio 1.1.5

(i). Suponga que #S = n y que para cada s ∈ S se tiene que #As = ns. Suponga ademas quecada elemento de la familia es disjunto dos a dos, es decir, que para cada s, s′ ∈ S, s 6= s′,se tiene que As

⋂As′ = ∅. Determine entonces #

⋃s∈S

As y #⋂

s∈SAs.

(ii). Determine la validez de las siguientes afirmaciones

(ii.a.)

(⋃

s∈SAs

)⋃

(⋃

t∈TBt

)=

⋃s,t∈S∪T

(As⋃

Bt).

(ii.b.)

(⋃

s∈SAs

)⋃

(⋃

t∈TBt

)=

⋃(s,t)∈S×T

(As⋃

Bt).

(iii). Sea S = [0, 1] (intervalo 0 - 1) y sea As el siguinete intervalo

As =[0,

11 + s

].

Determine entonces ∩s∈SAs y ∪s∈SAs.

1.1.3. Cuatificadores

Una cuestion que naturalemente se desprende de lo anterior es el uso de los cuantificadoresen matematicas. Los cuantificadores son conceptos auxiliares que nos permiten construir afir-maciones sobre los conjuntos. Estos son tres: el cuantificador para todo, el existe y el existeun unico, cuyos simbolos son ∀, ∃ y ∃! respectivamente. Ası, la afirmacion ∀a ∈ A se cumpletal o cual propiedad corresponde a decir que todos los elementos de A satisfacen tal o cualpropiedad, mientras que la afirmacion ∃a ∈ A que cumple tal o cual propiedad corresponde adecir que para al menos algun elemento del conjunto A se cumple tal o cual propiedad. Laafirmacion ∃! a ∈ A que cumple tal o cual propiedad equivale a decir que hay solo un elementoen A que cumple con la propiedad.

Ejercicio 1.1.6 Indique cual de las siguientes afirmaciones son verdaderas:

(i). ∀a ∈ [0, 1], a2 > 0,

(ii). ∃a ∈ [0, 1] | a2 > 0,

(iii). ∃! a ∈ [0, 1] | a2 = 0.

Page 12: Libro Matematicas Para Economistas

1.2. CONJUNTOS NUMERICOS 11

Como se niega una afirmacion que contiene cuantificadores? Tal vez esto es lo mas complejo demanejarse con cuntificadores. En todo caso la regla es muy directa del sentido comun: cuandose hace una afirmacion donde se indica que es valida para todos los elementos de un ciertoconjunto, obviamente esto quedara negado si somos capaces de encontrar un contraejemploque nos muestre que tal propiedad no se cumple en dicho valor encontrado. Por el contrario,si afirmamos que determinada propiedad es satisfecha por algun elemento del conjunto, paramostrar que la afirmacion es falsa, debemos ser capaces de mostrar que nadie la satisface. Si seafirma que una proposicion es satisfecha por un unico punto, entonces para demostrar que esfalsa debemos ser capaces de mostrar que, o bien ninguno la satisface o bien que hay mas deuno que efectivamente la satisface. En el ejercicio anterior, es claro que la primera afirmacion esfalsa, ya que a = 0 no cumple con la condicion (a pesar que todo el resto de los infinitos puntossi la cumple: basta con que falle en uno para que toda la afirmacion se erronea!).

Finalmente, nunca confundir el orden en que aparecen los cuantificadores en una determinadaexpresion. Como regla nemotecnica, en general se cumple que

∀∃ 6= ∃∀.

Ejercicio 1.1.7 (i) Un opitmo de Pareto en la economıa es una asignacion de bienes quecumple con la condicion de factibilidad, de tal forma que no existe otra que siendo factiblemejore a todos los individuos y que al menos a uno de ellos lo mejore estrictamente. Cuandouna asignacion en la economıa (lo que esto signifique) no sera un optimo de Pareto?

(ii) La continuidad de una funcion f : IR → IR en el punto x0 corresponde a decir que ∀ε > 0,∃δ > 0 tal que si |x − x0| ≤ δ, entonces |f(x) − f(x0)| ≤ ε. Que ocurre en la definicionanterior si intercambiamos el orden de los cuantificadores? Seguira siendo lo mismo?

1.2. Conjuntos numericos

El conjunto de los numeros naturales se define como

IN := 0, 1, 2, 3, .....El conjunto de los numeros enteros se representa por IZ = ...,−2,−1, 0, 1, 2, 3, ..., mientrasque el de los racionales por

IQ :=

p

q, p ∈ IZ, q ∈ IZ, q 6= 0

.

El conjunto de los numeros reales sera denotado IR. Es bien sabido que

IR = IQ⋃

I

donde I es el conjunto de los irracionales7.A partir de lo anterior, se tiene la siguiente cadena de inclusiones

IN ⊆ IZ ⊆ IQ ⊆ IR.

7Es decir, aquellos numeros que no pueden expresarce como fracciones. Ejemplos son π, e o√

3

Page 13: Libro Matematicas Para Economistas

12 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

En este apunte de curso no entraremos en detalles respecto de la definicion axiomatica delos conjuntos numericos anteriores. Se asumen conocidas nociones basicas sobre los mismos8.

Asumiremos que IR conocemos las operaciones basica de suma y producto, y que ademasmanejamos las desigualdades. Dado esto, recordemos que un intervalo en IR es un conjuntodonde quedan especificados los extremos derecho e izquierdo de tal forma que el conjunto com-prendido por tales extremos define el intervalo correspondiente. Dependiendo de si los extremosforman o no parte del intervalo, estos se representan de la siguiente forma (en lo que sigue,a, b ∈ IR, a < b):

(i) [a, b]: intervalo cuyos extremos son a y b, donde ambos pertenen al conjunto,

(ii) ]a, b]: intervalo cuyos extremos son a y b, donde b pertene al conjunto, pero no a,

(iii) [a, b[: intervalo cuyos extremos son a y b, donde a pertene al conjunto, pero no b,

(iv) ]a, b[: intervalo cuyos extremos son a y b, donde ni a ni b pertenen al conjunto.

En terminos de conjuntos, se tiene que

(i) [a, b] = x ∈ IR | a ≤ x ≤ b,(ii) ]a, b] = x ∈ IR | a < x ≤ b,(iii) [a, b[= x ∈ IR | a ≤ x < b,(iv) ]a, b[= x ∈ IR | a < x < b.

Finalmente, cuando se tienen intervalos de la forma A = x ∈ IR| a < x (es decir, todos losreales mayores que a) o bien de la forma B = x ∈ IR| x < b (es decir, todos los reales menoresque b), la forma de representarlos es

(i) ]−∞, b] = x ∈ IR | x ≤ b,(ii) ]−∞, b[= x ∈ IR | x < b,(iii) [a,∞[= x ∈ IR | a ≤ x,(iv) ]a,∞[= x ∈ IR | a < x.

Ejercicio 1.2.1 Dados A = [4, 7], B = [1, 9[, C =]− 1, 5[ y D = [20, 30], determine A∩B ∩C,A ∪ B ∪ C. Determine ademas A− C, Cc, B \ A. Exprese todos sus resultados en terminos deintervalos y en terminos de desigualdades.

Definicion 1.2.1 El conjunto de todos los reales mayores o iguales a cero se representa porIR+, mientras que aquel de todos los valores estrictamente positivos por IR++.

En otras palabras, IR+ = x ∈ IR| x ≥ 0, IR++ = x ∈ IR | x > 0.8Este es un tema arduo, que nos tomarıa demasiado tiempo detallar. En todo caso, para los mas curiosos y

con tiempo, existen diversos enfoques para definir el conjunto de los reales, sin tener que apelar a la intuicion quedel mismo podamos tener. Uno de ellos parte de las llamas cortaduras de Dedekind, otro a partir de las sucesionesde Cauchy, y otro utilizando el llamado Axioma del Supremo. En todos ellos se requiere formalizar la nocion decuerpo con las operaciones de suma y producto de numeros. Para mas detalles, ver el excelente libro de Browder[6].

Page 14: Libro Matematicas Para Economistas

1.2. CONJUNTOS NUMERICOS 13

Definicion 1.2.2 Dado x ∈ IR, el modulo (o valor absoluto) de x se define como

|x| =

x si x ≥ 0−x si x < 0

.

En otras palabras, el modulo de un numero hace referencia al tamano del mismo, sin consid-erar su signo9. Ası, |3| = 3 y | − 3| = 3. Las propiedades basicas del modulo son las siguientes.

Proposicion 1.2.1

a.- |x| ≥ 0; |x| = 0 si y solo si x = 0.

b.- |x + y| ≤ |x|+ |y| (desigualdad triangular).

c.- |x| − |y| ≤ |x− y|.d.- |x · y| = |x| · |y|.

Prueba. Por definicion se cumple que |x| ≥ 0. Si |x| = 0, entonces o bien x = 0 o bien −x = 0,con lo cual x = 0. Si x e y son positivos, entonces es claro que |x + y| = |x| + |y| ya que|x + y| = x + y. Si x e y tienen signo opuesto, entonces es facil verificar que |x + y| ≤ |x|+ |y|,etc, etc. Completar la demostracion como ejercicio! 2

Note ahora lo siguiente: dado a > 0, se tiene que

i.- |x| ≥ a ⇔ x ≥ a ∨ x ≤ −a, lo que expresado en intervalos corresponde a decir que

x ∈]−∞,−a]⋃

[a,+∞[,

ii.- |x| ≤ a ⇔ x ≤ a ∧ x ≥ −a, que expresado en intervalos es

x ∈ [−a, a].

En terminos de geometricos, el conjunto A = x ∈ IR | |x| ≤ a corresponde al intervalocerrado cuyos extremos son −a por la izquierda y a por la derecha. Por otro lado, el conjuntoB = x ∈ IR | |x| ≥ a corresponde a la union de dos intervalos, el primero de los cuales tienecomo extremo izquierdo −∞ y extremo derecho −a, mientras que el otro tiene por extremoizquierdo a y derecho +∞. Graficamente, es como sigue:

[ ]-a +a

|

0

[]-a +a

|

0

|x|< a

|x|> a

Si en particular se considera menor o mayor estricto (<, >) en vez de menor o igual (≤)o mayor o igual (≥) en las definiciones anteriores, lo unico que cambia es la pertenencia de losextremos −a o +a al conjunto respectivo.

9Mas adelante, extenderemos este concepto a vectores, donde el modulo pasa a llamarse norma.

Page 15: Libro Matematicas Para Economistas

14 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

Ejercicio 1.2.2 Resuleva los siguientes problemas.

a.- Resuelva las siguientes inecuaciones (encuentre todos los valores de x para los cuales secumplen las siguientes desigualdades):

b.1.- |x− 3| < 9.

b.2.- |x− 1|+ |x− 2| ≥ 1

b.1.- |x− 1|+ |x + 1| < 2Exprese sus resultados en trminos de intervalos.

b.- Dados x, y ∈ IR, definamos el maximo de ambos como el mayor entre ellos, el cualnotaremos max(x, y). El mınimo se define como el menor y se denota min(x, y). Pruebeentonces que

max(x, y) = x+y+|y−x|2

min(x, y) = x+y−|y−x|2

c.- Sean ε, δ > 0 y sean A = x ∈ IR| |x| ≤ ε y B = x ∈ IR| |x| ≤ δ. Bajo que condicionessobre los parametros anteriores sera cierto que A ∩B = φ?

d.- Sea x0 ∈ IR dado y sea Aδ = x ∈ IR| |x− x0| ≤ δ, con δ ∈ IR++. Muestre que

δ∈IR++

Aδ = x0.

e.- Sea x0 ∈ IR dado. Para cada ε > 0, definamos

Vε(x0) = x ∈ IR | |x− x0| < ε.

Muestre entonces que para cada ε1, ε2 > 0, existe δ1, δ2 > 0 tal que

Vδ1(x0) = Vε1(x0) ∩ Vε1(x0), Vδ2(x0) = Vε1(x0) ∪ Vε1(x0).

Muestre ademas que para todo ε > 0, si x ∈ Vε(x0), existe entonces δ > 0 tal que Vδ(x) ⊆Vε(x0).

Definicion 1.2.3 Dado un conjunto A ⊆ IR diremos que

a.- A es acotado por arriba (o superiormente) si existe un valor s ∈ IR tal que para todoa ∈ A se tiene que a ≤ s. En este caso se dice que s es una cota superior de A.

b.- A es acotado por abajo (o inferiormente) si existe un valor m ∈ IR tal que para todoa ∈ A se tiene que m ≤ a. En este caso se dice que m es una cota inferior de A.

c.- A es acotado si es acotado por arriba y es acotado por abajo.

Ejercicio 1.2.3 (i). Muestre que A ⊆ IR es acotado si y solo si existe c ∈ IR tal que para todoa ∈ A se cumple que |a| ≤ c.

Page 16: Libro Matematicas Para Economistas

1.2. CONJUNTOS NUMERICOS 15

(ii). Muestre que si A y B son acotados, entonces A∪B tambien lo es. Muestre ademas A∩Bes acotado. Que ocurre si A ∩B = φ? Es el conjunto vacıo un conjunto acotado?

(iii) Es acotado el conjunto A = x ∈ IR | |x− 2|+ |x + 2| ≥ 1?(iv) Muestre que si A ⊆ IR es acotado por arriba, entonces −A (conjunto con los negativos de

A) es acotado por abajo.

(v) De ejemplos de conjuntos que no son acotados, que son acotados, que no son acotados porarriba pero si por abajo, que no son acotados por abajo pero si por arriba.

Definicion 1.2.4 Dado un conjunto acotado A ⊆ IR, definamos el supremo de A como lamenor de sus cotas superiores. Se denotara por sup(A). Por otro lado, el infimo de A se definecomo la mayor de sus cotas inferiores y se denotara por inf(A).

En otras palabras, sup(A) cumple con las siguientes condiciones

a.- Para todo a ∈ A se tiene que a ≤ sup(A) (el supremo es una cota superior de A)

b.- Para toda cota superior s de A se tiene que sup(A) ≤ s (el supremo es la menor de lascotas superiores de A).

Para el caso de inf(A) se tiene que

a.- Para todo a ∈ A se tiene que inf(A) ≤ a (el infimo es cota inferior de A

b.- Para toda cota inferior m de A se tiene que m ≤ inf(A) (el infimo es la mayor de las cotasinferiores de A).

Ejemplo 1.2.1 Para los siguientes conjuntos se tiene lo indicado:

a.- Si A = [3, 6] entonces sup(A) = 6 y inf(A) = 3. Note que tanto sup(A) como inf(A)pertencen al conjunto.

b.- Si B =]−9, 12[ entonces sup(B) = 12 y inf(B) = −9. Note que tanto sup(A) como inf(A)no pertencen al conjunto.

c.- Si C =]−∞, 3] ∪ [6, 8[ entonces sup(C) = 8 y inf(C) no existe.

En el caso particular en que sup(A) ∈ A, el supremo pasa a llamarse maximo del conjuntoy se denota max(A), mientras que si inf(A) ∈ A, pasa a llamarse mınimo del conjunto y sedenota por min(A). En el ejemplo anterior, 6 es el maximo de A y 3 es su mınimo. Por otrolado, B no tiene ni mınimo ni maximo, solo infimo y supremo.

Ejercicio 1.2.4 Determine max(A), sup(A), inf(A),min(A) segun corresponda, cuando:

a.- A = x ∈ IR | |x + a| − 2x ≤ 4.b.- A = x ∈ IR | x2 − 3x + 2 ≥ 0.c.- A = x ∈ IR | |x− 2a| − |x + a| > 12.

Proposicion 1.2.2 Dado A ⊆ IR se tiene que

Page 17: Libro Matematicas Para Economistas

16 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

a.- S = sup(A) si y solo si S es una cota superior y para todo ε > 0 existe a ∈ A tal queS − ε ≤ a.

b.- s = inf(A) si y solo si s es una cota inferior y para todo ε > 0 existe a ∈ A tal ques + ε ≥ a. 2

Prueba. Ejercicio.

1.3. Numeros complejos

Finalizamos esta seccion con los numeros complejos, que representaremos por IC. Para ellovamos a introducir la unidad imaginaria i como la la raız cuadrada de −1, es decir,

i :=√−1.

Obviamente la unidad imaginaria no es real (es “imaginario”) ya que si fuera real se deberıacumplir que su cuadrado es positivo, cosa que no es cierto ya que i2 = i · i = −1!.

De la definicion, es directo que i2 = −1, i3 = −i, i4 = 1, i5 = i, i6 = −1, etc. Note elcaracter periodico (cıclico) de las potencias de i. Este es un hecho fundamental: por medio de loscomplejos podemos representar ciclos y periodicidades en economıa. Con lo anterior, el conjuntoIC se define como

IC := a + bi, a, b ∈ IR.Dado z = a + bi ∈ IC, el valor a corresponde a la parte real de z, y se representa por Re(z),

mientras que b es la llamada parte imaginaria de z, que se representa por Im(z).

Note que un numero real se puede identificar (es decir, es!) con un numero complejo, dondela parte imaginaria es cero.

Dado el complejo z = a + bi, el conjugado de z se define como z = a− bi, mientras que elmodulo de z, que se representa por |z|, se define como |z| = √

a2 + b2.

Dados z1 = a1 + b1i y z2 = a2 + b2i, la suma y producto de complejos se definen de maneranatural como10:

z1 + z2 = (a1 + a2) + (b1 + b2)i

z1 · z2 = (a1a2 − b1b2) + (a1b2 + a2b1)i.

Con lo anterior, note que |z| = √z · z.

Es interesante notar que existen diversas formas equivalentes de interpretar y/o visualizarlos complejos. Una de ellas es como vectores de IR2; otra por medio de la representacion polar yotra es la denominada forma exponencial.

a.- Representacion vectorial. Dado z = a + bi, la forma vectorial corresponde a asumir zcomo un vector (a, b) ∈ IR2, la que se resume en la siguiente figura:

10El producto es natural por cuanto al tomar dos complejos y multiplicarlos de manera directa y considerandoque i2 = −1 se tiene la expresion anterior. Hacerlo como ejercicio.

Page 18: Libro Matematicas Para Economistas

1.3. NUMEROS COMPLEJOS 17

z=a + b i

|z|

f

a

b

En ella, el angulo ϕ que forma el vector (a, b) con el eje x se denomina argumento de z.Ası, de la figura, se tiene que:

a = |z| cos(ϕ), b = |z| sin(ϕ).

b.- Forma polar. De lo anterior, el complejo z se puede expresar como

z = |z| · [cos(ϕ) + i sin(ϕ)]

que es la denominada forma polar del complejo z. La expresion [cos(ϕ) + i · sin(ϕ)] serepresenta usualmente como eϕ i.

c.- Forma exponencial. De lo anterior, utilizando la notacion exponencial, se tiene que zpuede ser representado como:11

z = |z| · eϕ i.

que es la denominada forma exponencial del complejo.

Ejemplo 1.3.1 Para determinar la forma polar del complejo debemos calcular |z| y el aguloϕ respectivo, para lo cual se procede de la siguiente manera: dado z = a + bi, y notando quetan(ϕ) = b

a , entonces

|z| =√

a2 + b2

ϕ = arctan(

b

a

).

Por que tanta complicacion? Simplemente porque la representacion exponencial es muy utilcuando deseamos hacer calculos complejos con complejos (p.ej, potencias y productos). Esto semuestra en la siguiente proposicon.

Proposicion 1.3.1 Dados z1 = a1 + b1i = |z1|eϕ1i, z2 = a2 + b2i = |z2|eϕ2i y dado n ∈ IN setiene que:

11Note que, si ϕ = π entonces cos(π) = 0 mientras que sin(π) = −1. Luego, de las definiciones anteriores seobtiene la muy conocida formula de Euler: eiπ +1 = 0. Se insiste que en la forma polar, los angulos son medidos enradianes. Para convertir grados sexagesimales (los usuales) en radianes, la formula es muy simple: basta recordarque la circunferencia completa tiene 360 y que estos equivalen a 2π radianes. Luego un angulo de x gradosequivale a x·360

2πradianes.

Page 19: Libro Matematicas Para Economistas

18 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

a.- z1 + z2 = z1 + z2; z1 · z2 = z1 · z2 (propiedades del conjugado).

b.- z1 · z2 = |z1||z2|e(ϕ1+ϕ2)i.

c.- z1z2

= |z1||z2|e

(ϕ1−ϕ2)i.

d.- zn1 = |z1|n · en·ϕ1 i

Demostracion. Ejercicio. Utilizar directamente las definiciones dadas. 2

Nota 1.3.1 Que importancia tienen los complejos en economıa? La relevancia viene del hechoque en economıa existen una serie de fenomenos de caracter cıclico que es interesante modelar.Ya no se trata solo de converger o diverger (como en el caso real), sino que ahora perfectamentese pueden dar situaciones (y es muy frecuente) economicas que tienen periodicidad o que suconvegencia se da en forma alternante.

Ejemplo 1.3.2 Supongamos que z = a + bi. Bajo que condiciones se tiene que zn converge?.Veamos, sabemos que z = |z|eφ i, con φ = arg(z): argumento de z. Luego, como zn = |z|n ·en·φ i,se tiene que zn converge siempre y cuando |z|n converge12, es decir, cuando a2 + b2 < 1. Quedapropuesto investigar cuando la sucesion zn diverge u oscila sin converger.

Ejercicio 1.3.1 Dado un polinomio p(x) = xn + an−1xn−1 + an−2x

n−2 + ...+ a1x+ a0, diremosque un complejo z∗ = a + bi es raız del mimos si p(z∗) = 0. Muestre entonces que:

a.- Para todo z ∈ IC se tiene que p(z) = p(z).

b.- Si z∗ es raız de p(·) entonces su conjugado tambien lo es.

c.- Muestre que si n es impar, entonces necesariamente el polinomio correspondiente debetener al menos una raız real, es decir, existe α ∈ IR tal que p(α) = 0.

1.4. Funciones

El concepto de funcion es tal vez uno de los mas importantes en matematicas. La ideaque esta implıcita en su definicion es aquella de “transformacion”, de “mutacion”, aunque nonecesariamente de “cambiocomo veremos mas adelante.

Una funcion se puede entender como una “maquina”muy “porfiada”. Maquina por que trans-forma objetos, porfiada por que esta transformacion es muy particular: a igualdad de entradas,el resultado siempre es el mismo!.

Lo que entra a la maquina vive en lo que denominamos el “dominio”de la funcion, mientrasque lo que sale de ella vive en el recorrido o imagen de la funcion. Una funcion de IR en IR tomaentonces valores en IR y los lleva a valores en IR; una funcion de IRn en IR toma valores en IRn

y los lleva a valores en IR.

La definicion formal de una funcion f que toma valores en un conjunto A y los transformaa valores en un conjunto B es la siguiente

12Notemos que en·φ i = cos(nφ) + i · sen(φ) es acotado, pues el seno y el coseno lo son; luego estos valores nointervienen en la convergencia.

Page 20: Libro Matematicas Para Economistas

1.4. FUNCIONES 19

Definicion 1.4.1 f es una funcion de A en B (que se representara por f : A → B) si f asociaa cada elemento de A un unico elemento de B. El conjunto A se llama dominio de f , mientrasque B sera el recorrido o conjunto imagen de f .

El caso mas importante a considerar (y el unico...) sera cuando A y B son de la forma IRk

para algun k ∈ IN . Si A = B = IR (primer caso relevante) diremos que la funcion es de unavariable y real valuada. Si A = IRn y B = IR (el otro caso importante), diremos que f es unafuncion vectorial a valores reales. Por ultimo, se puede tener el caso en que A = IRm y B = IRn,es decir, una funcion vectorial a valores vectoriales (caso menos relevante en economıa). En loque sigue, f sera o bien de IR en IR o bien de IRn en IR.

Dada una funcion f : IRn → IR, el grafo es simplemente el conjunto de puntos

Gr(f) = (x, y) ∈ IRn+1 | y = f(x).Geometricamente, para funciones de IR en IR las siguientes figuras corresponden al grafos de

alguna funcion.

En la siguiente figura se ilustran grafos “entes”que no son funciones.

a a a

Para ver geometricamente cuando una “relacion”es una funcion o no, basta con mirar sugrafo y ver si a cada punto del dominio se le asocia un unico valor en el conjunto de imagenes.En la figura anterior no es el caso, ya que el valor a esta asociado con mas de un valor en el ejevertical. En lafigura previa a la anterior, ocurre que efectivamente a cada punto de la horizontalse le asocia un unico punto en la vertical. Note que esta asociacion no tiene que ser unıvoca, enel sentido que a cada punto en la horizontal se le asocie un valor distinto en la vertical.

Dadas dos funciones f, g : IR → IR y dado α ∈ IR, una forma de construir nuevas funciones apartir de ellas es a traves de realizar operaciones tal como se describe en la siguiente definicion.

Definicion 1.4.1

a.- Suma de funciones. Es una nueva funcion (f + g) : IR → IR tal que

Page 21: Libro Matematicas Para Economistas

20 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

(f + g)(x) = f(x) + g(x).

b.- Producto de funciones. Es una nueva funcion (f · g) : IR → IR tal que

(f · g)(x) = f(x) · g(x).

c.- Cuociente de funciones. Es una nueva funcion (f/g) : IR → IR tal que

(f/g)(x) =f(x)g(x)

,

la que obviamente esta definida para los valores donde g es no nula.

d.- Ponderacion de funciones. Es una nueva funcion (α · f) : IR → IR tal que

(α · g)(x) = α · f(x).

Note que las operaciones recien definidas tienen perfecto sentido cuando f, g : IRn → IR.

Una manera adicional de construir nuevas funciones a partir de otras originales es por mediode la llamada composicion de funciones, que es una operacion muy importante a consid-erar.

Definicion 1.4.2 Dadas las funciones f, g : IR → IR, la composicion de f con g se definecomo f g : IR → IR tal que

(f g)(x) = f(g(x)).

Este concepto sigue siendo valido para funciones g : IRm → IRn y f : IRn → IRp, de modoque

(f g) : IRm → IRp | (f g)(x) = f(g(x)).

Para la correcta definicion de la composicion se necesita que el recorrido de una de ellas debeestar incluido en el dominio de la otra. La siguiente figura ilustra esta importante restriccion.

f

g

gf o

A B C

En la figura, la funcion g lleva valores de A a B, mientras que f los lleva de B a C. La composicionf g los lleva de A a C.

Ejercicio 1.4.1

Page 22: Libro Matematicas Para Economistas

1.4. FUNCIONES 21

(i) Dadas las funciones f, g : IR → IR definidas por f(x) = x2 − 4x + 3 y g(x) = e2x2,

determinar las expresiones algebraicas de las funciones f + 2g, f g, g g, g f , f f ,f/(f f), f · f , f · g.

(ii) Muestre que en general f g 6= g f .

(iii) Suoponiendo que f es de la forma f(x) = ax + b y tal que f f(x) = 4x + 3, determinef(5).

(iv) Dada f(x) = 7x + 2, determine una funcion g(x) tal que f g(x) = x.

(v) Exprese la funcion f(x1, x2) = 2(x12 + 2x2)3 como la composicion de dos funciones. Haga

lo mismo con la funcion g(x1, x2) = [Ln(αx1 + (1− α)x2)]1/2. Hay una unica forma de

escribir la composicion?

Puesto que el unico requsito para ser funcion es que la asociacion entre un punto del dominioy el recorrido sea unica, en ningun caso se ha exigido que la asociacion sea a su vez unicay exclusiva para cada punto del dominio. Por ejemplo, la funcion f : IR → IR que a cadapunto de IR le asocia el valor 2 es obviamente una funcion, donde a su vez cada punto de IRes correspondido con el mismo valor (2). Exigir esta exclusividad es adicional a la definicionde funcion en si y constituye un caso particular muy importante a considerar. Funciones quecumplen con esta doble condicion de “exclusividad”son las llamadas funciones inyectivas.

Definicion 1.4.3 Dados A, B dos conjuntos y dada f : A → B, diremos que f es inyectivasi x 6= y entonces f(x) 6= f(y). Diremos ademas que f es biyectiva si es inyectiva y para todob ∈ B existe a ∈ A tal que f(a) = b.

En rigor, el concepto importante de los anteriores es aquel de inyectividad. A partir de lainyectividad, la biyectividad siempre se puede lograr a traves de una restriccion del recorrido dela funcion. Lo que es difıcil de satisfacer es obviamente esta asociacion uno a uno que define lainyeccion.

Ejemplo 1.4.1

a.- Dada la funcion f : IR → IR tal que f(x) = ex (exponencial), resulta que es inyectivapero no biyectiva (la exponencial nunca en negativa). En cambio, si consideramos que elrecorrido de la funcion es IR++ y no IR, entonces la funcion es biyectiva.

b.- Dado α > 0, la funcion f(x) = xα es inyectiva de IR++ en IR. Vista como funcion de IR++

en IR++ resulta ademas ser biyectiva.

c.- La funcion f(x) = ax2 + bx + c no es inyectiva en IR. En cambio, modificando el dominio,si resulta ser inyectiva A = x ∈ IR | x ≥ −b

2a .Note que al existir una biyeccion entre los conjuntos A y B (digamos, f : A → B), queda

entonces definida una nueva funcion que a cada punto de B le asocia aquel de A segun el cual suimagen por f resulta ser este punto del recorrido. En otras palabras, si f : A → B es biyectiva,podemos definir una nueva funcion g : B → A tal que

a = g(b) ⇔ b = f(a).

Es como “hacer el proceso inverso”, por lo cual, obviamente, la funcion g anterior se denominafuncion inversa de f .

Page 23: Libro Matematicas Para Economistas

22 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

Proposicion 1.4.1 Dada f : A → B una biyeccion, existe entonces una unica funcion f−1 :B → A es tal que f(a) = b si y solo si f−1(b) = a. Esta funcion se denomina la inversa de f .

Cuando una funcion posee una inversa se dice que es invetible. Por lo tanto, y de maneraobvia, f es invertible si y solo si es una biyeccion.

Proposicion 1.4.2 Dadas f : B → C y g : A → B se tiene que, si son invertibles, entoncesf g es invertible y se satisface

(f g)−1 = g−1 f−1.

Ejemplo 1.4.2

a.- La funcion exponencial f(x) = ex es inyectiva e invertible en IR++ = x ∈ IR | x > 0,siendo su inversa f−1(x) = Ln(x).

b.- Dado α > 0, la funcion f(x) = xα es inyectiva e invertible en IR++, siendo su inversaf−1(x) = x

1α .

c.- La funcion f(x) = ax2 + bx + c no es inyectiva en IR y por lo tanto no es invertible. Encambio, si es inyectiva en A = x ∈ IR | x ≥ −b

2a .

1.4.1. Curvas de nivel

Un concepto importante que se define para funciones de IRn en IR es aquel de curva de nively el subsecuente conjunto de puntos para los cuales queda definida dicha curva de nivel. Laidea es considerar aquel conujunto de puntos en IRn que evaluados en la funcion nos entreganun valor predeterminado. Si la funcion respectiva es una de utilidad, el conjunto de puntos quedefine la curva de nivel respectiva correspondera a lo que en economıa se conoce como curvade indiferencia, es decir, como el conjunto de puntos que tienen igual utilidad. Si la funciones de produccion, tal conjunto asociado a la curva de nivel se interpreta como una isocuantade produccion, es decir, como aquel conjunto de factores que tienen asociada igual nivel deproduccion.

Una cuestion relevante de los puntos que definen la curvas de nivel (curva de indiferencia,isocuanta) es que, prefijado el valor del nivel, queda entonces definida una relacion implicitaentre las variables del dominio de la funcion. Graficar esta relacion corresponde a graficar lafuncion que define la relacion entre las variables del dominio que al ser evaluadas por la funcionimplican este valor predeterminado.

Para fijar ideas, supongamos que disponemos de una funcion que nos permite evaluar laidoneidad de un postulante a un cargo en una empresa. La idoneidad se define en funcion delcapital humano del sujeto (K) y de la experiencia del mismo (E). Es claro que a capital humanoconstante, mientras mayor es la experiencia, mejor es el candidato (mayor valor de la funcion)y viceversa. Ahora bien, podrıa perfectamente ocurrir que un tipo con mucha experiencia peropoco capital humano obtenga el mismo puntaje que un tipo con poca experiencia y alto capitalhumano. Ası, prefijado el puntaje, digamos α0, habra candidatos distintos que obtienen el mismopuntaje segun sea que tienen poco o mucho capital humano y mucha o poca experiencia. El valorde puntaje prefijado define el nivel de la curva de indiferencia y los diversos candidatos quealcanzan este puntaje definen el conjunto de puntos que tiene asociada la curva de indiferencia.

Page 24: Libro Matematicas Para Economistas

1.4. FUNCIONES 23

Con esto queda entonces definida una relacion entre K y E de la forma f(K, E) = α0 querepresenta a todos aquellos candidatos que obtiene el mismo puntaje.

Definicion 1.4.4 Dada f : IRn → IR y dado y0 un valor prefijado en el recorrido de la funcion,la curva de nivel de la funcion al valor y0 se define como el siguiente conjunto

Cy0 = (x, y0) ∈ IRn, | f(x) = y0.Dado y0 definamos ademas la isocuanta13 al respectivo nivel como el conjunto

Iy0 = x ∈ IRn, | f(x) = y0.

La siguiente figura es ilustrativa de todo lo anterior.

y

y0

x2

1x

Isocuanta: x ,x | f(x ,x )=y

Curva de nivel: f(x)=y

Gráfico de f

0

1 2 01 2

Ejemplo 1.4.3 Dado y0 ∈ IR+ y dada f : IR2 → IR+ tal que f(x1, x2) = xα1 · xβ

2 , con α, β > 0,la curva de nivel al valor y0 corresponde al conjunto de puntos

C = (x1, x2, y0) ∈ IR2+ | xα

1 · xβ2 = y0,

de lo cual se tiene que

(x1, x2) ∈ I ⇔ xα1 · xβ

2 = y0,

es decir, si se cumple que

x2 =y

1/β0

xα/β1

,

que es precisamente la relacion implıcita (en este caso, explıcita) entre las variables x1 y x2 quedefinen la isocuanta al nivel y0 dado. Si la funcion f es una de utilidad, la relacion anteriorentre x1 y x2 se denomina curva de indiferencia al nivel de utilidad y0. Si f es una funcionde produccion, entonces x1 y x2 pueden ser interpretados como factores y la relacion anteriorentre ambos se denomina isocuanta de produccion al nivel de producto y0 dado.

Ejercicio 1.4.2 Sea f : IRn → IR una funcion creciente por componentes y sean y0 < y1 ∈ IRdos valores prefijados. Muestre entonces que las respectivas isocuantas no se intersectan. Muestreademas que si f(x1, x2) = y0 y f(x1, x2) = y1 entonces necesariamente x1 < x1, e interpreteeste resultado como que la isocuanta al nivel y0 esta por “debajo” de la isocuanta al nivel y1.

13Podemos llamarla tambien curva de indiferencia.

Page 25: Libro Matematicas Para Economistas

24 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

Ejercicio 1.4.3 Determine las isocuantas al nivel y0 > 0 para las siguiente funciones: f(x1, x2) =x2

1 + x22, g(x1, x2) = x2

1 · x22, h(x1, x2) = maxx1, x2.

1.4.2. Crecimiento y convexidad de funciones

En todo lo que sigue de este apunte, ocuparemos dos conceptos sobre funciones que sonfundamentales a la hora de interpretarlas como transformaciones en economıa. Por un lado, nosinteresara tener alguna informacion sobre como se comporta la “maquina” cuando le metemosmas factor y, por otro lado, como son a su vez esos eventuales incrementos (o detrimentos) alaumentar el factor. La primera cuestion tiene que ver con los efectos directos de aumentar odisminuir el factor (la variable del dominio), mientras que la segunda con un analisis marginalistade los resultados: es como considerar los efectos en nivel y los cambios del nivel a su vez. Parailustrar el punto, sabemos que mientras mas estudiamos podemos obtener una mejor nota en elramo (mas factor, mejor resultado de la maquina), pero tambien sabemos que el aporte extrade habilidades que nos entrega la hora 9 de estudio es menor que aquel entregado por la hora 8(efecto marginal decreciente).

El analisis del eventual incremento o detrimento ante modificaciones de los factores se definedirectamente a partir del concepto de crecimiento o decrecimiento de la funcion. El analisis de losefectos marginales, mas complejo, se analiza usando los conceptos de convexidad y concavidadde las funciones.

Definicion 1.4.5 Dadas f : IR → IR y g : IRn → IR, diremos que:

a.- f es creciente si dado x < y entonces f(x) ≤ f(y) (estrıctamente creciente cuando lasegunda desigualdad es estricta).

b.- f es decreciente si dado x < y entonces f(x) ≥ f(y) (estrıctamente decreciente cuandola segunda desigualdad es estricta).

d.- g es convexa si dados x, y ∈ IRn y dado λ ∈ [0, 1], entonces

g(λx + (1− λ)y) ≤ λg(x) + (1− λ)g(y).

e.- g es concava si dados x, y ∈ IRn y dado λ ∈ [0, 1], entonces

g(λx + (1− λ)y) ≥ λg(x) + (1− λ)g(y).

De lo anterior entonces, la funciones crecientes son aquellas donde al aumentar el factor(variable dependiente del dominio) el resultado aumenta o se mantiene): si el aumento es estricto,se dice que la funcion es creciente estricta. Una funcion que es creciente pero no crecienteestricta es basicamente una constante o una funcion que tiene tramos planos. Esta distincion nosera relevante en lo que sigue, pues siempre vamos a suponer que cuando se trate de crecicimientoestamos hablando de crecimiento estricto.

El concepto de crecimiento o decrecimiento de una funcion se puede extender naturalmentea funciones de IRn en IR, definiendo para el efecto el concepto de crecimiento por componentes.

Definicion 1.4.6 Dada f : IRn → IR, diremos que es estrictamente creciente en la componentej = 1, 2, · · · , n si dados x = (x1, x2, · · · , xj , · · · , xn) ∈ IRn y x = (x1, x2, · · · , xj , · · · , xn) ∈ IRn,tal que xj > xj entonces

Page 26: Libro Matematicas Para Economistas

1.4. FUNCIONES 25

f(x1, x2, · · · , xj , · · · , xn) > f(x1, x2, · · · , xj , · · · , xn)

es decir, si al aumentar la componente j, manteniendo todo el resto constante, el valor de lafuncion tambien se incrementa.

Obviamente una funcion de IRn en IR podrıa ser creciente en algunas componentes y en otrasser decreciente. Tambien puede ocurrir que una funcion no sea ni creciente ni decreciente (...sinotodo lo contrario...).

Respecto de la convexidad, ya volveremos sobre el punto mas adelante, puesto que es unCONCEPTO FUNDAMENTAL en economıa. Cabe indicar que, usando un lenguaje bien in-formal, la definicion de convexidad nos dice “que la funcion en el promedio es menor que elpromedio de la funcion”, mientras que la concavidad nos dice lo contrario, es decir, “que lafuncion en el promedio es mayor que el promedio de la funcion”.

Geometricamente las funciones convexas en IR son valles, mientras que las concavas soncerros. Obviamente puede haber funciones que ni son concavas ni convexas: por ejemplo, elpaisaje que se observa, con sus depresiones y sus alturas, corresponde al grafico de una funcionque no es ni concava ni convexa.

A pesar de los comentarios anteriores, lo que efectivamente puede ocurrir es que, aun cuandouna funcion no sea ni creciente ni decreciente o bien ni convexa ni concava, localmente sipodrıa satisfacer alguna de las definiciones. Por ejemplo, la funcion f(x) = x2 no es crecienteni decreciente en todo IR, pero si la consideramos en el intervalo [0, 1], resulta que ahora escreciente en dicho conjunto (la mirada local...).

Ejemplo 1.4.4 La siguiente figura ilustra todos los conceptos anteriores:

1 2

34

56

La funcion 1 es creciente, la 2 es inyectiva, la 3 no es inyectiva, la 4 es convexa, la 5 esconcava y la 6 es creciente pero no es ni concava ni convexa.

La funcion f : IR → IR tal que f(x) = xα, con α ∈ IR es estrıctamente creciente si α > 0;estrıctamente decreciente si α < 0, convexa si α > 1, concava si 0 < α < 1. Ademas es inyectivapara α 6= 0.

Ejercicio 1.4.4

a.- Dada la funcion f : IR → IR tal que f(x) = a · x + b, con a, b ∈ IR. Muestre que f escreciente estricta si a > 0, decreciente estricta si a < 0.

b.- Muestre que una funcion creciente o decreciente estricta necesariamente es inyectiva.

c.- Entregue un ejemplo de una funcion inyectiva que no sea creciente o decreciente estricta.

Page 27: Libro Matematicas Para Economistas

26 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

d.- Dada la funcion f : IR → IR tal que f(x) = x2 + x + 1. Grafique la funcion y determine elvalor de x0 tal que la funcion es creciente si x ≥ x0.

e.- Sean f, g : IR → IR dos funciones estrıctamente crecientes. Muestre que f g tambien esestrıctamente creciente. Como cambia su respuesta si f creciente estricta y g es decrecienteestircta.

f.- Suponga que f : IR → IR es creciente estricta e invertible. Que propiedad de crecimientotiene la funcion f−1?

g.- Muestre que si f : IRn → IR es convexa, entonces la funcion g : IRn → IR tal que g(x) =−f(x) es concava.

h.- Muestre que la funcion f : IR → IR tal que f(x) = a · x + b, con a, b ∈ IR, es concava yconvexa a la vez.

i. Muestre que si f, g : IRn → IR son convexas (concavas) entonces la suma de ellas tambienlo es.

h. Muestre que si f : IR → IR es creciente estricta, entonces para todo x ∈ IR y para todoh 6= 0 se cumple que el cociente

f(x + h)− f(x)h

siempre debe ser positivo.

Ejemplo 1.4.5 Consideremos f : IR → IR definida por f(x) = ax2 + bx + c, con a, b, c ∈ IRdados. En este caso, se tiene lo siguiente:

a.- La funcion corta el eje x en las raıces del polinomio, es decir,

x1 =−b +

√b2 − 4ac

2a, x2 =

−b−√b2 − 4ac

2a.

Es claro que si b2 − 4ac < 0 la curva no corta el eje pues la raıces son complejas.

b.- Esta funcion es convexa si a > 0 y concava en caso contrario.

c.- Si a > 0 la funcion tiene un valor mınimo14 en x = −b2a . Si a < 0 la funcion tiene un maximo

en x = −b2a .

d.- Dado a > 0 y consideramos los valores de x mayores o iguales que x = −b2a , entonces la

funcion restringida es creciente y por lo tanto inyectiva. En este caso, es invertible en dichorango de valores y la inversa es

f−1(y) =−b +

√b2 − 4a(c− y)

2a

Ejercicio 1.4.5

14Es decir, f(x) ≤ f(x), ∀x ∈ IR.

Page 28: Libro Matematicas Para Economistas

1.4. FUNCIONES 27

a.- Probar todo lo indicado en el ejemplo anterior.

b.- Determinar cual de las siguientes funciones es creciente, inyectiva, convexa, concava, y/oinvertible:

f1(x) = ex, f2(x) = ex2, f3(x) = x2 + x + 1, f4(x) = ln(x), f5(x) = sin(x), f6(x) =

x + ex, f7(x) = x2 + ex.

c.- Dadas f(x) = ex + 1 y g(x) = x3 + x, determinar f g y g f . Comprobar las formulas ycalcular la inversa cuando corresponda. 2

Ejercicio 1.4.6Dada f : IR → IR, y dado A ⊆ IR, definamos f(A) = f(a) | a ∈ A.

a.- Muestre que f(A ∪B) = f(A) ∪ f(B).

b.- Suponiendo que f es inyectiva, muestre que la funcion f |A : A → f(A), donde f |A(x) =f(x) (restriccion de f al conjunto A) es biyectiva.

c.- Suponga que A = [a1, a2] y suponga que f(x) = xα, con α > 0. Determine f(A).

d.- Dada f(x) = 2x2 − 6x + 5 y dado A = [3, 8[, determine f(A). 2

Ejercicio 1.4.7Dadas las funciones f, g : IR → IR tales que f(x) = e2x+1 y g(x) = x3− 1, determine si son

crecientes, concavas o convexas. Determine ademas (f g)(x), (g f)(x), (f · g)(x), (g · f)(x),(f f)(x), f2(x) = (f ·f)(x). Comente los resultados. Cuando corresponda, dertermine (1/f)(x),f−1(x), (1/g)(x), g−1(x).

Ejercicio 1.4.8

a.- Suponga que f : IR → IR es creciente y que A ⊆ B ⊆ IR. Es cierto que f(A) ⊆ f(B)?

b.- Dado A ⊆ IR y dado S = sup(A). Si f : IR → IR es creciente estricta, es cierto que f(S) =supf(A)?

Ejercicio 1.4.9 Diremos que una funcion g : IRn → IR es cuasi - concava si dados x, y ∈ IRn

tales que g(x) ≥ g(y) entonces para todo λ ∈ [0, 1] se cumple que

g(λx + (1− λ)y) ≥ g(x).

La funcion g se dice cuasi-convexa si

g(λx + (1− λ)y) ≤ g(x).

(a) Muestre que la funcion lineal f : IR → IR tal que f(x) = ax + b, con a, b dados, es unafuncion cuasi-concava y cuasi-convexa a la vez.

(b) Muetsre que toda funcion concava (convexa) es cuasi-concava (cuasi-convexa)

(c) Encuentre una funcion que sea cuasi-concava pero que no sea concava.

(d) Una propiedad fundamental de las funciones cuasi-concavas (y de las concavas por el punto(b)) es que las isocuantas asociadas siempre representan funciones convexas.

Page 29: Libro Matematicas Para Economistas

28 CAPITULO 1. INTRODUCCION: CONJUNTOS, NUMEROS Y FUNCIONES.

d.1 Dada f(x1, x2) = xα1 ·xβ

2 , muestre que si α, β > 0, α +β < 1 entonces f es concava.

d.2 Muestre que para el caso anterior, la isocuanta respectiva es convexa.

Ejercicio 1.4.10 Se dice que g : IRn → IR es una funcion homogenea de grado α > 0 sipara todo x ∈ IRn y para todo t > 1 se cumple

g(t · x) = tα · g(x).

(a) Dada f(x1, x2) = xα1 · xβ

2 , α, β > 0, muestre que es homogenea de grado α + β.

(b) Muetsre que si g es homogenea de grado mayor que dos y si ademas cumple que g(0) = 0,entonces necesariamente g es convexa. Considere el caso n = 2 para hacer su demostracion.

(c) Muetsre si g es homogenea de grado menor que uno y en cero vale cero, entonces g esconcava. Considere el caso n = 2 para hacer su demostracion.

Page 30: Libro Matematicas Para Economistas

Capıtulo 2

Introduccion al algebra lineal

El algebra lineal se ocupa de estudiar las relaciones mas simples que se puedan dar entreciertas variables, a saber, las relaciones lineales. Su contenido constituye un pilar fundamentalpara todo lo que sigue en este curso, tanto por el valor en sı mismo que posee como porque atraves de sus conceptos podremos caracterizar y estudiar una serie de propiedades mas complejasde las funciones.

Sin perdida de generalidad, en todo lo que sigue trabajaremos basicamente sobre IRn. Estoviene del hecho que todo espacio vectorial de dimension finita es isomorfo a IRn para algun n,con lo cual, todas las propiedades de los espacioes vectoriales que se puedan considerar, son, enesencia, aquellas de IRn.

Los conceptos basicos de los cuales se deprenden todos las definiciones y propiedades quevamos a estudiar son aquel de suma y ponderacion de vectores por un escalar. Es a partir deestos conceptos basicos que se comienza a construir el edificio del algebra lineal. Con ellos, elprimer concepto relevante es aquel de dependencia lineal entre vectores, que nos da cuenta deaspectos informacionales asociados a los vectores. Una vez hecho esto, se definen las bases ydimension de un espacio vectorial, con la idea de definir un conjunto pequeno que tenga toda lainformacion importante del espacio.

La aparicion de las matrices surge de manera natural tanto como extension del concepto devectores como por analisis de sistemas de ecuaciones. A partir de esto, la idea de invertibilidadde matrices surge como una necesidad para caracterizar la independencia lineal de vectores quea su vez esta estrechamente relacionado con la posibilidad de resolver unıvocamente sistemas deecuaciones lineales. Se entregaran diversas caracterizaciones de la invertibilidad de una matriz,entre ellas, una que ocupa los determinantes. Precisamente con estos es posible introducir unconcepto mut importante en a.l, cual es de valor propio de una matriz. Los v.p de una matriznos entregan informacion muy importante relacionada con la invertibilidad de una matriz ycon la positividad de una matriz, cuestion esta ultima que se relaciona con las propiedades deconvexidad y concavidad de funciones de varias variables.

2.1. Vectores en IRn

Recordemos que dado n ∈ IN , el conjunto IRn se define como IRn := IR × ...× IR: productocartesiano de IR, n veces. Llamaremos vectores a los elementos de IRn con n ≥ 2 y escalares alos elementos de IR := IR1. Ası, dados1

1En todo lo que sigue, los vectores seran notados como columnas.

29

Page 31: Libro Matematicas Para Economistas

30 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

X =

x1

x2

.

.

.xn

; Y =

y1

y2

.

.

.yn

∈ IRn

y dado α ∈ IR, la suma de vectores y la ponderacion por escalar se definen como2

X + Y =

x1 + y1

x2 + y2

.

.

.xn + yn

∈ IRn

α ·X =

αx1

αx2

.

.

.αxn

∈ IRn.

Geometricamente la cuestion es como sigue

x

y

x+y

x

a x

a

a >0

<0a x

Definicion 2.1.1 Dado un vector X ∈ IRn como antes, definimos su traspuesto como aquelvector fila cuyas componentes son las del original. Se representara por Xt. Ası,

X =

x1

x2

.

.

.xn

∈ IRn ⇔ Xt = (x1, x2, · · · , xn).

El uso de los traspuestos nos ayudara mucho en la notacion de los vectores. Indistintamentepodemos usar X o Xt segun sea el caso.

Con estas definiciones, se tiene la siguiente proposicion.2Cuando sea necesario en el contexto, los vectores los notaremos con mayuscula mientras que sus com-

ponentes con minuscula. Siempre sera clara la distincion entre escalares y vectores.

Page 32: Libro Matematicas Para Economistas

2.1. VECTORES EN IRN 31

Proposicion 2.1.1 El conjunto IRn dotado de las operaciones + (suma de vectores) y · (poden-racion por escalar) cumple las siguientes propiedades: dados X, Y, Z ∈ IRn y dados α, β ∈ IR,

a.- X + (Y + Z) = (X + Y ) + Z; X + Y = Y + X; X + 0 = X; X + (−X) = 0; donde 0 esaquel vector con ceros en sus componentes y (−X) aquel vector cuyas componentes sonlos negativos de aquellas de X.

b.- α · (X + Y ) = αX + αY ; 1 ·X = X; (αβ)X = (α)(β ·X); (α + β) ·X = α ·X + β ·X.

Prueba. Directo de la definicion de suma de vectores y ponderacion por escalar, ademas obvi-amente de las propiedades de los numeros reales. Queda como ejercicio hacer explıcitamente elcaso IR2. 2

Las propiedades anteriores nos dicen que IRn dotado de la suma de vectores y la ponderacionpor escalar es un ESPACIO VECTORIAL3. En un sentido muy preciso, IRn es el espaciovectorial de dimension finita4 por antonomasia5, razon por la cual, su estudio tiene toda lariqueza posible que cualquier otro espacio podrıa tener. En resumen, para estudiar el algrebalinea, basta con hacerlo sobre IRn, que es precisamente lo que haremos

Un concepto muy importante que se desprende de la definicion de espacio vectorial es aquelde sub-espacio vectorial. Intuitivamente un sub-espacio vectorial de un espacio vectorial es otroespacio vectorial contenido en el original.

Definicion 2.1.2 Diremos que un ocnjunto no vacıo V ⊆ IRn es un sub - espacio vectorial deIRn (sev) si dicho conjunto, dotado de la suma de vectores y la ponderacion por escalar es, a suvez, un espacio vectorial6.

A partir de la definicion anterior, se tiene la siguiente caracterizacion de un sub - espaciovectorial.

Proposicion 2.1.2 Un conjunto no vacıo V ⊆ IRn dotado de suma y ponderacion por escalares un sub - espacio vectorial de IRn si y solo si cumple que

a.- 0 ∈ V ,

c.- para todo v1, v2 ∈ V y para todo α ∈ IR

v1 + αv2 ∈ V.

Prueba. Ejercicio. 2

El concepto de sub-espacio vectorial se refiere entonces a un subconjunto que es cerrado parala suma y ponderacion por escalar de vectores. Es como otro conjunto dentro del espacio originalque se preserva con la suma y la ponderacion por escalares; cualquier cosa que se construya enel a partir de sumas y ponderaciones sigue estando en el conjunto.

3De hecho, toda estructura algebraica para la cual estaan definidas una suma de sus elementos (usualmentellamada ley de composicion interna y una ponderacion por elementos llamados escalaras (usualmente llamada leyde composicion externa y tal que cumple con las propiedades anteriores, conforma lo que se denomina un espaciovectorial. Los escalares deben a su vez conformar lo que en algebra se llama un cuerpo. Por ejemplo, los realescon la suma y producto de reales, conforman un cuerpo. Otro ejemplo de cuerpo son los complejos con la sumay prodcuto de complejos.

4Ya definiremos esto.5Se puede demostrar que todo otro espacio vectorial de dimension finita es isomorfo a IRn, es decir, que son la

misma cosa desde el punto algebraico...6Es decir, cumple con todas las propiedades anteriores.

Page 33: Libro Matematicas Para Economistas

32 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Ejemplo 2.1.1 Sea

V = Xt = (x1, x2, x3) ∈ IR3 |x1 + x2 + x2 = a.

Veamos que V es un sub - espacio vectorial siempre y cuando a = 0. En efecto, si a = 0, se tieneque 0IR3 = (0, 0, 0)t ∈ V (cumple la condicion ya que la suma de sus componentes es cero). Porotro lado, sean Xt

1 = (x11, x

12, x

13), Xt

2 = (x21, x

22, x

23) ∈ V y sea α ∈ IR cualquiera. Entonces

(1) x11 + x1

2 + x12 = 0

(2) x21 + x2

2 + x22 = 0 ⇒ αx2

1 + αx22 + αx2

2 = 0Sumando (1) con (2) se tiene que

(x11 + αx2

1) + (x12 + αx2

2) + (x13 + αx2

2) = 0.

Luego, las componentes del vector X1 + αX2 verifican la condicion, es decir, estan en V , con locual se tiene lo indicado. Note que si a 6= 0, el conjunto V no es sub - espacio vectorial (Ejercicio:verificarlo con un contraejemplo).

Ejercicio 2.1.1

(a) Pruebe que los conjuntos V1 = 0IRn y V2 = IRn son sub-espacios vectoriales de IRn (dehecho, son los llamados sub-espacios triviales de IRn).

(b) DadoV = X ∈ IRn | xn = 0,

pruebe que V es un sev de IRn.

(c) Sean V1 y V2 dos sev de IRn, pruebe que V1 ∩ V2 es tambien un sev de IRn.

(d) Sea X0 ∈ IRn y seaVX0 = αX0, α ∈ IR.

Pruebe que VX0 es un sev de IRn. Iustre este sev con X0 = (1, 1) ∈ IR2.

Definicion 2.1.3 Dado un conjunto de vectores Xj ∈ IRn, j = 1, ..., k, diremos que Z ∈ IRn esuna combinacion lineal de los mismos si existen escalares αj ∈ IR, j = 1, ..., k, tales que

Z =k∑

j=1

αjXj .

El conjunto de todas las combinaciones lineales de los vectores Xj se denomina sub - espaciolineal generado por X1, ..., Xk, el cual representaremos por L(X1, X2, ..., Xk).

Proposicion 2.1.3

a.- Dados dos conjuntos de vectores V1, V2 ⊆ IRn tales que V1 ⊆ V2, entonces

LV1 ⊆ LV2.

b.- Si Y ∈ L(X1, X2, ..., Xk) entonces

L(Y, X1, X2, ..., Xk) = L(X1, X2, ..., Xk).

Page 34: Libro Matematicas Para Economistas

2.1. VECTORES EN IRN 33

c.- Dado V ⊆ IRn, entonces LV es un sub - espacio vectorial de IRn.

Prueba.

a.- Directo: si Y ∈ LV1, entonces se puede escribir como combinacion lineal de elementosde V1; pero dichos elementos deben estar en V2 y luego Y ∈ LV2.

b.- Sea Y ∈ L(X1, X2, ..., Xk). En primer lugar, de la condicion anterior, es claro queL(X1, X2, ..., Xk) ⊆ L(Y,X1, X2, ..., Xk) pues X1, X2, ..., Xk ⊆ Y,X1, X2, ..., Xk.Falta entonces probar que L(Y,X1, X2, ..., Xk) ⊆ L(X1, X2, ..., Xk). Sea entoncesX ∈ L(Y, X1, X2, ..., Xk). Por lo tanto, existen escalares α1, ..., αk, β tales que

X =k∑

j=1

αjXj + β · Y.

Pero Y ∈ L(X1, X2, ..., Xk), luego existen escalares α′1, ..., α′k tales que

Y =k∑

j=1

α′jXj .

Reemplazando esto en la relacion anterior, se tiene que

X =k∑

j=1

αjXj + β ·

k∑

j=1

α′jXj

=

k∑

j=1

(αj + βα′j)Xj ,

es decir, existen escalares µj = (αj + βα′j) tales que X =k∑

j=1µjXj , con lo cual X ∈

L(X1, X2, ..., Xk), que finaliza la prueba.

c.- Supongamos que V = X1, ..., Xk y sean X, Y ∈ LV y sea β ∈ IR. Entonces si X =k∑

j=1αjXj e Y =

k∑j=1

α′jXj , se tiene que

X + βY =k∑

j=1

(αj + βα′j)Xj ,

con lo cual X + βY ∈ LV . Finalmente, notar que 0 =k∑

j=10Xj ∈ LV . Luego, se tiene

lo indicado. 2

Ejercicio 2.1.2

(a) Dados X0, X1 ∈ IRn, muestre que VX0 ∩ VX1 6= 0IRn si y solo si existe un escalar λ 6= 0tal que X0 = λX1.

(b) Dados Xt1 = (1, 2, 3) y Xt

2 = (4, 5, 6), determine si X = (10, 11, 12) es un elemento deLX1, X2.

Page 35: Libro Matematicas Para Economistas

34 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

En lo que sigue vamos a introducir uno de los conceptos mas importantes del algebra lineal.Este concepto se relaciona con la “cantidad de informacion” que posee un conjunto de vectores.

Definicion 2.1.4 Diremos que el conjunto de vectores Xj ∈ IRn, j = 1, ..., k, es linealmenteindependiente (l.i) si para cualquier αj ∈ IR tal que

k∑

j=1

αjXj = 0

se tiene necesariamente que αj = 0, ∀j.

En otras palabras, un conjunto de vectores es l.i si la unica combinacion lineal que resultanula es aquella en que todos los escalares son cero. Si la condicion anterior no es verificada, es

decir, si existen αj ∈ IR, no todos cero, tales quek∑

j=1αjXj = 0, diremos que el conjunto de

vectores es linealmente dependendiente (l.d), Note que un conjunto cualquiera de vectoreses, o bien l.i o bien l.d.

Ejemplo 2.1.2

a.- Si Y 6= 0 ∈ L(X1, X2, ..., Xk), entonces, necesariamente, el conjunto Y,X1, X2, ..., Xkes l.d. En efecto, como sabemos existen escalares α1, ..., αk (no todos cero) tales que Y =k∑

j=1αjXj . Luego Y −

k∑j=1

αjXj = 0 y por lo tanto existen escalares, no todos nulos, tales

que la combinacion lineal indicada es nula.

b.- Es claro que si X1, X2, ..., Xk es un conjunto l.i, tambien lo es cualquier subconjunto deel.

c.- Supongamos que V = L(X1, X2, ..., Xk) y supongamos ademas que existe un subconjun-to estricto7 de X1, X2, ..., Xk, digamos, X ′

1, X′2, ..., X

′k′ tal que V = L(X ′

1, X′2, ..., X

′k′),

entonces necesariamente X1, X2, ..., Xk es un conjunto l.d. En efecto, para simplificarsupongamos que dicho subconjunto estricto se obtiene de eliminar el primer vector X1

8 .Luego, por definicion sabemos que

L(X1, X2, ..., Xk) = L(X2, ..., Xk).

Como X1 ∈ L(X1, X2, ..., Xk)9, de lo anterior se tiene que X1 ∈ L(X2, ..., Xk). Por lotanto, existen escalares (no todos cero) α2, ..., αk ∈ IR tales que

X1 =k∑

j=2

αjXj ,

es decir, X1−α2X2−α3X3− ...αkXk = 0, con lo cual X1, X2, ..., Xk es l.d como se habıaindicado.

7Es decir, con menos elementos.8Es decir, k′ = k − 1 y X ′

1 = X2, X′2 = X3, ..., X

′k′ = Xk

9Obvio: X1 = 1 ·X1 + 0X2 + ... + 0Xk ∈ L(X1, X2, ..., Xk).

Page 36: Libro Matematicas Para Economistas

2.1. VECTORES EN IRN 35

d.- Cuando en econometrıa disponemos de la matriz de datos, la existencia de multicolineali-dad significa que una de las variables consideradas se puede representar como una funcionlineal de las otras. En tal caso las columnas de la matriz son l.d. En efecto, supongamos quela columna 1 (X1) se puede escribir como una funcion lineal de las otras n−1 (X2, ..., Xn).Luego, existen escalares α2, α3, ..., αn tales que

X1 = α2X2 + α3X3 + .... + αnXn.

De esta manera, X1 − α2X2 − α3X3 − .... − αnXn = 0. Ası, los vectores son l.d segun ladefinicion, ya que existen escalares, no todos cero, tales que la combinacion lineal de losvectores es cero.

Cuando no existe multicolinealidad, las columnas de las matriz de datos son vectores l.i.

e.- Si V es el sub-espacio vectorial generado a partir de las combinaciones lineales de losvectores X1, X2, · · · , Xk, entonces V coincide con el sub-espacio vecrorial generado por elmayor conjunto de vectores l.i que se pueden extraer del conjunto original.

Definicion 2.1.5 Se dice que un conjunto de vectores Xj , j = 1, ..., k genera el sub-espaciovectorial V ⊆ IRn si cualquier otro vector X ∈ V se puede escribir como combinacion lineal delos mismos. Si ademas dicho conjunto es l.i se dice entonces que es una base del sub-espaciovectorial.

En otras palabras, Xj , j = 1, ..., k genera V si ∀X ∈ V , ∃αj ∈ IR tal que X =k∑

j=1αjXj . Si

ademas dicho conjunto es l.i entonces se dice que es una base de V .

Ejemplo 2.1.3 a.- Si V = L(X1, ..., Xk), el conjunto X1, ..., Xk genera V , pero no nece-sariamente es una base, ya que como conjunto de vectores puede ser l.d. Note ademasque dado cualquier Y ∈ L(X1, ..., Xk), el conjunto Y, X1, ..., Xk tambien genera V . Dehecho, para cada sub - espacio vectorial pueden existir muchos conjuntos generadores.

b.- En IR3, un conjunto de un vector genera una recta por el origen en el espacio. Un conjuntode dos vectores l.i genera un plano que pasa por el origen. Si los dos vectores son l.d,generan una recta que pasa por el origen.

Proposicion 2.1.4 Sea X1, X2, · · · , Xk una base del sub-espacio vectorial V ⊆ IRn. Entonces,dado X ∈ V , existen escalares unicos α1, α2, · · · , αk tales que

X = α1X1 + α2X2 + · · ·+ αkXk.

Prueba. En primer lugar, que X1, X2, · · · , Xk sea una base de V significa que es un conjunto l.ique genera V , por lo cual existen escalares α1, α2, · · · , αk tales que X = α1X1+α2X2+· · ·+αkXk.Para probar que son unicos, supongamos que hay dos posibilidades de escribir el vector X enterminos de la base mencionada, es decir, supongamos que existen otros escalares α′1, α′2, · · · , α′k,distintos de los anteriores, tales que X = α′1X1 + α′2X2 + · · · + α′kXk. En tal caso, restandoambas igualdades, ocurre que

(α1 − α′1)X1 + (α2 − α′2)X2 + · · ·+ (αk − α′k)Xk = 0IRn

Page 37: Libro Matematicas Para Economistas

36 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

y por lo tanto, de la independencia lineal, sigue que todos los coeficientes deben ser cero, razonpor la cual αj − α′j = 0, j = 1, 2, · · · , k, con lo cual se tiene la unicidad de los coeficientes. 2

Una cuestion que es muy importante tener presente es que pueden existir muchas bases paraun sub-espacio vectorial. Sin embargo, fijada la base, hay una unica forma de expresar unvector cualquiera en sus terminos.

Ejemplo 2.1.4 Para IRn, una base muy usada es la llamda base canonica, que esta formadapor los siguientes vectores: ei, i = 1, 2, · · · , n tal que et

i = (0, 0, · · · , 1, 0, · · · , 0) donde el 1 esta enla posicion i. Veamos que este conjunto de vectores conforman una base de IRn. En primer lugar,veamos que generan IRn: dado Xt = (x1, x2, · · · , xn) ∈ IRn, notemos que

X = x1e1 + x2e2 + · · ·+ xnen

con lo cual eii=1,2,···,n genera IRn. Veamos ahora que el conjunto es l.i. En efecto, sin∑

i=1αiei =

0IRn , significa que (α1, α2, · · · , αn) = (0, 0, · · · , 0), con lo cual cada escalar es cero.

Un resultado muy importante nos dice que en todo espacio vectorial ocurre que las bases siemprehan de tener el mismo numero de vectores, valor que se conoce como dimension del espa-cio vectorial. Para demostrarlo, utilizaremos algunos conceptos relativos a los sistemas deecuaciones linales, sobre los cuales volveremos con mas detelle en secciones posteriores.

Proposicion 2.1.5 Caulquier conjunto de n vectores l.i en IRn genera IRn.

Prueba. Sean Yj , j = 1, 2, · · · , n, vectores l.i en IRn y sea Xt = (xi) ∈ IRn un vector cualquiera.Debemos probar entonces que necesariamente existen escalares µj tal que X =

∑j µjYj , cuestion

que equivale a probar que el sistema de ecuaciones

y11µ1 + y21µ2 + · · ·+ yn1µn = x1

y12µ1 + y22µ2 + · · ·+ yn2µn = x2

···y1nµ1 + y2nµ2 + · · ·+ ynnµn = xn

tiene solucion, donde yij es la i-esima componente del vector Yj y xi la i-esima componente delvector X. Sin perdida de generalidad podemos suponer que cada componente de los vectoresson positivas. En este caso, al multiplicar la segunda ecuacion por −y12/y11 y sumarla con laprimera, el sistema de ecuaciones no se altera y ademas la segunda ecuacion es tal que no aparecela variable µ1 en su expresion. En forma analoga, podemos multiplicar las otras ecuaciones porel factor −y1k/y11 y sumarlas con la primera para ası eliminar la primera variable de cada unade ellas. Se puede continuar con este proceso de eliminacion considerando entonces la segundaecuacion como pivote para elmininar la tercera variable desde la tercera hasta la ultima ecuacion.Ası sucesivamente pivoteando con la tercera ecuacion, etc. Obviamente lo que hacemos con lasecuaciones lo hacemos con el lado derechos de las ecuaciones. Finalmente, como resultado detodo este proceso, el sistema de ecuaciones tendra entonces la forma equivalente

y11µ1 + y21µ2 + y31µ3 + y41µ4 + · · ·+ yn1µn = x1

y21µ2 + y31µ3 + y41µ4 + · · ·+ yn1µn = x2

Page 38: Libro Matematicas Para Economistas

2.1. VECTORES EN IRN 37

y31µ3 + y41µ4 + · · ·+ yn1µn = x3

y41µ4 + · · ·+ yn1µn = x4

···ynnµn = xn.

Puesto que los vectores Yj , j = 1, 2, · · · , n son l.i, necesariamente cada coeficiente yii, i =1, 2, · · · , n sera distinto de cero, pues en caso contrario significa que uno de los lados derechos delas ecuaciones se puede obtener como combinacion lineal de los otros lados derechos, con lo cualse tendrıa que los vectores son l.d. De esta manera, por sustitucion inversa (se determina primeroµn en la ecuacion n, con esto se determina µn−1 en la ecuacion n − 1 y ası sucesivamente) sepuede entonces resolver el sistema de ecuaciones, con lo cual encontramos los escalares deseados.2

De lo anterior queda entonces claro que todo conjunto l.i de n vectores genera IRn y que,por lo tanto, no puede haber conjuntos l.i con n + 1 vectores o mas (por que?). Se tiene ademasque cualquier conjunto l.i con menos de n vectores no puede generar IRn (por que?), lo que endefinitiva implica que toda base de IRn debe necesariamente tener n vectores (por que?). Estomotiva la siguiente definicion.

Definicion 2.1.6 La dimension de un espacio vectorial es el numero maximo de vectoresl.i que lo generan. Este valor es coincidente con el numero de vectores de cualquier base de dichoespacio. Para V sev de IRn se denotara por dim(V ) el valor de su dimension.

A partir de lo anterior, se tiene entonces que

(a) La dimension de IRn es n ya que disponemos de una base con n elementos (la canonica)que lo genera. En consecuencia, toda base de IRn tiene necesariamente n elementos.

(b) En IRn ocurre que cualquier conjunto con mas de n vectores necesariamente es l.d.

(c) En IRn ocurre que cualquier conjunto con menos de vectores que la dimension del espaciono puede generarlo.

Ejercicio 2.1.3 Demostrar lo anterior. Demostrar ademas que dados dos sev V1, V2 de IRn secumple que

dim(V1 ∩ V2) ≤ mındim(V1, dim(V2).

Para nuestros efectos, en todo lo que sigue trabajaremos con espacios de dimension finita,que, para fijar ideas, siempre podra ser asociados a IRn.

Ejemplo 2.1.5 Un ejemplo de espacio vectorial de dimension infinita es el conjunto de todaslas funciones continuas del intervalo cerrado [a, b] en IR, dotado de la suma usual de funcionesy de la ponderacion por escalar.

Ejercicio 2.1.4 Sabemos que V1 = X ∈ IRn | xn = 0 es un suv de IRn. Determine su

dimension. Analogo con el sev V2 = X ∈ IRn |n∑

i=1αixi = 0, con αi dados.

Page 39: Libro Matematicas Para Economistas

38 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

2.2. Un poco de geometrıa en IRn

En todo lo anterior solo hemos visto aspectos mas bien algebraicos de los vectores (suma,ponderacion). Ahora nos concentraremos en cuestiones mas bien geometricas sobre los mismos,de lo cual surge la idea de angulo y de distancia entre vectores. Para ello el concepto basico es elde producto interno de vectores (o producto punto o producto euclidiano, hay varios nombres).Primero la definicion y luego la interpretacion.

Definicion 2.2.1 Dados X = (x1, x2, ..., xn)t, Y = (y1, y2, ..., yn)t ∈ IRn, definimos el produc-to interior o euclidiano de X e Y como

X · Y =n∑

j=1

xjyj ∈ IR.

Note que el producto punto entre dos vectores es siempre un numero real, positivo, negativoo cero. Note ademas que el producto interno de cualquier vector con el vector nulo es siemprecero, pero que tambien podrıa ser cero aun cuando ambos vectores sean distintos de cero. Enalgunos textos el producto interno de X con Y se denota como < X, Y > o incluso (X, Y ).

Definicion 2.2.2 La norma Euclidiana de un vector X = (x1, x2, ..., xn)t ∈ IRn se definecomo

‖X‖ =√

X ·X =

√√√√n∑

j=1

(xj)2 ∈ IR.

Note que la norma de un vector siempre es un numero real o positivo o cero (si el vectortiene todas sus componentes nulas).

Geometricamente, la norma de un vector nos da cuenta del tamano del mismo10.

Definicion 2.2.3 Dados dos vectores en X, Y ∈ IRn, definimos la distancia Euclidiana11

entre ellos como

d(X,Y ) = ‖X − Y ‖ ∈ IR.

Con los conceptos anteriores, se tiene la siguiente proposicion:

Proposicion 2.2.1 Para todo X, Y, Z ∈ IRn y α ∈ IR

a.1. X · (Y + Z) = X · Y + X · Za.2. (αX) · Y = α(X · Y )

10Para efectos de definir el tamano esta implıcita una metrica en el espacio vectorial. Para el caso de la normatal como se ha definido anteriormente, la metrica es la euclidiana y las distancias corresponden a la nocion usualque de ella se tiene. Pueden existir otras metricas para medir tamanos y distancias. Tal es el caso en econometrıacuando se trabaja con mınimos cuadrados generalizados, donde la metrica esta dada por la matrız de varianza -covarianza de los datos.

11Note que la distancia es funcional a la norma que se emplee para definirla.

Page 40: Libro Matematicas Para Economistas

2.2. UN POCO DE GEOMETRIA EN IRN 39

a.3. X · Y = Y ·X

a.4. 0 ·X = 0.

b.1. ‖X‖ ≥ 0 y ‖X‖ = 0 si y solo si X = 0

b.2. ‖αX‖ = |α|‖X‖ (|α| es el modulo o valor absoluto de α)

b.3. ‖X + Y ‖ ≤ ‖X‖+ ‖Y ‖ (desigualdad triangular).

c.1. d(X,Y ) = d(Y, X)

c.2. d(X,Y ) ≥ 0 y d(X,Y ) = 0 si y solo si X = Y .

c.3. d(X,Y ) ≤ d(X,Z) + d(Z, Y ) (desiguldad triangular de la distancia).

d.1. X · Y ≤ ‖X‖ ‖Y ‖ (desigualdad de Cauchy - Schwartz)

Prueba. Esto es directo de las definiciones que se han hecho, salvo la desigualdad de Cuachy-Schawartz. Para demostrarla, dados X,Y ∈ IRn, si Y = 0 (o X = 0 o ambos) la desigualdades directa (por que?). Supongamos entonces que Y 6= 0. Ahora bien, del hecho que para todoα ∈ IR se cumple

0 ≤ ‖X − αY ‖2 = (X − αY ) · ((X − αY ) = X ·X + α2Y · Y − 2αX · Y,

es decir,

0 ≤ ‖X − αY ‖2 = ‖X‖2 + α2‖Y ‖2 − 2αX · Y,

escogiendo

α =X · Y‖Y ‖2

y reemplazando en la igualdad anterior, se tiene que

0 ≤ ‖X‖2 +[X · Y‖Y ‖2

]2

‖Y ‖2 − 2X · Y‖Y ‖2

X · Y,

que ordenando los terminos nos lleva a la desigualdad indicada. El resto de la demostracionqueda como ejercicio. 2

A partir de la desigualdad de Cauchy-Schawrtz es posible definir el angulo entre vectores.

Definicion 2.2.4 Dados X,Y dos vectores en IRn distintos de cero, el angulo entre ellos, quedenotaremos 6 (X, Y ), se define como aquel valor que cumple con

cos(6 (X, Y )) =X · Y‖X‖‖Y ‖ ∈ [−1, 1].

De la definicion de angulo anterior, notemos que si 6 (X,Y ) = 90 (es decir, X e Y sonortogonales), entonces se debe cumplir que su coseno es 0, con lo cual, debido a que la normaes diferente de cero, se debe cumplir que el producto interno entre ellos debe ser cero. Con esto,se tiene la siguiente definicion.

Page 41: Libro Matematicas Para Economistas

40 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Definicion 2.2.5 Dos vectores X e Y se dicen ortogonales si el angulo que forman es de 90,lo que es equivalente a decir que X · Y = 0. En este caso notaremos X ⊥ Y .

La siguiente figura ilustra geometricamente los conceptos anteriores.

||x||

x

xy

x+y

||x+y|| < ||x|| + ||y||_

x

y

d(x,y)

ang(x,y)

Definicion 2.2.6 Diremos que un vector X ∈ IRn es unitario si ‖X‖ = 1.

Ejercicio 2.2.1 a.- Muestre que 0 ⊥ X, para todo X ∈ IRn. Muestre ademas que si Z ∈ IRn

es tal que Z ⊥ X, ∀X ∈ IRn entonces necesariamente Z = 0.

b.- Muestre que si X ⊥ Xi, i = 1, 2, ..., k entonces X ⊥ Y , para todo Y ∈ L(X1, X2, ..., Xk).c.- Muestre que X = X

‖X‖ es un vector unitario, X 6= 0.

d.- Definamos la siguiente familia de vectores:

B = e1, e2, ..., en ⊆ IRn

donde ei = (0, ..., 0, 1, 0, , ..., 0)︸ ︷︷ ︸1 en posicion i

. Muestre que B es una familia de vectores mutuamente

ortogonales y unitarios. Muestre ademas que para todo X ∈ IRn, se tiene que

X =n∑

j=1

(X · ej)ej .

e.- Muestre que X, Y son dos vectores ortogonales distintos de cero, entonces X e Y son l.i.

f.- Sean X1, X2, · · · , Xn vectores distintos de cero y ortogonales dos a dos, es decir, ∀i, j ∈1, 2, · · · , n se cumple queXi ·Xj = 0, i 6= j. Muestre que X1, X2, · · · , Xn es una basede IRn. Si ademas suponemos que estos vectores son unitarios, muestre entonces que paratodo X ∈ IRn se cumple que

X =n∑

j=1

(X ·Xj)Xj ,

que se entiende como una extension natural de lo indicado en d.-

Page 42: Libro Matematicas Para Economistas

2.2. UN POCO DE GEOMETRIA EN IRN 41

g.- Dados αi ∈ IR++, i = 1, ..., n, definamos

‖X‖α =

√√√√n∑

j=1

αjx2j .

Muestre entonces que ‖·‖α cumple con todas las propiedades b.1 hasta b.3 de la proposicionanterior.

h.- Dado X = (x1, x2, ..., xn)t ∈ IRn, definamos

‖X‖∞ = max|x1|, |x2|, ..., |xn|, ‖X‖1 =n∑

j=1

|xj |.

Muestre entonces que ‖ · ‖∞ y ‖ · ‖1 cumplen con todas las propiedades b.1 hasta b.3 de laproposicion anterior.

i.- Definamos

d1(X,Y ) =n∑

j=1

|xj − yj |.

Muestre entonces que d1(·, ·) cumple con todas las propiedades c.1 hasta c.3 de la proposi-cion anterior.

Ejercicio 2.2.2 Dados dos vectores no nulos X, Y ∈ IRn, definamos la proyeccion de Y sobreX como el vector proy(Y )X tal que cumple con las siguientes condiciones: (i) proy(Y )X = λXpara algun λ ∈ IR y (ii) [proy(Y )X − Y ] ⊥ X. La geometrıa es como sigue

Y

Xproy (Y)

X

A partir de todo lo anterior, pruebe entonces que

proy(Y )X =X · Y‖X‖2

X

y con esto, muestre que

[proy(Y )X − Y ] ⊥ X.

Extendamos lo anterior para definir la proyeccion de un vector Y sobre un sub-espacio vec-torial definido por una base X1, X2, · · · , Xk. Naturalmente el concepto es que la proyeccion deY sobre el sev V = LX1, X2, · · · , Xk se define como aquel vector proy(Y )V ∈ V tal que[proy(Y )X − Y ] ⊥ Xi, para todo i = 1, 2, · · · , k. Geometricamente es como sigue

Page 43: Libro Matematicas Para Economistas

42 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Y

proy (Y)V

V

De todo lo anterior, encuentre entonces una expresion de proy(Y )V en terminos de lasvariables ya mencionadas.

2.3. Conceptos basicos de matrices

Las matrices son simplemente arreglos rectangulares de numeros12. La razon de por que definir-las como se definen es meramente practica, y proviene de innumerables ejemplos. En este sentido,las matrices aparecen naturalemente como una extension del arreglo de columna que les hemosdado a los vectores.

Definicion 2.3.1 Diremos que A es una matriz real de m×n si es un arreglo de numeros realesde la forma

A =

a11 a12 ... a1j ... a1n

a21 a22 ... a2j ... a2n

... ... ... ... ... ...ai1 ai2 ... aij ... ain

... ... ... ... ... ...am1 am2 ... amj ... amn

donde cada aij ∈ IR, con i = 1, ...,m y j = 1, ..., n. El valor m corresponde al numero de filasde la matriz, mientras que n al de columnas. El conjunto de matrices de m×n a valores realessera denotado por IRn×n. Si los valores considerados fuesen complejos, el conjunto de matricesrespectivo se denotara ICm×n.

Genericamente, una matriz A como al anterior sera denotada A = [aij ] ∈ IRm×n. De estamanera, dadas las matrices A,B ∈ IRm×n, dada C ∈ IRn×` y dado α ∈ IR, se definen lossiguientes conceptos.

Definicion 2.3.2

a.- Suma de A con B: A + B := [aij + bij ]

b.- Producto de A con C: A · C := [pik], donde i = 1, ..., m y k = 1, ..., ` tal que:

cik =n∑

j=1

aij · cjm.

12En este sentido, los vectores podrıan ser entonces entendidos como arreglos rectangulares de numeros, soloque el rectangulo es uno muy delgado.

Page 44: Libro Matematicas Para Economistas

2.3. CONCEPTOS BASICOS DE MATRICES 43

c.- Ponderacion por escalar: α ·A = [αaij ].

En otras palabras, al sumar matrices del mismo orden, el resultado es una nueva matriz cuyoselementos se construyen como la suma de los respectivos numeros originales; la ponderacion essimilar. Para el producto de matrices, se debe tener presente que el numero de columnas dela primera (en este caso A) debe ser igual al numero de fila de la segunda (C). Un elementocualquiera de la matriz producto se obtiene de hacer el producto interno de la respectiva fila deA por la columna correspondiente de C.

Una regla simple para recordar las dimensiones del producto se tiene en lo siguiente:

[m× n] · [n× `] = [m× `].

Por otro lado, a partir de la definicion de matrices, notemos que un vector

X =

x1

x2

.

.

.xn

∈ IRn

se puede entender como una matriz de n × 1. Con ello, aplicando la definicion general de pro-ducto de matrices, la mutiplicacion AX (matriz por vector) tiene sentido solo si el numerode columnas de la matriz es igual a la dimension del vector. Notemos ademas que dadaA = [aij ] ∈ IRm×n y dado X como antes, entonces AX es un vector de dimension m, queesta formado por la combinacion lineal de las colcumnas de A, donde los ponder-adores son las componentes del vector X. En otras palabras, dada A = [aij ] ∈ IRm×n ydado Xt = (x1, x2, · · · , xn) ∈ IRn, se tiene que

AX = [A]1x1 + [A2]x2 + · · ·+ [An]xn ∈ IRm,

donde cada [Ai], i = 1, 2, · · · , n es la respectiva columna de la matriz A. De esto se tiene entoncesque si A ∈ IRm×n y B ∈ IRn×p, el producto de A con B es una nueva matriz donde la columnak de la misma es simplemente la combinacion lineal de las columnas de la matriz A por losrespectivos coeficientes de la columna k de la matriz B.

Definicion 2.3.3 Dada A = [aij ] ∈ IRm×n, definimos su traspuesta como la matriz At = [atij ]

tal que:

atij = aji.

Es decir, la traspuesta de una matriz corresponde a aquella donde se cambian las filas porcolumnas13.

Definicion 2.3.4 Diremos que una matriz A ∈ IRm×n es cuadrada si m = n: numero de filasigual a numero de columnas.

13Para el caso de un vector columna, su transpuesta correspondera a un vector fila.

Page 45: Libro Matematicas Para Economistas

44 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Definicion 2.3.5 Diremos que A una matriz cuadrada es simetrica si At = A. Diremos quees antisimetrica si At = −A.

Definicion 2.3.6 Diremos que una matriz cuadrada A es invertible si existe otra matriz, quedenotaremos A−1, tal que14:

A−1A = AA−1 = I

donde I es la matriz identidad definida como

Iii = 1; Iij = 0, con i 6= j.

La siguiente proposicion resume las principales propiedades de las matrices.

Proposicion 2.3.1 Dadas las matrices A = [aij ], B = [bij ], C = [cij ] ∈ IRn×n, se tiene que:

a.- A + B = B + A.

b.- En general AB es distinto de BA. Por otro lado, siempre se cumple que A(BC) = (AB)Cy A(B + C) = AB + AC.

c.- (A + B)t = At + Bt, (AB)t = BtAt, (At)t = A.

d.- Si A y B son invertibles, entonces AB y BA son invertibles y ademas (AB)−1 = B−1A−1.

e.- Si A es invertible, (At)−1 = (At)−1.

Ejercicio 2.3.1

a.- Demostrar la proposicion anterior para el caso de matrices de 2× 2.

b.- Dese tres matrices de orden 3× 3 y verifique las propiedades anteriores.

Nota. Obviamente (ni tan obviamente...), si la inversa de una matriz existe, esta es unica. Quedacomo ejercicio demostrarlo usando razonamiento por contradiccion. 2

A partir de las definiciones anteriores de suma y ponderacion de matrices, se tiene el siguienteresultado.

Proposicion 2.3.2 El conjunto de matrices IRm×n es un espacio vectorial con la suma dematrices y la multiplicacion por escalar.

Ejercicio 2.3.2

a.- Muestre que las matrices, con la suma y ponderacion por escalar definidas, verifica todaslas propiadades de un espacio vectorial, segun la definicion ya hecha.

14La nocion de invertibilidad no tiene sentido si la matriz no es cuadrada.

Page 46: Libro Matematicas Para Economistas

2.3. CONCEPTOS BASICOS DE MATRICES 45

b.- A partir de lo anterior, pruebe que si Ai ∈ IRn×n, i = 1, ..., K, son K matrices, entonces(A1A2 · · ·AK)t = At

KAtK−1···At

1 y si todas ellas son invertibles entonces (A1A2 · · ·AK)−1 =A−1

K A−1K−1 · · ·A−1

1 .

c.- Dadas las matrices

A =

α 0 00 1 00 0 4

B =

α 1 10 β 10 0 γ

pruebe que A es invertible si y solo si α 6= 0, mientras que B lo es siempre y cuando cadaelemento de la diagonal es distinto de cero. Compruebe ademas todas formulas (seguncorresponda) indicadas en la proposicion anterior.

d.- Dada una matriz de 2× 2

A =

(α βγ δ

)

muestre que es invertible si y solo si α · δ − γ · β 6= 0 y muestre ademas que la inversa es

A =1

α · δ − γ · β

(δ −β−γ α

)

2

Dada la matriz cuadrada A = [aij ] ∈ IRn×n, para deterinar su inversa (y con ello sabersi efectivamente es invertible) la idea es encontrar otra matriz A−1 = [αij ] que cumpla con ladefinicion. Puesto que el producto de dos matrices corresponde a una nueva matriz donde lacolumna respectiva es la combinacion lineal de las columnas de la matriz de la izquierda por loscoeficientes de la columna correspondiente de la matriz de la derecha, sigue que al imponer laigualdad con la identidad se debe cumplir que para todo k = 1, 2, · · · , n

[A]1αk1 + [A]2αk2 + · · ·+ [A]nαkn = [I]k

donde [A]j es la columna j de la matriz A, [I]k es la columna k de la matriz identidad (quede hecho, coincide con el k de la base canonica de IRn) y cada αki, i = 1, 2, · · · , n son lascomponentes de la k-columna de A−1. Por lo tanto, si miramos las columnas de A como vectoresde IRn se tiene que los valores αki han de existir toda vez que dichas columnas sean l.i. Enefecto, si ellas son l.i automaticamente conforman una base de IRn (son n vectores l.i en IRn) ypor lo tanto, generan el espacio vectorial. Como [I]k ∈ IRn se tiene entonces que deben existirescalares αki cumpliendo con lo anterior. Mas aun, de la lineal independencia de los vectores,estos escalares son unicos. Con esto, haciendo variar k, se tiene que determinar la inversa deuna matriz corresponde a poder encontrar los respectivos escalares αij que permiten expresartodas las columnas de la identidad como combinaciones lineales de las columnas de A. Todo loanterior se resume entonces en la siguiente muy importante proposicion.

Page 47: Libro Matematicas Para Economistas

46 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Proposicion 2.3.3 Una matriz cuadrada A ∈ IRn×n es invertible si y solo si todas sus columnasson l.i

Ejercicio 2.3.3 Muestre que si A ∈ IRn×n es invertible, entonces At tambien lo es. Muestreademas que dada cualquier matriz B ∈ IRn×n, existe una unica matriz Z ∈ IRn×n tal que

AZ = B.

Esta matriz Z es simplemente A−1B.

Ejemplo 2.3.1 Dada una matriz A = [aij ] ∈ IRm×n, diremos que es triangular superior sitiene la siguiente forma

A =

a11 a12 ... a1j ... a1n

0 a22 ... a2j ... a2n

0 0 a33 ... ... a2n

... ... ... ... ...0 0 0 amm ... amn

Es decir, todos aquellos elementos que estan bajo la diagonal principal (aii) son nulos. En elcaso ilustrado, m < n. Si m = n la figura serıa como sigue:

es decir, A es de la forma

A =

a11 a12 ... a1j ... a1n

0 a22 ... a2j ... a2n

0 0 a33 ... ... a2n

... ... ... ... ...0 0 0 ... 0 ann

.

A partir de la definicion, es directo que la suma de dos matrices triangulares superiores estriangular superior y que la ponderacion por escalar de la misma tambien lo es. Con esto quedaprobada entonces la siguiente proposicion.

Proposicion 2.3.4 El sub-conjunto de las matrices de n× n que son triangular superior es unsub-espacio vectorial del conjunto de las matrices de n× n. Denotemoslo por TSn.

Las matrices que son triangular superior son muy importantes en algebra lineal, basicamentepor que sus propiedades son de gran utilidad en una enorme variedad de aplicaciones. Porejemplo, se tiene que

Page 48: Libro Matematicas Para Economistas

2.4. NUCLEO E IMAGEN DE UNA MATRIZ 47

a.- Dada A ∈ IRn×n una matriz triangular superior tal que desde la fila k en adelante (sinincluirla) todos los elementos son nulos, entonces el rango de la matriz es k. La siguientefigura ilustra lo anterior:

n

n

k

n-k

k (n-k)

En efecto, claramente las primeras k filas son l.i, luego, el rango por filas es (k); peroel rango por filas es igual al rango por columnas (numero de columnas l.i), que es igualal rango de la matriz. Consecuencia inmediata de lo anterior es que la nulidad de dichamatriz (dimension del kernel) es igual a (n− k). Con esto, la suma del rango y la nulidades igual al numero de columnas de la matriz.

b.- Una matriz triangular superior A ∈ IRn×n es invertible si y solo si todos los elementosde su diagonal son distintos de cero. En efecto, en tal caso ocurre que su rango es n,por lo cual todas sus columnas son l.i, con lo cual se tiene lo indicado.

c.- El producto de dos matrices cuadradas triangular superior es tambien triangular superior.Queda como ejericio probarlo con matrices de 2× 2. 2

Ejercicio 2.3.4

(i) Diremos que una matriz cuadrada (aplica tambien para matrices no cuadradas) es triangu-lar inferior si su traspuesta es triangular superior. Usando esta definicion, pruebe que lasmatrices triangular inferior satisfacen las mismas propiedades que las matrices triangularsuperior.

(ii) Definamos el conjunto de las matrices diagonales de orden n×n como aquellas matricesque son triangular superior y triangular inferior a la vez. Denotemoslo por Dn.

(ii.1) Muestre que Dn es un sev de IRn×n.

(ii.2) Muestre que A ∈ Dn si tiene la forma A = [aij ] con aij = 0,∀i 6= j. Ilustre la formaque tienen estas matrices.

(ii.3) Muestre que A ∈ Dn es invertible si y solo todos los elementos de la diagonal sondistintos de cero. Muestre ademas que la inversa de A ∈ Dn es otra matriz diagonalcon los valores en la diagonal iguales a los inversos de aquellos de A.

2.4. Nucleo e imagen de una matriz

Considerando la definicion de producto de matrices y vectores, notemos que cualquier sistemade ecuaciones lineales de la forma (m ecuaciones y n incognitas)

Page 49: Libro Matematicas Para Economistas

48 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

a11x1 + a12x2 + ... + a1jxj + ... + a1nxn = b1

a21x1 + a22x2 + ... + a2jxj + ... + a2nxn = b2

....ai1x1 + ai2x2 + ... + aijxj + ... + ainxn = bi

....am1x1 + am2x2 + ... + amjxj + ... + amnxn = bm

se puede re-escribir en forma matricial de la siguiente manera:

AX = b,

donde

A =

a11 ... a1j ... a1n

a21 ... a2j ... a2n

... ... ... ... ...am1 ... amj ... amn

∈ IRm×n, X =

x1

x2

.

.

.xn

, b =

b1

b2

.

.

.bm

Resolver el sistema de ecuaciones significa encontrar todos los valores de X que lo satisfacen.Notemos ahora lo siguiente: supongamos que hemos podido encontrar un valor Xb tal que

AXb = b (en principio, una solucion del sistema lineal). Sea ahora X0 un vector cualquiera talque AX0 = 0 ∈ IRn. Dado λ ∈ IR cualquiera, definamos

Xs = Xb + λX0.

Notemos entonces que

AXs = A(Xb + λX0) = AXb + λAX0 = AXb + 0 = b,

es decir, Xs tambien es una solucion del sistema de ecuaciones. De hecho, Xb es un casoparticular de los Xs pues corresponde al caso en que λ = 0. Lo anterior motiva la siguientedefinicion.

Definicion 2.4.1 Dado el sistema de ecuaciones AX = b, diremos que un vector Xb ∈ IRn esuna solucion particular del sistema si AXb = b y diremos que X0 es una solucion homogeneasi AX0 = 0.

Con esto, la solucion de un sistema de ecuaciones necesariamente tiene dos componentes: unaparticular y una homogenea. La solucion del sistema es entonces la suma de ambas, ponderandola homogenea por un escalar cualquiera.

Suponiendo que el sistema tiene solucion particular, si existe al menos una solucion ho-mogenea distinta de cero15, entonces el sistema de ecuaciones tiene infinitas soluciones.

Lo anterior motiva una definicion muy importante en algebra lineal.

Definicion 2.4.2 El nucleo (o kernel) de una matriz A = [aij ] ∈ IRm×n se define como:

Ker(A) := X ∈ IRn | AX = 0.

15El vector cero siempre es solucion de la homogenea.

Page 50: Libro Matematicas Para Economistas

2.4. NUCLEO E IMAGEN DE UNA MATRIZ 49

Proposicion 2.4.1 Ker(A) ⊆ IRn es un sub-espacio vectorial de IRn.

Demostracion. Puesto que A0 = 0 se tiene que 0 ∈ Ker(A). Por otro lado, dados X1, X2 ∈Ker(A) y dado α ∈ IR, se tiene que

A(X1 + αX2) = AX1 + αAX2 = 0 + α0 = 0

luego, X1 + αX2 ∈ Ker(A), 2.

Definicion 2.4.3 La dimension del Ker(A) se denomina nulidad de A y se representa pornul(A). Si Ker(A) = 0 se dice que la nulidad es cero.

Reescribiendo todo lo antes discutido, si deseamos resolver el sistema AX = b, supongamosque hemos encontrado una solucion particular Xb. Entonces, para todo Xh ∈ Ker(A) se tieneque

Xs = Xb + Xh

resuelve el sistema de ecuaciones. En el caso especial Ker(A) = 0, de existir una solucionparticular para el sistema de ecuaciones, esta necesariamente es unica. En caso contrario, dichosistema tiene infinitas soluciones.

Ejemplo 2.4.1 Dada A ∈ IRm×n tal que Ker(A) = 0, entonces la unica solucion del sistemade ecuaciones AX = 0 es X = 0. Luego, como AX ∈ IRn es una combinacion lineal de lascolumnas de A, donde los ponderadores son las componentes de X, la condicion anterior equivalea decir que la unica combinacion lineal de las columnas de A que es igual a cero es aquella dondelos coeficientes son todos nulos, es decir, las columnas de A son l.i.

A partir de lo anterior, se tiene la siguiente propiedad:

Proposicion 2.4.2 Una matriz cuadrada A ∈ IRn×n es invertible si y solo si ker(A) = 0, olo que es equivalente, si nul(A) = 0.

Demostracion. Veamos el si (es decir, la condicion necesaria). En efecto, supongamos que A esinvertible y sea X tal que AX = 0. Como existe la inversa, se tiene que AX = 0 ⇒ A−1(AX) =A−10 = 0, es decir, IX = 0, es decir, X = 0, con lo cual Ker(A) = 0.

Veamos ahora el solo si (es decir, la condicion suficiente), para lo cual supongamos queKer(A) = 0. Del ejemplo anterior, se tiene que las columnas de A son l.i y, por lo tanto,forman una base de IRn (son n vectores l.i de IRn). Notemos que encontrar una inversa Z de Acorresponde a resolver n sistemas de ecuaciones de la forma

AZi = ei

donde ei ∈ IRn es tal que eti = (0, 0, ..., 1, 0, ..., 0): uno en la posicion i-esima y cero en el resto, y

Zi es la i-esima columna de Z. Puesto que las columnas de A forman una base de IRn, entonces sepuede encontrar el mentado vector Zi, esto para cada i = 1, 2, ..., n. Con esto, hemos encontradouna matriz Z tal que AZ = I. Resta probar que ZA = I. Sea H = ZA. Entonces AZA = AH,pero AZ = I y luego A = AH, es decir, A − AH = A(I −H) = [0]. Lo anterior corresponde an sistemas de ecuaciones homogeneas (cada columna de la matriz (I −H) por A igual a cero).

Page 51: Libro Matematicas Para Economistas

50 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Puesto que Ker(A) = 0 se tiene que cada una de las columnas de I −H debe ser cero, es decir,I −H = 0 con lo cual, H = ZA = I. 2

En otras palabras, la proposicion anterior nos dice que una matriz es invertible si y solo elsistema de ecuaciones AX = 0 tiene una unica solucion (cero). De esto se desprende directamentelo siguiente:

Proposicion 2.4.3 Una matriz cuadrada A ∈ IRn×n es invertible si y solo si el sistema deecuaciones AX = b tiene una unica solucion para todo b ∈ IRn.

Prueba. Si existe inversa, se tiene que AX = b ⇔ A−1AX = A−1b ⇔ X = A−1b, que es lasolucion unica del sistema de ecuaciones. Por otro lado, si el sistema de ecuaciones AX = b tienesolucion unica, considerando el caso particular b = 0 se tiene que Ker(A) = 0 y luego, de laproposicion anterior, la matriz es invertible. 2

Lo anterior es el hecho fundamental que caracteriza a las matrices invertibles.Para terminan con esta seccion, vamos a presentar un resultado fundamental del algebra

lineal, que liga los conceptos anteriores. Para ello solo necesitamos una ultima definicion.

Definicion 2.4.4 La imagen de una matriz A ∈ IRn×n se define como el conjunto:

Im(A) = y ∈ IRn | ∃x ∈ IRn, y = Ax ≡ Ax | x ∈ IRn.

Proposicion 2.4.4 Dada A ∈ IRn×n se tiene que Im(A) es un sub-espacio vectorial de IRn.

Prueba. Claramente 0 ∈ Im(A) pues A0 = 0. Sean ahora y1, y2 ∈ Im(A) y λ ∈ IR. Entoncesexiste x1, x2 ∈ IRn tal que Axi = yi, i = 1, 2. Sea y = y1 + λy2 y sea x = x1 + λy2. EntoncesAx = A(x1 + λx2) = Ax1 + λAx2 = y1 + λy2 = y. Luego, y ∈ Im(A) con lo cual Im(A) es uns.e.v de IRn. 2

Definicion 2.4.5 La dimension del sub-espacio vectorial Im(A) se denomina Rango de lamatriz A y se denota por rg(A).

Proposicion 2.4.5 Dada A ∈ IRn×n, rg(A) corresponde al numero de columnas l.i de A.

Prueba. El rango de A es la dimension de la imagen de A, corresponde entonces a la dimensionde espacio vectorial generado por las columnas de A, pues precisamente AX, X ∈ IRn, es elvector combinacion lineal de las columnas de A por las componentes de X. Luego, como ladimension de este sub-espacio vectorial es igual al numero de vectores l.i que lo generan, se tienedirectamente lo indicado. 2

Un resultado central que vincula todos los conceptos anteriores es el siguiente.

Proposicion 2.4.6 Dada una matriz cuadrada A ∈ IRn×n, se tiene que

nul(A) + rg(A) = n.

Nota. Para el caso mas general de matrices A ∈ IRm×n el resultado que se tiene es el siguiente

nul(A) + rg(A) = n.

Page 52: Libro Matematicas Para Economistas

2.4. NUCLEO E IMAGEN DE UNA MATRIZ 51

Ejemplo 2.4.2 Veamos que dada A ∈ IRn×n invertible y dada B ∈ IRn×n cualquiera (no nece-sariamente invertible) entonces

nul(B) = nul(AB), rg(B) = rg(AB).

En efecto, si B es invertible la propiedad es directa, ya que AB es invertible. Supongamosahora que B no es invertible y que nul(B) = k > 0. En tal caso, de hecho que

ABX = 0 ⇔ BX = 0

se tiene directamente que ker(AB) = ker(B), por lo cual nul(AB) = nul(B) y, por la proposi-cion anterior, sigue inmediatamente la igualdad de los rangos. 2

Ejercicio 2.4.1 Muestre que el rango de A es igual al rango de su traspuesta.

Ejemplo 2.4.3 Sea A ∈ IRm×n con m > n y tal que el rango de A es n. Veamos entoncesque AtA es invertible. En primer lugar, notemos que AtA ∈ IRn×n, razon por la cual, paraprobar que es invertible basta con probar que todas sus filas son l.i. o, lo que es lo mismo,probar que ker(AtA) = 0IRn . Sea entonces X ∈ ker(AtA). Luego, AtAX = 0, con lo cual,XtAtAX = Xt0 = 0. Pero XtAtAX = (AX)t(AX) = ‖AX‖2. Luego, usando las propiedades ydefinicion de la norma, se tiene que

XtAtAX = 0 ⇔ ‖AX‖2 = 0 ⇔ AX = 0.

Como todas las columnas de A son l.i (rango de A es n), se tiene que la unica combinacionlineal de ellas que es cero es cuando los coeficientes son cero, por lo cual necesariamente X debeser cero. Con esto hemos pobado entonces que AtAX = 0 implica que X = 0, y por lo tantoker(AtA) = 0, es decir, AtA es invertible. Este es un resultado muy importante. 2

Ejemplo 2.4.4 Volvamos al tema de las proyecciones orgonales. Consideremos entonces un sevV de IRn cuya base es X1, X2, · · · , Xk y sea Y ∈ IRn un vector cualquiera. Como sabemos, laproyeccion ortogonal de Y sobre V , que se denota por proy(Y )V , corresponde a aquel vector enV tal que Y − proyV (Y ) es perpendicular a todo vector de V , lo que a su vez equivale a decirque es perpendicular a todo elemento de la base de V . Como proyV (Y ) ∈ V , existen entoncesescalares βi, i = 1, 2, · · · , k, (los que deben ser determinados!) tales que

proyV (Y ) = X1β1 + X2β2 + · · ·+ Xkβk

lo que se puede expresar equivalentemente como

proyV (Y ) = Xβ

donde X es la matriz cuyas columnas son los Xi anteriores y β ∈ IRk es el vector cuyas columnasson los βj mencionados. Con lo anterior, por definicion16,

Xj · [Y − proyV (Y )] = 0 ⇔ Xtj [Y −Xβ] = 0, ∀j = 1, 2, · · · , k,

16NOTAR que el producto interno de X con Y se puede ver a su vez como un producto de matrices:

X · Y = XtY =∑

i

xiyi.

Page 53: Libro Matematicas Para Economistas

52 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

lo que a su vez, expresado en terminos matriciales, corresponde a

Xt[Y −Xβ] = 0 ⇔ XtY −XtXβ = 0.

Finalmente, si la matriz X es de rango completo, entonces necesariamente XtX sera invert-ible, con lo cual

β = [XtX]−1XtY,

que es la expresion que nos permite calcular la proyeccion ortogonal de Y sobre V . Ası, final-mente,

proyV (Y ) = X[XtX]−1XtY.

2

Ejercicio 2.4.2

(a) Dada una matriz triangular superior, muestre directamente que su rango coindice con elnumero de elementos distintos de cero que estan en su diagonal.

(b) Dados Y t = (1, 2, 3, 4), Xt1 = (1, 1, 1, 1), Xt

2 = (0, 1, 0, 1) ∈ IR4, determine proyV (Y ) conV = LX1, X2.

2.4.1. Aspectos numericos de los sistemas de ecuaciones

En lo que sigue nos ocuparemos de resolver numericamente sistemas de ecuaciones lineales.Estos sistemas surgen naturalmente ante cuestiones tales como

dada un conjunto de vectores, determinar si es l.i o l.d.

dado un sub - espacio lineal generado por X1, ..., Xk, encontrar una base del mismo

dada una matriz A, determinar su nucleo e imagen

dada una matriz A determinar su rango y nulidad

dada una matriz A determinar si es invertible y en caso afirmativo encontrar su inversa

dados A ∈ IRm×n y dado b ∈ IRm, encontrar todos los X ∈ IRn tal que AX = b

Para resolver sistemas de ecuaciones lineales, vamos a presentar un algoritmo de eliminacionmatricial muy simple, cuyo objetivo es la triangularizacion de una matriz dada. La idea centrales la siguiente: supongamos que es dada una matriz A, que asumiremos cuadrada17. Entonces,como bien sabemos, al hacer combinaciones lineales de columnas o filas de A, no cambiansu rango ni su nulidad. En efecto, una matriz que se obtiene de sumar o ponderar filas dela original, corresponde simplemente al producto de la matriz original por otras matrices detransformacion que son invertibles18. Dado el sistema de ecuaciones AX = 0, notemos si Ces una matriz invertible, la solucion del sistema anterior es equivalente a la solucion del nuevo

17El analisis no cambia si no es cuadrada. Es solo para simplificar notacion.18De rotacion de filas, de suma de filas, etc. Estas matrices de paso son todas invertibles y no cambian ni el

rango ni la nulidad de la matriz original.

Page 54: Libro Matematicas Para Economistas

2.4. NUCLEO E IMAGEN DE UNA MATRIZ 53

sistema (CA)X = 019. Por lo tanto, todo el problema que sigue consiste entonces en enontraruna buena matriz C de tal forma que CA tenga una forma sencilla.

Respecto de lo anterior, en primer lugar, para los efectos que nos interesan, esa forma sencillasera la triangular superior20. En segundo lugar, esta matriz C siempre existe, es decir, dadacualquier matriz A, existe una matriz C invertible tal que CA es triangular superior21 Ası lascosas, resumimos lo anterior diciendo que

Proposicion 2.4.7 Para cualquier matriz A ∈ IRn×n, existe una matriz C invertible y unamatriz R triangular superior tal que

CA = R ⇔ A = C−1R.

En lo que sigue, solo nos preocupara encontrar R y no C, pues R resume las propiedadesde A que nos interesan. La forma de proceder considera que dada la matriz A, la primera filase multiplica por una cantidad tal que al sumar dicha primera fila ponderada con la segundafila se obtiene un cero en el primer coeficiente de la segunda fila. Luego se procede a realizar lomismo entre la primera fila y la tercera, y ası sucesivamente hasta la ultima fila. Hecho esto,hemos obtenido una matriz transformada donde la primera columna tiene un unico elemento nonulo (a11) y el resto es cero. Acto seguido se procede a realizar lo mismo en la sub - matriz de(n− 1)× (n− 1) que se obtiene de la original al eliminar la primera fila y la primera columna.Ası sucesivamente hasta completar con todas las filas. Si sucediera que algun primer elementode la columna c.r a la cual se efectua el proceso es 0, se deja tal cual y se pasa a la fila siguiente.Veamos un ejemplo para ilustrar este proceso.

A =

4 2 8 62 1 0 33 3 5 91 8 3 7−1 0 3 5

→ A1 =

4 2 8 60 0 −4 03 3 5 91 8 3 7−1 0 3 5

→ A2 =

4 2 8 60 0 −4 00 3/2 −1 9/21 8 3 7−1 0 3 5

→ A3 =

4 2 8 60 0 −4 00 3/2 −1 9/20 7,5 1 5,5−1 0 3 5

A4 =

4 2 8 60 0 −4 00 3/2 −1 9/20 7,5 1 5,50 0,5 5 6,5

19(CA)X = 0 ⇔ C(Ax) = 0, como C es invertible, la solucion se tiene cuando Ax = 0, que es el problemaoriginal. Recordar que algunas de las propiedades fundamentales de una matriz vienen de analizar las solucionesde la ecuacion homogenea.

20La razon es simple: para una matriz triangular superior es muy simple conocer su rango y su nulidad. Masaun, es posible identificar los vectores que generan ambos conjuntos

21La demostracion de esto no es complicado: es constructiva a partir de un algoritmo de reduccion, donde C seconstruye explıcitamente como el producto de una serie de matrices de poderacion y de suma de filas, cada unade las cuales son invertibles.

Page 55: Libro Matematicas Para Economistas

54 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

De A para A1 multiplicamos la primera fila por −0,5 = −12 y la sumamos con la segunda

fila; de A1 para A2 multiplicamos la primera fila por −0,75 = −34 y la sumamos con la tercera

fila; de A2 para A3 multiplicamos la primera fila por −0,25 = −14 y la sumamos con la cuarta

fila; finalmente de A3 para A4 multiplicamos la primera fila por 0,25 = 14 y la sumamos con la

quinta fila.Como en A4 la segunda fila (primera fila de la sub - matriz que se obtiene de eliminar la

primera columna y fila de la original) es cero, se hace una permutacion con, por ejemplo, latercera fila. De esta manera, la matriz A5 que se obtiene es:

A5 =

4 2 8 60 1,5 −1 4,50 0 −4 00 7,5 1 5,50 0,5 5 6,5

Con esto se procede en forma analoga a lo realizado, pero ahora pivoteando con la segundafila. Ası, finalmente se obtiene la siguiente matriz:

A8 =

4 2 8 60 1,5 −1 4,50 0 −4 00 0 6 −170 0 16/3 5

Volviendo a realizar lo mismo pero ahora con la tercera fila, se obtiene la siguiente matriz:

A10 =

4 2 8 60 1,5 −1 4,50 0 −4 00 0 0 −170 0 0 5

Finalmente, eliminado la ultima fila con la penultima (multiplicar la cuarta fila por 5/17 ysumar a la quinta) se obtiene la siguiente matriz triangular superior:

A11 =

4 2 8 60 1,5 −1 4,50 0 −4 00 0 0 −170 0 0 0

De todo lo anterior, deducimos que el rango de A (matriz original) es 4 (numero de filas nonulas) y que por lo tanto la nulidad es 0 (numero de columnas menos rango). En consecuencia,las cuatro columnas de la matriz son l.i. Note como se verifica la propiedad de que rango masnulidad es igual al numero de columnas. Note como ademas las propiedades de la matriz originalpueden ser mas facilmente “vistas” en la matriz triangular superior resultante de todo el proceso.

Ejemplo 2.4.5 Encontrar el nucleo de una matriz.Supongamos que nuestro objetivo es resolver la ecuacion lineal homogenea A·x = 0, donde22:

22Misma matriz del ejemplo anterior.

Page 56: Libro Matematicas Para Economistas

2.4. NUCLEO E IMAGEN DE UNA MATRIZ 55

A =

4 2 8 62 1 0 33 3 5 91 8 3 7−1 0 3 5

De las transformaciones anteriores, se tiene que es este sistema es equivalente resolver B ·x =0, donde

B =

4 2 8 60 1,5 −1 4,50 0 −4 00 0 0 −170 0 0 0

es decir, el sistema

(1) 4x1 + 2x2 + 8x3 + 6x4 = 0(2) 1,5x2 − x3 + 4,5x4 = 0

(3) − 4x3 = 0(4) − 17x4 = 0

De esta manera, de (4), x4 = 0, de (3) x3 = 0, (4) y (3) en (2) implica que x2 = 0; todo loanterior en (1) implica finalmente que x1 = 0.

Nota. A pesar que el nucleo de la matriz anterior es 0, esta matriz no es invertible pues noes cuadrada.

El metodo anterior es muy util para resolver sistemas de ecuaciones. En efecto, si dado elsistema de ecuaciones A ·x = b, la matriz A es triangular superior, entonces el valor de la ultimavariable se puede obtener trivialmente, con ella el de la penultima haciendo la sustitucion dela obtenida en la ecuacion anterior. Ası sucesivamente hasta llegar a la primera ecuacion. Estemetodo se denomina sustitucion hacia atras. Si la matriz A no es triangular, se triangularizasegun el metodo anterior, pero agregando una ultima columna ficticia dada por el lado derechode la ecuacion, columna sobre la cual se efectuan las mismas operaciones hechas en la matriz.A modo de ejemplo, lo siguiente:

Ejemplo 2.4.6 Resolver un sistema de ecuacionesResolver el sisuiente sistema de ecuaciones A · x = b, donde

A =

1 2 32 5 40 3 −1

, b =

251

En este caso, la matriz ampliada es

A =

1 2 3 | 22 5 4 | 50 3 −1 | 1

Luego,

Page 57: Libro Matematicas Para Economistas

56 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

1 2 3 | 22 5 4 | 50 3 −1 | 1

1 2 3 | 20 1 −2 | 10 3 −1 | 1

1 2 3 | 20 1 −2 | 10 0 5 | −2

Luego, x3 = −25 , con esto x2 − 2x3 = 1 y luego, x2 = 1

5 . Con ambos, se tiene que x1 + 2 ·−25 + 3 · 1

5 = 2 y por lo tanto, x1 = 65 .

Ejemplo 2.4.7 Encontrar la inversa de una matrizEncontrar la inversa de una matriz se traduce a resolver un sistema de ecuaciones, donde,

dada la matriz, las incognitas son los coeficientes de la matriz inversa que se desea obtener. Parailustrar veamos el ejemplo de encontrar la inversa de la matriz A del problema anterior. En estecaso, denotemos la inversa por

B =

b11 b12 b13

b21 b22 b23

b31 b32 b33

Luego, por definicion se tiene que A · B = I, que expresado en terminos de ecuacionescorresponde a:

b11 + 2b21 + 3b31 = 1b12 + 2b22 + 3b32 = 0b13 + 2b23 + 3b33 = 02b11 + 5b21 + 4b31 = 02b12 + 5b22 + 4b32 = 12b13 + 5b23 + 4b33 = 03b21 − b31 = 03b22 − b32 = 03b23 − b33 = 1

Este sistema de ecuaciones de 9 × 9 se puede resolver utilizando la tecnica anterior, con locual obtener la inversa deseada. Otram forma de verlo es considerar que se deben encontrar tresvectores en IR3 (las columnas de B) que satisfacen las respectivas ecuaciones relacionadas conla identidad. Por ejemplo, el bloque con las tres primeras ecuaciones de las anteriores definen laprimera columna de la inversa, el segundo bloque de tres ecuaciones la segunda columna de lainversa, etc. Cada uno de estos bloques es un sistema de ecuaciones que se puede resolver segunlo ya indicado.

Ejemplo 2.4.8 Encontrar el nucleo de una matrizEl problema consiste simplemente en resolver un sistema lineal homogeneo, que es un caso

particular de resolver un sistema de ecuaciones. Por lo tanto, ya se dispone del metodo.

Ejemplo 2.4.9 Encontrar el ortogonal a un espacio generado por vectores dados.Recordemos que un vector y es ortogonal a otro x si el producto interno es igual es cero, es

decir, si y · x =n∑

i=1yixi = 0, donde y = (yi)t, x = (xi)t. Notemos que otra forma de escribir el

producto interno es a traves de la siguiente notacion matricial:

y · x = yt · x.

Page 58: Libro Matematicas Para Economistas

2.4. NUCLEO E IMAGEN DE UNA MATRIZ 57

Supongamos entonces que son dados los vectores X1, ..., Xk ∈ IRn y que nuestro problemaes encotrar una expresion general para los ortogonales al sub - espacio V = L(X1, ..., Xk),conjunto que se notara por V ⊥. Ahora, es claro que y ∈ V ⊥ si y solo si < y,Xi >= 0, i = 1, ..., k.Luego, yt · Xi = 0, lo que es equivalente a decir que Xt

i · y = 0, i = 1, ..., k. Si definamos lasiguiente matriz:

X =

X11 X21 ... Xk1

X12 X22 ... Xk1

... ... ... ...X1i X2i ... Xki

... ... ... ...X1n X2n ... Xkn

es decir, la matriz cuyas columnas son los vectores Xi, se tiene que y ∈ V ⊥ equivale a decir quey es ortogonal con cada columna de la matriz, lo que se traduce finalmente en que Xt · y = 0.Luego, encontrar el ortogonal a un espacio generado por vectores dados se reduce a resolver unsistema de ecuaciones homogeneno, donde la matriz correspondiente es aquella cuyas columnascon los vectores que generan dicho espacio. Este problema lo sabemos resolver a partir de loanterior.

A partir de todo lo anterior, hemos visto que un problema fundamental es resolver la ecuacionhomogenea: ya sea para encontrar el nulcleo, para encontrar los ortogonales, para determinarsi una matriz es invertible, para conocer el rango de una matriz, etc. En tal sentido, como yasabemos, para un sistema lineal cualquiera A · x = 0, siempre se dara una de las siguientessituaciones:

a.- El sistema tiene solucion unica x0 = 0.

b.- El sistema tiene infinitas soluciones, que forman un sub - espacio (nucleo de la matriz).

El caso [a.−] es el sencillo. El caso [b.−] puede resultar muy importante saber cuales son losvectores que generan el nucleo respectivo. Para el efecto, toda la informacion relevante esta enla matriz triangular superior que se obtiene a traves del metodo ya desarrolado. Ilustraremoscon algunos ejemplos.

Ejemplo 2.4.10 Supongamos que dada una matriz A al triangularizarla se obtiene una de lasiguiente forma:

0es decir, donde la diagonal no tiene elementos cero. En este caso, por sustitucion hacia atras, setiene que la solucion es cero (caso [a.−]).

Sin embargo, si la matriz tiene la forma siguiente:

Page 59: Libro Matematicas Para Economistas

58 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

0

0el sistema tiene necesariamente infinitas soluciones (caso [b.−]). En este caso, es conjunto degeneradores se obtiene en forma directa, lo que ilustramos con un ejemplo.

Suoongamos que el sistema resultante es:

A =

2 7 4 1 | 00 3 5 1 | 00 0 2 6 | 00 0 0 0 | 0

En este caso, 2x3 + 6x4 = 0, lo cual impica que x3 = −2x4. Con esto, 4x2 + 6x3 + x4 = 0 seconvierte en 3x2 +5(−2x4)+x4 = 0, es decir, x2 = 3x4. Finalmente, de 2x1 +7x2 +4x3 +x4 = 0se tiene que 2x1 + 7(3x4) + 4(−2x4) + x4 = 0, es decir, x1 = −7x4. Luego, cualquier vector delnucleo se puede escribir de la forma:

x4 ·

−73−11

donde x4 actua solo como parametro. En otras palabras, el nucleo de la matriz es

ker(A) = L

−73−11

Ejercicio 2.4.3

a.- Dada la siguiente matriz:

A =

2 7 4 1 04 4 1 −1 33 1 4 2 98 3 1 3 6

determinar su rango y nulidad. Determinar una base para el nucleo y la imagen.

b.- Con la matriz anterior, sea B = A · At y sea b un vector de unos. Determinar si B esinverible. Si lo es, resolver el sistema de ecuaciones Bx = b; si no lo es, encontrar losgeneradores del kernel.

Page 60: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 59

c.- Dada la siguiente matriz,

1 2 32 β 40 3 α

determinar las condiciones sobre α y β para que la matriz sea inverible.

2.5. Formas cuadraticas

En todo lo que sigue trabajaremos solo con matrices cuadradas. Ası, dada una matriz A ∈IRn×n, comencemos con la siguiente definicion:

Definicion 2.5.1 La forma cuadratica asociada a A es una funcion QA : IRn → IR tal quepara todo X ∈ IRn,

QA(X) = XtAX ∈ IR.

A partir de la definicion, es directo (Ejercicio) que dadas dos matrices A,B ∈ IRn×n y dadoλ ∈ IR, entonces:

QA+λB(x) = QA(x) + λQB(x).

Ejemplo 2.5.1 Dada

A =

1 2 32 β 40 3 α

se tiene que

QA(X) = x21 + βx2

2 + αx23 + 2x1x2 + 3/2x1x3 + 7/2x2x3 ∈ IR.

Note que, por definicion, la forma cuadraatica siempre es un numero real. Por lo tanto, sutraspuesta es ella misma:

[XtAX]t = XtAX ∈ IR.

2

Dada A ∈ IRn×n, de un calculo simple es claro que

A =A + At

2+

A−At

2.

Si definimos ahora

S =A + At

2, T =

A−At

2,

notemos queSt = S, T t = −T.

Esto motiva la siguiente definicion.

Page 61: Libro Matematicas Para Economistas

60 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Definicion 2.5.2 La matriz A se dice simetrica si At = A y se dice antisimetrica si At = −A.

Por lo tanto, de lo anterior es directo que dada cualquier matriz A ∈ IRn×n siempre existendos matrices, S simetrica y T antisimetrica, tales que

A = S + T.

Ahora bien, dada esta descomposicion, notemos que

QA(x) = QS(x) + QT (x).

Pero QT (x) = xtTx ∈ IR. Luego, trasponiendo xtTx el resultado no cambia, es decir, QT (x) =(xtTx)t = xtT t(xt)t = xt(−T )x=−QT (x). Ası, necesariamente QT (x) = 0, por lo cual QA(x) =QS(x). De esta manera, para definir formas cuadraticas solo es necesario utitilizarmatrices simetricas, lo que, como veremos, nos simplifica el mundo enormemente. Ası, entodo lo que sigue siempre trabajaremos con matrices simetricas.

A partir de la definicion de forma cuadratica se tiene la siguiente (y muy importante) defini-cion de signo de una matriz.

Definicion 2.5.3 Diremos que una matriz simetrica A ∈ IRn×n es definida positiva si ∀x ∈IRn, x 6= 0, se tiene que

QA(x) = xtAx > 0.

Dicha matriz se dice semi - definida positiva si

xtAx ≥ 0.

Por otro lado, la matriz se dice definida negativa si ∀x ∈ IRn, x 6= 0, se tiene que

xtAx < 0.

En forma analoga se dice que es semi - definida negativa si xtAx ≤ 0.

Notemos que si x = 0 entonces xtAx = 0. De hecho, para la definicion de positividad el unicocaso en que xtAx = 0 es cuando x = 0: para todos los otros valores de x este triple productodebe ser estrıctamente positivo. Para el caso de una matriz semi-definida positiva puede ocurrirque la forma cuadratica asociada sea cero aun cuando el vector donde se calcula sea distinto decero. Por ejemplo, la matriz nula23 es semi - definida positiva pero no es definida positiva.

Ejemplo 2.5.2 Consideremos la siguiente matriz:

A =

α 0 00 1 00 0 4

En este caso, dado x = (x1, x2, x3)t la forma cuadratica asociada a la matriz A correspondea:

xtAx = (x1, x2, x3) ·

α 0 00 1 00 0 4

·

x1

x2

x3

= αx2

1 + x22 + 4x2

3

23Es decir, aquella cuyos elementos son todos cero.

Page 62: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 61

Es claro que si α > 0 la expresion anterior es estrıctamente positiva para todo x ∈ IR3, x 6= 0.Si α = 0 dicha expresion puede ser igual a cero aun cuando x 6= 0 (por ejemplo, basta considerarx = (1, 0, 0)t). En cambio, si α < 0 se puede dar el caso que xtAx sea negativo para algunx ∈ IR3 (por ejemplo, dado α < 0, considerar x = (1, 0, 0), en tal caso xtAx es negativo). Deesta manera, cuando α > 0 la matriz A es definida positiva, cuando α = 0 la matriz es semi -definida positiva y cuando α < 0 la matriz no es definida positiva ni tampoco definidanegativa!. 2

La determinacion del signo de una matriz simetrica cualquiera es una cuestion muy impor-tante en matematicas. Mas adelante veremos las aplicaciones de dicho concepto a las condicionesde optimalidad de segundo orden para problemas con y sin restricciones. Tal concepto nos per-mitira ademas caracterizar en forma sencilla la concavidad y convexidad de funciones de variasvariable, lo que tambien es fundamental en economıa.

Ası las cosas, el problema central que nos ocupara en el resto de esta seccion es determinar,en forma relativamente sencilla, el signo de una matriz. Para el efecto necesitamos introducir elconcepto de valor y vector propio de una matriz.

2.5.1. Valores y vectores propios

El concepto de valor y vector propio de una matriz es fundamental para estudiar y analizarsus propiedades: es por medio de estos conceptos que se puede caracterizar la invertibilidad deuna matriz, estudiar el signo de la misma, calcular potencias, etc.

Definicion 2.5.4 Diremos que λ ∈ IC (complejo)24 es un valor propio de la matriz A ∈ IRn×n

(no necesariamente simetrica) si existe un vector xλ ∈ IRn, x 6= 0IRn , tal que

A · xλ = λxλ.

Ejemplo 2.5.3 Veamos que para una matriz diagonal A = D(aii) ∈ IRn×n sus valores propiosson precisamente los valores de la diagonal. En efecto, para λ1 = a11 se tiene que el vectoret1 = (1, 0, 0, · · · , 0) ∈ IRn es un vector propio de A ya que

Ae1 = (a11, 0, 0, 0, · · · , 0)t = a11(1, 0, 0, · · · , 0).

Analogamente con los otros valores de la diagonal. Note que cualquier otro vector de la forma(α, 0, 0, 0, · · · , 0)t ∈ IRn tambien es un valor propio asociado al mismo valor propio λ1 = a11. 2

Nota. 2.5.1 Del ejemplo anterior, queda claro que es perfectamente posible que los valorespropios de una matriz se repitan. Por ejemplo, los valores propios de la matriz identidad sontodos iguales a uno. Se define entnces la multiplicidad de un valor propio como la cantidad deveces que se repite. Por ejemplo, en el caso de la matriz identidad, se tiene que posee un valorpropio (λ = 1) cuya multiplicidad es el orden de la matriz. 2

Proposicion 2.5.1 Dada A ∈ IRn×n y dado λ un valor propio de A, entonces el conjunto delos vectores propios asociados a este valor propio conforman un sub-espacio vectorial de IRn.

24En general, los valores propios de una matriz cualquiera pueden perfectamente ser complejos. Como veremosmas adelante, si la matriz es simetrica, estos necesariamente son reales.

Page 63: Libro Matematicas Para Economistas

62 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Prueba. Dado λ un valor propio de A, denotemos por SEλ ⊆ IRn el respectivo conjunto devectores propios asociado. Ası, v ∈ SEλ si y solo si Av = λv. Notemos entonces que 0IRn ∈ SEλ

pues A0IRn = λ0IRn = 0IRn . Por otro lado, dados v1, v2 ∈ SEλ y dado α ∈ IR cualquiera, setiene que

A(v1 + αv2) = Av1 + αAv2 = λv1 + αλv2 = λ(v1 + αv2),

con lo cual v1 + αv2 ∈ SEλ, que finaliza la prueba. 2

Proposicion 2.5.2 Sea A ∈ IRn×n y sean λ1 y λ2 dos velores propios distintos. Dados v1 ∈SEλ1 y v2 ∈ SEλ2 distintos de cero, entonces v1 es l.i con v2.

Prueba. Dados µ1, µ2 tal que µ1v1 + µ2v2 = 0, se tiene que A(µ1v1 + µ2v2) = 0. Pero

A(µ1v1 + µ2v2) = µ1λ1v1 + µ2λ2v2

por lo cual µ1λ1v1 + µ2λ2v2 = 0. Ahora bien, si v1 es l.d con v2 ocurre que µ1 y µ2 son distintosde cero (si alguno de ellos es cero, el otro debe ser cero tambien, por que?). Luego,

v1 = −µ2

µ1v1

que reemplazando en la relacion anterior (con λ) nos lleva a que

−µ2λ1v1 + µ2λ2v2 = 0

por lo cual µ2λ1 = µ2λ1. Esto implica λ1 = λ2, que es una contradiccion. Por lo tanto, v1 es l.icon v2. 2

Nota 2.5.1 Si un valor propio tiene multiplicdad mayor que uno, courre entonces que el sub-espacio propio tiene dimension mayor que uno. De hecho, se puede probar que la dimension delsub-espacio propio es igual a la multiplicidad del valor propio. 2

Ejercicio 2.5.1 Suponga que A ∈ IRn×n es una matriz tal que todos sus valores propios sonreales y distintos, digamos, λi, i = 1, 2, · · · , n. Sean entonces vi, i = 1, 2, · · · , n, vectores propiosasociados al valor propio λi y sea V la matriz cuya columna i = 1, 2, · · · , n es vi. Muestreentonces que

V −1AV = D(λ),

con D(λ) la matriz diagonal con los valores propios de A. Deduzca de lo anterior que A esinvertible si y solo si todos sus valores propios son distintos de cero. De hecho, para este caso,muestre ademas que para cualquier n ∈ IN se tiene que

An = V D(λn)V −1

donde D(λn es la diagonal de valores propios de A elevados a n.

Con todo lo anterior, estamos entonces en condiciones de probar la siguiente proposicion.

Proposicion 2.5.3 Dada A ∈ IRn×n una matriz simetrica, entonces sus valores propios sonreales.

Page 64: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 63

Prueba. Supongamos que A ∈ IRn×n es una matriz simetrica y sea λ = a + bi ∈ IC un valorpropio de A. Puesto que dicho valor propio es la raiz del polinomio caracterıstico de A, se tieneentonces que su conjugado tambien es una raiz de dicho polinomio, razon por la cual λ = a− bitambien debe ser un valor propio de A. Veamos que si x es un vector propio asociado a λ,entonces el conjugado de x es un vector propio asociado al valor propio λ. En efecto, del hechoque Ax = λx, aplicado conjugado se tiene que25

Ax = λx,

donde A denota aquella matriz formada por los conjugados de A y x el vector de los conjugadosde x. Ya que A es real, entonces A = A y por lo tanto, se tiene que Ax = λx, por lo cual x es unvetor propio asociado a λ. Ahora bien, premultiplicando por xt (traspuesto conjugado de x) esdirecto entonces que xtAx = xt[λx] = λxtx, con lo cual, [Atx]tx = λxtx, y ası, [Ax]tx = λxtx,es decir, [λx]tx = λxtx, con lo cual, finalmente, λxtx = λxtx. Ası, ordenando los terminos,[λ − λ]xtx = 0. Finalmente, considerando que el producto de un complejo con su conjugadoes un real positivo (modulo del complejo al cuadrado), sigue que xtx ∈ IR++ y por lo tantoλ− λ = 0, lo cual implica que λ = λ, es decir, que λ ∈ IR (un complejo es igual a su conjugadosi y solo si es real!). 2

Una pregunta fundamental que hemos pospuesto hasta el momento dice relacion con elcalculo efectivo de los valores propios de una matriz. Sin mas conceptos que los que tenemos,esto es muy complejo, pues requiere de determinar en forma simultanea un escalar y un vectorque satisfagan la definicion de valor y vector propio. Esto obliga a buscar una alternativa quesea mas simple. Es por medio del uso de los determinantes que podremos calcular directamentelos valores propios de una matriz sin tener que pasar por el calculo de los vectores propios.

2.5.2. Determinantes

Para introducir el concepto, ilustremos la idea para una matriz de 2× 2

A =

(1 43 2

)

Geometricamente las columnas de A las podemos imaginar como dos vectores de IR2 ilustra-dos en la siguiente figura

Determinante = Area

(1,3)

(4,2)

Es facil ver que el valor absoluto del area del cuadrilatero anterior es |1 ∗ 2− 3 ∗ 4| = 10. Dehecho, para una matriz cuadrada cualquiera

25Recordar que el conjugado de un producto y una suma de valores es el producto o suma de los respectivosconjugados.

Page 65: Libro Matematicas Para Economistas

64 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

A =

(a bc d

)

se puede probar (ejercicio!) que el area del cuadrilatero correspondiente es

|ad− bc| ∈ IR.

Note que en el caso anterior ocurre que si los vectores columna de A son l.i, entonces el areacorrespondiente sera disitinta de cero, y que si los vectores columna son l.d, dicha area sera cero.La siguiente figura ilustra este importante punto.

Area = 0

(a,c)

(b,d)

|

Area = 0

(a,c)(b,d)

Por lo tanto, directamente de lo anterior, sigue que las columnas de una matriz son l.isiempre y cuando al area anterior sea distinta de cero, y son l.d si dicha cantidad es nula. Enotras palabras, una matriz A como antes es invertible siempre y cuando el area mencionada esdistinta de cero.

Sin considerar el signo, el determinante de la matriz A corresponde simplemente al area delcuadrilatero definido por los vectores columna de A y se denota det(A)26. De esta manera, enterminos generales, dada

A =

(a bc d

)

su determinante se define como

det(A) = ad− bc.

Para una matriz de 3 × 3, el determinante esta asociado al volumen de la figura (poliedro)que generan los tres vectores columna de la matriz. Para una matriz de 4 × 4 corresponde alhiper - volumen de la figura, etc...

Nota. 2.5.2 No es menester insistir que el concepto de determinante solo aplica a matricesque son cuadradas. El volumen o hipervolumen es entonces el valor absoluto del determinantede la matriz. 2

26El signo de un determinante tiene que ver con la orientacion de los vectores considerados. Para efectos deinterpretacion, el area del cuadrilatero corresponde mas bien al valor absoluto del determinante de la matriz.

Page 66: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 65

Como calcular un determinante de una matriz cualquiera? Para el efecto se procede demanera recursiva. Supongamos dada una matriz de n× n.

A =

a11 a12 ... a1n

a21 a22 ... a2n

. . . .an1 an2 ... ann

Dado a11, consideremos la sub - matriz de A que se obtiene de elminar la primera fila y laprimera columna:

A11 =

a22 ... a2n

a32 ... a3n

. . .an2 ... ann

Dado a12, consiremos la sub - matriz de A que proviene de eliminar la primera fila y lasegunda columna:

A12 =

a21 a23 ... a2n

a31 a33 ... a3n

. . . .an1 an3 ... ann

Dado a1j cualquiera de la primera fila, consideremos la sub - matriz de A que se genera deeliminar la primera fila y la columna j - esima: A1j . Note que cada una de las sub - matricesA1j es de (n− 1)× (n− 1). Entonces se tiene que

det(A) = a11 · det(A11)− a12 · det(A12) + a13 · det(A13)− a14 · det(A14) + ....± a1n · det(A1n).

A partir del calculo de determinante para una matriz de 2 × 2, con lo anterior podemosencontrar el determinante de cualquier matriz (recursividad). En efecto, con la formula anteriorpodemos calcular determinates para matrıces de 3×3; dado esto podemos hacerlo para aquellasde 4× 4 y ası sucesivamente.

El metodo anterior se denomina metodo de los menores y los cofactores (para simpli-ficar, de los menores...) para encontrar determinantes. De hecho, este metodo se puede aplicarconsiderando cualquiera de las filas en vez de la primera tal como fue descrito. Se llega ademasal mismo resultado si en vez de considerar una fila se trabaja sobre una columna. En caulquierade los casos, las submatrices correspondientes se calculan siguiente la regla ya descrita.

Ejemplo 2.5.4 Calculemos el determinante la siguiente matriz de 3× 3:

B =

1 2 50 2 24 1 3

Aquı, b11 = 1, b12 = 2, b13 = 5. Ademas, se tiene que

B11 =

(2 21 3

)B12 =

(0 24 3

)B13 =

(0 24 1

)

Page 67: Libro Matematicas Para Economistas

66 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Luego,

det(B) = b11 · det(B11)− b12 · det(B12) + b13 · det(B13),

es decir,

det(B) = 1 · (2 · 3− 2 · 1)− 2 · (0 · 3− 4 · 2) + 5 · (0 · 1− 2 · 4) = −20.

Ejercicio 2.5.2 Calcular el determinante de la matriz B anterior usando la segunda fila en vezde la primera y usando la primera columna en vez de las filas. Verificar que el resultado es elmismo.

Ejercicio 2.5.3

(a) Dada A ∈ IRn×n una matriz diagonal de valores λi, i = 1, 2, · · · , n, muestre que

det(A) = λ1λ2 · · ·λn ≡ Πni=1λi.

(b) Muestre que el determinante de una matriz triangular superior es igual al producto de loselementos de su diagonal.

Que significa que el determinante de una matriz es cero? En el caso de una matriz de 2× 2que el area del cuadrilatero es cero. Ahora, para que el cuadrilatero tenga area cero significa quelos vectores que lo definen deben ser colineales, es decir, l.d. Luego, para una matriz de 2× 2, siel determinante es cero, las culumnas (o filas) son l.d y luego la matriz no es invertible. Analogopara una matriz de 3 × 3: si el determinante es cero, las columnas son l.d y la matriz no esinvertible. La siguiente proposicion paga de sobremanera el concepto de determinante.

La siguiente proposicion resume los principales aspectos de los determinantes que nos serande utilidad mas adelante.

Proposicion 2.5.4

(a) Una matriz cuadrada es invertible si y solo si su determinante es distinto de cero.

(b) Para cualquier conjunto de matrices Ai ∈ IRn×n, i = 1, 2, · · · , k, se tiene que

det[A1A2 · · ·Ak] = det[A1] det[A2] · · · det[Ak].

(c) Si A es invertible, entonces

det[A−1] =1

det[A].

(d) Para cualquier A ∈ IRn×n ocurre que

det[At] = det[A].

(e) Si dos filas (o columnas) de A son intercambiadas de posicion, entonces el determinantede la matriz resultante es igual al de A pero con signo cambiado.

Ejercicio 2.5.4 Mostrar que una matriz triangular superior es invertible si y solo si todos loselementos de su diagonal son distintos de cero.

Page 68: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 67

2.5.3. Calculo de valores y vectores propios usando determinantes

Volvamos ahora al problema de encontrar los valores propios de una matriz, es decir, deter-minar los λ tales que existe xλ 6= 0 verificando que Axλ = λxλ, lo que es equivalente a decir que(A− λI)xλ = 0IRn . Por lo tanto, xλ 6= 0IRn sera un vector propio de A asociada al valor propioλ si y solo si

xλ ∈ ker(A− λI).

Visto de otra forma, lo anterior es equivalente a decir que λ es un valor propio de A si y solosi

ker(A− λI) 6= 0IRn,que a su vez es equivalente a decir que A− λI no es invertible. Pero sabemos que una matriz Ano es invertible cuado su determinante es cero. Por lo tanto,

λ es valor propio de A si y solo si det(A− λI) = 0.

Definicion 2.5.5 Dada A ∈ IRn×n, se define el polinomio caracteristico de A como aquellafuncion pA : IR → IR tal que

pA(λ) = det[A− λI].

Con lo anterior, λ es un valor propio de A si es una raız del polinomio caracterıstico de A,es decir, si

pA(λ) = 0.

Ejemplo 2.5.5 Dada

A =

(a bc d

)

se tiene que

A− λI =

(a− λ bc d− λ

)

y por lo tanto

pA(λ) = (a− λ)(d− λ)− bc = λ2 − (a + d)λ + ad− bc,

que es precisamente un polinomio de segundo grado. Los valores propios de A son las raices deeste polinomio, es decir,

λ1 =(a + d) +

√(a + d)2 − 4(ad− bc)

2, λ2 =

(a + d)−√(a + d)2 − 4(ad− bc)

2.

Page 69: Libro Matematicas Para Economistas

68 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Ejemplo 2.5.6 Encontremos los valores propios de la siguiente matriz:

A =

(1 35 2

)

Note que:

A− λI =

(1 35 2

)− λ

(1 00 1

)=

(1− λ 3

5 2− λ

)

Luego, det(A−λI) = (1−λ) ·(2−λ)−3 ·5 = λ2−3λ−13. De esta manera, los valores propiosde A se obtienen de reolver la ecuacion λ2 − 3λ− 13 = 0, es decir, λ1 = 3+

√61

2 , λ2 = 3−√612 .

Ejercicio 2.5.5 Dada

A =

(3 −1

−1 2

)

determine los valores propios de A y para cada uno de ellos encuentre los rspectivos sub-espacios propios.

Ejemplo 2.5.7 Para una matriz diagonal los valores propios corresponden a los valores de ladiagonal. Es decir, dada

A =

a11 0 ... 00 a12 ... 0. . . .0 0 ... ann

los valores propios de A son a11, a12, ..., ann.

Ejercicio 2.5.6 Dada una matriz A, el determinante de A es igual al producto de los valorespropios de A.

Ejercicio 2.5.7 Dada A ∈ IRn×n, definimos la traza de A, que se nota tr(A), como la sumade los valores de su diagonal, es decir,

tra(A) =n∑

i=1

aii.

Muestre entonces que la suma de todos los valores propios de A es igual a la traza de lamatriz.

2.5.4. Positividad de matrices, valores propios y descomposicion ortogonalde matrices simetricas

Volvamos ahora a nuestro problema de determinar cuando una matriz es (semi) definidapositiva o (semi) definida negativa. Como sabemos, para el analisis de una forma cuadraticabasta considerar solo matrices simetricas. En tal caso, somo se ha mencionado, ocurre que losvalores propios de la matriz son siempre reales. Mas aun, cuando las matrices son simetricas sepuede probar que los vectores propios asociados a valores propios que son distintos no solo son

Page 70: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 69

l.i, sino que ademas son ortogonales. En efecto, supongamos que A es simetrica y sean λ1 6= λ2

dos valores propios distintos. Sean ademas v1 y v2 vectores propios asociados a los vp anteriores.Entonces, del hecho que Av1 = λ1v1, sigue que v1 = Av1

λ1(analogo con v2) y por lo tanto

v1 · v2 = vt1v2 =

(Av1)t

λ1v2 =

1λ1

vt1A

tv2 =1λ1

vt1Av2 =

1λ1

vt1(λ2v2) =

λ2

λ1vt1v2 =

λ2

λ1v1 · v2

de lo cual se tiene que(

1− λ2

λ1

)v1 · v2 = 0.

Como el cociente de los valores propios es diferente de uno (son distintos) sigue que v1 ·v2 = 0,es decir, que los vectores propios son ortogonales. Con esto hemos probado que

Proposicion 2.5.5 Para matrices simetricas se tiene que vectores propios asociados a valorespropios distintos son ortogonales.

Note ahora que si v1 6= 0IRn es un vector propio de A, tambien lo es el vector unitario

v1 =v1

‖v1‖ .

Supongamos ahora que la matriz simetrica A tiene todos sus valores distintos. En tal caso,dados los valores propios λi, i = 1, 2, · · · , n, y los correspondientes vectores propios unitariosvi, i = 1, 2, · · · , n,, se tiene que al definir la matriz V como aquella cuya columna i = 1, 2, · · · , n,es el vector vi, entonces, tal como hemos visto anteriormente,

AV = V D(λi) ⇔ A = V D(λi)V −1.

Ahora bien, al desarrollar el producto V V t se tiene que corresponde al producto internoentre las columnas de A: el elemento 11 es el producto interno de la primera columna de Vcon la primera columna de V , es decir, de v1 con hatv1, el elemento 12 es el producto internode la primera columna de V con la segunda columna de V , es decir, de de v1 con hatv2, etc.Analogamante, la segunda fila de V V t es el producto interno de la segunda columna de V (elvector hatv2) con la primera de V , el 22 el producto de v2 consigo mismo, el 23 aquel de v2

con v3, etc. Por lo tanto, considerando que vi es un vector unitario, y que al ser todos losvalores propios de A distintos se tiene que los vectores propios son ortogonales, entonces elproducto de V con V t es la identidad: cada elemento de la diagonal (ii) coincide con el productovectorial vi · vi = ‖vi‖2 = 1, y cada elemento fuera de la diagonal con un producto de la formavi · vj = 0, i 6= j. Por lo tanto

V t = V −1

con lo cual se obtiene la siguiente identidad fundamental para las matrices simetricas

A = V D(λi)V t.

Si bien es cierto que lo anterior lo hemos demostrado para matrices simetricas que tienentodos sus valores propios distintos, el resultado sigue siendo cierto para matrices simetricacualquiera. En resumen, se tiene entonces la siguiente proposicion.

Page 71: Libro Matematicas Para Economistas

70 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

Proposicion 2.5.6 Dada A ∈ IRn×n una matriz simetrica, se tiene que

A = V DV t

donde D es la matriz diagonal de valores propios de A y V es una matriz de vectores propiosunitarios de A.

Nota. 2.5.3 La proposicion anterior es valida para un conjunto de matrices mas extenso queaquel de las simetricas. Este conjunto mas amplio es aquel de las llamadas matrices normales,es decir, de las matrices A tal que AAt = AtA. Obviamente una matriz simetrica es normal,pero obviamente hay matrices que son normales pero no simetricas.

Ejemplo 2.5.8 Dada

A =

(2 −1−1 2

)

es facil ver que λ1 = 1 y λ2 = 3 son los valores propios de A. De esto, claramente A es definidapositiva. Ahora, para λ1 = 1, un vector propio v1 = (v11, v12)t debe cumplir con que

2v11 − v12 = v11, −v11 + 2v12 = v12,

lo que es equivalente a decir que v11−v12 = 0, es decir, v11 = v12. De esta manera, el subespaciopropio asociado a λ1 = 1 es

SEλ1=1 = L

(11

)

Para λ2 = 3 sigue que

2v11 − v12 = 3v11, −v11 + 2v12 = 3v12,

de lo cual se tiene que v11 = −v12, es decir, todo vector propio asociado al valor propio λ2 = 3es tal que la segunda componente es igual a menos la primera componente, es decir,

SEλ2=3 = L

(1−1

)

Dado entonces v1 = (1, 1)t, definamos v1 = v1/‖v1‖ = (1/√

2, 1/√

2)t y dado v2 = (1,−1)t,definamos v2 = v2/‖v2‖ = (1/

√2,−1/

√2)t. Definiendo entonces

V =

(1/√

2 1/√

21/√

2 −1/√

2

)

sigue que A = V DV t con D la diagonal de valores propios de A. Se deja como ejercicio verificartodo lo anterior.

Ejemplo 2.5.9 Suponga que A ∈ IRn×n es una matriz cuadrada y simetrica. Entonces sabemosque existe una matriz ortogonal V y otra diagonal D tal que A = V DV t. Por lo tanto, paracada n ∈ IN sigue que

Page 72: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 71

An = [V DV t] · [V DV t] · [V DV t] · · · [V DV t]︸ ︷︷ ︸n veces

Como V V t = I, al evaluar los productos anteriores sigue que

An = V DV t · V DV t · V DV t · · ·V DV t = V D ·D · · ·D︸ ︷︷ ︸n veces

V t = V DnV t.

Como Dn es simplemente la diagonal de valores propios elevados a la potencia respectiva, sigueque evaluar la potencia de A es igual a triple producto anterior, que obviamente resulta massimple que hacer el calculo directo.

Ejercicio 2.5.8 Suponga que A es una matriz simetrica y sea p : IR → IR un polinomio tal quep(x) = xn + an−1x

n−1 + an−2xn−2 + · · ·+ a1x + a0. Definamos entonces el polinomio evaluado

en la matriz A anterior como

p(A) = An + an−1An−1 + an−2A

n−2 + · · ·+ a1A + a0I ∈ IRn×n.

Muetsre entonces que si A = V AV t (descomposicion ortogonal) sigue que

p(A) = V Diag[p(λ)]V t,

donde Diag[p(λ)] es una matriz diagonal, cuyos elementos son el polinomio p(·) evaluado enlos valores propios de A. Con lo anterior, pruebe que si pA es el polinomio caracterıstico de A,entonces pA(A) = [0] : matriz nula.

A partir del resultado de descomposicion ortogonal de una matriz simetrica, dada A ∈ IRn×n

simetrica se tiene que

QA(X) = XtAX = XtV DV tX = [V X]tD[V X].

Definiendo Z = V X, sigue que

QA(X) = ZtDZ =n∑

i=1

λiz2i

con λi valor propio de A y zi la respectiva componente de Z. Considerando que V invertible,sabemos que Z = 0IRn ⇔ X = 0IRn y, por lo tanto, si todos los valores propios de A conestrictamente positivos, entonces la suma de la derecha lo sera si Z 6= 0 y en consecuencia laforma cuadratica asociada a la matriz A sera estrictamente positiva para Z 6= 0, es decir, laforma cuadratica sera estrictamente positiva cuando X 6= 0. Analogamente, si cada valor propiode A es estrictamente negativo, entonces la forma cuadratica asociada a A sera definida negativa.En resumen, se tiene la siguiente proposicion.

Proposicion 2.5.7 Dada A ∈ IRn×n una matriz simetrica,

a.- A es definida positiva si todos los valores propios de A son estrıctamente positivos,

b.- A es semi - definida positiva si los valores propios son no negativos (es decir, positivos ocero),

c.- A es definida negativa si todos los valores propios de A son estrıctamente negativos,

Page 73: Libro Matematicas Para Economistas

72 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

d.- A es semi - definida negativa si los valores propios son no positivos (es decir, negativos ocero).

Ejemplo 2.5.10 Consideremos la siguiente matriz:

A =

a 0 00 b 00 0 c

Los valores propios de A son aquellos de la diagonal. Si a > 0, b > 0 y c > 0 la matriz esdefinida positiva; si a > 0, b > 0 pero c = 0 la matriz es semi - definida positiva. Ahora, porejemplo, cuando a > 0, b > 0 y c < 0 la matriz no es definida negativa ni definida positiva. Estecaso es muy importante en, por ejmplo, teorıa de juegos: se trata de una situacion de punto desilla.

Estas definiciones seran aplicadas mas adelante cuando se trate de determinar los maximosy mınimos de una funcion de varias variables.

Ejemplo 2.5.11 Suponga que A es una matriz definida positiva. Sabemos entonces que existeuna matriz diagonal de valores propios, todos positivos, y una matriz ortogonal V tal queA = V DV t. Definamos la matriz H = Diag[

√λ] como aquella cuyos valores en la diagonal son

precisamente las raices de los valores propios de A. Claramente D = HH. Note ademas queH = Ht (es una diagonal). Ahora bien, de la descomposicion anterior sigue que

A = V DV t = V HHV t = V HHT V t = [V H][V H]t = RtR

con R = [V H]t. Por lo tanto, de todo lo anterior sigue que si A es una matriz definida positiva,existe una matriz R tal que A = RtR. Esta es la llamada descomposicion de Cholewsky dela matriz A anterior.

Ejercicio 2.5.9 Dadas la matriz

A =

α 4 74 1 97 9 4

determinar los valores propios y determinar el signo de la matriz en funcion de α. Paraque valores de α la matriz es definida positiva?

Ejercicio 2.5.10 Dadas la matriz

A =

2 1 −11 1 2−1 2 4

encuentre su descomposicion orotogonal.

Ejercicio 2.5.11 Dados x1, x2 ∈ IR++ y dados α, β ∈ IR++, definamos la siguiente matriz

Γ =

(α(α− 1)xα−2

1 xβ2 αβxα−1

1 xβ−12

αβxα−11 xβ−1

2 β(β − 1)xα1 xβ−2

2

)∈ IR2×2

Muestre que si α + β < 1 entonces Γ es definida negativa para todo valor de x1, x2. Muestreademas que si α + β > 1 dicha matriz es definida positiva.

Page 74: Libro Matematicas Para Economistas

2.5. FORMAS CUADRATICAS 73

Ejercicio 2.5.12 Dada

A =

(2 −2−2 1

)

determine A34 usando dos metodos: el primero, por calculo directo y el otro usando la descom-posicion ortogonal de A.

2.5.5. Funciones lineales

Las funciones lineales son las mas simples que uno puede imaginar. Su importancia esta pre-cisamente en esta simpleza y en el hecho que pueden ser utilizadas para aproximar funcionesmas complejas, tal como veremos mas adelante.

Definicion 2.5.6 Una funcion f : IRn → IRm se dice lineal si cumple con que para todoX, Y ∈ IRn y para todo α ∈ IR:

f(X + Y ) = f(X) + f(Y ), f(αX) = αf(X).

Equivalente a lo anterior es decir que una f es lineal si para todo X, Y ∈ IRn y para todoα ∈ IR

f(X + αY ) = f(X) + αf(Y ).

De la definicion es directo que si f : IRn → IRm es lineal, entonces para todo X1, X2, · · · , Xk ∈IRn y para todo α1, α2, · · · , αk se cumple que

f

(k∑

i=1

αiXi

)=

k∑

i=1

αif(Xi).

Ejemplo 2.5.12 Una funcion f : IR → IR es lineal si es de la forma f(x) = ax. La funciong(x) = ax + b no es lineal pues no cumple con la definicion. En efecto, dados x, y ∈ IR,g(x + y) = a(x + y) + b 6= g(x) + g(y) (= ax + b + ay + b = a(x + y) + 2b).

Consideremos el caso particular en que f : IRn → IRn. Dada la base canonica de IRn, y dadoX ∈ IRn cualquiera, entonces sabemos que

X =n∑

i=1

xiei

donde xi es la i-componente del vector x. Por lo tanto, si f es lineal, se tiene que

f(X) =n∑

i=1

xif(ei)

donde f(ei) ∈ IRn es el vector imagen del respectivo elemento de la base canonica por la funcionf . Por lo tanto, interpretando lo anterior como un producto matricial, se tiene que

f(X) = [f ]X

Page 75: Libro Matematicas Para Economistas

74 CAPITULO 2. INTRODUCCION AL ALGEBRA LINEAL

donde [f ] es la matriz cuyas columnas con precisamente las imagenes de la base canonica porf . De todo lo anterior entonces, queda claro que cualquier funcion lineal f : IRn → IRn es de laforma

f(X) = [f ]X

donde [f ] es la llamada matriz de la funcion, que se construye como antes. Esto sigue siendovalido si la funcion es de IRn en IRm: en tal caso, la matriz de f sera de m× n.

Ejercicio 2.5.13 (a) Muestre, usando la definicion, que si f : IRn → IRm es lineal, entoncesf(0IRn) = 0IRm.

(b) Muestre que si f, g : IRn → IRn son funciones lineales, entonces f + g tambien lo es y,ademas, [f + g] = [f ] + [g] (la matriz de la funcion suma es la suma de las matrices decada una.)

(c) Muestre que si f, g : IRn → IRn son dos funciones lineales, entonces f g (composicion def con g) tambien es lineal. De hecho, muestre que

[f g] = [f ][g]

que es precisamente una justificacion para la definicion de producto de matrices que se hahecho.

Page 76: Libro Matematicas Para Economistas

Capıtulo 3

Topologıa y continuidad

3.1. Conceptos basicos

El concepto fundamental que requerimos es aquel de vecindad de un punto, con la cual vamosa formalizar la idea de cercanıa que es clave para la convergencia. Por antonomasia, la idea devecindad se asocia al de bola en torno al punto.

Definicion 3.1.1 La bola abierta de centro x0 ∈ IRn y radio r > 0 se define como

B(x0, r) = x ∈ IRn | ‖x− x0‖ < r,

mientras que la bola cerrada de centro x0 y radio r > 0 corresponde a

B(x0, r) = x ∈ IRn | ‖x− x0‖ ≤ r.

De lo anterior, la bola abierta se diferencia de la cerrada en que esta ultima comprende ademasel borde. Note como interviene la norma en la definicion de la bola. De hecho, si analizamos ladefinicion, una bola abierta con centro x0 y radio r es simplemente el conjunto de todos lospuntos que estan a una distancia menor que r de x0, mientras que en la bola cerrada dichadistancia es menor o igual a r.

Ejemplo 3.1.1 Cuando n = 1 (es decir, IR) una bola abierta de radio r en torno al puntox0 ∈ IR es simplemente un intervalo con centro x0, cuyo extremo derecho es x0 + r0 y cuyoextremo izquierdo es x0−r0. Ya que la bola es abierta, estos extremos no pertenecen al intervaloen cuestion; si la bola es cerrada, los extremos pertenecen al conjunto. En resumen,

B(x0, r) =]x0 − r, x0 + r[, B(x0, r) = [x0 − r, x0 + r]

En IR2 es la siguiente figura que ilustra las conceptos anteriores

75

Page 77: Libro Matematicas Para Economistas

76 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

x0

x0

r

Bola abierta Bola cerrada

En IR3, los cırculos de IR2 se convierten en esferas, etc.

Como hemos mencionado, el concepto de bola (abierta o cerrada) es util para precisar la ideade cercanıa o vecindad a un punto x0 ∈ IRn, donde el radio nos dice que tan cerca estamos. Esteconcepto es fundamental en matematicas. De hecho, la nocion de convergencia se desprende dela idea anterior.

Definicion 3.1.2 Dado A ⊆ IRn diremos que x0 ∈ A es un punto interior del conjunto siexiste una bola abierta cuyo centro es x0 y que esta contenida en A.

En otras palabras, x0 es un punto interior de A si ∃ε > 0 tal que

B(x0, ε) ⊆ A.

Definicion 3.1.3 Dado un conjunto A ⊆ IRn, definimos el interior de A, que denotaremosint(A) como el conjunto formado por todos sus puntos interiores.

En otras palabras,

int(A) = x0 ∈ A | ∃ε > 0, B(x0, ε) ⊆ A.

Definicion 3.1.4 Se dice que un conjunto A ⊆ IRn es abierto si todos sus puntos son interiores.

En otras palabras, A es abierto si para todo x0 ∈ A existe un radio ε > 0 (que depende delpunto en cuestion) tal que la bola abierta B(x0, ε) esta contenida en A. Note que, por definicion,para cada punto debe existir al menos una bola contenida en el conjunto. Como se ha indicado,obviamente esta bola depende del punto en cuestion.

De todo lo anterior, podemos concluir entonces que

A es abierto ⇔ int(A) = A.

La siguiente figura ilustra la idea de conjunto abierto.

x

y

z

Page 78: Libro Matematicas Para Economistas

3.1. CONCEPTOS BASICOS 77

En torno a cualquier punto del conjunto de la izquierda podemos encontrar una bola abiertaque esta contenida en el mismo. Tambien es claro que dicha bola debe ser mas chica en lamedida que nos acercamos al borde del conjunto. El conjunto de la derecha no es abierto yaque, por ejemplo, en el punto z (que esta en el borde) no podemos construir una bola abiertaque este completamente contenida en el conjunto: siempre hay puntos que quedan fuera. No esabierto a pesar de que si es posible construir la bola en todos aquellos puntos que estan en elinterior del conjunto. En este caso, el problema solo se tiene en la frontera del conjunto.

Ejemplo 3.1.2 Dado x0 ∈ IRn y dado r > 0, la bola abierta B(x0, r) es un conjunto abierto deIRn. Veamoslo para el caso IR. Dado x ∈]x0 − r, x0 + r[, entonces la “distancia” de x al bordederecho es d1 = x0 +r−x, y al izquierdo es d2 = x0−r−x. Definamos entonces δ = mınd1, d2y sea r0 = δ/2. Es facil ver que ]x− r0, x+ r0[⊆]x0− r, x0 + r[, con lo cual queda probado que labola en IR es abierto. Mismo razonamiento se sigue para una bola abierta en IRn. Queda comoejercicio probarlo.

En forma complementaria a la idea de conjunto abierto existe la nocion de conjunto cerrado.

Definicion 3.1.5 Un conjunto se dice cerrado si su complemento1 es abierto.

Nota. 3.1.1 Lo anterior no implica que si un conjunto no es abierto necesariamente debe sercerrado. Existen conjuntos que no son ni abiertos ni cerrados. En terminos intuitivos, la ideade cerrado se asocia con el hecho que conjunto posee su frontera (concepto que pronto for-malizaremos, pero que por ahora basta con la idea intuitiva). La siguiente figura ilustra la ideade cerrado:

Conjunto cerrado Su complemento es abierto

En la siguiente figura mostramos un conjunto que no es abierto ni cerrado:

Conjunto que no es abierto ni cerrado

Ejemplo 3.1.3 Veamos que el conjunto de los racionales IQ no es abierto en IR. En efecto,tomemos un racional q ∈ IQ cualquiera. La idea es encontrar una bola abierta B cuyo centro es

1Complemento en el sentido de toerıa de conjuntos, es decir, la diferencia del espacio total (en este caso IRn)con el conjunto. Intuitivamente, lo que esta fuera del conjunto.

Page 79: Libro Matematicas Para Economistas

78 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

q y tal que B ⊆ IQ. Ahora bien, cualquiera que sea la bola que tomemos, necesariamente ha decontener reales que no son racionales, por lo cual el conjunto no puede ser abierto.

Algunas propiedades basicas de los conjuntos abierto y cerrados son las siguientes:

Proposicion 3.1.1 Dado A ⊆ IRn y dada una familia de conjuntos Ai ⊆ IRn, i ∈ I, se tieneque:

a.- int(A) ⊆ A.

b.- A es abierto si y solo si int(A) = A.

c.- Si los Ai son abiertos, entonces⋃i∈I

Ai es abierto, cualquiera sea el conjunto de ındices.

d.- Si los Ai son abiertos e I es finito entonces⋂i∈I

Ai es abierto.

e.- φ y IRn son conjuntos abiertos y cerrados a la vez.

f.- Si los Ai son cerrados, entonces⋂i∈I

Ai es cerrado, cualquiera sea el conjunto de ındices.

g.- Si los Ai son cerrados e I es finito entonces⋃i∈I

Ai es cerrado

Demostracion.

a.- Directo, por definicion ya que los puntos de int(A) deben estar en A.

b.- En primer lugar, ya sabemos que int(A) ⊆ A. Por otro lado, si A es abierto, sabemos quepor definicion todos sus puntos son interiores y por lo tanto int(A) ⊆ A.

c.- Para ver que⋃i∈I

Ai es abierto, tomemos un punto a ∈ ⋃i∈I

Ai. Por lo tanto, existe i0 ∈ I

tal que a ∈ Ai0 . Como Ai0 es abierto, existe una bola abierta B(a, r) ⊆ Ai0 y, por lotanto, como Ai0 ⊆

⋃i∈I

Ai se tiene que B(a, r) ⊆ ⋃i∈I

Ai. De esta manera, dado a ∈ ⋃i∈I

Ai

hemos encontrado una bola abierta en torno al punto que esta contenida en el conjunto.Luego el conjunto es abierto. Note que en la proposicion no imponemos la condicion que elconjunto de ındices sea finito: puede ser cualquier conjunto. En cambio, para la interseccionse requiere que el conjunto de ındices sea finito.

d.- Si I es finito y los Ai son abiertos, entonces dado a ∈ ⋂i∈I

Ai se tiene que a ∈ Ai, para

todo i ∈ I. Luego, como cada Ai es abierto, existe una bola abierta B(a, ri) tal queB(a, ri) ⊆ Ai, donde el radio ri depende del conjunto Ai considerado. Escojamos r comoel mınimo de los radios ri, i ∈ I, (el cual es distinto de cero por cuanto estamos escogiendoel mınimo dentro de un conjunto finito de valores que son positivos). Ası, por definicionse tiene que B(a, r) ⊆ B(a, ri), ∀i ∈ I. Luego, B(a, r) ⊆ ⋂

i∈IAi, con lo cual probamos que

dicha interseccion es abierta. Note que necesitamos la finitud del conjunto de indices paragarantizar que este radio r que hemos definido sea positivo.

e.- Directo de la definion.

f.- Directo de la parte (a.−) considerando que A cerrado si y solo si Ac es abierto. Considerarademas las leyes de De Morgan para pasar de uniones a intersecciones. Ejercicio.

Page 80: Libro Matematicas Para Economistas

3.1. CONCEPTOS BASICOS 79

g.- Directo de parte (b.−) siguiente razonamiento anterior. Ejercicio.

Ejemplo 3.1.4 El que sigue es un ejemplo de interseccion de abiertos donde, si el conjunto deındices no es finito, el resultado no es abierto. Supongamos que I = IN y que Ai =

]−1

i ,1i

[. Ası,

A2 =]−1

2 , 12

[, A35 =

]− 1

35 , 135

[, etc. Luego compruebe Ud. que

⋂i∈IN

Ai = 0, conjunto que no

es abierto2

Ejemplo 3.1.5 Sea x0 ∈ int(A), por lo tanto, existe una bola abierta Bx0 ⊆ A. Note que estoes equivalente a decir que existe un abierto C ⊆ A tal que x0 ∈ C. Definamos ahora el conjunto

A =⋃

x0∈int(A)

Bx0

el cual, por lo anterior, se puede escribir como

A =⋃

C⊆A

C

donde C es abierto. Obviamente A es abierto (es la union de abiertos) y ademas esta contenidoen A (union de subconjuntos de A).

Por construccion se tiene que int(A) ⊆ A. Sin embargo, puesto que todos los puntos de Ason interiores de A, se tiene entonces que A ⊆ int(A). Luego, se concluye que

int(A) = A =⋃

x0∈int(A)

Bx0 ,

lo que es equivalente a escribir que

int(A) =⋃

C⊆A

C,

con C abierto. Es decir, el interior de un conjunto es el mayor abierto que esta contenidoen el conjunto3. Esta es otra forma de ver el interior de un conjunto.

Los siguientes conceptos nos seran de utilidad en lo que sigue de este curso.

Definicion 3.1.6

a.- La clausura de A, que se representa por cl A o por A, corresponde al menor conjuntocerrado que contiene a A, es decir:

cl A =⋂

D⊇A

D, D cerrado.

2En efecto, para encotrar esta interseccion, notemos que para todo i ∈ IN se tiene que Ai+1 ⊆ Ai y por lo

tanto, para todo n ∈ IN se tiene quen⋂

i=1

Ai = An =]− 1

n, 1

n

[, que cuando n tiende a infinito implica que dicha

interseccion es 0.3Mayor en el siguiente sentido: para todo C ⊆ A abierto se tiene que C ⊆ int(A).

Page 81: Libro Matematicas Para Economistas

80 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

b.- La frontera de A es simplemente la diferencia entre la clausura y el interior de A. Serepresentara por fr A. Luego,

fr A = cl A \ int A.

Intuitivamente, la frontera de A es el borde de A, la clausura es la union de A con su bordey el interior es todo el conjunto menos su borde. En la siguiente figura se ilustran las ideasanteriores.

A cl A

int A fr A

A partir de lo anterior, en forma directa se tiene que un conjunto es cerrado si es igual a suclausura

A es cerrado ⇔ A = cl(A)

Ejemplo 3.1.6 Dados A =]2, 3[ y B = [2, 3] se tiene que A es abierto mientras que B cerrado.Ademas, clA = [2, 3] = clB = B, int(A) = A = int(B) =]2, 3[. La frontera de A y B coincide(igual al conjunto 2, 3). La frontera de A no le pertenece, mientras que la forntera de B esta enB.

Definicion 3.1.7 Diremos que un conjunto A ⊆ IRn es acotado si existe una bola abierta quecontiene al conjunto, es decir

A ⊆ IRn acotado ⇔ ∃B : bola abierta |A ⊆ B.

En forma equivalente, A es acotado si existe una constante c > 0 tal que ∀a ∈ A, ‖a‖ ≤ c.En efecto, si existe B bola abierta, digamos, de centro x0 y radio r > 0 tal que A ⊆ B, entoces∀x ∈ A se tiene que x ∈ B(x0, r), por lo cual, ‖x − x0‖ < r. Usando desigualdad triangular, loanterior implica que ‖x‖ ≤ ‖x0‖+ r. Definiendo entoces c = ‖x0‖+ r se tiene que x ∈ A implicaque ‖x‖ ≤ c. Por otro lado, si existe c > 0 tal que para todo x ∈ A, ‖x‖ ≤ c, entonces la bolaB(0, 2c) contiene al conjunto A (Ejercicio!), con lo cual queda probada la equivalencia que se hamencionado.

Ejemplo 3.1.7 Los conjuntos A1 = [x0, x1], A2 =]x0, x1[ y A3 = [x0, x1[ son acotados enIR. A1 es ademas cerrado, A2 es abierto mientras que A3 ni lo uno ni lo otro. Los conjuntosC1 = [x0, +∞[ y C2 =]x0, +∞[ no son acotados en IR. C1 es cerrado, mientras que C2 es abierto.

Page 82: Libro Matematicas Para Economistas

3.2. CONVERGENCIA 81

Definicion 3.1.8 Un cojunto A ⊆ IRn que es cerrado y acotado se dice compacto.

Ejemplo 3.1.8Veamos que la interseccion y la union de dos compactos es compacto. En efecto, sean K1, K2

dos compactos. Entonces son cerrados y por lo tanto K1 ∪K2 y K1 ∩K2 tambien lo son. Faltaver que son acotados. Puesto que K1 ∩K2 ⊆ K1 (K2) se tiene el acotamiento de este. Por otrolado, sean α1, α2 tales que

‖ki‖ ≤ αi, ki ∈ Ki, i = 1, 2.

Si definimos α = maxα1, α2 se tiene que ‖k‖ ≤ α, ∀k ∈ K1 ∪ K2, lo que muestra elacotamiento de la union. Luego, ambos son compactos.

Nota. 3.1.2 Note que el conjunto vacıo es cerrado y abierto a la vez. Ademas es compacto.En efecto, veamos que es abierto. Si no lo fuera, existira entonces un punto en ∅ tal que algunabola abierta en torno a este punto no estara contenida en ∅. Pero como el conjunto es vacıo, talpunt no existe; luego es abierto. Veamos que es cerrado: en efecto, su complemento es IRn quees abierto. Veamos que es compacto: si no lo fuera, entonces para cualquier constante c > 0 hade existir un punto x ∈ ∅ tal que ‖x‖ > c. Como dicho punto no existe (es el vacıo), se tiene lapropiedad. Intersante, no...

Con todo lo anterior, hemos visto algunas propiedades topologicas de conjuntos desde unpunto de vista mas bien geometrico. En lo que sigue, vincularemos dichos conceptos con cues-tiones de tipo analıtico, con lo cual cerraremos un cırculo conceptual muy importante, tanto porel lenguaje como por las aplicaciones que de ello sacaremos. El concepto fundamental que sedesea precisar, y que establece el vınculo entre ambas visiones, es aquel de convergencia.

3.2. Convergencia

Con los conceptos de distancia y de bola abierta hemos modelado, la idea de parecersea es una nocion algo estatica en el sentido que compara dos valores dados y nada mas. Unconcepto “dinamico” serıa algo ası como irse pareciendo a, tender a, lo que matematicamentecorresponderıa a converger a. Esta idea de tender a es una idea basica en todo lo que sigue y deenorme utilidad para nuestros objetivos. A traves de los conceptos topologicos que hemos definidoestamos en condiciones de precisar este concepto, ademas de tener una vision complementariade lo antes mostrado.

Nota. 3.2.1 Note una cosa fundamental: estamos hablando de “parecerse a” y no de“ser igual a”. La convergencia se refiere al “parecer”, no al “ser” igual. Obviamentesi se es igual se parece, pero no necesariamente a la inversa.

El concepto auxiliar que necesitamos para definir lo que nos intersa es aquel de sucesion dereales o vectores. La idea de sucesion es simplemente aquel de secuencia, donde hay claramenteidntificado un primer termino, un segundo termino, un tercer, y ası sucesivamente. Formalmenteesto corresponde a establecer una funcion entre los objetos de la secuencia con los naturales.

Definicion 3.2.1 Una sucesion de elementos de IRn sera cualquier funcion de IN en IRn.

Ejemplo 3.2.1 Son sucesiones las siguientes funciones

Page 83: Libro Matematicas Para Economistas

82 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

a.- φ : IN → IR | φ(k) = 1k2+1

b.- µ : IN → IR | µ(k) = 2k

c.- η : IN → IR | η(k) = (−1)k

d.- h : IN → IR | h(k) = k!

Nota. 3.2.2

i.- Note que una sucesion los elementos de ella (es decir, las imagenes de la funcion) estanindexados: hay un primer elemento, un segundo elemento, un tercer elemento, etc.

ii.- Una sucesion puede tomar infinitos valores o un numero finito de ellos. Del ejemplo anterior,la sucesion de [a.−] toma infinitos valores, mientras que [c.−] toma solo dos valores: +1 y−1.

iii.- Normalmente para describir una sucesion usualmente no se hace referencia explıcita ala funcion involucrada, mas bien se denota directamente por su imagen tal como se ilustraen lo siguiente para los ejemplos anteriores

iii.a.- φ(t) → φt = 1t2+1

iii.b.- µ(t) → µt = 2t

iii.c.- η(t) → ηt = (−1)t

iii.d.- h(t) → ht = t!

iv. El parametro que se utiliza para indexar la sucesion es mudo, en el sentido que es irrel-evante. Ası, la sucesion 2t la podemos notar como 2n o 2k, etc., en el entendido que lavariable t, n o k se mueve en los naturales.

Ası, en todo lo que sigue trabajaremos indistintamente con la notacion x(t) o xt para denotaruna sucesion cuyo elemento t-esimo es xt ∈ IRn.

Definicion 3.2.2 Diremos que la sucesion xt converge a x0 si para toda bola abierta que con-tiene a x0, la sucesion esta contenida en la bola salvo un numero finito de puntos. En tal casose dice que x0 es el lımite de la sucesion y se representara por lım

t→∞xt = x0 o por xt → x0.

Proposicion 3.2.1 Si una sucesion converge entonces el lımite es unico.

Prueba. Supongamos que xt converge y sean α y β dos lımites. Debemos probar entonces queα = β. Supongamos que no y sea entonces δ = |α− β| > 0. Por definicion, sabemos que ∀ε > 0,∃T1, T2 ∈ IN tal que ‖xt − α‖ ≤ ε para todo t ≥ T1 y que ‖xt − β‖ ≤ ε para todo t ≥ T2.Sea entonces T = maxT1, T2, de modo que para t ≥ T se cumplen simultaneamente ambasdesigualdades. Notemos ahora que ‖xt − α‖ ≤ ε y ademas ‖xt − β‖ = ‖β − xt‖ ≤ ε, ∀t ≥ T .Luego, ‖xt − α‖+ ‖β − xt‖ ≤ 2ε. Por desigualdad triangular se tiene que

‖(xt − α) + (β − xt)‖ ≤ ‖xt − α‖+ ‖β − xt‖y luego, ‖(xt−α)+(β−xt)‖ ≤ 2ε, es decir, ‖β−α‖ ≤ 2ε. Del hecho que δ = ‖α−β‖ = ‖β−α‖ > 0,entonces la condicion anterior no se cumple para ε < δ

2 , con lo cual se obtiene una contradiccion,la que obviamente proviene de suponer que α 6= β. Ası, α = β, es decir, el lımite es unico. 2

Page 84: Libro Matematicas Para Economistas

3.2. CONVERGENCIA 83

Con la definicion de lımite se persigue modelar el hecho que, en la medida que t crece, losvalores de la sucesion se acercan cada vez mas al valor x0 lımite de la misma. Otra forma deescribir lo mismo es como sigue:

xt → x0 ⇔ ∀ε > 0, ∃tε ∈ IN : ‖xt − x0‖ ≤ ε, ∀t ≥ tε

es decir, para un valor t suficientemente grande toda los elementos de la sucesion se encuentran auna distancia arbitrariamente pequena de x0. Obviamente ese valor de t depende de la distanciaque estemos considerando.

Ejemplo 3.2.2 Intuitivamente, para imaginar la convergencia podemos pensar en algun procesoeconomico que se da en el tiempo, del cual en cada instante t conocemos su estado. Supongamosque dicho estado lo caracterizamos por un vector xt y que deseamos saber que pasa con el sistemacuando t crece, digamos, tiende a infinito. Es claro que hay varias alternativas de lo que podrıasuceder cuando el tiempo transcurre. Por ejemplo, el vector de estado podrıa oscilar o podrıacrecer desmesuradamente. Sin embargo, tambien existe la posibilidad que dicho vector tienda aalgun valor determindo: en la medida que transcurre el tiempo, el vector xt se aproxima cadavez mas a un vector, digamos, x0. Esta es la idea de la convergencia.

En este sentido, el irse pareciendo implica que la distancia entre xt y x0 debe ser cada vezmenor en la medida que t crece. Ası, considerando cualquier bola abierta en torno a x0, digamosB(x0, ε) para algun ε > 0, cuando t crece, necesariamente deben comenzar a caer todos los xt

dentro de este saco definido por dicha bola. Note que el instante en que comienzan a caer todoslos xt en el saco depende de la bola escogida. En otras palabras, para cada radio ε > 0 existeun instante Tε (instante que depende de ε) tal que xt ∈ B(x0, ε), para todo xt tal que t > Tε.Esto ha sido formalizado en la idea de convergencia ya presentada. La siguiente figura ilustraesta importante cuestion:

x0r

xt

xT

Proposicion 3.2.1 Las siguientes son las propiedades mas relevantes de los lımites.

a.- Si una sucecion xt es convergente, entonces el conjunto X = xt |t ∈ IN es acotado.

b.- Si xt → x0 e yt → y0 entonces (xt +yt) → (x0 +y0) y (xt ·yt) → (x0 ·y0). Si y0 6= 0 entoncesxtyt→ x0

y0(el lımite de la suma, producto o cuociente es la suma, producto o cuociente de

los lımites).

c.- Si xt → 0 e yt es acotada4 entonces xt · yt → 0 (producto de una sucesion que converge acero por una acotada converge a cero).

4Es decir, si existe una constante c > 0 que no depende de n tal que ‖yt‖ ≤ c para todo n.

Page 85: Libro Matematicas Para Economistas

84 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

d.- Si para todo n ∈ IN se tiene que xt ≤ yt ≤ zt y xt → α, zt → α entonces yt → α (criteriode comparacion o del sandwich).

e.- Si xt es una sucesion de elementos positivos y convergente, entonces el lımite debe sermayor o igual a cero.

Demostracion.

a.- Si xt converge, a partir de un cierto T ∈ IN esta completamente contenida en una bola,cuyo radio es, digamos, R > 0. Definamos una nueva bola cuyo rario es el maximo entreR y la mas grande de las normas ‖xt‖, con t < T . Ası, toda la sucecion esta contenida enesta bola de radio R∗ por lo cual es acotada.

b.- Veamos solo la suma. Como xt → x0 e yt → y0, para todo ε > 0 existen T1, T2 ∈ IN talesque ‖xt − x0‖ ≤ ε

2 , ∀t > T1 e ‖yt − y0‖ ≤ ε2 , ∀t > T2. Como

‖(xt + yt)− (x0 + y0)‖ ≤ ‖xt − x0‖+ ‖yt − y0‖,

considerando T = maxT1, T2, se tiene que para todo t > T , ‖xt − x0‖ ≤ ε2 y ademas

‖yt − y0‖ ≤ ε2 , por lo cual, reemplzando en la expresion anterior,

‖(xt + yt)− (x0 + y0)‖ ≤ ε

2+

ε

2= ε,

con lo cual queda demostrada la convergencia. Para el producto, se deja propuesta lademostracion, considerando que ‖xtyt − x0y0‖ = ‖xtyt − xty0 + xty0 − x0y0‖ ≤ ‖xtyt −xty0‖+‖xty0−x0y0‖ = ‖xt‖ · ‖yt− y0‖+‖y0‖ · ‖xt−x0‖. Con esto, seguir el razonamientoanterior, considerando que ‖xt‖ es acotado.

c.- Propuesto utilizando lo anterior.

d.- De hecho que (xt−α) ≤ (yt−α) ≤ (zt−α) se tiene que ‖yt−α‖ ≤ max‖xt−α‖, ‖zt−α‖.Seguir con esto para concluir.

e.- Supongamos que xt ≥ 0 y que xt → x∗. Si fuera que x∗ < 0, del hecho que para todo ε > 0existe T ∈ IN tal que |xt − x∗| ≤ ε, t ≥ T , se tiene que que

−ε < xt − x∗ < ε,

es decir, xt < ε + x∗. Como x∗ < 0, para 0 < ε < −x∗/2 se tendrıa que xt < 0, t ≥ T , loque contradice el supuesto inicial. Luego, x∗ debe ser positivo. 2

smallskip

Ejemplo 3.2.3 a.- Si la sucesion xt = cte entonces converge a la constante.

b.- Consideremos ahora la sucecion xt definida por xt = αt, con α ∈ IR fijo. Cuando α > 1entonces xt → ∞; cuando |α| < 1 (es decir, cuando −1 < α < 1) entonces xt → 0. Siα = 1 entonces xt = 1 y por lo tanto converge a 1. Finalmente, si α = −1 entonces xt noconverge (oscila).

c.- En general, dada una sucesion en IRn se dara una de las siguientes situaciones:

Page 86: Libro Matematicas Para Economistas

3.2. CONVERGENCIA 85

• que la sucecion converja (tenga lımite): caso anterior cuando −1 < α ≤ 1

• que la sucesion tienda a +/−∞, por lo cual no converge: caso anterior cuando α > 1o α < −1.

• que la sucesion oscile “infinitamente”, por lo cual no converge: caso anterior cuandoα = −1.

d.- Si xt → x∗ entonces |xt| → |x∗|. Analogo con ‖xt‖ → ‖x∗‖ si xt ∈ IRn.

e.- Dado un polinomio p(x) = xn + an−1xn−1 + an−2x

n−2 + ... + a1x + a0, entonces si xt → x∗

se tiene que p(xt) → p(x∗).

Ejemplo 3.2.4 Sea α ∈ IR dado y sea Sn definida como

Sn =n∑

k=0

αk = 1 + α + α2 + · · ·+ αn.

Entonces se tiene que:

a.- (Ejercicio) Sn = 1−αn+1

1−α

b.- Si 0 < α < 1 entonces αn+1 → 0 y por lo tanto Sn → 11−α . Luego, cuando 0 < α < 1 se

tiene que

∞∑

k=0

αk = 1 + α + α2 + · · ·+ αn + · · · = 11− α

.

Un caso particular e importante que garantiza convergencia de sucesiones es cuando la suce-sion es creciente y acotada. Las definiciones y la propiedad.

Definicion 3.2.3 Diremos que la sucesion real xt es creciente si xt ≤ xt+1 ∈ IR, para todot = 0, 1, 2, .... Diremos ademas que la sucesion es acotada por arriba (o superiormente) si existeuna constante c tal que

xt ≤ c, ∀t ∈ IN.

Proposicion 3.2.2 Si una sucesion real es creciente y acotada superiormente entonces nece-sariamente converge.

A modo de ejemplo daremos la demostracion.

Prueba. Supongamos que xt es creciente y acotada superiormente. Entonces el conjunto X =x0, x1, ..., xn, ... es un conjunto acotado en IR. Sea α ∈ IR el supremo de dicho conjunto5, elcual existe ya que el conjunto es acotado por arriba.

Entonces, por definicion de supremo, se tiene que, por un lado, para todo t, xt ≤ α y, porotro lado, ∀ε > 0 existe xtε ∈ X tal que |xtε −α| = α−xt ≤ ε (|xtε −α| = α−xtε , pues α > xt).De esta manera, como la sucesion es creciente, se tiene que α−xt+1 ≤ α−xt, de lo cual se tieneque para todo t ≥ tε, |xt − α| ≤ ε, y ası se muestra la convergencia de xt hacia α. 2

5Ver Seccion de conjuntos para detalles.

Page 87: Libro Matematicas Para Economistas

86 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

Nota. 3.2.3 Cuando la sucesion es decreciente y acotada por abajo, se puede demostrar, enforma analoga, que hay convergencia de la sucesion. Note que en este caso no es necesario conocerel lımite para saber positivamente que existe convergencia. Es solo un resultado de existencia!

Ejemplo 3.2.5 En lo que sigue, vamos a analizar una de las sucesiones mas importantes enmatematicas: aquella que define al numero e. Para el efecto, definamos la siguiente sucesion:

en =(

1 +1n

)n

.

a.- Se puede probar que dicha sucesion es creciente (verlo como ejercicio en Excel).

b.- Se puede probar que dicha sucesion es acotada.

De lo anterior, se tiene que dicha sucesion es convergente. El lımite de la misma se llamae. Un valor aproximado de e es el siguiente (Ejercicio: hacer en Excel una hoja que permitacalcular e con 50 decimales.):

e ' 2,718281.

2

Un concepto relacionado al de lımite es el de punto de acumulacion. Previo a definirlo, la ideaintuitiva. Supongamos una sucesion en que algunos de los terminos tienden a un determinadovalor y que otros valores de la sucesion tiendan otro punto. Por ejemplo, todos los terminosimpares de la sucesion xt = (−1)t tienden a −1 y que los terminos pares tiendan a 1. En estecaso, la sucesion no converge: “ es como si tuviera dos lımites”. En este caso se dice que lasucesion tiene dos puntos de acumulacion: el 1 y el −1.

Para definir formalmente el concepto deseado, necesitamos introducir la nocion de sub-sucesion de una sucesion.

Definicion 3.2.4 Dada una sucesion xt, una subsucesion de xt es una nueva sucesion que seconstruye a partir de la original tomando una cantidad infinita de puntos de la misma.

En otras palabras, una sub-sucesion de xn es otra sucesion que se construye tomando terminosde xn en forma creciente. Formalmente, dada una funcion φ : IN → IN creciente, la sucesiondefinida por yt = xφ(t) es una sub-sucesion de xt.

Por ejemplo, de la sucesion xt una sub-sucesion serıa aquella que se construye tomando todoslos terminos pares de xt (es decir, x2, x4, x6, ..., x2t, ....). Otro ejemplo es aquella que consideraen tomar todos los terminos de la forma x3t (x3, x6, x9, x12, ...), etc.

Definicion 3.2.5 Dada una sucesion xt, diremos que x∗ es un punto de acumulacion de lamisma si existe una sub-sucesion de xt que converge a x∗, es decir, si existe φ : IN → IN crecientetal que xφ(t) → x∗.

Ejemplo 3.2.6 La sucesion xt = (−1)t tiene dos puntos de acumulacion: el 1 y el -1. En efecto,de la sucesion original podemos extraer aquella sub-sucecion de los terminos pares (x2x4, x6, ....)que es constante e igual a 1 y que por lo tanto converge a 1. La sub-sucesion de terminos imparesconverge a -1.

Page 88: Libro Matematicas Para Economistas

3.2. CONVERGENCIA 87

Utilizando el concepto anterior de punto de acumulacion, se tiene la siguiente propiedad, quees directa.

Proposicion 3.2.3 Una sucesion converge si y solo si tiene solo un punto de acumulacion quees finito.

Supongamos ahora que una sucecion real xt tiene varios puntos de acumulacion, digamosx∗1, x∗2, ..., x∗p.

Definicion 3.2.6

a.- Definimos el lımite superior de xt como:

lım supt

xt = maxx∗1, x∗2, ..., x∗p.

b.- Definimos el lımite inferior de xt como:

lım inft

xt = mınx∗1, x∗2, ..., x∗p.

En otras palabras, el lım supxt es el mayor de los puntos de acumulacion de xt mientras queel lım inf xt es el menor de los puntos de acumulacion de xt.

Notemos que si xt converge se tiene que lım supxt = lım inf xt = lımxt.

Cual es la relacion entre los conceptos analıticos que hemos introducido y las propiedadestopologicas de los conjuntos? La siguiente proposicion resume los resultados mas importantespara nuestros fines, en el sentido que relaciona los conceptos topologicos que hemos definidocon propiedades de sucesiones. Estos resultados son una forma alternativa de ver las defini-ciones topologicas. El uso de una u otra forma de ver o entender un conjunto dependera de laspropiedades que se desea estudiar.

Proposicion 3.2.4 Dado un conjunto A ⊆ IRn se tiene que:

a.- A es cerrado si y solo si toda sucesion de elementos de A que es convergente tiene su lımiteen A. Es decir, dada xt ∈ A, ∀t, si xt → x∗ entonces x∗ ∈ A6.

b.- A es compacto si y solo si para toda sucesion en A, existe una subsucesion que es conver-gente. Es decir, si para toda sucesion xt ∈ A, ∀t, existe una sub-sucesion xt′ ∈ A que esconvergente7.

c. Dado A ⊆ IRn, se tiene que

cl A = x∗ | ∃xt ∈ A, xt → x∗.

Nota. La propiedad c.- establece que la adherencia o clausura de A corresponde al conjuntoformado por los lımites de sucesiones de A que son convergentes.

Prueba.6Esto justifica el nombre de conjunto cerrado.7Este es un teorema de existencia. El valor del lımite no siempre se conoce de manera explıcita: solo se afirma

que existe.

Page 89: Libro Matematicas Para Economistas

88 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

a.- Probemos que si A es cerrado entonces para toda xt ∈ A tal que xt → x∗, se tiene quex∗ ∈ A. Si fuera que x∗ /∈ A entonces x∗ ∈ Ac, que es abierto. Luego, existe ε0 > 0 talque B(x∗, ε0) ⊆ Ac (el conjunto es abierto). Como xt → x∗, sabemos que para todo ε > 0(en particular para ε0) existe T tal que ‖xt − x∗‖ ≤ ε0, t ≥ T , es decir, dado t ≥ T setiene que xt ∈ B(x∗, ε0). Esto es una contradiccion pues hemos supuesto que ∀t, xt ∈ Ay hemos probado que para t ≥ T no es ası. Luego, x∗ ∈ A. La otra direccion, es decir,probaremos que si toda sucesion de elementos de A que es convergente tiene su lımite enA entonces A es cerrado. En efecto, para demostrar que A es cerrado, mostremos que Ac

es abierto. Sea entonces x∗ ∈ Ac y veamos que existe ε > 0 tal que B(x∗, ε) ⊆ Ac. Si nofuera el caso, entonces para todo εn > 0 existira xn ∈ B(x∗, εn) tal que xn /∈ Ac, es decir,xn ∈ A. Podemos entonces pensar en εn → 0 y de esta manera construir una sucesionxn ∈ A tal que xn → x∗ (para ello basta tomar la sucesion definida por cada xn a partirde la condicion anterior). Luego, por condicion x∗ debera estar en A ya que es el lımitede una sucesion de elementos de A. Esto es una contradiccion pues hemos supuesto quex∗ ∈ Ac. Luego, Ac es abierto y por lo tanto A es cerrado.

b.- Probemos la propiedad para un intervalo compacto A = [a, b] de IR. Sea entonces seaentonces xt una sucesion en A. Dividamos el intervalos en dos mitades: A1 = [a, a+b

2 ] ≡[a1, b1] y A2 = [a+b

2 , b] ≡ [a2, b2]. Entonces en al menos una de las mitades habra infinitoselementos de la sucesion. Supongamos que en A2. Dividamos nuevamente el intervalos A2

como antes y consideremos una de las mitades en que habra infinitos elementos. Denotemosese intervalo por A3. Ası sucesivamente. Con esto hemos construido una secuencia deintervalos A1, A2, A3, ..., An, ... tales que en cada uno de ellos hay infinitos elementos dela sucesion y ademas cada uno de ellos tiene una longitud la mitad del anterior. Notemosdos cosas. En primer lugar, por construccion se tiene que An+1 ⊆ An y, segundo, para unintervalo n-esimo cualquiera su longitud es

Ln =b− a

2n.

Si este proceso continua ad-infinitum, designemos por A∞ el intervalo lımite al cual sellega por medio de este proceso. En este caso, puesto que

A∞ =⋂

n∈IN

An

se tiene que A∞ es cerrado. Veamos ahora que tal conjunto no es vacıo, pues si lo fuerasignificarıa que alguno de los An debe serlo, para algun n ∈ IN , lo que no puede ser porconstruccion. Mas aun, puesto que la longitud de An tiende a cero, se tiene que A∞ debecontener solo un elemento, digamos x∗. Con todo lo anterior, si definimos una sucesionxk de modo que para todo k ∈ IN se cumple que xk ∈ Ak, de las definiciones anterioresse tiene que xk → x∗. Esta es la sub-sucesion convergente que andabamos buscando,con lo cual se prueba esta parte del resultado. Para un conjunto compacto cualquieraA ⊆ IRn se procede de la misma manera, considerando que existe un hipercubo de laforma [a1, b1] × [a2, b2] × ... × [an, bn] que lo contiene. Se procede entonces dividiendo elconjunto A de la misma forma anterior, sobre la base del hipercubo ya definido, con locual se obtiene el resultado general. Este resultado general recibe el nombre de Teoremade Bolzano - Weierstrass 2

Page 90: Libro Matematicas Para Economistas

3.2. CONVERGENCIA 89

Ejemplo 3.2.7 Definamos el siguiente conjunto en IRn:

∆n = x = (x1, x2, ..., xn)t | xi ≥ 0,n∑

i=1

xi = 1

que es el llamado Simplex de IRn. Veamos que tal conjunto es compacto. Primero, que esacotado es directo si consideramos que para todo x ∈ ∆n se cumple que ‖x‖ ≤ 1 (por que?). Quees cerrado viene de lo siguiente: supongamos que xt ∈ ∆ es una sucesioon convergente, digamosa x∗ = (x∗1, x∗2, ..., x∗n). Entonces cada componente de xt debe converger a cada componente dex∗, es decir, xti → x∗i , i = 1, ..., n. Luego, necesariamente x∗i ≥ 0. Ademas, de la condicion deconvergencia de cada componente, se tiene que la suma de ellas tambien converge. Puesto quen∑

i=1xti = 1 se tiene que

n∑i=1

x∗i = 1. Luego, x∗ ∈ ∆. De esta manera ∆ es compacto y ası cualquier

secuencia de elementos en el debe necesariamente tener sub-sucesion convergente. 2

Para terminar con las definiciones de esta seccion, vamos a introducir un concepto muyimportante: la densidad de un conjunto en otro. La definicion es como sigue.

Definicion 3.2.7 Supongamos que tenemos dos conjuntos A, C ⊆ IRn tales que C ⊆ A. Dire-mos entonces que C es denso en A si y solo si cl C = A, es decir, si la adherencia (clausura) deC es igual a A.

A modo de ejemplo, es bien sabido que IQ es denso en IR. Esto quiere decir (y con estointerpretamos la definicion) que dado cualquier real x0 ∈ IR, existe una sucesion de racionalesqn tales que x = lım

nqn. En otras palabras, dado cualquier numero real, existe un racional tan

cerca como se quiera. Como ejercicio, construya una secuencia de racionales que converja a π.

Ejercicio 3.2.1 (i) Muestre que si A es abierto, entonces ∀an → a se tiene que existe n0 ∈ INtal que an ∈ A para todo a ≥ n0.

(ii) Muestre que si A es cerrado, entonces lo anterior no necesariamente es cierto. Ilustre conun contraejemplo.

(iii) Muestre que si an → a, entonces el conjunto A = an n ∈ IN es acotado. Es necesaria-mente A un conjunto cerrado?

(iv) Muestre que si A ⊆ B entonces int(A) ⊆ int(B).

(v) Muestre que si A ⊆ B entonces cl(A) ⊆ cl(B).

(vi) Muestre que si K es compacto y A cerrado, entonces K ∩A es compacto.

(vii) Definamos el siguiente conjunto en IRn:

H = x = (x1, x2, ..., xn)t ∈ IRn |n∑

i=1

αixi = c

donde αi y c son constantes. Determine si H es cerrado o abierto o compacto.

(viii) Determine el lımite (si existe) de las siguientes sucesiones: n·sin(n); 1/n·sin(n); n√

an + bn

con a > b > 0; p(n)/q(n) donde p y q son polinomios y el grado de p es menor que el gradode q; nk/kn con k ∈ IN fijo; kn/nk con k ∈ IN fijo.

Page 91: Libro Matematicas Para Economistas

90 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

(ix) Sea xt una sucesion tal que∣∣∣xt+1

xt

∣∣∣ → L. Muestre que si 0 < L < 1 entonces la sucesion xt

converge.

(x) Sea xt una sucesion tal que t√|xt| → L. Muestre que si 0 < L < 1 entonces la sucesion xt

converge.

(xi) Considere una sucesion acotada xk en IR cualquiera. Definamos entonces el conjunto

A = xk | k ∈ IN.

Muestre entonces que el conjunto A es compacto. Aplique este resultado para mostrar quela sucesion xk = sin(k) tiene una subsucesion convergente y muestra una de ellas.

3.3. Lımite de funciones y continuidad

El concepto de convergencia que disponemos lo hemos definido solo para sucesiones. Sinembargo, este se puede extender a las funciones, cuestion que sera de gran utilidad en todo loque sigue.

Definicion 3.3.1 Dada f : IRm → IRn diremos que f(x) converge a α ∈ IRn cuando x ∈ IRm

tiende a x0 ∈ IRm si para toda suecesion xn → x0 ocurre que la sucesion f(xn) converge a α.Esto se denotara por

lımx→x0

f(x) = α.

Indistintamente notaremos lımx→x0

f(x) = α o f(x) →x→x0 α.

Las propiedades de los lımites de funciones son similares a aquellas de los lımites usuales desucesiones. En resumen

Proposicion 3.3.1 Si lımx→x0

f(x) = α y lımx→x0

g(x) = β entonces lımx→x0

[f(x) + g(x)] = α + β

y lımx→x0

[f(x)g(x)] = αβ. Si β 6= 0 entonces lımx→x0

f(x)g(x) = α

β (el lımite de la suma, producto o

cuociente es la suma, producto o cuociente de los lımites).

Para terminar con este capıtulo, vamos a vincular todo lo anterior con el concepto de con-tinuidad de una funcion. Esta idea es muy importante en economıa (y en matematicas obvia-mente). De manera muy informal e intuitiva, lo que se persigue representar con la idea de decontinuidad es que lo que tiene que pasar finalmente pasa o, visto de otra forma, si la historia diceque un proceso va por cierto camino y todo indica que deberıa llegar a cierto estado, entonces,si el fenomeno se comporta de manera continua, sucedera lo que todos esperamos.

Definicion 3.3.2 Diremos que la funcion f : IRm → IRn es continua en x0 ∈ IRm si para todasucecion xt → x0 se tiene que

f(xt) → f(x0).

Si la funcion es continua en todos los puntos de un conjunto A ⊆ IRm, se dice que es continuaen A.

Page 92: Libro Matematicas Para Economistas

3.3. LIMITE DE FUNCIONES Y CONTINUIDAD 91

En otras palabras, de acuerdo a la definicion de lımite de funciones, f es continua en x0 si ysolo si

lımx→x0

f(x) = f(x0),

es decir, si

lımx→x0

f(x) = f( lımx→x0

x),

que, en trminos vulgares o nemotecnicamente, corresponde a decir que el “lımite pasa paraadentro”en el punto en cuestion.

Ahora bien, una forma equivalente de escribir lo anterior es por medio de intervalos. La ideaque esta detras de la continuidad es que en la medida que x es cercano a x0 (x → x0) entonces lasrespectivas imagenes tambien lo son (f(x) → f(x0)), donde la cercanıa es tan “proxima” comose quiera. En otras palabras, para todo ε > 0 (valor que mide la cercanıa entre las imagenes dela funcion) ha de existir δ > 0 (valor que mide la cercanıa entre los puntos del dominio, queobvamente dependera de la cercanıa que se quiere lograr en las imagenes) tal que

‖x− x0‖ ≤ δ ⇒ ‖f(x)− f(x0)‖ ≤ ε.

La siguiente proposicion es directa de los conceptos de suma y ponderacion por escalar defunciones y de las propiedades de los lımites que hemos mencionado.

Proposicion 3.3.1 Dado A ⊆ IRm y dado F = f : A → IRm, f continua en A, se tiene queF es un espacio vectorial con la suma usual de funciones y la ponderacion por escalar.

Lo anterior nos dice en particular que la suma de funciones continuas es continua y que laponderacion por escalar de ellas tambien lo es. Una cuestion interesante del espacio vectorialanterior es que su dimension es infinita, razon por la cual no se puede interpretar o hacercorresponder con IRn para algun n ∈ IN . Mas adelante volveremos sobre esto.

Nota. 3.3.1 Interpretacion informal. Que la sucesion xt se aproxime a x0, a priori noimplica para nada que f(xt) se deba aproximar a f(x0). En terminos practicos e informales,podemos pensar que xt es el tiempo y que x0 es una hora de cita. La funcion evaluada en xt nosentrega la posicion en que nos encotramos. Nuestro objetivo es llegar a determinado lugar en eltiempo x0, lugar que corresponderı a f(x0). Uno podrıa pensar que mientras mas cerca esta xt

de x0, mas cerca del lugar de encuentro nos encontramos, es decir, f(xt) deberıa tender a f(x0).Pero todos sabemos que esto no necesariamente es cierto. Puede suceder que justo antes deellgar al lugar de encuentro f(x0) ocurra algun imprevisto que nos obliga a cambiar de posicion(por una emergencia de ultimo minuto, por que se olvido de algo, por un accidente, etc). Eneste caso, el fenomeno de encuetro definido no serıa continuo, ya que, a pesar de que toda lahistoria nos lleva a pensar que llegaremos al lugar de encuetro, finalmente no ocurre lo predeciblesino que algo distinto. Si fuera que siempre ocurre lo que uno espera que ocurra, es decir, quecuando xt tiende a x0 (xt → x0) se tenga que f(xt) tienda de f(x0) (f(xt) → f(x0)) entonceshay continuidad. Esto se modela y define formalmente de acuerdo a la definicion anterior. 2

En el caso de una funcion de IR en IR, graficamente las funciones continuas no tienen saltos.Intuitivamante, el concepto corresponde mas menos a la idea que el grafo de una funcion continuase puede dibujar sin levantar el lapiz. A partir de lo anterior, la forma de no ser continua es

Page 93: Libro Matematicas Para Economistas

92 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

teniendo saltos o que un punto se escape de la tendencia con que venıa la funcion. La siguientefigura ilustra lo anterior:

(1) (2) (3)

x x

a

a

0 0

El Grafo (1) corresponde al de una funcion continua, el (2) no es continuo ya que tiene unsalto, mientras que el (3) tampoco es continuo ya que existe un punto que escapa a la tendencia.

Ejemplo 3.3.1 La mayorıa de las funciones usuales con que uno trabaja son continuas en todoslos puntos del espacio: los polinomios, las trigonometricas, las exponenciales, los logaritmos.

Proposicion 3.3.2 Dadas dos funciones continuas f, g : IR → IR se tiene que la suma, pro-ducto, cuociente (donde este definido) y composicion de ellas es continua.

Prueba. Esto es simplemente la propiedad de que la suma, producto y cuociente de sucesionesque convergen tambien existe y corresponde a la suma, producto y cuociente de los respectivoslımites. Para el caso de la composicion es directo: si xk → x0 entonces yk = g(xk) → y0 = g(x0).Luego, f(yk) → f(y0), es decir, (f g)(xk) → (f g)(x0). 2

Para funciones de varias variables en varias variables (f : IRm → IRn), la continuidad de lamisma es equivalente a la continuidad de cada una de las componentes.

Una de las propiedades mas importantes de las funciones continuas se relaciona con el he-cho que eveluada esta en conjuntos compactos, la imagen resultante es tambien un conjuntocompacto.

Proposicion 3.3.3 Si K ⊆ IRm es un conjunto compacto y f : IRm → IRn es una funcioncontinua, entonces f(K) es un conjunto compacto.

Demostracion. Veamos en primer lugar que f(K) es cerrado. Para ello, sea zt ∈ f(K) unasucesion convergente, digamos, zt → z0. Por definicion se tiene que existe xt ∈ K tal quezt = f(xt). Como zt es convergente, sigue que xt tambien lo sera (por que?) y, ya que K escerrado, el lımite de xt (que denotamos x0) esta en K. De la continuidad de f se tiene finalmenteque z0 = f(x0), y, por lo tanto, z0 ∈ f(K), que prueba la cerradura de f(K). Veamos ahoraque f(K) es acotado. En caso contrario, existe yt ∈ f(K) tal que ‖yt‖ → ∞. Sea entonces xt

tal que yt = f(xt). Sin perdida de generalidad podemos suponer entonces que xt es convergente(esta en un compacto), digamos, xt → x0. Como yt = f(xt) y f(xt) → f(x0) ∈ K, se tiene queyt tambien es convergente, y luego es acotada. Por lo tanto, no puede ser que ‖yt‖ → ∞, con locual f(K) es acotado, es decir, compacto. 2

Para una segunda propiedad importante de las funciones continuas, necesitamos definir al-gunos conceptos.

Page 94: Libro Matematicas Para Economistas

3.3. LIMITE DE FUNCIONES Y CONTINUIDAD 93

Definicion 3.3.3 Dado K ⊆ IRn y f : K → IR una funcion cualquiera, definamos el maximoy el mınimo de f en en K como xM ∈ K y xm ∈ K respectivamente, de tal forma que

f(xM ) ≥ f(x), ∀x ∈ K

f(xm) ≤ f(x), ∀x ∈ K.

Ejemplo 3.3.2 Para un conjunto K y una funcion cualquiera, estos maximos y mınimos notienen por que existir. Por ejemplo, si K = IR y f(x) = x2, entonces xM no existe, pero si xm

que vale cero. Si K = IR y f(x) = −3x + 5 entonces ni xM ni xm existen.

Sin embargo, a pesar de lo anterior, para el caso de funciones continuas y conjuntos compactosse puede demostrar que siempre existen estos maximos y mınimos, tal como se muestra en lasiguiente proposicion.

Proposicion 3.3.4 Dada una funcion continua f : K → IR con K compacto, entonces xM yxm existen.

Prueba. De la proposicion anterior, sabemos que f(K) es un conjunto compacto y por lo tantoes cerrado y acotado en IR. Denotemos por S el supremo de este conjunto. Recordemos que pordefinicion de supremo8, se cumple que S ≥ y, ∀y ∈ f(K) y ademas para todo ε > 0, ∃ yε ∈f(K) | S − ε ≤ yε. Dado t ∈ IN , definamos ε = 1/t y entonces tenemos una sucesion yt tal que

S − yt ≤ 1t, ∀t ∈ IN.

Obviamente −1t ≤ S − yt y por lo tanto |S − yt| ≤ 1

t , ∀t ∈ IN . De esta manera, dado ε > 0existe T ∈ IN (de hecho, cualquier T entero mayor que 1

ε ) tal que para todo t ≥ T se cumpleque |S−yt| ≤ ε. En consecuencia yt → S. Como f(K) es compacto, obviamente es cerrado y porlo tanto S ∈ f(K). Por otro lado, dado que yt ∈ f(K), existe xt ∈ K tal que f(xt) = yt. ComoK es compacto, se tiene que xt admite una sub-sucesion convergente, digamos xt′ → x∗, la queobviamente debe verificar que f(xt′) = yt′ . Pero yt′ debe converger a S ya que yt es convergente ypor lo tanto cada subsucesion de ella debe ser tambien convergente. De esta manera, f(xt′) → S.

Ahora, puesto que f es continua, se concluye que lımt′

f(xt′) = f

(lımt′

xt′

)= f(x∗) = S, con lo

cual hemos encontrado un punto x∗ tal que f(x∗) = S, es decir, tal que f(x∗) ≥ y, ∀y ∈ f(K),lo que es equivalente a decir que f(x∗) ≥ f(x), ∀x ∈ K. Para el caso del mınimo la prueba esidentica y se deja como ejercicio. 2

Una forma equivalente de presentar la proposicion anterior corresponde a decir que unacondicion suficiente para que el problema de optimizacion encontrar un punto en un cojunto Kde tal manera que la funcion f se maximice o minimice tenga solucion, es que f sea continuay que K sea compacto. En otras palabras, si f es continua y K compacto, el problema deoptimizacion

mın (max) f(x)s.a x ∈ K

tiene solucion. Note que la afirmacion es tener solucion, en ningun caso hemos dicho que esunica.

8Ver seccion de conjuntos.

Page 95: Libro Matematicas Para Economistas

94 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

Ejemplo 3.3.3 Consideremos el problema de maximizacion de beneficio de un consumidor

max u(x1, x2)s.a p1x1 + p2x2 ≤ Rx1 ≥ 0, x2 ≥ 0

donde u(·) es una funcion de utilidad continua, p1, p2 son precios positivos y R un ingresopositivo. Para demostrar que tal problema tiene solucion (que corresponde a la demanda delindividuo), bastarıa con probar que el conjunto de restriccion

K = (x1, x2) ∈ IR2 | p1x1 + p2x2 ≤ R, x1 ≥ 0, x2 ≥ 0es compacto. En efecto, en primer lugar notemos que este conjunto es la interseccion de dosconjuntos cerrados: por un lado el hiperplano p1x1 + p2x2 ≤ R y por otro lado el cuadrantepositivo IR2

+. Para probar que es acotado, notemos en primer lugar que todos sus elementosson acotados por abajo (por cero). Resta entonces probar que son acotados por arriba, lo quees directo considerando que el mayor valor que puede tomar x1 es cuando x2 = 0, es decir,x1max = R/p1, y el mayor valor que puede tomar x2 es x2max = R/p2. Con esto, la norma detodo elemento de K es acotada. Luego, el problema tiene solucion. 2

Ejemplo 3.3.4 Problema de la oferta de una firma. Una firma puede ser representadapor lo que en ecoonmıa se llama su conjunto de produccion, que simplemente resume todas lasopciones tecnologicas que esta tiene para transformar los inputs en outputs. Estos conjuntos sonde la forma Y ⊆ IR`, donde ` denota el numero de bienes en la economıa. Ası, un vector y ∈ IR`

se dice que es un plan de produccion de la firma si y ∈ Y . En general, los planes de producciony ∈ Y han de tener componentes negativas (que se interpretan como inputs o insumos delproceso productivo) y componentes positivas (que corresponden a los productos u outputs de lafirma dados los insumos correspondientes - componentes negativas de dicho vector-). Ası, dadoun precio de mercado p ∈ IR`

++ por los bienes de la economıa, sigue que al escoger un plan deproduccion y ∈ Y , el beneficio neto de la firma (ingreso menos costo) es simplemente p · y. Porlo tanto, el problema que define la oferta de la firma es

max p · ys.a y ∈ Y.

Con todo lo anterior, queda claro entonces que si Y es compacto, entonces la oferta de lafirma esta bien definida, esto ya que la funcion objetivo es continua (de hecho, es lineal).

Definicion 3.3.4 Diremos que A es conexo si para todo par de puntos a, b ∈ A, existe unafuncion continua φ : [0, 1] → A tal que φ(0) = a y φ(1) = b.

En otras palabras, la conexidad de un conjunto nos garantiza que es posible ir desde un puntoa otro del mismo a traves de un camino continuo. La siguiente figura ilustra la idea conexidad:

No es conexo

Es conexo

Page 96: Libro Matematicas Para Economistas

3.3. LIMITE DE FUNCIONES Y CONTINUIDAD 95

Un ejemplo importante de conjunto conexo es IR (y IRn tambien). En efecto, dados cualquierpar de puntos a, b ∈ IR existe una funcion continua h : [0, 1] → IR tal que h(0) = a y h(1) = b.Una funcion es, por ejemplo, h(x) = (b − a)x + a. A partir de esta definicion, se tiene que unacaracterizacion de la conexidad es la siguiente.

Proposicion 3.3.5 Un conjunto A es conexo si no existen dos conjuntos abiertos disjuntos V1

y V2 tales que V1 ∪ V2 = A.

Utilizando la nocion de conexidad anterior, podemos mostrar el siguiente resultado.

Proposicion 3.3.6 Supongamos que f : IR → IR es continua y que para algun x0 se tiene quef(x0) < 0 (en rigor, ≤ 0) y para algun x1, f(x1) > 0 (en rigor, ≥ 0). Entonces se tiene quenecesariamente debe existir un valor x tal que f(x) = 0.

Prueba. En caso contrario, se tiene que para todo x ∈ IR, o bien f(x) > 0 o bien f(x) < 0.En consecuencia IR se puede particionar en dos conjuntos, digamos R1 = x ∈ IR | f(x) > 0 yR2 = x ∈ IR | f(x) < 0, de modo que que R1 ∩R2 = ∅ y obviamente IR = R1 ∪R2. Con estose tiene que IR no serıa conexo, lo que es una contradiccion. Por lo tanto, debe ser que existex ∈ IR tal que f(x) = 0.

Para terminar esta seccion, la siguiente proposicion.

Proposicion 3.3.7 Supongamos que f : IR → IR es continua y que f(x0) > 0 para algunx0 ∈ IR. Entonces existe una bola abierta en torno a x0 donde la funcion sigue siendo positiva.

Prueba. Dado ε > 0 sabemos que existe δ > 0 tal que |x− x0| ≤ ε entonces |f(x)− f(x0)| ≤ ε,es decir, −ε + f(x0) ≤ f(x) ≤ ε + f(x0). Como f(x0) > 0, si ε es suficientemente pequeno, setiene que −ε+ f(x0) > 0 y por lo tanto, f(x) > 0 para todo x en alguna bola B(x0, δ). En otraspalabras, si una funcion continua es positiva en un punto, lo sera en un vecindad (bola abierta)en torno a dicho punto. De hecho, si fuera que para algun α ∈ IR dado, se cumple que f(x0) > αentonces habra una vecindad en torno a x0 donde la funcion seguira siendo mayor que α. Laprueba es obvia, considerando la propiedad anterior aplicada a la funcion g(x) = f(x)− α. 2

Ejercicio 3.3.1 [∗ ∗ ∗]Supongamos que f : K → IR es continua y que K es compacto. Como sabemos, f(K) es

un subconjunto compacto de IR y ademas la funcion alcanza su maximo y su mınimo dentro delconjunto. Sean xM , xm ∈ K los puntos donde se maximiza y minimiza la funcion en K y seanM = f(xM ) y m = f(xm) los valores maximo y mınimo respectivamente. Sea ahora m ≤ α ≤ Mun valor intermedio cualquiera entre los extremos. Muestre entonces que existe xα ∈ K tal quef(xα) = α.

Ejercicio 3.3.2 a.- Determine la condicion sobre α para que la funcion f : IR → IR definidapor

f(x) =

x2 + 4 si x ≥ 0x + α si x < 0

.

sea continua.

b.- Sabiendo que lımx→0

sin(x)x = 1 y dada la funcion f : IR \ 0 → IR definida por f(x) = sin(x)

x .Definamos la extension de f a todos los reales como g : IR → IR tal que para todo x 6= 0,g(x) = f(x) y g(0) = 1. Muestre entonces que g es continua en todo IR.

Page 97: Libro Matematicas Para Economistas

96 CAPITULO 3. TOPOLOGIA Y CONTINUIDAD

c*.- Dada f : IR → IR una funcion continua y dado B ⊆ IR un conjunto abierto, muestre quef−1(B) es un conjunto abierto.

d.- Dado un polinomio p(x) = x3 + a2x2 + a1x + a0, con a2, a1 y a0 constantes, se pide:

d.1 Muestre que lımx→+∞ p(x) = +∞ y que lım

x→−∞ p(x) = −∞.

d.2 Concluya que existen reales x1 y x2 tales que p(x1) < 0 y p(x2) > 0. De esto, deduzcaque existe un real x tal que p(x) = 0.

d.3 Muestre que [d,2] se cumple para el caso general de un polinomio de grado imparcualquiera.

e.- Suponga que A es una matriz de n× n y definamos la funcion f : IRn → IRn como

f(x) = Ax.

e.1 Muestre que f(x + y) = f(x) + f(y) y que f(λx) = λf(x), ∀x, y ∈ IRn y ∀λ ∈ IR(condiciones de linealidad).

e.2 Muestre que f es continua en todo IRn.

e.3* Suponga ahora una funcion f : IRn → IRn cualquiera que cumple con las condicionesde linealidad anterior. Muestre entonces que si f es continua en 0 entonces es con-tinua en todo punto de IRn.

f.-** Suponga que la funcion f : [0, 1] → [0, 1] es continua. Definamos la funcion g : [0, 1] → [0, 1]tal que g(x) = f(x)− x.

f.1 Muestre que g es continua y que g(0) ≥ 0 y que g(1) ≤ 0.

f.2 Concluya que existe x ∈ [0, 1] tal que g(x) = 0. De esto, deduzca que f(x) = x. Eneste caso se dice que f tiene un punto fijo en [0, 1]. Una extension de esta propiedada una funcion continua f : B(0, 1) → B(0, 1) (bola unitaria de centro cero y radio 1en IRn) se llama Teorema del punto fijo de Brower, que pasamos a enunciar:dada f : B → B una funcion continua de la bola unitaria (rario uno) decentro 0IRn en si misma admite un punto fijo, es decir, existe x ∈ B tal quef(x) = x.

Page 98: Libro Matematicas Para Economistas

Capıtulo 4

Diferenciacion de funciones

4.1. Introduccion

El concepto de continuidad nos entrega cierta condicion mınima de regularidad de una fun-cion. En algun sentido, nos dice que podemos caminar sobre el grafo de la funcion sin encontrarsalto u hoyos, es decir, sin caernos. Pero nada nos dice sobre si el camino recorrido es suave o no,si efectivamente existen puntas que hacen muy dıficil el traslado. Una condicion de suavidad delgrafo es algo extra que podrıa ser interesante de considerar, tanto por que en algun sentido nosmostrarıa que el fenomeno modelado por la funcion podrıa no presentar cambios bruscos antecambios en las variables como porque (veremos pronto) nos permitirıa hacer aproximaciones delmismo a traves de funciones mas simples. Lo que deseamos imponer ahora sobre la funcion noes solo la posibilidad de caminar en el grafo, sino que algo mas fuerte, que es la posibilidad deesquiar sobre el mismo, es decir, deslizar por sobre el grafo una pequena recta tangente. Esta esprecisamente la condicion de derivabilidad de una funcion, cuestion que pasamos a estudiar.

4.2. Definiciones basicas

Definicion 4.2.1 Dada f : IR → IR, diremos que la funcion es derivable en x0 si el lımite

lımh→0

f(x0 + h)− f(x0)h

= lımx→x0

f(x0 + x)− f(x0)x− x0

existe. En tal caso, dicho valor se representa por f ′(x0).

Ejemplo 4.2.1 Dada la funcion f : IR → IR tal que f(x) = x2, notemos que:

lımh→0

f(x0 + h)− f(x0)h

= lımh→0

(x0 + h)2 − x02

h= lım

h→0

x20 + 2x0h + h2 − x2

0

h

es decir, lımh→0

2x0 + h = 2x0. Por lo tanto, para todo x0 la derivada de la funcion existe y en el

punto x0 vale f ′(x0) = 2x0. 2

Ejemplo 4.2.2 Dada la funcion f : IR → IR tal que f(x) = |x|, notemos que en x0 = 0 se tieneque

lımh→0

f(x0 + h)− f(x0)h

= lımh→0

|h| − 0h

.

97

Page 99: Libro Matematicas Para Economistas

98 CAPITULO 4. DIFERENCIACION DE FUNCIONES

Ahora, dependiendo de si h → 0 lo hace por valores positivos (se denota h → 0+) o por valoresnegativos (se denota h → 0−) se tiene que el lımite puede valer −1 o +1, por lo cual no existe.De esta manera, la funcion f(x) = |x| no es derivable en x0 = 0. Note que la funcion escontinua en todo punto y aun ası puede no ser derivable. 2

Definicion 4.2.2 Diremos que una funcion f : IRn → IR admite derivada parcial en x0 =(x1

0, x20, ..., x

n0 ) con respecto a la j-esima variable si el lımite

lımh→0

f(x10, x

20, ..., x

j0 + h, xj+1

0 , ..., xn0 )− f(x1

0, x20, ..., x

j0, x

j+10 , ..., xn

0 )h

existe. En tal caso dicho lımite se denota ∂f(x0)∂xj

.

Definicion 4.2.3 Si f : IRn → IR admite derivada parcial para cada una de las variables enel punto x0, se define entonces el gradiente de la misma como el vector columna de derivadasparciales respectivas, es decir,

∇f(x0) =(

∂f(x0)∂x1

,∂f(x0)

∂x2, ...,

∂f(x0)∂xn

)t

=

∂f(x0)∂x1

∂f(x0)∂x2

.

.

.∂f(x0)∂xn

.

Definicion 4.2.4 Si para funcion f : IR → IR la derivada existe en todo punto, entonces quedadefinida una funcion de IR en IR, la que se llama (abusando del lenguaje) derivada. Dada f ,esta funcion se denota usualmente por f ′ : IR → IR.

Ejemplo 4.2.3 Para el caso de la funcion f(x) = x2, la funcion derivada respectiva (simple-mente la derivada) es f ′(x) = 2x.

Ejemplo 4.2.4 Interpretacion geometrica de la derivada.Consideremos una funcion f : IR → IR derivable en todo IR y sea x0 un punto dado. Entonces,

si tomamos h > 0, notemos que los puntos (x0, f(x0)) y (x0 + h, f(x0 + h)) son dos puntos delgrafo, por el cual podemos pasar una recta secante S tal como se muestra en la siguiente figura

x0 x0+ h

S

T

f

Notemos ahora que si h → 0 entonces la recta secante pasa a ser una recta tangente T y ental caso la derivada de la funcion en el punto corresponde simplemente a la pendiente de dicharecta.

Page 100: Libro Matematicas Para Economistas

4.2. DEFINICIONES BASICAS 99

Ejemplo 4.2.5 Otra forma de interpretar la derivada es considerarla como un couciente devariaciones. De esta manera, ∂f(x∗)

∂xicorresponde a la variacion de f en x∗ cuando la variable i

se se mueve ligeramente. De hecho, en economıa es frecuente el siguiente razonamiento: puestoque

∂f(x0)∂xj

= lımh→0

f(x10, x

20, ..., x

j0 + h, xj+1

0 , ..., xn0 )− f(x1

0, x20, ..., x

j0, x

j+10 , ..., xn

0 )h

,

sigue que cuando h es pequeno

∂f(x0)∂xj

' f(x10, x

20, ..., x

j0 + h, xj+1

0 , ..., xn0 )− f(x1

0, x20, ..., x

j0, x

j+10 , ..., xn

0 )h

,

por lo cual, si h = 1

∂f(x0)∂xj

' f(x10, x

20, ..., x

j0 + 1, xj+1

0 , ..., xn0 )− f(x1

0, x20, ..., x

j0, x

j+10 , ..., xn

0 ).

Ası, la derivada parcial de f c.r a xj en x0 es una medida del incremento de la funcion cuando lavariable xj pasa de xj

0 a xj0+1, manteniendo todo el resto constante. Esto motiva las definiciones

de cambio marginal ampliamente utilizadas en economıa.

Ejemplo 4.2.6 Un concepto muy utilizado en economıa es elasticidad. Se define la elasticidadde la funcion f c.r a la variable xj en el punto x0 como la variacion porcentual de la misma,evaluada en x0, ante un cambio porcentual de la variable xj . En otras palabras, sidenotamos por εxj ,f (x0) la elasticidad, se tiene que

εxj ,f (x0) =

(f(x1

0,x20,...,xj

0+h,xj+10 ,...,xn

0 )−f(x10,x2

0,...,xj0,xj+1

0 ,...,xn0 )

f(x10,x2

0,...,xj0,xj+1

0 ,...,xn0 )

)

(xj0+h−xj

0

xj0

) .

Ordenando terminos, se tiene que

εxj ,f (x0) =f(x1

0, x20, ..., x

j0 + h, xj+1

0 , ..., xn0 )− f(x1

0, x20, ..., x

j0, x

j+10 , ..., xn

0 )xj

0 + h− xj0

· f(x0)xj

0

.

Aproximando la primera expresion por la derivada (considerando h pequeno) se tiene en-tonces que

εxj ,f (x0) ' ∂f(x0)∂xj

· f(x0)xj

0

que normalmente se asume como la definicion de elasticidad.

Ejemplo 4.2.7 Una funcion continua no tiene por que ser derivable.Como sabemos, las funciones continuas no tienen saltos. Por otro lado, las funciones difer-

enciables (es decir, aquellas en que se puede calcular la derivada) son suaves: se puede esquiar.Sin embargo, una funcion continua no tiene por que ser suave, es decir, una funcion continua notiene porque ser derivable. En la siguiente figura se ilustra lo anterior:

Page 101: Libro Matematicas Para Economistas

100 CAPITULO 4. DIFERENCIACION DE FUNCIONES

1 2 3

x0x0

La funcion 1 no es continua (tiene un salto); la funcion 2 es continua pero no es derivable enx0 (no es suave en x0); la funcion 3 es derivable en todos los puntos.

Note que toda funcion que es derivable es continua, pero la recıproca no es cierta: existenfunciones continuas que no son derivables en algun punto (ejemplo 2 de figura anterior).

Definicion 4.2.5 Derivadas de orden superior.Para definir derivadas de orden superior de una funcion f : IR → IR, se procede en forma

recursiva:f (n)(x0) =

(f (n−1)(x0)

)′

f (1)(x0) = f ′(x0).

Para el caso de una funcion de dos o mas variables, la segunda derivada es una matriz quese llama Hessiano. Sus elementos son la segundas derivadas parciales de f , que se definen comosigue:

∂2f(x0)∂xi∂xj

:=∂

∂xi

(∂f(x0)

∂xj

),

con i, j = 1, 2, ..., n.

De esta manera, la matriz Hessiana de f corresponde a:

H(f, x0) =

∂2f(x0)∂x1∂x1

∂2f(x0)∂x2∂x1

... ∂2f(x0)∂xn∂x1

. . .

. . .

. . .∂2f(x0)∂x1∂xn

∂2f(x0)∂x2∂xn

... ∂2f(x0)∂xn∂xn

Notas.Dada f : IRn → IR, el Hassiano es una matriz de n× n.Cuando la funcion es suficientemente regular1 se tiene que

∂2f(x0)∂xi∂xj

=∂2f(x0)∂xj∂xi

,

de tal forma que el Hessiano es una matriz simetrica. 2

Las reglas basicas de derivacion se resumen en lo que sigue.1Solo basta que las primeras derivadas parciales sean continuas.

Page 102: Libro Matematicas Para Economistas

4.2. DEFINICIONES BASICAS 101

Proposicion 4.2.1 Dadas f, g : IR → IR derivables, se tiene entonces que:

a.- (f + g)′(x0) = f ′(x0) + g′(x0): la derivada de la suma es la suma de las derivadas.

b.- (f · g)′(x0) = f(x0) · g′(x0) + f ′(x0) · g(x0): regla del producto.

c.-(

fg

)′(x0) = g(x0)·f ′(x0)−g′(x0)·f(x0)

g2(x0): regla del cuociente.

d.- Dada h(x) = f(g(x)) entonces h′(x) = f ′(g(x)) · g′(x): regla de la cadena para una funcionreal.

e.- Dada f : IRn → IR y dadas funciones xi : IRk → IR, de modo que xi ≡ xi(p1, p2, ..., pk),entonces se tiene que (regla de la cadena para varias variables)

∂f(x1, x2, ..., xn)∂pj

=n∑

i=1

∂f(x)∂xi

· ∂xi

∂pj, ∀j = 1, ..., k.

Nota. Para el caso de funciones de variables, las reglas a.-, b.- y c.- son similares a las indicadas.

Ejemplo 4.2.8 Ilustremos la regla de la cadena para una funcion de varias variables. Supong-amos dada f : IRn → IR y φ : IRk → IRn. Definamos g : IRk → IR tal que g(p) = f(φ(p)),es decir, g = f φ, donde p = (p1, ..., pk) ∈ IRk. Supongamos que las componentes de φ sonφ1, φ2, ..., φn de modo que

g(p1, p2, ..., pk) = f(φ1(p1, ..., pk), ..., φn(p1, ..., pk)).

A modo de ejemplo, en este problema p1, ..., pk pueden representar precios de algunos factores,mientras que xi = φi(p1, ..., pk) corresponden a demandas por bienes (consumos). La funcion deutilidad f depende directamente de los consumos, pero en segundo orden de los precios. Cuandocalculamos ∂f(x)

∂xiestamos analizando el impacto de un cambio en el consumo del bien i sobre la

utilidad, suponiendo el resto constante. En cambio, cuando calculamos ∂f(x)∂pj

debemos considerardos efectos que inciden en el cambio. Por un lado, al modificar el precio pj tenemos impacto entodos los consumos (derivada de φ c.r al precio, impacto de primer orden) y, en forma adicional,se produce un efecto sobre la utilidad dados los cambios en los consumos (derivada de f c.r axi). Luego, para analizar el impacto del cambio en el precio se deben considerar los dos efectosmencionados. Esta es la regla de la cadena para el problema. Intuitivamente (que de hecho es elresultado formal) se tiene lo siguiente:supongamos que cambia el precios pj. Esto implica un cambio en la demanda de cada bien(φi → xi), medido por la derivada

∂xi(p1, ..., pk)∂pj

, i = 1, ..., n; j = 1, ..., k.

El cambio en el consumo de los bienes implica un cambio en la utilidad dado por

f(x1, ...., xn)∂xi

, i = 1, ..., n.

Luego, el cambio global es la suma de los cambios ponderados, es decir,

∂f(x1, ..., xn)∂pj

=∂f(x1, ..., xn)

∂x1· ∂x1(p1, ..., pk)

∂pj+ ... +

∂f(x1, ..., xn)∂xn

· ∂xn(p1, ..., pk)∂pj

,

Page 103: Libro Matematicas Para Economistas

102 CAPITULO 4. DIFERENCIACION DE FUNCIONES

que es la regla de la cadena.

Ejemplo 4.2.9 a.- Para la funcion p(x) = a0 + a1x + a2x2 + ... + anxn, se tiene que

p(n)(x) = an · n!

donde n! ≡ 1 · 2 · 3 · · · n: factorial de n.

b.- Se tienen las siguientes formulas para las derivadas de las funciones indicadas:

f(x) = xk → f ′(x) = kxk−1 → f (m)(x) = k · (k − 1) · (k − 2) · · · (k −m + 1)xk−m

f(x) = Ln(x) → f ′(x) = 1x → f (2)(x) = − 1

x2 → f (n)(x) = (−1)n+1 · 1xn

f(x) = ex → f ′(x) = ex → f (n)(x) = ex

f(x) = cos(x) → f ′(x) = −sin(x)

f(x) = sin(x) → f ′(x) = cos(x).

c.- Dada la funcion f(x) = xx, notemos que

g(x) = Ln(f(x)) = xLn(x)

luego, aplicando cadena se tiene que

g′(x) =f ′(x)f(x)

= x · 1x

+ Ln(x)

y por lo tanto,

f ′(x) = f(x) · (1 + Ln(x)) = xx · (1 + Ln(x)) .

4.3. Aplicaciones de la derivada y resultados complementarios

4.3.1. El Teorema de la Funcion implıcita

El Teorema de la Funcion Implıcita nos da las condiciones para despejar una variable de unadeterminada expresion funcional en terminos de las restantes. Por ejemplo, supongamos que lafuncion de utilidad de un individuo es u(·) y que dada la curva de indiferencia definida poru(x1, x2) = α, deseamos establecer la relacion que existe entre x1 y x2: sera posible despejar x1

en funcion de x2 a partir de la relacion anterior?La respuesta se tiene en el siguiente teorema:

Teorema 4.3.1 Sea f : IR× IRn−1 → IR una funcion tal que

f(x01, x

02, x

03, ..., x

0n) = 0.

Si ∂f(x0)∂x1

6= 0 entonces existe una funcion diferenciable φ tal que

x01 = φ(x0

2, x03, ..., x

0n)

y f(φ(x2, x3, ..., xn), x2, x3, ..., xn) = 0 para todo (x2, x3, ..., xn) en una vecidad de (x02, x

03, ..., x

0n).

Page 104: Libro Matematicas Para Economistas

4.3. APLICACIONES DE LA DERIVADA Y RESULTADOS COMPLEMENTARIOS 103

Mas aun, a partir del caracter diferenciable de la funcion φ podemos calcular explıcitamentela derivada con la regla de la cadena. Ya que f(φ(x2, x3, ..., xn), x2, x3, ..., xn) = 0, derivando c/ra xj , j = 2, 3, ..., n se tiene que

∂f(φ(x2, x3, ..., xn), x2, x3, ..., xn)∂xj

= 0,

luego, por cadena se tiene que:

∂f(φ(x2, x3, ..., xn), x2, x3, ..., xn)∂x1

· ∂φ(x2, x3, ..., xn)∂xj

+∂f(φ(x2, x3, ..., xn), x2, x3, ..., xn)

∂xj= 0.

De esta manera:

∂φ(x2, x3, ..., xn)∂xj

= −∂f(φ(x2,x3,...,xn),x2,x3,...,xn)

∂xj

∂f(φ(x2,x3,...,xn),x2,x3,...,xn)∂x1

, j = 2, 3, ..., n.

4.3.2. El Teorema del Valor Medio

Este teorema nos permite obtener propiedades de la funcion en terminos de las propiedadesde la derivada de la misma. Para fijar ideas, consideremos el siguiente grafico:

f

a c b

A

B

Dada la funcion f : [a, b] → IR, el valor promedio de f en el intervalo considerado es

f(b)− f(a)b− a

,

que es la pendiente de la recta AB. De la figura es claro que la tangente a la curva por el puntoc tiene la misma pendiente que la recta AB, es decir,

f ′(c) =f(b)− f(a)

b− a.

El Teorema del valor medio afirma exactamente lo anterior.

Teorema 4.3.2 Dada una funcion derivable f : [a, b] → IR, entonces existe c ∈ [a, b] tal que

f ′(c) =f(b)− f(a)

b− a.

Ejercicio 4.3.1 Supongamos que Vina del Mar esta a 100 Km. de Santiago y que velocidadmaxima permitida en la ruta es de 100 Km/hra. Diego parte de Santiago a las 13 hrs. y llegaa Vina a las 13:55. Un carabinero recibe todos los antecedentes anteriores y decide sacarle unparte a Diego. Esta en lo correcto? Justifique utilizando TVM.

Page 105: Libro Matematicas Para Economistas

104 CAPITULO 4. DIFERENCIACION DE FUNCIONES

Ejercicio 4.3.2 Utilice el TVM para probar que si la derivada de una funcion es estrıctamentepositiva (f ′(x) > 0,∀x), entonces la funcion es creciente, es decir , si x < y entonces f(x) <f(y).

4.3.3. Funciones Lipschitzianas y punto fijo

Una funcion f : IRn → IRn se dice localmente Lipschitziana si para todo x0 ∈ IRn existe unavecindad Vx0 y una constante L > 02 tal que para todo x, y ∈ Vx0 se tiene que

‖f(x)− f(y)‖ ≤ L · ‖x− y‖.Si la constante L > 0 no depende del punto, se dice que la funcion es Lipschitziana. Dicha

constante se denomina constante de Lipschitz de f . Cuando la constante de Lipschitz de fes menor que uno se dice que la funcion es contractante3. Por que este concepto? Vamos aver que una funcion contractante tiene lo que se denomina un punto fijo, nocion que es muyimportante en teorıa del equilibrio.

Teorema 4.3.3 Si f : IRn → IRn es una funcion contractante, entonces existe un unico x∗ ∈ IRn

tal que x∗ = f(x∗).

Cual es la importancia de este resultado? Veamos un ejemplo general: los problemas deexistencia de equilibrio de una economıa son escencialmente problemas de punto fijo. Otro ejemloviene de buscar soluciones a ecuaciones. De hecho, supongamos que el problema consiste enresolver la ecuacion f(x) = 0, que en forma equivalente se puede plantear como encontrar x talque f(x)− x = x. Definiendo g(x) = f(x)− x, el problema anterior consiste entonces en buscarun punto fijo de g.

Si la funcion es contractante, como se encuentra el punto fijo? La forma es sencilla: dadox0 ∈ IRn cualquiera, definamos la siguiente sucesion en forma recursiva:

xt+1 = f(xt), t ∈ IN

x0 = x0.Graficamente la situacion es como sigue:

x0 xn xn+1

y = x

f(x)f(x )n

Pto. fijo de f

Nota.

• El resultado anterior se denomina Teorema del Punto Fijo de Banach.

De hecho, una version mas general establece que:

2La constante depende del punto x0.3Estos conceptos se definen en forma general para cualquier funcion f : IRn → IRm.

Page 106: Libro Matematicas Para Economistas

4.3. APLICACIONES DE LA DERIVADA Y RESULTADOS COMPLEMENTARIOS 105

dado C ⊆ IRn un subconjunto no vacıo, y cerrado IRn y sea f : C → C una funconcontractante en C; entonces existe un unico x∗ ∈ C tal que f(x∗) = x∗. Mas aun, dadox0 ∈ C y dado xt+1 = f(xt), se tiene que x∗ = lım

t→inftyf(xt).

• Las aplicaciones de este resultado se relacionan con probar la existencia de soluciones dealguna ecuacion, problema que puede provenir, por ejemplo, de demostrar la existencia deequilibrio en una determinada economıa, de probar la existencia de soluciones de algunaecuacion diferencial o de recurrencia, de probar que alguna ecuacion determinada tienesolucion, etc.

• Existen diversos teoremas de punto fijo en matematicas. Los dos mas importantes, ademasdel anterior, son los de Brouwer y de Kakutani. El Teorema del Punto Fijo de Brouwerestablece que:

Teorema 4.3.4 Teorema del Punto Fijo de Brouwer.

Dada Bn ⊆ IRn la bola unitaria abierta de IRn y dada f : Bn → Bn una funcion continuacualquiera. Entonces f tiene un punto fijo en Bn, es decir, existe (no necesariamenteunico) un punto x∗ ∈ Bn tal que f(x∗) = x∗.

El Teorema de Punto Fijo de Kakutani es una teorma mas general que nos entrega lascondiciones de existencia de punto fijo para correspondencias, es decir, para funciones cuyosvalores son conjuntos. Mas adelante, cuando se definan las correspondencias, volveremossobre este asunto.

Ejemplo 4.3.1 Supongamos que f : IR → IR es una funcion derivable en todas partes y tal quesu derivada f ′(x) es acotada en todo IR. De hecho, supongamos que existe una constante L > 0tal que para todo x ∈ IR se cumple que

|f ′(x)| ≤ L.

Se tiene entonces que si 0 < L < 1 la funcion f es contractante. En efecto, dados x < y ∈ IRcualesquiera, entonces existe z ∈ [x, y] tal que

∣∣∣∣f(y)− f(x)

y − x

∣∣∣∣ = |f ′(z)| ≤ L

y por lo tanto |f(y)− f(x)| ≤ L · |y− x|, es decir, f es Lipschitziana con constante de Lipschitzmenor que uno, es decir, contractante. Por lo tanto, f tiene un unico punto fijo en IR. De estamanera, tenemos una condicion suficiente para que f se contractante y es que su derivada seauniformemente acotada en todo IR por una constante menor que uno.

Ejemplo 4.3.2 Note lo siguiente: si podemos resolver el problema de encontrar puntos fijosde funciones entonces podemos resolver el problema de encontrar soluciones de ecuaciones dela forma f(x) = 0. En efecto, resolver una ecuacion de la forma f(x) = 0 es equivalente aencontrar solucion a la ecuacion f(x) + x = 0 + x = x. Por lo tanto, si definimos la funciong tal que g(x) = f(x) + x entonces el problema se convierte en encontrar un punto fijo de g.Analogamente, poder resolver ecuaciones es equivalente a poder encontrar puntos fijos.

Page 107: Libro Matematicas Para Economistas

106 CAPITULO 4. DIFERENCIACION DE FUNCIONES

4.3.4. Resolucion numerica de ecuaciones

Nuestro problema es resolver en forma aproximada una ecuacion de la forma f(x) = 0. Enalgunos casos esto es factible utilizando un metodo iterativo muy simple: el algoritmo de Newton.La idea viene de la siguiente figura:

xnxn+1

f(x)

x*

Dado x0 ∈ IR cualquiera, construyamos la tangente a la curva por dicho punto. Denotemospor x1 la interseccion de dicha tangente con el eje de las absisas. Luego, se tiene que:

1.- Ecuacion de la tangente: f(x0) + f ′(x0)(x− x0)

2.- Interseccion con el eje x: f(x0) + f ′(x0)(x− x0) = 0

3.- Valor de x1: resolver ecuacion anterior: x1 = x0 − f(x0)f ′(x0) .

Ası, dado xn, definimos xn+1 de la siguiente manera:

xn+1 = xn − f(xn)f ′(xn)

.

Bajo condiciones de regularidad4, esta sucesion converge a la solucion de la ecuacion f(x) = 0.

Ejemplo 4.3.3 Encontremos una expresion para calcular√

α, con α > 0. En otras palabras,resolvamos la ecuacion x2 − α = 0. Para ello, definamos la funcion f : IR → IR tal que f(x) =x2 − α de tal forma que todo nuestro problema consiste en determinar un cero de la misma.Utilizando el algoritmo anterior, se tiene que, dado x0 ∈ IR cualquiera (prefijado, supongamospositivo), definimos entonces recursivamente la sucesion

xn+1 = xn − x2n − α

2xn, x0 dado.

Como x0 es dado, podemos calcular x1, con esto el x2 y ası sucesivamente. Esta secuenciaconverge a

√α, lo que queda propuesto verificar en el computador.

Ejercicio 4.3.3 Resolver la siguiente ecuacion: e2x+1 = x2 + 5 utilizando lo anterior y uncomputador. Verifique sus resultados.

4.3.5. Analisis de crecimiento

Supongamos que f : IR → IR es una funcion creciente estricta en IR, es decir, ∀x, y ∈ IR six < y entonces f(x), f(y). En tal caso, dado h > 0 se tiene que

4En particular que la derivada sea simpre distinta de cero.

Page 108: Libro Matematicas Para Economistas

4.3. APLICACIONES DE LA DERIVADA Y RESULTADOS COMPLEMENTARIOS 107

f(x + h)− f(x)h

> 0

pues tanto numerador como denominador son positivos. Si h < 0 se tiene lo mismo ya que tantonumerador como denominador son negativos. Por lo tanto, f(x+h)−f(x)

h es siempre positivo, paratodo h. Luego, si el lımite cuando h → 0 existe, este debe ser positivo, es decir, la derivada espositiva. Por otro lado, supongamos que la derivada es siempre positiva y sean x < y dos valoresreales. Luego, por TVM se tiene que existe z ∈ [x, y] tal que

f(y)− f(x)y − x

= f ′(z) > 0

y por lo tanto, f(y)− f(x) = f ′(z) · (y − x) > 0, es decir, f(y) > f(x), con lo cual la funcion escreciente. De esta manera hemos probado que.

Proposicion 4.3.1 Dada una funcion f : IR → IR derivable, entonces f es estrıctamente cre-ciente si y solo si f ′(x) > 0, para todo x ∈ IR.

En forma analoga se puede probar que f : IR → IR es estrıctamente decreciente si y solo sif ′(x) < 0, para todo x ∈ IR.

Finalmente, si las derivadas parciales de una funcion f : IRn → IR tienen signo se puedeafirmar lo anterior pero solo con respecto a la variable correspondiente.

Ejemplo 4.3.4 Dada la funcion f(x) = ax2 + bx + c, con a > 0, se tiene que f ′(x) = 2ax + b.Esta derivada es positiva si 2ax + b > 0, es decir, cuando x > −b

2a . Por lo tanto, la parabola escreciente cuando se cumple lo anterior. Otro ejemplo, para la funcion f(x) = ex se tiene quef ′(x) = ex > 0, ∀x. Por lo tanto, la exponencial es siempre creciente.

Ejercicio 4.3.4 a.- Muestre que la composicion de dos funciones crecientes es creciente.

b.- Determine el rango de valores donde la funcion f(x) = x3 − 3x2 + x es creciente.

4.3.6. Condiciones de optimalidad

Recordemos algunas definiciones.

Definicion 4.3.1 Dado A ⊆ IR y dada f : A → IR, diremos que x0 es un maximo local de f eA si existe una bola B(x0, ε) ⊆ A tal que f(x0) ≥ f(x), para todo x ∈ B(x0, ε)∩A. Diremos quex1 es un mınimo local de f en A si existe una bola B(x0, δ) ⊆ A tal que f(x1) ≤ f(x), para todox ∈ B(x0, δ)∩A. Diremos que x∗ ∈ A es un maximo global de f en A si f(x∗) ≥ f(x), ∀x ∈ A.Diremos que x ∈ A es un mınimo global de f en A si f(x) ≤ f(x), ∀x ∈ A.

Con esto, los optimos locales son optimos en una vecindad del punto mientras que los globalesen todo el conjunto. Es claro que un optimo global es obviamente un optimo local, pero que alcontrario no es cierto. La siguiente figura ilustra el concepto:

Page 109: Libro Matematicas Para Economistas

108 CAPITULO 4. DIFERENCIACION DE FUNCIONES

f

(1) (2) (3) (4) (5) (6)

En ella, los puntos (1), (3) y (5) son maximos locales siendo (5) el maximo global. Los puntos(2), (4) y (6) son mınimos locales siendo (2) el mınimo global.Nota. Obviamente el concepto anterior aplica al caso especial en que A = IR, es decir, la funcionesta definida en todo el espacio.

Supongamos ahora que f : IR → IR es dos veces diferenciable y supongamos que el problemade encontrar maximos y/o mınimos de f en IR tiene solucion. Entonces, la forma de procederpara encontrarlos es la siguiente:

a.- En primer lugar se resuelve la ecuacion f ′(x) = 0. Con esto se obtiene puntos candidatosa optimizar la funcion. Puede que alguno de ellos no resuelva el problema, pero si fuera elcaso necesariamente se debe cumplir lo anterior. Esta es la condicion de optimalidadde primer orden. Denotemos los candidatos por x1, x2, ..., xk.

b.- Para cada uno de los puntos anteriores xj , j = 1, .., k, se cumple una de las siguientes

[* ] o bien f ′′(xj) > 0

[** ] o bien f ′′(xj) < 0

[*** ] o bien f ′′(xj) = 0.

Si se da [∗] se tiene que el xj respectivo es un mınimo local.

Si se da [∗∗] se tiene que el xj respectivo es un maximo local.

Si se da [∗ ∗ ∗] nada se puede afirma sobre la optimalidad de xj5.

a.- Lo anterior es valido para funciones definidas en subconjuntos de IR. En tal caso, lascondiciones de optimalidad anterior son ciertas siempre y cuando el optimo local esta enel interior del conjunto. Si el punto en cuestion es frontera, entonces las condicionesanteriores no son validas. Un analisis mas detallado del punto lo veremos en la seccionde optimizacion.

b.- Para funciones de IRn en IR las condiciones de optimalidad son como las anteriores. Lacondicion primera derivada igual a cero se reemplaza por gradiente igual a cero. La condi-cion segunda derivada positiva o negativa se reemplza con Hessiano definido positivo odefinido negativo.

5En rigor se deberıa seguir analizando con derivadas de orden superior: la regla en tal caso es que si la proximaderivada que no es cero en el punto es de orden par y ella es positiva, entonces se trata de un punto demınimo local, caso contrario si es negativa.

Page 110: Libro Matematicas Para Economistas

4.3. APLICACIONES DE LA DERIVADA Y RESULTADOS COMPLEMENTARIOS 109

4.3.7. Polinomio de Taylor

En lo que sigue, supondremos que la funcion con que trabajamos es derivable en el ordenque sea necesario.

Definicion 4.3.2 Dado x0 ∈ IR y dada f : IR → IR, el polinomio de Taylor de orden kde f en torno a x0, se define como aquel polinomio de grado k que cumple con la siguientecondicion:

p(x0) = f(x0)

p(j)(x0) = f (j)(x0), j = 1, 2, ..., k.

En otras palabras, es un polinomio de grado k que coincide con la funcion en el punto yademas cada una de las derivadas hasta el orden k tambien coinciden.

De esta manera, si el polinomio es p(x) = a0 + a1x + a2x2 + ... + akx

k se debe cumplir que

a0 + a1x0 + a2x20 + a3x

30 + ... + akx

k0 = f(x0)

a1 + 2a2x0 + 3a3x20... + kakx

k−10 = f ′(x0)

2a2 + 3 · 2x0... + k(k − 1)akxk−20 = f ′(x0)

.

.

.

k!ak = f (k)(x0).Resolviendo el sistema en reversa y reemplazando los valores en la expresion del polinomio,

se tiene finalmente que

p(x) = f(x0) + f ′(x0)(x− x0) +f (2)(x0)

2!(x− x0)

2 + ... +f (k)(x0)

k!(x− x0)

k

que sera la expresion del polinomio de Taylor de orden k en torno al punto x0 de lafuncion f . Usualmente notaremos Tk(f, x0)(x) dicho polinomio.

Ejemplo 4.3.5 A modo de ejemplo, el Taylor de primer y segundo orden de una funcion f entorno a x0 corresponde a:

• T1(f, x) = f(x0) + f ′(x0)(x− x0)

• T2(f, x) = f(x0) + f ′(x0)(x− x0) + f (2)(x0)2! (x− x0)

2.

Como se interpreta el polinomio de Taylor? Cual es su utilidad?La utilidad del polonomio de Taylor esta en que nos permite disponer de una expresion

polinomica que nos aproxima en forma razonable a la funcion, para valores cercanos a x0. Estoes de utilidad toda vez que deseemos hacer una analisis aproximado de un determinado fenomeno.Mientras mayor es el grado del polinomio mejor es la aproximacion obtenida.

La interpretacion del polinomio de Taylos se tiene en la siguiente figura:

Page 111: Libro Matematicas Para Economistas

110 CAPITULO 4. DIFERENCIACION DE FUNCIONES

x x0 0

La recta tangente al grafo de la funcion por el punto (x0, f(x0)) (izquierda) es el polinomiode Taylor de orden 1. La parabola de la derecha corresponde al Taylor de orden 2 de f en x0.

Ejemplo 4.3.6 En lo que sigue se entrega el Taylor de orden k de la funcion indicada, en tornoal punto indicado:

• f(x) = ex, x0 = 0 : Tk(f, x) = 1 + x + x2

2! + x3

3! + ... + xk

k! .

• f(x) = sin(x), x0 = 0 : Tk(f, x) = x− x3

3! + x5

5! + x7

7! + ....± xk

k! (k impar)

• f(x) = cos(x), x0 = 0 : Tk(f, x) = 1− x2

2! + x4

4! − x6

6! + ....± xk

k! (k par).

Ejercicio 4.3.5 Con lo anterior, compruebe la formula

eϕi = cos(ϕ) + i sin(ϕ).

Indicacion: Desarrolle los polinomios respectivos, evalue y compruebe el resultado.

Ejercicio 4.3.6 Calcule el polinomio de Taylor de orden n de la funcion f(x) = Ln(1 + x), entorno a x0 = 0. Con ello, calcule Ln(2) con 10 decimales de exactitud.

Ejercicio 4.3.7 Para el caso de una funcion f : IRn → IR, el polinomio de Taylor solo sepuede construir de manera razonable hasta el segundo orden. Ası, dado x0 ∈ IRn, la expresioncorrespondiente es la que sigue:

T2(f, x) = f(x0) +∇tf(x0) · (x− x0) +12(x− x0)

tH(f, x0)(x− x0).

A partir de lo anterior, calcule el polinomio de Taylor de orden 2, en torno de (1, 1), de lafuncion f(x1, x2) = xα

1 xβ2

4.3.8. Reglas de L’Hopital

La regla de L’Hopital es muy util a la hora de calcular lımites de cocientes de funcionescuando el numerador y el denominador tienden a cero en el valor considerado. Por un desarrollosimple, esta regla, como veremos, tambien a otros tipos de expresiones que en definitiva puedenser expresados como cocientes de funciones que tienden a cero cuando la variable tiende al puntoen cuestion.

Sean f, g dos funciones derivables y sea x0 tal que lımx→x0

f(x) = 0 y lımx→x0

g(x) = 0. Suponiendo

entonces que el lımite

lımx→x0

f ′(x)g′(x)

Page 112: Libro Matematicas Para Economistas

4.4. EJEMPLOS Y EJERCICIOS ADICIONALES 111

existe, la regla de L’Hopital nos dice que

lımx→x0

f(x)g(x)

= lımx→x0

f ′(x)g′(x)

.

Si ocurre que f ′ y g′ cumplen las mismas condiciones que f y g, se puede continuar aplicandola regla a las derivadas , evaluando entonces el lımite del cociente de las segundas derivadas.

La utilidad de la regla anterior viene del hecho que en muchos casos ocurre que si el cocientede funciones es indeterminado en el valor x0, esto no necesariamente sigue siendo cierto con elcociente de las derivadas en el punto, razon por la cual es posible evaluar el lımite en cuestion.Veamos con un ejemplo.

Ejemplo 4.3.7 Calcular

lımx→0

sen(x)x

.

En este caso, lımx→0

sen(x) = 0 y lımx→0

x = 0, por lo cual el cociente anterior es de la forma “00”,

y de esta manera aplica la regla de L’Hopital. Ası,

lımx→0

sen(x)x

= lımx→0

cos(x)1

= lımx→0

cos(x) = 1.

Otro ejemplo:

lımx→0

x2 − 3x

Ln(x + 1)= lım

x→0

2x− 31/(x + 1)

= lımx→0

(x + 1)(2x− 3) = −3.

4.4. Ejemplos y ejercicios adicionales

4.4.1. El problema de los costos: caso simple

Supongamos que f(x,x2) representa una funcion de produccion. Dado y0 un cierto nivel deproducto prefijado, el problema de los costos consiste entonces en encontrar las cantidades deinsumos x1 y x2 tales que minimizan el costo de producir la cantidad de producto menciona-da, habida cuenta que los precios de estos factores son w1 y w2 respectivamente. Con esto, elproblema de los costos consiste entonces en minimizar la cantidad w1x1 + w2x2 sujeto al hechoque f(x1, x2) = y0. De esta ultima relacion sigue que existe una relacion implicita entre x1 y x2,digamos, x2 = x2(x1, y0), razon por la cual el problema de costos se reduce a uno con una unicavariable, es decir, minimizar w1x1 + w2x2(x1, y0). La condicion de optimalidad es entonces

dw1x1 + w2x2(x1, y0)dx1

= 0 ⇔ w1 + w2dx2(x1, y0)

dx1= 0 ⇔ dx2(x1, y0)

dx1= −w1

w2.

Para calcular la derivada de la derecha, notemos que, por condcion, f(x1, x2) = y0, y por lotanto, derivando c.r a x1 y aplicando la regla de la cadena, se tiene que

∂f(x1, x2)∂x1

+∂f(x1, x2)

∂x2

dx2

dx1=

dy0

dx1.

Considerando que y0 no depende de x1 se tiene que dy0/dx1 = 0, por lo cual

Page 113: Libro Matematicas Para Economistas

112 CAPITULO 4. DIFERENCIACION DE FUNCIONES

∂f(x1, x2)∂x1

+∂f(x1, x2)

∂x2

dx2

dx1= 0 ⇒ dx2

dx1= −

∂f(x1,x2)∂x1

∂f(x1,x2)∂x2

,

y por lo tanto la condicion de optimalidad queda como

∂f(x1,x2)∂x1

∂f(x1,x2)∂x2

=w1

w2[1].

La ecuacion [1] junto con el hecho que f(x1, x2) = y0 permite entonces determinar los valoresoptimos x1(w1, w2, y0) y x2(w1, w2, y0), y con ello el valor del costo, definido como C(w1, w2, y0) =w1x1(w1, w2, y0) + w2x2(w1, w2, y0).

Dada la funcion de costos, se definen las funciones auxiliares costo medio y costo marginalcomo sigue

CMe(w1, w2, y0) =C(w1, w2, y0)

y0, CMg(w1, w2, y0) =

∂C(w1, w2, y0)∂y

.

En terminos economicos, el costo marginal en y0 es el incremento en el costo que se tiene deproducir una unidad adicional de producto a partir de y0.

Ejercicio 4.4.1 Dada f(x1, x2) = xα1 xβ

2 y dados w1, w2 e y0, determine C(w1, w2, y0). Muestreque el costo es de la forma γy

1/(α+β)0 , con γ una constante que depende solo de los parametros

del problema. Determine ademas el costo medio y marginal. Muestre que el costo siempre escreciente en y0 y que si α + β < 1 entonces el costo es convexo en y0, y que si α + β > 1,el costo es concavo en y0. Lo anterior corresponde a decir que el costo marginal es creciente ydecreciente, respectivamente.

Ejercicio 4.4.2 Dada f(x1, x2) una funcion de produccion y dado C(w1, w2, y0) el respectivocosto, muestre que

∂C(w1, w2, y0)∂wi

= xi(w1, w2, y0), i = 1, 2.

Este resultado es conocido en economıa como el Lema de Shephard.

Ejercicio 4.4.3 Dados los precios, supongamos que y es un punto donde el costo medio seminimiza. Muestre entonces que CMe(w1, w2, y) = CMg(w1, w2, y).

Ejercicio 4.4.4 Muestre que para todo t > 0 se cumple que

C(tw1, tw2, y0) = tC(w1, w2, y0).

4.4.2. El problema de la maximizacion de beneficios

Supongamos que una firma es caracterizada por una funcion de produccion f : IR2 → IR+,tal que f(0, 0) = 0 y tal que f es estrictamente creciente en ambas componentes. Supongamosque dicha firma produce un bien cuyo precio en el mercado es p y que los insumos cuestanw1, w2 respectivamente. El problema de la maximizacion del beneficio es simplemente aquel deencontrar los valores de los insumos x1 y x2 que maximizan la ganancia de la firma, es decir,maximizan la funcion de beneficios definida por

Page 114: Libro Matematicas Para Economistas

4.4. EJEMPLOS Y EJERCICIOS ADICIONALES 113

π(x1, x2) = pf(x1, x2)− w1x1 − w2x2.

Las condiciones de optimalidad son entonces que las derivadas parciales de π(x1, x2) conrespecto a x1 y x2 son cero, es decir,

∂π(x1, x2)∂xi

= 0, i = 1, 2,

lo que corresponde a

∂[pf(x1, x2)− w1x1 − w2x2]∂xi

= 0 ⇔ p∂f(x1, x2)

∂xi= wi, i = 1, 2.

La solucion del sistema de ecuaciones anterior se denomina demanda de factores de lafirma, y se denota por xi(p, w1, w2), i = 1, 2. La oferta de la firma y el beneficio son simple-mente

y(p, w1, w2) = f(x1(p, w1, w2), x2(p, w1, w2)

π(p, w1, w2) = py(p, w1, w2)− w1x1(p, w1, w2)− w2x2(p, w1, w2).

Ejercicio 4.4.5 Dados p, w1 y w2, y dada f(x1, x2) = xα1 xβ

2 , con α + β < 1, determine lademanda de factores, la oferta y el beneficio de la firma. Analogo con f(x1, x2) = xα

1 + xβ2 .

4.4.3. La maximizacion de la utilidad y la demanda de mercado

Supongamos que un individuo cualquiera es caracterizado por una funcion de utilidad u :IR2

+ → IR+ y por ciertas dotaciones iniciales de bienes dadas por w1 y w2. El precio de los bienesuno y dos sera p1 y p2 respectivamente. Dado esto, el ingreso del individuo se define como I =p1w1 +p2w2. Con este ingreso, la persona puede adquirir todas aquellas combinaciones de bienesque puede comprar a los precios indicados, es decir, todos aquellas canastas (x1, x2) ∈ IR2

+ talque

p1x1 + p2x2 ≤ I.

Dado esto, el problema del consumidor es entonces escoger aquella canasta que puede comprar(canastas factibles) que maximizan su utilidad, es decir,

max u(x1, x2)s.a p1x1 + p2x2 ≤ I

x≥0, x2 ≥ 0

Como hemos visto en Ejemplo 3.3.3, el problema anterior tiene solucion, que denotaremospor xi(p, w1, w2) y que llamaremos demanda por los respectivos bienes.

Previo a continuar, notemos que si la funcion de utilidad es creciente por componentes, en-tonces ocurre que necesariamente p1x1(p, w1, w2)+p2x2(p, w1, w2) = I, ya que en caso contrario(es decir, p1x1(p, w1, w2) + p2x2(p, w1, w2) < I) se tendrıa que el individuo puede aumentar elvalor de su utilidad consumiendo un poco mas de alguno de los bienes, esto hasta gastarse todoel dinero que posee. Por lo tanto, el problema del consumidor puede ser re-escrito como

max u(x1, x2)s.a p1x1 + p2x2 = I

x≥0, x2 ≥ 0.

Page 115: Libro Matematicas Para Economistas

114 CAPITULO 4. DIFERENCIACION DE FUNCIONES

Con lo anterior, ocurre que

x2 =I − p1x1

p2

con lo cual el problema del consumidor puede ser reformulado en una variable como

max u

(x1,

I − p1x1

p2

),

que derivando c.r a x1 (aplicar regla de la cadena) implica que

∂u

∂x1+

∂u

∂x2·

(I−p1x1

p2

)

∂x1= 0 ⇔ ∂u

∂x1+

∂u

∂x2· −p1

p2= 0 ⇔

∂u∂x1

∂u∂x2

=p1

p2,

es decir, que es cociente de utilidades marginales es igual al cociente de precios en la demanda.Esta condicion, junto con el hecho que el valor de la demanda es igual a I permite entoncesencontrar las demandas (sistema de dos ecuaciones con dos incognitas).

La funcion de utilidad indirecta se define simplemente como la utilidad evaluada en la de-manda, es decir,

v(p1, p2, w1, w2) = u(x1(p, w1, w2), x2(p, w1, w2).

Ejercicio 4.4.6 Dados p1, p2 y dada u(x1, x2) = x1/21 x

1/42 , determine las demandas correspon-

dientes y la respectiva funcion de utilidad indirecta. Analogo con u(x1, x2) = xα1 + xβ

2 .

Page 116: Libro Matematicas Para Economistas

Capıtulo 5

Convexidad y temas afines

La convexidad, y los conceptos relacionados, son fundamentales en economıa. Informal-mente, la razon de fondo viene del hecho que en optimizaicon ocurre que bajo supuestos deconvexidad se puede garantizar, por un lado, la existencia de soluciones de problemas de op-timizacion y, por otro lado, que estas soluciones son unicas. A partir de esto, y considerandoque los problemas economicos son basicamente problemas de optimizacion, es entonces que bajoeste tipo de supuestos que podremos garantizar la existencia y unicidad de la demanda, de laoferta, de los costos, etc., lo que en definitiva nos entrega un marco adecuado para hacer lateorıa economica.

Muchas veces se asume en microeconomıa que la productividad marginal de las firmas esdereciente o que la utilidad marginal de los individuos tambien lo es. Estos supuestos son jus-tificados con evidencia empirica y muchos ejemplos, apareciendo de esta forma como supuestosrazonables a considerar en todo el edificio de la micro. Lo que resulta extraordinario es que apartir de estos supuestos, que parecen muy naturales, es posible entonces definir la demanday la oferta de manera univoca, y con ello poder realizar todo el analisis subsecuente sobre laspropiedades de los objetos ecoonmicos ya definidos. Sin embargo, dos cosas. En primer lugar,nada mas lejos de la realidad que los supuestos de marginalidad decreciente sean connaturales alfenomeno economico y, segundo, lo que en definitiva esta detras de estos supuestos “naturales”esprecisamente disponer de un marco adecuados que nos permita hacer teorıa de manera simpley razonable.

Todos los “supuestos naturales”que hemos mencionado tienen por objetivo simplementegarantizar que la solucion de ciertos problemas de optimizacion sea unica y que obviamenteexista. Mas que lo natural o no de las hipotesis antes mencionadas, lo que en definitiva esta enla medula es la convexidad o concavidad de los objetos economicos considerados.

Ya mas formalmente, la utilidad del concepto radica en dos hechos. Por un lado, comoveremos, esta en que los problemas de optimizacion con supuestos de convexidad - concavidad,son resolubles solo a partir de las condiciones necesarias de optimalidad de primer orden: no serequieren condiciones de segundo orden y, mas aun, las soluciones encontradas son globales y nolocales. En segundo lugar, son supuestos de convexidad sobre la economıa los que en definitivase requieren para garantizar la existencia de puntos fijos de un sistema, es decir, demostrar laexistencia de equilibrios o soluciones de ecuaciones que aparecen naturalmente en economıa.

115

Page 117: Libro Matematicas Para Economistas

116 CAPITULO 5. CONVEXIDAD Y TEMAS AFINES

5.1. Conjuntos convexos

Previo a definir los conceptos para funciones, necesitamos en primer lugar definir lo que seentiende por conjuntos convexos, cuestion que es complementaria a la definicion de funcionesconvexas y concavas. Ası, partamos con la siguiente definicion.

Definicion 5.1.1 Dado λ ∈ [0, 1] y dados x, y ∈ IRn, el vector ponderado

λ · x + (1− λ)y

se denomina combinacion convexa de x e y. El conjunto de todas las combinaciones convexasde x e y es el segmento de recta cuyos extremos son x e y.

La siguiente figura ilustra el concepto anterior:

[

]

x

y

x y+

Combinación Convexa de x e y

a (1-a)

Definicion 5.1.2 Diremos que un conjunto no vacıo C ⊆ IRn es un conjunto convexo si paratodo x, y ∈ C y para todo λ ∈ [0, 1] se tiene que

λ · x + (1− λ)y ∈ C.

En otras palabras, C es convexo si dados dos puntos cualquieras de el, el segmento quelos une esta contenido en el conjunto. La siguiente figura ilustra el concepto.

Convexo No Convexo No Convexo

Ejemplo 5.1.1 Cualquier bola de centro x0 y rario r > 0: B(x0, r) = x ∈ IRn | ‖x− x0‖ < res un conjunto convexo. La bola abierta es un convexo abierto mientras que la bola cerrada esun convexo cerrado.

Page 118: Libro Matematicas Para Economistas

5.1. CONJUNTOS CONVEXOS 117

IRn (todo el espacio) es un conjunto convexo para cualquier n.En IR son convexos todos aquellos conjuntos conexos (por ejemplo, intervalos de la forma

[a,+∞[; [a, b]; ]a, b[; ] −∞, a] etc). No es convexo un conjunto de la forma C = [a, b]⋃

[c, d] conc > b. Tampoco lo es un conjunto discreto de puntos: C = a, b, c.

Ejemplo 5.1.2 En terminos economicos, los conjuntos de produccion convexos se relacionan consupuestos de rendimientos decrecientes a escala en la produccion. El supuestos de productividadmarginal decreciente corresponde a suponer que las funciones de produccion son concavas, comoası el supuesto de utilidad marginal decreciente para consumidores y las funciones de utilidadconcavas.

Un tipo muy importante de conjunto convexo es la llamada envoltura convexa de puntos,que se define como sigue.

Definicion 5.1.3 Dados X1, X2, · · · , Xk ∈ IRn, se define la envoltura convexa de ellos como elmenor convexo que los contiene. Se denotara por

co X1, X2, · · · , Xk.

En general, para un sub-cojunto A ⊆ IRn cualquiera, su envoltura convexa es obviamente elmenor conjunto convexo que lo contiene y se denotara por coA. 2

A partir de la definicion anterior, se puede probar que

co X1, X2, · · · , Xk = k∑

i=1

λiXi, λi ≥ 0,∑

i

λ = 1

y que

coA = s∑

i=1

λiai, λi ≥ 0,s∑

i=1

λ = 1, s ∈ IN, ai ∈ A.

Las siguientes figuras ilustran el concepto de envoltura convexa a un conjunto de puntos y aun conjunto A cualquiera.

X co X

A co A

Ejercicio 5.1.1

(a) Muestre que la interseccion de dos conjuntos convexos cualquiera tambien sera un conjuntoconvexo, aun cuando sea vacıo.

Page 119: Libro Matematicas Para Economistas

118 CAPITULO 5. CONVEXIDAD Y TEMAS AFINES

(b) Muestre que cualquier intervalo de la forma [a, b] ⊆ IR es un conjunto convexo.

(c) Muestre que la bola B(x0, r) ⊆ IRn es un conjunto convexo.

(d) Muestre que el conjunto presupuestario definido en Ejemplo 3.3.3 es un cojunto convexo.

(e) Definamos el Simplex de IRn como

∆n = µ = (µ1, µ2, · · · , µn)t ∈ IRn | µi ≥ 0,n∑

i=1

µi = 1.

Muestre que ∆n es un conjunto convexo y compacto. Muestre ademas que

∆n = coe1, e2, · · · , en

donde ei es la base canonica de IRn.

5.2. Convexidad de funciones

El concepto de convexidad para funciones es distinto que aquel de conjuntos. La convexidadde un conjunto tiene que ver con propiedades topologicas de un conjunto, mientras que aquelde funciones con propiedades analıticas de las mismas.

A partir de lo anterior, dado C ⊆ IRn un conjunto convexo y dada f : C → IR una funcion,se tiene la siguiente definicion:

Definicion 5.2.1 Diremos que f : C → IR es una funcion1:

a.- Convexa si para todo x, y ∈ C y para todo λ ∈ [0, 1] se tiene que:

f(λx + (1− λ)y) ≤ λf(x) + (1− λ)f(y).

b.- Estrıctamente Convexa si para todo x, y ∈ C, x 6= y, y para todo λ ∈]0, 1[ se tiene que:

f(λx + (1− λ)y) < λf(x) + (1− λ)f(y).

c.- Concava si para todo x, y ∈ C y para todo λ ∈]0, 1[ se tiene que:

f(λx + (1− λ)y) ≥ λf(x) + (1− λ)f(y).

d.- Estrıctamente Concava si para todo x, y ∈ C, x 6= y, y para todo λ ∈]0, 1[ se tiene que:

f(λx + (1− λ)y) > λf(x) + (1− λ)f(y).

e.- Cuasi - concava si para todo x, y ∈ C tal que f(x) ≥ f(y) entonces para todo λ ∈ [0, 1]se tiene que

f(λx + (1− λ)y) ≥ f(y).1Para fijar ideas, podemos imaginar que la funcion f esta definida en todo IRn.

Page 120: Libro Matematicas Para Economistas

5.2. CONVEXIDAD DE FUNCIONES 119

f.- Estrıctamente cuasi - concava si para todo x, y ∈ C tal que f(x) > f(y) entonces paratodo λ ∈]0, 1] se tiene que

f(λx + (1− λ)y) > f(y).

Ejemplo 5.2.1 Algunos ejemplos se muestran en la siguiente figura.

1 2 3

4 5 6

78

Las funciones 1 y 2 son estrıctamente convexas, la funcion 3 es convexa pero no estrıcta-mente convexa, las funciones 4 y 5 son estrıctamente concavas, la funcion 6 es concava pero noestrıctamente concava, la funcion 7 es cuasi - concava mientras que la 8 no es de ninguno de lostipos anteriores.

Nota. La definicion de funcion convexa nos dice que el segmento que une dos puntos cualesquieradel grafo de la funcion esta siempre por encima del grafo de la funcion. Si dicho segmentoesta estrıctamente por encima, la funcion es estrıctamente convexa; si esta por encima, tocandoalgunos en puntos que no sean los extremos, la funcion es convexa. En forma analoga, para elcaso de funciones concavas, el segmento considerado esta por debajo del grafo de la funcion, etc.La siguiente figura ilustra esta idea:

Convexa:segmentopor encimadel grafo

Cóncava:segmentopor debajodel grafo

Nota. La diferencia entre estricta convexidad y convexidad es que en la segunda las desigual-dades involucradas no son estrictas de modo que se permite, por ejemplo, que la funcion tengatramos rectos sin que esto viole la definicion. De hecho, una funcion lineal (lnea recta) es una fun-

Page 121: Libro Matematicas Para Economistas

120 CAPITULO 5. CONVEXIDAD Y TEMAS AFINES

cion convexa de acuerdo a esta definicion, pero no es estrıctamente convexa (ademas es concavapero no estrıctamente concava).

Ejemplo 5.2.2 La funcion f : IR → IR definida por f(x) = xα, con α > 0, es:

a.- Convexa si α ≥ 1.

a.- Estrıctamente convexa si α > 1.

a.- Concava si α ≤ 1.

a.- Estrıctamente concava si α < 1.

La siguiente figura ilustra lo anterior.

α>1

α<1

Ejemplo 5.2.3 La parabola p(x) = ax2 + bx + c es estrıctamente convexa si a > 0 y estrıcta-mente concava si a < 0.

Ejemplo 5.2.4 Note que si f es convexa, entonces −f es concava.

Algunas propiedades elementales de las funciones convexas (y concavas...) se resumen en loque sigue.

Proposicion 5.2.1 Dada f : IRn → IR una funcion, se tiene que:

a.- Si n = 1 (es decir, f : IR → IR) y f es dos veces diferenciable, entonces f es convexa si ysolo si

f′′(x) ≥ 0

para todo x ∈ IR. Por otro lado, f es concava si y solo si f′′(x) ≤ 0.

Si la desigualdad anterior es estrıcta (es decir, ≤→< y ≥→>) entonces la funcion esestrıctamente convexa o concava segun el caso.

b.- Para el caso general f : IRn → IR, se tiene el mismo resultado anterior si reemplazamos lasegunda derivada real por la matriz Hessiana de f . Ası, f es convexa si y solo si para todox ∈ IRn el Hessiano de f en x es semi - definido positivo; es concava si el Hessiano es semi -definido negativo; estrıctamente convexa si el Hessiano es definido positivo y estrıctamenteconcava si el Hessiano es definido negativo.

b.- Si una funcion es concava entonces es cuasi - concava. En forma analoga, una funcion quees estrıctamente concava es estrıctamente cuasi - concava.

Page 122: Libro Matematicas Para Economistas

5.2. CONVEXIDAD DE FUNCIONES 121

c.- f es cuasi - concava si y solo si para todo α ∈ IR, los conjuntos

Sα(f) = x ∈ IRn | f(x) ≥ α

son convexos2 en IRn.

d.- La funcion f : IRn → IR es cuasi - concava si para todo x ∈ IRn tal que ∇f(x) · x = 0entonces H(f, x) es semi - definido negativo3.

e.- Si f : IRn → IR es estrıctamente cuasi - concava entonces para todo α ∈ IR los conjuntos

Iα = x ∈ IRn | f(x) = α

son conjuntos convexos4.

Demostracion. Ver Takayama, Parte 1. En todo caso, la demsotracion se basa fundamental-mente en la aproximacion de Taylor de segundo orden de las funciones involucradas. A modo deejemplo, y esto no es una demostracion, veamos el hecho que para funciones convexas se cumpleque la segunda derivada es siempre positiva. Para ello, notemos en la figura siguiente

x x x x1 2 3 4

f

como las pendientes aumentan en la medida que x aumenta. Luego, la primera derivada de lafuncion debera ser creciente en la variable, es decir, f ′(x) es creciente, por lo cual su derivada,es decir f ′′(x) debera ser positiva, con lo cual se tiene el resultado. 2

Ejemplo 5.2.5 La propiedad e.− anterior es muy importante en economıa y justifica la intro-duccion de funciones cuasi-concavas como concepto mas amplio que las concavas. De hecho, talpropiedad es una caracterizacion de las funciones cuasi - concavas. En efecto, utilizando termi-nologıa economica, supongamos que f representa a una funcion de utilidad y que trabajamoscon dos variables. Entonces, dado α > 0, el conjunto de puntos Iα = (x1, x2) | f(x1, x2) = αes lo que se denomina una curva de indiferencia al nivel α. Por lo tanto, la propiedad e.− nosdice que si la funcion de utilidad es cuasi-concava, entonces la curva de indiferencia es convexa.La siguiente figura ilustra una cuasi - concava tıpica y su respectiva curva de indiferencia:

2Estos conjuntos son las llamadas secciones superiores de la funcion.3Es decir, el Hessiano es semi - definido negativo en el ortogonal del gradiente de la funcion.4Si por ejemplo la funcion f representa a una funcion de utilidad, estos conjuntos corresponden a las curvas

de indiferencia, si la funcion f es una de produccion, estamos hablando de isocuantas de produccion, etc. Esteresultado justifica por si mismo la introduccion de la cuasi - concavidad: tenemos una condicion que nos garantizaque las curvas de indiferencia sean convexas.

Page 123: Libro Matematicas Para Economistas

122 CAPITULO 5. CONVEXIDAD Y TEMAS AFINES

x

f(x)

x1

x2

Nivel y

FUNCION CURVA DE INDIFERENCIA

De esta manera, cuando en particular la funcion es concava se tiene entonces que las curvasde indiferencia son convexas como en el caso anterior.

Ejemplo 5.2.6 Supongamos que f : IR2 → IR es una funcion de produccion convexa, es decir,para todo X1, X2 ∈ IR2 y para todo 0 < λ < 1 se cumple

f(λX1 + (1− λ)X2) ≤ λf(X1) + (1− λ)f(X2).

Si en particular X2 = 0 se tiene que

f(λX1) ≤ λf(X1) + (1− λ)f(0).

Puesto que f es funcion de produccion, se tiene que f(0) = 0 y luego, para todo X1 ∈ IR2 ypara todo 0 < λ < 1 se cumple que

f(λX1) ≤ λf(X1).

Sea entonces t = 1λ > 1 y definamos X1 = λX1. De lo anterior, se concluye que

f(X1) ≤ 1tf(tX1)

es decir,

f(tX1) ≥ t · f(X1).

Esto obviamente es cierto para todo X1 pues X1 es arbitrario. Por otro lado, como 0 < λ < 1tambien es arbitrario, se tiene que lo anterior es valido para todo t > 1. De esta manera, hemosprobado que si f es f.d.p convexa se cumple que para todo t > 1 y para todo X ∈ IR2

f(tX) ≥ t · f(X),

lo que equivale a decir que f presenta rendimientos crecientes a escala. Esta es una intere-sante interpretacion de la convexidad para funciones de produccion.

Ejercicio 5.2.1 a.- Suponga que f : IR2 → IR es concava y sea α ∈ IR. Sabemos que de larelacion f(x1, x2) = α existe relacion implıcita entre x1 y x2. Como ademas sabemos,

∂x2

∂x1= −

∂f∂x1

∂f∂x2

se pide:

Page 124: Libro Matematicas Para Economistas

5.2. CONVEXIDAD DE FUNCIONES 123

a.a.- Determinar ∂2x2

∂x21.

a.b.- Probar que la derivada anterior es siempre positiva (utilizar el hecho que la funciones concava).

a.c.- Concluir que la curva de indiferencia es convexa en este caso.

b.- Muestre que si f : IR2 → IR es concava, entonces presenta rendimientos decrecientes deescala, es decir, para todo t > 1 y para todo X ∈ IR2 se cumple que

f(tX) ≤ tf(X).

c.- Muestre que la norma euclidiana en IRn es una funcion convexa.

d.- Pruebe que si f : IRn → IR es convexa entonces −f es concava. Pruebe ademas que sif, g : IRn → IR son dos funciones convexas y λ > 0 entonces la funcion f +λg es convexa.

e.- Pruebe las partes d.− y e.− de la proposicion anterior.

f.- Establezca las condiciones sobre α y β para que la funcion f(x1, x2) = xα1 +xβ

2 sea convexa,sea concava, sea estrıctamente convexa, estrıctamente concava.

g.- Idem caso anterior para la funcion f(x1, x2) = xα1 · xβ

2 .

h.- Suponga que f, g : IR → IR son dos funciones tales que g es convexa y f es creciente.Muestre entonces que f g es convexa.

i.- Determine en que rango de valores de la variable la funcion f : IR → IR definida porf(x) = x3 − 6x2 − x es convexa, concava, convexa y creciente, concava y decreciente.

j*.- Suponga que f : IR → IR es convexa y derivable en todo punto. Muestre entonces que paratodo x0 ∈ IR se cumple que

f(x) ≥ f(x0) + f ′(x0) · (x− x0),

es decir, que el grafo de la funcion esta siempre por encima de la recta tangente a cualquierpunto del mismo. Ver geometricamente la propiedad.

k.- Dado que sabemos que si la funcion f es diferenciable y es definida en un espacio convexoX en Rn, entonces f sera concava si y solo si,

f ′(x0) · (x− x0) ≥ f(x)− f(x0) ∀x, x0 ∈ X (5.1)

La intuicion se presenta para el caso de f : R −→ R en la siguiente figura

Page 125: Libro Matematicas Para Economistas

124 CAPITULO 5. CONVEXIDAD Y TEMAS AFINES

x0 x1

f(x1)-f(x0)

f' (x1-x0)

x

f(x)

Demuestre entonces, que si f concava se cumple que

∂2f

∂x2i

≤ 0 (5.2)

l.- Sea f : IR2 → R definida por f(x1, x2) = x0,51 x0,5

2 . Muestre que f(x1, x2) es una funcionconcava.

m.- Toda funcion concava es cuasiconcava y toda funcion cuasiconcava es concava. Comente(y demuestre).

n.- Sea f : Ωn → R, donde Ωn ≡ x ∈ Rn, x ≥ 0. Pruebe que f(x) no puede ser estrıctamenteconcava si es homogenea de grado uno. Recordemos que una funcion f : IRn → IR eshomogenea de grado uno si cumple que para todo t > 0

f(tx) = tf(x).

o.- Sea f = xαyβ con (x, y) ∈ Ω2 y α, β > 0, α + β < 1 donde Ω2 es un conjunto no negativode R2. Pruebe que f(x1, x2) es estrıctamente concava.

5.3. Propiedades complementarias

5.3.1. Convexas y optimizacion

Supongamos que f : IRn → IR es una funcion estrıctamente convexa y supongamos quex0 es un punto que verifica las condiciones necesarias de optimalidad de primer orden (es decir,∇f(x0) = 0). Como la funcion es estrıctamente convexa, el Hessiano en cualquier punto (enparticular en x0) es definido positivo. Por lo tanto, dicho punto necesariamente debe ser unmınimo local de la funcion pues se cumple directamente la condicion de segundo orden.

De esta manera, existe una bola abierta en torno a x0, digamos B(x0, r) para algun r > 0,tal que f(x0) < f(x) para todo x ∈ B(x0, r). Supongamos ahora que dicho punto x0 no es elmınimo global de la funcion, es decir, supongamos que existe otro punto x∗ 6= x0 tal que es elmınimo global de f . Luego, en particular f(x∗) < f(x0). Ahora bien, como f es estrıctamenteconvexa, dado λ ∈]0, 1[ se tiene que

Page 126: Libro Matematicas Para Economistas

5.3. PROPIEDADES COMPLEMENTARIAS 125

f(λx∗ + (1− λ)x0) < λf(x∗) + (1− λ)f(x0).

Pero f(x∗) < f(x0), y por lo tanto, reemplazando esto en la desigualdad enterior se concluyeque para todo λ ∈]0, 1[

f(λx∗ + (1− λ)x0) < f(x0).

Notemos ahora que para λ suficientemente cerca de 0, el punto λx∗+(1−λ)x0 pertenecera ala bola B(x0, r) y por lo tanto, considerando λ ∼ 0 y del hecho que x0 es mınimo en dichabola se tiene que λx∗ + (1− λ)x0 ∈ B(x0, r) y luego f(x0) < f(λx∗ + (1− λ)x0), lo que es unacontradiccion con el parrafo anterior. Luego, hemos demostrado la siguiente proposicion.

Proposicion 5.3.1 Para una funcion estrıctamente convexa, un mınimo local es necesariamentemınimo global y este se determina solo a partir de las condiciones necesarias de optimalidad deprimer orden.

En forma analoga se tiene un resultado similar para la maximizacion de funciones concavas.Este es un resultado fundamental que refleja una propiedad muy importante de las fucionesconvexas y concavas. Los supuestos de convexidad en un modelo muchas tienen como objeti-vo central garantizar la existencia y unicidad de soluciones de un problema de optimiazacion.Ademas, bajo este supuesto la forma de resolver el problema se simplifica enormemente ya queno es necesario verificar condiciones de segundo orden.

Ejercicio 5.3.1 Dada la funcion f(x1, x2) = xα1 · xβ

2 − w1x1 − w2x2, suponga que α, β > 0 yque α + β < 1.

a.- Muestre que la funcion es estrictamente convexa.

b.- Encuentre la solucion del problema.

c.- Muestre que dicha solucion es unica.

5.3.2. Teorema de Hahn - Banach

En primer lugar, vamos a mostrar un resultado que es fundamental en economıa de bienestary en teorıa del equilibrio: el teorema de separacion de convexos de Hahn - Banach. La intuiciones directa y la siguiente figura ilustra la propiedad:

C1

C2

p

x0

Supongamos que tenemos dos conjuntos convexos cerrados C1 y C2, que se intersectan soloen un punto, digamos x0 (ver figura); entonces el Teorema de Separacion de Hahn - Banch afirmaque existe un hiperplano que separa a ambos conjuntos.

Page 127: Libro Matematicas Para Economistas

126 CAPITULO 5. CONVEXIDAD Y TEMAS AFINES

En la figura, dicho hiperplano queda definido por un vector p ∈ IRn, p 6= 05.Cuando se dice que el hiperplano separa a ambos conjuntos se afirma que para todo c1 ∈ C1

y para todo c2 ∈ C2 entonces p · (c1 − x0) ≥ 0 y, simultaneamente, p · (c2 − x0) ≤ 0.Ası se tiene el siguiente teorema:

Teorema 5.3.1 Teorema de Separacion de Hahn - Banach.Dados dos conjuntos convexos cerrados C1, C2 ⊆ IRn tales que C1

⋂C2 = x0, entonces

existe p ∈ IRn, p 6= 0 tal que para todo c1 ∈ C1 y para todo c2 ∈ C2 se tiene que

p · (c1 − x0) ≥ 0, p · (c1 − x0) ≤ 0.

5.3.3. Propiedades geometricas

La siguiente figura ilustra una propiedad geometrica de las funciones convexas que sera in-teresante de analizar.

x x1 2

f

En la figura, por el punto x1 al trazar la tangente a la curva de la funcion convexa f , dichatangente esta siempre por debajo de la funcion. Analogo con x2 y cualquier otro punto. De estamanera, recordando que la ecuacion de la tangente a la curva por el punto (x1, f(x1)) es:

f(x1) + f ′(x1)(x− x1)

se tiene que para la funcion convexa de la figura se cumple que para todo x ∈ IR y para todox1,

f(x1) + f ′(x1)(x− x1) ≤ f(x).

En terminos generales, se tiene la siguiente proposicion:

Teorema 5.3.2 Dada f : IRn → IR una funcion convexa diferenciable, entonces dado x0 ∈ IRn,se tiene que para todo x ∈ IRn

f(x0) +∇tf(x0) · (x− x0) ≤ f(x).

5Recordemos que todo hiperplano de IRn se puede escribir de la forma p · x = cte.

Page 128: Libro Matematicas Para Economistas

Capıtulo 6

Optimizacion estatica

6.1. Introduccion.

En lo que sigue, nos ocuparemos de estudiar problemas de optimizacion estaticos, con y sinrestricciones. La idea de “estatico”esta en el hecho que el objetivo es encontrar ciertos puntos enel espacio que optimizan la funcion. Cuando las incognitas son funciones y no puntos, hablaremosde problemas de optimizacion dinamicos, tal como veremos mas adelante.

Los problemas de optimizacion estan en la escencia de la economıa: todo lo que se entiendepor comportamiento racional en economıa viene del hecho que los agantes agentes economicosse asume maximizan (o minimizan segun el caso) sus objetivos, sujeto a restricciones de re-cursos o informacion. En definitiva, el homus economicus podrıa ser entendido como un homusoptimizador...

Dada una funcion f : IRn → IR y dado S ⊆ IRn, en lo que sigue vamos entonces a resolver elsiguiente problema de optimizacion

mın (max) f(x)s.a x ∈ S

que se entiende como encontrar x0 ∈ S (no necesariamente unico!) tal que maximice o minimicela funcion sobre el conjunto1 S. Cuando S = IRn (es decir, todo el espacio) el problema se dicesin restricciones. En cambio, cuando S es un subconjunto estrıcto de IRn, el problema se dicerestringido o con restricciones.

En todo lo que sigue, sin perdida de generalidad supondremos que el problema que vamos atratar es uno de minimizacion. Esto se debe a que maximizar una funcion f es equivalente aminimizar la funcion (−f). La siguiente figura ilustra esta idea

1En otras palabras, encontrar un valor de x donde la funcion tome el valor mas pequeno sobre el conjunto(minimizar) o el valor mas grande sobre el mismo(maximizar).

127

Page 129: Libro Matematicas Para Economistas

128 CAPITULO 6. OPTIMIZACION ESTATICA

f

-f

x0Mínimo de (-f)

Máximo de f

De lo anterior, maximizar f corresponde a minimizar −f , razon por la cual si disponemos deuna tecnica que nos permita minimizar funciones, obviamente dicha tecnica nos permitira max-imizar funciones.

Dado el problema de optimizacion

mın f(x)s.a x ∈ S

definamos los siguientes conceptos basicos.

Definicion 6.1.1 Diremos que x0 es un mınimo local de la funcion sobre S si existe una bolaB(x0, r) tal que para todo x ∈ B(x0, r) ∩ S se tiene que f(x0) ≤ f(x). Por otro lado, x∗ se dicemınimo global de la funcion en S si para todo x ∈ S se tiene que f(x∗) ≤ f(x). 2

En otras palabras, la diferencia de un mınimo local con un global es que en el primero deellos la minimalidad se da en un entorno del punto en el conjunto de restriccion, mientras queel caso global esta minimalidad se da sobre todo el conjunto de restriccion.

La siguiente figura ilustra estos conceptos:

x x x1 2 3

f

Tanto x1 como x3 son mınimos locales mientras que x2 es mınimo global.

Nota. 6.1.1 Todas las condiciones de primer o segundo orden que vamos a desarrollar nospermitiran encontrar optimos locales. Si existen muultiples soluciones (varios mınimos locales),para determinar aquel que es el global se debe necesariamente evaluar la funcion objetivo yası discrimiar por aquel que entrega el menor valor de la funcion sobre el conjunto. En estesentido, las funciones convexas tienen la gracia que los mınimos locales coinciden con los mınimosglobales, lo que es de gran utilidad. Ya volveremos sobre este punto. 2

Definicion 6.1.1 Dado el problema de optimizacion anterior, definamos el conjunto de solu-ciones globales del mismo como argmin(f, S), es decir,

Page 130: Libro Matematicas Para Economistas

6.1. INTRODUCCION. 129

x0 ∈ argmin(f, S) ⇔ x0 ∈ S ∧ f(x0) ≤ f(x), ∀x ∈ S.

Definamos ademas el mınimo de la funcion en el conjunto como el mınimo valor de la funcionen el conjunto. Se notara min(f, S). Luego,

min(f, S) = f(x0), x0 ∈ argmin(f, S).

Notemos que este conjunto argmin(f, S) puede tener mas de un elemento (pueden habermuchas soluciones) o puede ser vacıo (el problema no tiene solucion). Sin embargo, si argmin(f, S) 6=φ, se tiene obviamente que para cualquier x1, x0 ∈ argmin(f, S), f(x0) = f(x1) = min(f, S).

En forma analoga podemos definir el argmax(f, S) como el conjunto de puntos que maximizaglobalmente la funcion en el conjunto y el max(f, S) como el maximo valor de la funcion en elconjunto.

Ejemplo 6.1.1 Para el problema de maximizacion de utilidad sujeto a restriccion presupues-taria

max u(x1, x2)s.a p1x1 + p2x2 = R

se tiene que el argmax(f, S) (con S = (x1, x2) ∈ IR2 |p1x1 + p2x2 = R) es la demanda de losindividuos mientras que max(u, S) es simplemente la utilidad indirecta.

Cuando al funcion f es continua y el conjunto de restricciones S es compacto, sabemos queel problema anterior tiene al menos una solucion. Este hecho es fundamental pues nos entregacondiciones muy basicas que permiten garantizar la existencia de soluciones de un problema deoptimizacion2.

Resumamos lo anterior en la siguiente proposicion.

Proposicion 6.1.1 Dada f : IRn → IR una funcion continua y dado S ⊆ IRn un conjuntocompacto entonces el problema de optimizacion

mın f(x)s.a x ∈ S

tiene al menos una solucion, es decir, existe x0 ∈ S (no necesariamente unico) tal que f(x0) ≤f(x), ∀x ∈ S, o, lo que es equivalente, argmin(f, S) 6= ∅.

Una vez resuelta la primera interrogante de saber si un determinado problema de opti-mizacion tiene o no solucion, la siguiente cuestion que nos ocupara sera disponer de metodosque nos permitan encontrar dicha solucion. En tal sentido, hay una fuerte restriccion a los posi-bles problemas de optimizacion para los cuales se puede disponer de estos metodos generales debusqueda. Los unicos casos en que esto es posible es cuando

• el conjunto de restriccion S esta definido por igualdades de funciones;

• y cuando conjunto de restriccion S esta definido por igualdades y desigualdades de fun-ciones.

Desafortunadamente no existe teorıa general para tratar el problema en toda su extension,es decir, para un conjunto S cualquiera. Sin embargo, de todas formas el espectro de conjuntos

2Esto, entre otros, justifica la definicion de compacidad.

Page 131: Libro Matematicas Para Economistas

130 CAPITULO 6. OPTIMIZACION ESTATICA

anterior es de todas suficientemente amplio para tratar una serie de problemas economicos deinteres. Para cada caso de conjunto de restriccion anterior se dispondra de condiciones de opti-malidad de primer y segundo orden, las que finalmente nos permitiran encontrar las solucionesdeseadas. Para el caso de conjuntos definidos por igualdades de funciones, estas condiciones sonlas llamadas de Lagrange, mientras que para el caso mas general de igualdades y desigualdadesestan seran las de Kuhn - Tucker. Esto lo detallamos mas adelante.

Finalmente, para terminar con esta introduccion, otra cuestion importante que vamos a con-siderar tiene que ver con la forma en que cambian las soluciones de los problemas de optimizacionante modificaciones de las restricciones del problema. Este analisis es de suma importancia eneconomıa, y en terminos generales se habla de analisis de sensibilidad, lo que veremos endetalle mas adelante. Por ahora un primer resultado simple.

Proposicion 6.1.1 Si S1 ⊆ S2 entonces mın(f, S1) ≥ mın(f, S2)3.

En otras palabras, si el conjunto de restriccion es mas pequeno, el valor mınimo de la funciones mas grande (o, equivalentemente, mientras menos restricciones tenemos en el problema, maspequeno es el mınimo de la funcion). La demostracion de esta propiedad es muy simple: six0 ∈ argmin(f, S1) entonces x0 ∈ S1 y luego x0 ∈ S2. Por lo tanto, dado x ∈ argmin(f, S2), setiene que f(x) ≤ f(x0), con lo cual mın(f, S1) ≥ mın(f, S2). De otra forma:si minimizamos unafuncion en un cierto conjunto, al considerar un conjunto mas grande caben dos posibilidades,(1) que este valor siga minimizando la funcion el el conjunto mayor o (2) que sea otro el puntoen el conjunto mas grande que minimize. En el primer caso, min(f, S1) = min(f, S2) y en elsegundo caso min(f, S1) ≥ min(f, S2), con lo cual, necesariamente min(f, S1) ≥ min(f, S2).

Ejercicio 6.1.1 Justifique y pruebe lo anterior. Mas aun, pruebe que cuando el problema es demaximizacion, al ser mas grande el conjunto de restricciones, entonces el valor del maximo esmayor. Aplique esto para demostrar que la funcion de costos es siempre creciente con la cantidadde producto. Apliquelo ademas para demostrar que en el problema del consumidor, si el preciode un bien aumenta, necesariamente la utilidad indirecta debe disminuir.

6.2. Problema de optimizacion sin restricciones

Consideremos el siguiente grafico que representa una funcion f : IR → IR

a b c d

Los puntos a y c son maximos locales de la funcion4. En cambio, los puntos b y d son mınimoslocales de la funcion. El maximo global de f se tiene en c mientras que el mınimo global en d.

3Inverso si el problema es de maximizacion: S1 ⊆ S2 entonces max(f, S1) ≤ max(f, S2).4Es decir, que existe una vecindad Va en torno al punto a tal que f(x) ≤ f(a), ∀x ∈ Va.

Page 132: Libro Matematicas Para Economistas

6.2. PROBLEMA DE OPTIMIZACION SIN RESTRICCIONES 131

Note que en todos los puntos anteriores la derivada de f es cero (recta tangente es horizontal).De esta manera, que la derivada sea cero en un punto no garantiza que el punto se el optimo(maximo o mınimo) de la funcion: es solo una condicion necesaria de optimalidad.

Por otro lado, en torno a los puntos de maximo local la funcion es localmente concava,mientras que en aquellos de mınimo es localmente convexa. A partir de esto se puede concluirque la segunda derivada de f en los puntos de maximo local es negativa mientras que en aquellosde mınimo debe ser positiva. Ası:

f ′(a) = f(c) = 0 ∧ f′′(a), f

′′(c) < 0.

f ′(b) = f(d) = 0 ∧ f′′(b), f

′′(d) > 0.

Estas son las condiciones necesarias de optimalidad de primer y segundo ordenpara maximizar o minimizar una funcion real, donde no existen restricciones sobre la variable.A traves de ellas podemos encontrar aquellos puntos que son candidatos a resolver el problemade maximizar o minimizar nuestra funcion.

Cuando la funcion es de varias variables, f : IRn → IR, las condiciones necesarias de op-timalidad de primer y segundo orden son similares a las anteriores. En este caso, la primeraderivada corresponde al gradiente de la funcion mientras que la segunda derivada al Hessiano: lapositividad o negatividad de la segunda derivada para el caso real se convierte en una condicionde positividad o negatividad para la matriz Hessiano de f .

De esta manera, las condiciones de optimalidad son las siguientes: x0 es un optimo local def : IRn → IR si

(1) ∇f(x0) = 0: condicion de primer orden.

(2) Si H(f, x0) ≥ 0 (Hessiano semi - definido positivo) entonces es un mınimo local (cond.de segundo orden).

(3) Si H(f, x0) ≤ 0 (Hessiano semi - definido negativo) entonces es un maximo local (cond.de segundo orden).

Note que la condicion ∇f(x0) = 0 es un sistema de n ecuaciones (cada una de las derivadasparciales ∂f(x0)

∂xj, j = 1, ..., n igualadas a cero) con n incognitas (las xj que maximizan). Dado

esto, al reemplazar estos candidatos en el Hessiano, debemos determinar si es definido positivoo negativo. Como hemos visto, para ello se calculan los valores propios de la matriz: si son todosmayores o iguales a cero, es semi - definida positiva; si todos son menores o iguales a cero, essemi - definida negativa.

Ejemplo 6.2.1 Supongamos dada f(x1, x2) = x31 − x2

1x2 + 2x22. Encontremos los puntos de

maximo o mınimo de la funcion. En primer lugar, impongamos la condicion ∇f(x1, x2) = 0, esdecir:

∂f(x1,x2)∂x1

= 3x21 − 2x1x2 = 0

∂f(x1,x2)∂x2

= −x21 + 4x2 = 0

Resolviendo el sistema encontramos que existen dos soluciones x1 = x2 = 0 y x1 = 6, x2 = 9.Veamos cual es maximo o mınimo local. Para ello debemos calcular el Hessiano de f :

H(f, x) =

(6x1 − 2x2 −2x1

−2x1 4

)

Page 133: Libro Matematicas Para Economistas

132 CAPITULO 6. OPTIMIZACION ESTATICA

Evaluando en los puntos candidatos se tiene que

H(f, (0, 0)) =

(0 00 4

)

Esta matriz es semi - definida positiva, luego la funcion tiene un mınimo local en (0, 0). Porotro lado, evaluando en x1 = 6 y x2 = 9 se tiene que

H(f, (6, 9)) =

(18 −12−12 4

)

Los valores propios de esta matriz vienen de resolver la ecuacion λ2 − 22λ − 72 = 0, cuyassoluciones son λ1 = 22+

√222+4·722 > 0 y λ2 = 22−√222+4·72

2 < 0. Luego, el punto encontrado no esni maximo ni mınimo local de f . En este caso es un punto de silla. De todo lo anterior, quedaclaro entonces que la funcion tiene un mınimo en el punto (0, 0).

Como se ha mencionado, el otro punto candidato es uno muy especial que frecuentementeaparece en matematicas: son los llamados punto de silla. Los puntos que maximizan una funcionde varias variables se pueden entender como las cumbres de los cerros, aquellas que la minimizancorresponden a los puntos de los valles donde la depresion es maxima. Los puntos de silla sonaquellos que seran puntas de cerro o valles segun la direccion por donde se camine en la superficiedel cerro: en una direccion seran cumbres de cerro y en otras sean valles, en unas direcciones semaximiza la funcion, en otras se minimiza. La siguiente figura se ilustra un punto de silla parauna funcion f : IR2 → IR

Punto Silla

Nota. 6.2.1 Si la funcion que deseamos minimizar es convexa, entonces ya sabemos que apriori el Hessiano es semi - definido positivo en todas partes. Por lo tanto, para encontrarlos optimos, solo bastara con encontrar aquellos puntos que anulan al gradiente, es decir, quesatisfacen las condiciones de primer orden: las de segundo orden son verificadas a priori debidoa la convexidad. Mas aun, si la funcion es estrıctamente convexa (es decir, sin caras planas),entonces, tal como vimos en la seccion de convexidad, el punto que satisface las condicionesnecesarias de optimalidad (derivada igual a cero) es unico y corresponde al mınimo global5.Esta es una propiedad fundamental de las funciones convexas. Para el caso de maximizacion elanalogo es con funciones concavas.

6.3. Problema de optimizacion con restricciones de igualdad

En lo que sigue vamos a suponer que S esta definido por igualdades de funciones. Ası,asumiremos dadas m funciones hi : IRn → IR, i = 1, ..., m, tales que

5En otras palabras, las funciones convexas no tienen mınimos locales.

Page 134: Libro Matematicas Para Economistas

6.3. PROBLEMA DE OPTIMIZACION CON RESTRICCIONES DE IGUALDAD 133

S = x ∈ IRn | hi(x) = 0, i = 1, ..., m.El problema que nos ocupa es se puede re-escribir entonces de la siguiente manera

mın f(x)s.a hi(x) = 0, i = 1, ..., m

Definicion 6.3.1 Diremos que un punto que verifica las restricciones del problema (es decir,hi(x) = 0,∀i = 1, ..., m) es un punto factible del problema de optimizacion considerado.

De esta manera, nuestro asunto consiste en encontrar, dentro de los puntos factibles, aquelque minimice la funcion objetivo f (de acuerdo a lo ya mencionado, estamos hablando de encon-trar mınimo locales que despues seran analizados para determinar cual de ellos es el global). Unconcepto clave para establecer las condiciones de optimalidad del problema es el de regularidadde un punto respecto de las restricciones.

Definicion 6.3.2 Un punto x∗ ∈ IRn que verifica las condiciones hi(x∗) = 0, i = 1, ..., m, sedice regular si el conjunto de gradientes ∇hi(x∗), i = 1, ..., m es linealmente independiente.

Esta condicion de regularidad recibe el nombre de condicion de cualificacion o de Mangazar-ian - Fromowitz. Es de suma importancia considerarlas, ya que de no cumplirse es muy probableque las condiciones necesarias de optimalidad que vamos a presentar no den origen a puntos quesean candidatos a resolver el problema de optimizacion: existe un problema de degenerancia queimplica que algunas soluciones puedan ser no optimas.

Para establecer las condiciones necesarias de optimalidad de primer orden, vamos a introducirel Lagrangeano de este problema de optimizacion. Esta funcion es fundamental en todo elanalisis que sigue.

Definicion 6.3.3 Dado el problema de optimizacionmın f(x)s.a hi(x) = 0, i = 1, ..., m

definamos la funcion

L : IRn × IRm → IR

tal que

L(x1, x2, ..., xn, λ1, λ2, ..., λm) = f(x) +m∑

i=1

λi · hi(x).

Esta funcion es el denominado Lagrangeano del problema de optimizacion. 2

Con lo anterior se tiene el siguiente teorema.

Teorema 6.3.1 Sea x∗ un punto mınimo local de f sujeto a las restricciones hi(x) = 0, i =1, ...,m. Supongamos ademas que x∗ es un punto regular. Existe entonces un vector λ =(λ1, λ2, ..., λm)t ∈ IRm tal que

∂f(x∗)∂xi

+m∑

j=1

λj∂hj(x∗)

∂xi= 0, i = 1, ..., n [1]

∂f(x∗)∂λj

= 0, j = 1, ..., m [2].

Page 135: Libro Matematicas Para Economistas

134 CAPITULO 6. OPTIMIZACION ESTATICA

Las ecuaciones [1] anteriores nos dicen que en el ptimo ocurre que el gradiente de lafuncion objetivo y los gradientes de las restricciones son l.d, mientras que las ecuaciones[2] son simplemente que el optimo debe satisfacer las restricciones del problema. Por otro lado,note que la condicion [1] anterior se puede expresar de manera equivalente como

∇f(x∗) +m∑

j=1

λj∇hj(x∗) = 0,

es decir, como

(1)∂L(x, λ)

∂xj= 0, j = 1, ..., n

(2)∂L(x, λ)

∂λi= 0, i = 1, ..., m,

Lo anterior corresponde a un sistema de n + m ecuaciones (cada una de las n derivadasparciales iguales a cero ademas de las m restricciones del problema) con m + n incognitas (losxi y los λj). Con esto podemos, en principio, encontrar los puntos candidatos a resolver nuestroproblema de optimizacion.

Ejemplo 6.3.1 Para una demostracion informal (y particular) del teorema anterior, veamos elcaso simple de una funcion que depende de dos variables y donde hay solo una restriccion:

mın f(x1, x2)s.a h1(x1, x2) = 0

De la condicion h1(x1, x2) = 0 se tiene que existe una relacion implıcita entre x1 y x2,digamos x2 = x2(x1). Luego, reemplazando esta restriccion en la funcion objetivo, el problemaanterior se convierte en

mın f(x1, x2(x1))s.a x1 ∈ IR

que es un problema de optimizacion sin restricciones y que depende de solo una variable. Por lotanto, basta con derivar f con respecto a x1 e igualar a cero. Ası, derivando (aplicar la regla decadena) se tiene que:

d f(x1, x2(x1))dx1

= 0 ⇔ ∂f(x1, x2(x1))∂x1

+∂f(x1, x2(x1))

∂x2· ∂x2(x1)

∂x1= 0.

Por otro lado, de la relacion h1(x1, x2(x1)) = 0, derivando c.r a x1 se tiene que

∂h1(x1, x2(x1))∂x1

+∂h1(x1, x2(x1))

∂x2· ∂x2(x1)

∂x1= 0,

y luego,

∂x2(x1)∂x1

= −∂h1(x1,x2(x1))

∂x1

∂h1(x1,x2(x1))∂x2

.

Reemplazando en la relacion anterior que involucra a f se tiene que

∂f(x1, x2(x1))∂x1

+∂f(x1, x2(x1))

∂x2·−

∂h1(x1,x2(x1))∂x1

∂h1(x1,x2(x1))∂x2

= 0,

Page 136: Libro Matematicas Para Economistas

6.3. PROBLEMA DE OPTIMIZACION CON RESTRICCIONES DE IGUALDAD 135

es decir,

∂f(x1,x2(x1))∂x1

∂f(x1,x2(x1))∂x2

=∂h1(x1,x2(x1))

∂x1

∂h1(x1,x2(x1))∂x2

.

En otras palabras, los vectores ∇f y ∇h1 son proporcionales en el optimo, es decir, dado x∗ eloptimo, existe λ ∈ IR tal que

∇f(x∗) + λ · ∇h1(x∗) = 0,

que es la forma vectorial de escribir las condiciones necesarias de optimalidad que ya habıamosmostrado6.

Finalmente debemos establecer las condiciones de segundo orden para determinar si lospuntos condidatos son maximos o mınimos de la funcion. El resultado que se tiene es el siguiente:

Teorema 6.3.2 Supongamos que x∗ es un mınimo local de f que satisface hj(x∗) = 0, j =1, ...,m y que ademas es regular. Como sabemos, existe λ = (λj) ∈ IRm (multiplicadores) talque

∇f(x∗) +m∑

j=1

λj∇hj(x∗) = 0.

Entonces la matriz

H = H(f, x∗) +m∑

j=1

λjH(hj , x∗)

es semi - definida positiva en el conjunto M := y ∈ IRn | ∇hj(x∗) · y = 0, ∀j = 1, ...,m.

Nota. 6.3.1 Recordemos que H(f, x∗) es el Hessiano de f en x∗: matriz simetrica de segundasderivadas parciales. Por otro lado, el conjunto M corresponde al conjunto ortogonal de losgradientes de las restricciones:

M := ∇h1(x∗),∇h2(x∗), ...,∇hm(x∗)⊥.

Para verificar las condiciones de segundo orden se requiere en primer lugar determinar x∗

y λ, lo que viene de las condiciones de primer orden. Luego se procede a verificar si la matrizrespectiva es semi - definida positiva. De hecho, solo se requiere averiguarlo en un conjunto masrestringigo: el ortogonal de las restricciones. En particular, si dicha matriz es semi - definidapositiva en todo el espacio, automaticamente se tiene en este conjunto menor, lo que garantizala minimadidad del punto en cuestion.

6En efecto, si tenemos dos vectores x = (x1, x2)t es y = (y1, y2)

t tales que

x1

x2=

y1

y2,

entonces (x1, x2) = x2 · (x1x2

, 1) = x2 · ( y1y2

, 1) = x2y2· (y1, y2), luego, existe λ = x2

y2tal que (x1, x2) = λ(y1, y2), es

decir, son l.d.

Page 137: Libro Matematicas Para Economistas

136 CAPITULO 6. OPTIMIZACION ESTATICA

Ejemplo 6.3.2 Consideremos el problema del consumidor:

max u(x)

s.an∑

i=1pi · xi = I

Como se trata de maximizacion, la forma de proceder es analoga al caso de una minimizacionpara efectos de establer las condiciones de primer orden.

Otro problema relevante es el de minimizar el costo sujeto a una restriccion de produccion:

mın w1x1 + w2x2 + ... + wnxn

s.a f(x1, x2, ..., xn) = y

donde f es la funcion de produccion, wi los precios de los factores e y la produccion objetivo.Como ejercicio se deja propuesto desarrollar las condiciones de primer orden del problema yen el caso particular n = 2 y f(x1, x2) = u(x1, x2) = xα

1 · xβ2 , desarrollar explıcitamente estas

condiciones y encontrar el argmax, el min y el max segun corresponda.

Ejercicio 6.3.1 Supongamos que en la economıa hay dos individuos i = 1, 2, cuyas funcionesde utilidad son ui(x1, x2) = xai

1 ·xbi2 . Dichos individuos poseen inicialmente dotaciones de ambos

bienes de la economıa, digamos wi = (w1i, w2i) y que los precios de los bienes son p1 y p2

respectivamente.

a.- Plantee el problema de maximizacion de beneficio de cada individuo, considerando que lariqueza inicial esta dada por el valor de su dotacion inicial a los precios pi. Encuentre lasolucion de dicho problema.

b.- Si denotamos por x∗ij la demanda del indivuduo i = 1, 2 por el bien j = 1, 2, definamos elexceso de demanda de la economıa como:

z(p1, p2) = (x∗11 + x∗21 − w11 − w21; x∗12 + x∗22 − w12 − w22) ∈ IR2.

Para este problema, se pide encontrar explıcitamente la funcion z y determinar bajo quecondiciones sobre los parametros es contractante.

c.- Cambiemos ligeramente la formulacion del problema y supongamos que el objetivo es aho-ra maximizar una utilidad conjunta de la forma U(x11, x12, x21, x22) = u1(x11, x12) +λu2(x21, x22), donde λ > 0. Las restricciones son las anteriores. Es este problema equiva-lente al anterior en cuanto a sus soluciones? Determine las soluciones del problema agre-gado y comente.

6.4. Problema de optimizacion con restricciones de desigualdad

En este caso, el problema general que nos ocupa tiene la forma

mın f(x)s.a hi(x) = 0, i = 1, ..., m

gj(x) ≤ 0, j = 1, ..., p

La siguiente figura ilustra este tipo de restricciones (solo desigualdades):

Page 138: Libro Matematicas Para Economistas

6.4. PROBLEMA DE OPTIMIZACION CON RESTRICCIONES DE DESIGUALDAD 137

xx

g

g

g

1

2

3

* **

La flecha indica el sentido de la desigualdad: en la direccion de la flecha, la funcion esnegativa, en la otra es positiva. Obviamente sobre la curva la funcion es cero. En el ejemplo, elconjunto factible esta definido por tres funciones: g1, g2 y g3 : IR2 → IR. En la figura, el puntox∗ se encuentra en el interior del conjunto factible: de hecho, gi(x∗) < 0, i = 1, 2, 3. En cambio,el punto x∗∗ esta en la frontera del conjunto. Note que solo estan activas7 las restricciones 2y 3: g2(x∗∗) = g3(x∗∗) = 0 mientras que g1(x∗∗) < 0.

A partir de lo anterior nos queda claro que en este tipo de problemas, las restriccionesrelevantes son las activas, es decir, donde la desigualdad se convierte en igualdad.

Si a apriori supieramos cuales de las restricciones de desigualdad seran activas en el optimo,entonces el problema se podrıa tratar utilizando multiplicadores de Lagrange como en el casoanterior. Sin embargo, no sabemos esto y por lo tanto se requiere de condiciones complementariasque permitan discriminar sobre el asunto.

En primer lugar, antes de establecer el resultado, necesitamos el concepto de punto regularpara este caso.

Definicion 6.4.1 Un punto x∗ ∈ IRn que verifica las condiciones hi(x∗) = 0 y gj(x∗) ≤ 0,i = 1, ..., m; j = 1, ..., p, se dice regular para las restricciones consideradas si el conjunto degradientes

∇hi(x∗), ∇gj(x∗), i = 1, ..., m, j ∈ JAes linealmente independiente, donde JA ⊆ 1, ..., p respresenta aquellas restricciones que sonactivas en x∗8.

Con lo anterior, la condicion de primer orden es muy similar en este tipo de problema queen aquel de igualdad. Esta condicion es la llamada de Karush - Kuhn - Tucker.

Teorema 6.4.1 Condiciones de Karush - Kuhn - Tucker (primer orden)Sea x∗ un punto de mınimo local para el problema

mın f(x)s.a hi(x) = 0, i = 1, ...,m

gj(x) ≤ 0, j = 1, ..., p

tal que es regular para las restricciones. Entonces existen multiplicadores λj , j = 1, ..., m yµk, k = 1, ..., p tales que

7Se dice que una restriccion i (gi(x) ≤ 0) es activa en el punto x∗ si gi(x∗) = 0.

8Es decir, aquellas que estan en igualdad en x∗

Page 139: Libro Matematicas Para Economistas

138 CAPITULO 6. OPTIMIZACION ESTATICA

a.- µk ≥ 0

b.- ∇f(x∗) +m∑

j=1λj∇hj(x∗) +

p∑k=1

µk∇gk(x∗) = 0

c.-p∑

k=1µkgk(x∗) = 0.

La condicion a.− es de no negatividad de los multiplicadores asociados a las restricciones dedesigualdad; la b.- es una del tipo Lagrange y la c.- es la denominada de holgura complemen-taria.

La version no-vectorial de la segunda condicion es

∂f(x∗)∂xi

+m∑

j=1

λj∂hj(x∗)

∂xi+

p∑

k=1

µk∂gk(x∗)

∂xj= 0, i = 1, ..., n.

En lo que sigue, veremos la intuicion matematica de este importante resultado:

a.- Supongamos que el problema de optimizacion esmın f(x)s.a g1(x) ≤ 0

y que la solucion es x∗ tal que g1(x∗) < 0 (restriccion no activa). En tal caso, la solu-cion es interior al conjunto de restriccion y por lo tanto, la condicion de optimalidad essimplemente ∇f(x∗) = 09. En forma equivalente, de lo anterior se cumple que ∇f(x∗) +µ1∇g1(x∗) = 0, con µ1 = 0 (condicion de KKT). En consecuencia, las restricciones inacti-vas no influyen en las condiciones de optimalidad.

b.- supongamos ahora que x∗ mınimo local de f en el problema orginal; supongamos ademasque las restricciones activas son las q primeras (con q ≤ p), es decir, g1(x∗) = g2(x∗) =... = gq(x∗) = 0. Por lo tanto, gq+1(x∗) < 0, ..., gp(x∗) < 0. Ahora bien, si x∗ resuelve elproblema original, tambien resuelve el siguiente problema:

mın f(x)s.a hi(x) = 0, i = 1, ..., mgj(x) = 0, j = 1, ..., qgj(x) < 0, j = q + 1, ..., p

En consecuencia, por el lado de las primeras m + q restricciones deben existir multipli-cadores de Lagrange λ1, ..., λm, µ1, ..., µq tales que

∇f(x∗) +m∑

j=1

λj∇hj(x∗) +q∑

k=1

µk∇gk(x∗) = 0.

Las restricciones que no estan activas (q + 1, q + 2, ..., p), segun lo visto en el punto [a.−]no influyen en las condiciones de optimalidad. Para ellas, en forma analoga a lo hecho,escojamos µk = 0, k = q + 1, q + 2, ..., p. Luego, a partir de esto, solo restarıa mostrar lapositividad de los multiplicadores µk, k = 1, 2, ..., q para concluir las condiciones de KKT.

9Recordemos que el problema se tiene en los puntos frontera, no en el interior donde la condicion de primerorden es simplemente el gradiente igual a cero.

Page 140: Libro Matematicas Para Economistas

6.4. PROBLEMA DE OPTIMIZACION CON RESTRICCIONES DE DESIGUALDAD 139

Esto viene del siguiente hecho: ya que x∗ es un mınimo de la funcion, implica que puntoscercanos a x∗, dentro del conjunto, deberıan tener un valor mayor: en otras palabras,la funcion deberıa crecer en cualquier direccion de entrada al conjunto. Como lasdirecciones de antrada al conjunto son los gradientes de las restricciones con signo opuesto,se tiene que el gradiente de la funcion objetivo deberıa apuntar en la misma direccion deaquellos de dichas direcciones de entrada, es decir, ser una combinacion lineal positiva delos mismos. En otras palabras, deberıan existir multiplicadores µ1, ..., µq ≥ 0 tales que

∇f(x∗) = µ1 · (−∇g1(x∗)) + µ2(−∇g2(x∗)) + ... + µq(−∇gq(x∗)),

lo que equivale a decir que ∇f(x∗)+µ1 ·∇g1(x∗)+µ2∇g2(x∗)+ ...+µq∇gq(x∗) = 0. Comoademas debemos considerar las restricciones de igualdad, aparecen los multiplicadores deLagrange. Ası, considerando que para restricciones inactivas basta tomar µk = 0, juntandotodo lo anterior se conluyen las condiciones de KKT.

Nota. Notemos que de la condicion µk ≥ 0, k = 1, ..., p y del hecho quep∑

k=1µkgk(x∗) = 0 se tiene

que eventulamente algun µk > 0 siempre y cuando la restriccion correspondiente sea activa. Sila restriccion es inactiva, necesariamente el multiplicador debe ser cero.

En terminos generales, la forma de resolver un problema de esta naturaleza consiste en probartodas las posibles combinaciones de restricciones de desigualdad, haciendolas activas e inactivas,y determinar los parametros λj y µk. Se debe entonces verificar el signo de los mismos y lacondicion de holgura complementaria. Si todo cumple con la regla habremos encontrado un puntocandidato. De hecho, si hay p restricciones de desigualdad, habra que probar 2p combinacionesde activa - inactiva y obviamente resolver 2p problemas de optimizacion.

Ejemplo 6.4.1 Considere el problema:

mın 2x21 + 2x1x2 + x2

2 − 10x1 − 10x2

s.a x21 + x2

2 ≤ 53x1 + x2 ≤ 6

Las condiciones de primer orden, ademas de las restricciones del problema, son:4x1 + 2x2 − 10 + 2µ1x1 + 3µ2 = 02x1 + 2x2 − 10 + 2µ1x2 + µ2 = 0µ1 ≥ 0, µ2 ≥ 0µ1 · (x2

1 + x22 − 5) = 0

µ2 · (3x1 = x2 − 6) = 0.

Para hallar la solucion, la forma de proceder considera necesariamente definir varias combi-naciones de restricciones activas y ver si se verifican los signos de los multiplicadores resultantes(solo los µk, los λj no tienen restriccion de signo). En este problema se puede intentar haceractivas ninguna de las restricciones, solo una de ellas o ambas10. Por ejemplo, al suponerque solo la primera es activa y la segunda no, resultan las siguientes ecuaciones:

4x1 + 2x2 − 10 + 2µ1x1 = 010En total cuatro combinaciones. Si tuvieramos p restricciones de desigualdad deberıan considerarse 2p combi-

naciones de activas e inactivas. Problema trabajoso!

Page 141: Libro Matematicas Para Economistas

140 CAPITULO 6. OPTIMIZACION ESTATICA

2x1 + 2x2 − 10 + 2µ1x2 = 0x2

1 + x22 − 5 = 0

Resolviendo el sistema, se tiene que x1 = 1, x2 = 2 µ1 = 1. Esto produce 3x1 + x2 = 5 y porlo tanto se satisface la segunda restriccion (que sigue inactiva). Luego, existe el multiplicadorpositivo (µ1 = 1 ≥ 0 y µ2 = 0 (imponemos el valor cero ya que la restriccion 2 se encuentraactiva) y ademas el punto es factible. En resumen, el punto encontrado verifica las condiciones deoptimalidad y es un candidato a mınimo local. Para terminar con el problema se debe analizarel resto de los casos posibles.

Las condiciones de segundo orden para este problema son similares al caso estudiado derestricciones con igualdad. De esta manera, se tiene la siguiente proposicion:

Teorema 6.4.2 Condiciones de segundo ordenSupongamos que x∗ es un mınimo local de f que satisface hj(x∗) = 0, gk(x∗) ≤ 0, j = 1, ..., m

y k = 1, ..., p. Supongamos ademas que dicho punto es regular para las restricciones11. Comosabemos, existen λ = (λj) ∈ IRm y µk, k = 1, ..., p (multiplicadores) tales que µk ≥ 0 y ademas

∇f(x∗) +m∑

j=1

λj∇hj(x∗) +p∑

k=1

µk∇gk(x∗) = 0.

Entonces (condiciones de segundo orden) la matriz

H = H(f, x∗) +m∑

j=1

λjH(hj , x∗) +

p∑

k=1

µkH(g, x∗)

es semi - definida positiva en el conjunto ortogonal de las restricciones activas:

M := y ∈ IRn | ∇hj(x∗) · y = 0, ∀j = 1, ...,m, ∇gk(x∗) · y = 0, k ∈ Activas.

Un caso particular importante del resultado anterior se tiene cuando las funciones involu-cradas son concavas o convexas. En tal situacion, para resolver el problema de optimizacionbasta solo con las condiciones necesarias de optimalidad de primer orden, lo que se resume enla siguiente proposicion:

Proposicion 6.4.1 Dado el problema de optimizacion

mın f(x)s.a gk(x) ≤ 0, k = 1, ..., p

entonces, si f es concava y cada una de las gk son convexas, se tiene que todo mınimo local delproblema anterior es un mınimo global y este se determina a traves de las condiciones de primerorden (KKT): no se requiere un analisis de segundo orden para concluir.

11En algunos textos encontraan que dicho punto verifica las condiciones de cualificacion o de Mangazarian -Fromowitz.

Page 142: Libro Matematicas Para Economistas

6.5. ANALISIS DE SENSIBILIDAD Y TEMAS RELACIONADOS 141

6.5. Analisis de sensibilidad y temas relacionados

El objetivo del analisis de sensibilidad es estudiar como varian las soluciones del problemade optimizacion cuando alguno de los parametros que lo definen son perturbados. A modode ejemplo, pensar en problemas de demanda de mercado y el analisis que se efectua cuandolos precios son modificados o en un analisis de costos cuando los precios de los insumos sonperturbados. La idea en entonces analizar el efecto en el valor del optimo (valor de la funcionobjetivo) como sobre las soluciones del problema12.

De esta manera, supongamos dado el siguiente problema de optimizacion13:

mın f(x, α)s.a gk(x, α) ≤ 0, k = 1, ..., p

donde, tanto la funcion objetivo, como las restricciones, dependen de un parametro α = (α1, ..., αq)14.A modo de ejemplo, consideremos el siguiente problema de optimizacion (problema del consumidor)15:

maxu(x1, ..., xn)s.a p1x1 + ... + pnxn ≤ I

En este caso los parametros que son de interes son los precios y el ingreso. De esta manera,α → p1, p2, ..., pn, I: vector de IRn+1. La solucion del problema de optimizacion (demanda delindividuo) depende de parametros pk e I, como ası la funcion de utilidad indirecta.

Otro ejemplo es el analisis de la funcion de costos de una firma, en cuyo caso los parametrosα corresponden, por ejemplo, a los precios de los factores y el precio del producto, etc.

Volviendo al problema de optimizacion:

mın f(x, α)s.a gk(x, α) ≤ 0, k = 1, ..., p

con α = (α1, ..., αq), el Lagrangeano es:

L(x, λ, α) = f(x, α) +p∑

k=1

λjgk(x, α).

La condicion de optimalidad establece que en la solucion x∗, λ∗ se debe cumplir que

∇xL(x∗, λ∗, α) = 0

donde ∇x representa la derivacion c.r a x1, ..., xn. Sin perdida de generalidad asumiremos quetodas las restricciones son activas en la solucion, de modo que gk(x∗, α) = 016. Para hacer masexplıcita la dependencia de x∗ y λ∗ en α, denotemos la solucion del problema como x∗ = x(α) ∈IRn y λ∗ = λ(α) ∈ IRp. Por lo tanto, se tiene que:

12A modo de ejemplo, si la funcion objetivo fuera una de utilidad y la restriccion de tipo presupuestario,estariamos preocupados de analizar los cambios sobre la demanda (solucion del problema) y la funcion de utilidadindirecta (valor del optimo) ante variaciones en los parametros (pej. precios.

13En lo que sigue solo vamos a considerar restricciones de de desigualdad. El caso con restricciones de igualdadse desprende de los resultados obtenidos en esta seccion. En efecto, una restriccion de igualdad se puede obtenerde dos restricciones de desigualdad: h(x) = 0 si y solo si, h(x) ≤ 0 y −h(x) ≤ 0. Luego, un analisis general en elcaso de desigualdades cubre el caso indicado.

14Pensar en precios, rentas, productividad, etc.15Insisto en que las condiciones de optimalidad que hemos visto son validas si el problema es de minimizacion

o maximizacion. En ambos casos el metodo es el mismo. La salvedad es que debe estar claro en el contexto deque tipo de problema se trata para efectos de interpretacion: las condiciones necesarias de primer ordenson similares, la forma de discriminar es por medio de las condiciones de segundo orden.

16No es necesario considerar las no activas.

Page 143: Libro Matematicas Para Economistas

142 CAPITULO 6. OPTIMIZACION ESTATICA

∇xL(x(α), λ(α), α) = 0

gk(x(α), α) = 0, k = 1, ..., p.

Ası, como hemos indicado, el problema central del analisis de sensibilidad consiste en estudiarcomo varıan las soluciones del problema de optimizacion (y el valor optimo) cuandolos parametros α son modificados. En otras palabras, estamos buscando caracterizar el valorde:

∂xi(α)∂αk

,∂λj(α)∂αk

.

La respuesta nos la entrega el siguiente resultado general:

Teorema 6.5.1[

∂λ(α)∂αk

∂x(α)∂αk

]= −

[0 Lλx

Lλx Lxx

]−1

·[

Lλαk

Lxαk

]

con k = 1, ..., q y donde

a.- ∂λ(α)∂αk

: vector de derivadas parciales de los multiplicadores c.r a αk, es decir, ∂λ(α)∂αk

=[∂λ1(α)

∂αk, ..., ∂λm(α)

∂αk

]t(traspuesto). Analogo con ∂x(α)

∂αk.

b.- Lλx : matriz de segundas derivadas parciales del Lagrangeano c.r a xi y λj. Analogo conLxx: matriz de segundas derivadas parciales del Lagrangeano c.r a xi.

c.- Lλαk: matriz de segundas derivadas parciales del Lagrangeano c.r a λj y αk. Analogo con

Lxαk.

Este es un resultado general, que no vamos a demostrar17. En lo que sigue, nos concetraremosen algunos casos particulares y consecuencias de esta propieda. Estas se presentan en el siguienteresultado:

Proposicion 6.5.1 Como casos particulares del resultado anterior se tiene que:

a.- Sensibilidad c.r a un parametro y restriccion de igualdad.

Supongamos dado el problema de optimizacion de la forma:

mın f(x)s.a hi(x) = ci, i = 1, ..., m

tal que cuando ci = 0, ∀i, tiene una solucion x∗, λ∗. Entonces para ci cercano a cero setiene que el problema perturbado tiene una solucion x(c) que varıa continuamente con c,de modo que x(0) = x∗ y ademas se verifica que:

∂f(x(c))∂ci

]

ci=0= −λi.

17Ver A. Takayama, Analytical methods in economics, The Univesity of Michigan Press, 2000.

Page 144: Libro Matematicas Para Economistas

6.5. ANALISIS DE SENSIBILIDAD Y TEMAS RELACIONADOS 143

c.- Teorema de la envolvente

Supongamos el siguiente problema de optimizacion

mın f(x, α)s.a hj(x, α) = 0, j = 1, ..., m

donde α = (α1, ..., α`) ∈ IR` es un vector de parametros y todas las funciones involucradasson continuamente diferenciables18. Sea x(α) ∈ IRn la solucion del problema y sea ademasmin(f)(α) = f(x(α), α) el valor mınimo de la funcion. Entonces, para todo k = 1, ..., ` setiene que

d min(f)(α)dαk

=∂f(x(α), α)

∂αk+

m∑

j=1

λj∂hj(x(α), α)

∂αk,

donde λj es el multiplicador que viene de las condiciones necesarias de optimalidad.

Finalmente, concluimos esta seccion con un resultado que nos entraga condiciones para garan-tizar que las soluciones, y el valor optimo del problema de optimizacion, sean funciones continuasde los parametros. Este hecho es relevante ya que, por ejemplo, nos entrega condiciones que per-miten garantizar cuando cambios suaves de los parametros implican variaciones controladas enlas soluciones del problema. Somos mas felices con este tipo de resultados.

Teorema 6.5.2 Teorema del maximo de Berge

Dado el problema de optimizacion:

mın f(x, α)s.a gj(x, α) ≤ 0, j = 1, ..., p,

supongamos que para α∗, la solucion del problema es x∗(α∗). Entonces, si las funciones f ygj son continuas en x∗(α∗), α∗ y el conjunto de restricciones que definen las desigualdades escompacto entonces la funcion mın(f)(α) = f(x∗(α), α) es continua en α∗ y si la solucion x∗(α)es unica, entonces, vista como funcion de los parametros, tambien es una funcion continua.

Ejemplo 6.5.1 a.- Demostremos el teorema de la envolvente para el caso particular en quehay solo un parametro (digamos a ∈ IR) y solo una restriccion. En otras palabras, elproblema de optimizacion es:

mın f(x, a)s.a h(x, a) = 0

En tal caso, sea x(a) = (x1(a), ..., xn(a)) ∈ IRn la solucion del problema. Derivando direc-tamente f(x(a), a) c.r al valor a se tiene que (aplicar la regla de la cadena):

d f(x(a), a)da

=n∑

i=1

∂f(x(a), a)∂xi

· ∂xi(a)∂a

+∂f(x(a), a)

∂a.

Como el punto x(a) es optimo del problema, por condicion de optimalidad se tiene que

∇f(x(a), a) + λ∇h(x(a), a) = 0.18es decir, la derivada de cada una de ellas es continua.

Page 145: Libro Matematicas Para Economistas

144 CAPITULO 6. OPTIMIZACION ESTATICA

Ahora, como h(x(a), a) = 0, derivando (aplicar regla de la cadena!) se tiene quen∑

i=1

∂h(x(a),a)∂xi

· ∂xi(a)∂a + ∂h(x(a),a)

∂a = 0.

De las dos relaciones anteriores se deduce inmediatamente lo indicado (Ejercicio: com-pletar la demostracion sustituyendo los terminos).

b.- Consideremos el problema de minimizacion de costos de una firma:mınw1x1 + w2x2 + ... + wnxn

s.a f(x1, x2, ..., xn) = y,

donde wi son los precios de los factores e y el nivel de producto deseado. La solucion deeste problema se representa por xi(w, y): demanda condicional de factores, mientras queel valor optimo

n∑

i=1

wixi(w, y)

corresponde a la funcion de costos C(w, y). En este problema los parametros α son losprecios wi y el nivel de produccion y. Se deja como ejercio determinar las derivadas ∂C(w,y)

∂wi

y ∂C(w,y)∂y . Verificar con lo anterior el Lema de Shephard.

6.6. Ejercicios Adicionales

P1.- Considere el problema de minimizacion de costos para una firma. Digamos que la produc-cion eficiente esta representada por la siguiente funcion de produccion:

y = f(l, k) = Akαlβ (6.1)

Ademas, es conocido el hecho de que esta firma participa en mercados competitivos. Por lotanto, el precio que cobra en el mercado es fijo e igual a p. De la misma forma, los preciosde los insumos que utiliza son w y r, para el trabajo (l) y el capital (k), respectivamente.Ud. debe resolver las siguientes preguntas:

1. Plantee el problema de la firma, y encuentre las condiciones de primer orden delproblema.

2. Calcule la funcion de costos y las demandas condicionadas de factores.3. Muestre que la funcion de costos es homogenea de grado 1 en precio de insumos.4. Muestre que la funcion de costos es no decreciente en el nivel de producto.5. Muestre que la funcion de costos es concava en r y w. Ayuda: Suponga A = 1 y

α + β = 1.6. Demuestre el Lema de Sheppard, por el cual ∇~wC = z(~w, q), donde ∇ representa la

gradiente de C y z es el vector de demandas condicionadas.7. Demuestra que si f(·) es concava, entonces C(·) es convexa en el nivel de producto.

P2.- Resuelva el siguiente problema:

max pf(x1, x2)− w1x1 − w2x2 s.a. f(x1, x2) = xα1 xβ

2 (6.2)

donde se tienen los siguientes valores para los parametros:p = 75, w1 = 15, w2 = 20, α = 0,5y β = 0,3.

Page 146: Libro Matematicas Para Economistas

6.6. EJERCICIOS ADICIONALES 145

1. De una interpretacion economica al problema.2. Encuentre las condiciones de primer orden.3. Encuentre la funcion de beneficios y la demanda derivada de factores. Encuentre

ademas sus valores en el optimo.4. Muestre que la funcion Lagrangiana del problema asegura la condicion de segundo

orden en el optimo(es concava). Para esto utilize dos metodos:a) Analisis de menores a partir de la matriz Hessiana.b) Analisis de valores propios a partir de la matriz Hessiana.

5. Grafique la funcion objetivo.

P3.- Resuelva el siguiente problema de optimizacion con restricciones:

maxx1,x2

−x2 − y2 + 20x− 40y (6.3)

s.a. − x− y2 + 9 ≥ 0 (6.4)x ≥ 0 (6.5)

x2 + y2 − 26 = 0 (6.6)

P4.- Encuentre la solucion (es) al siguiente problema:

max(x1,x2)F (x1, x2) = −8x22 − 10x2

2 + 12x1x2 − 50x1 + 80x2 (6.7)

x1 + x2 ≤ 1 (6.8)8x2

1 + x22 ≤ 2 (6.9)

x1 ≥ 0 (6.10)x2 ≥ 0 (6.11)

P5.- 1. Plantee y Demuestre el Teorema de la Envolvente.2. Demuestre que si u() es una funcion de utilidad que representa una relacion de pref-

erencias ”bien comportadas”, entonces si h(p, u) es la demanda hicksiana se cumpleque:

h(p, u) = ∇pe(p, u) (6.12)

donde ∇p es el nabla de la funcion de gastos respecto a los precios. Ayuda: Utiliceintuicion de teorema de la Envolvente.

3. Aplique el anterior resultado para una funcion de utilidad del tipo u = xα1 xβ

2 . (Ayuda:Puede suponer que es homogenea de grado 1).

4. Demuestre la identidad de Roy, y aplıquela al caso anterior.

P6.-maxx1,x2

6x1 − 2x21 + 2x1x2 − 2x2

2 (6.13)

sujeto a

3x1 + 4x2 ≤ 6 (6.14)−x1 + 4x2

2 ≤ 2 (6.15)x1, x2 ≥ 0 (6.16)

Page 147: Libro Matematicas Para Economistas

146 CAPITULO 6. OPTIMIZACION ESTATICA

P7.- Resuelva el siguiente problema de optimizacion:

maxx1,x2

px21 + qx1x2 (6.17)

sujeto a

x21 + rx2

2 ≤ 1 (6.18)x1, x2 ≥ 0 (6.19)

P8.- Encuentre geometricamente la solucion del problema anterior si p = 0, q = r = 1. Obten-ga para ellos las condiciones de Kuhn-Tucker. Para que valor de los parametros existesolucion?

P9.- Suponga que Ud. quiere construir una caja de carton de volumen maximo, pero posee uncarton de area dado. Es decir, Ud. debe resolver:

maxx,y,z

xyx s.a (xy + yz + xz) =c

2(6.20)

donde c es el area. Resuelva el problema

P10.- Dado el problema de optimizacion

maxx,y,z

2x21 + 2x1x2 + x2

2 − 10x1 − 10x2 s.a (6.21)

x21 + x2

2 ≤ 5 (6.22)3x1 + x2 ≤ 6 (6.23)

determine los valores optimos para x1, x2 y los multimplicadores de Lagrange

P11.- Resuelvamaxx1,x2

3x1x2 − x32 (6.24)

sujeto a

2x1 + 5x2 ≥ 20 (6.25)x1 − 2x2 = 5 (6.26)

x1, x2 ≥ 0 (6.27)

P12.- Reglas de Polıtica.

Suponga que la autoridad tiene como objetivo el minimizar la siguiente funcion de perdida:

Ψ = E[απ2t + (1− α)y2

t ] (6.28)

siendo E el operador de esperanza y donde πt Y yt son la tasa de inflacion del perıodo Yel logaritmo del producto del perıodo, respectivamente. El parametro α recibe el nombrede aversion de la autoridad hacia la inflacion. Considere ademas que existen dos tipos deshocks en la economıa, st y dt, shocks agregados de oferta y demanda con varianzas σ2

s y σ2d

respectivamente, que afectan a las variables inflacion y producto a traves de las siguientesecuaciones:

yt = γ(rt − dt) + st (6.29)π= − (rt − dt)− wst (6.30)

con γ < 0.

Page 148: Libro Matematicas Para Economistas

6.6. EJERCICIOS ADICIONALES 147

1. Se puede ver que el shock de demanda dt mueve a la inflacion y el producto en lamisma direccion, mientras que el shock de oferta los mueve en direccion contraria.¿Cual es la intuicion economica de este supuesto?

2. Plantee el problema a resolver por la autoridad, suponiendo que esta tiene comoinstrumento a la tasa de interes r.

3. Suponiendo que el Banco Central reacciona frente a los shocks de oferta y demanda,siguiendo una regla lineal para la tasa de interes de la forma r=a*d+b*s, resuelva elproblema planteado anteriormente y encuentre a y b como funcion de los parametrosdel modelo.

4. Encuentre la varianza para el producto (logaritmo) (σ2y) y para la inflacion (σ2

π).

Interprete ademas lo que ocurre con la relacion σ2y

σ2π

para distintos valores de la aversionde la autoridad respecto de la variablidad de la inflacion (α), ¿de que depende?.

Page 149: Libro Matematicas Para Economistas

148 CAPITULO 6. OPTIMIZACION ESTATICA

Page 150: Libro Matematicas Para Economistas

Capıtulo 7

Ecuaciones diferenciales y endiferencia

7.1. Ecuaciones diferenciales: introduccion

Una ecuacion diferencial es aquella donde la incognita es una funcion que satisface unaserie de condiciones expresadas en terminos de sus derivadas y de valores que ella toma endeterminados puntos. Estas ecuaciones pueden ser ordinarias o en derivadas parciales. Parael caso de las ordinarias, se trata de problemas donde la incognita es una funcion real, mientrasque para aquellas en en derivadas parciales, la incognita es una funcion de varias variables. Otraforma de clasificar las ecuaciones es en lineales y no lineales. La linealidad dependera de si eloperador de diferenciacion que define a la ecuacion es o no lineal1. A estas alturas, ya debemosestar pensando que la resolucion de ecuaciones diferenciales es un problema muy complejo y queen general, salvo casos muy simples2, no existe una tecnica universal para resolverlas.

A modo de ejemplo, y solo en forma introductoria, veamos como aparecen en forma naturallas ecuaciones difrenciales en problemas de economıa.

Ejemplo 7.1.1 Crecimiento de la poblacion. Supongamos que la poblacion en un determi-nado lugar en un determinado momento t es P (t) y que inicialmente, digamos en t = 0, esta esP0. Supongamos ahora que en cada instante de tiempo la tasa de cambio poblacional (es decir,nacimientos menos defunciones) es proporcional a la poblacion que hay en ese instante. Estatasa de cambio de la poblacion es simplemente la derivada de la poblacion c.r al tiempo, es decir,P ′(t). Por lo tanto, de las hipotesis enunciadas, se tiene que

P ′(t) = λ · P (t),

donde λ ∈ IR es la constante de proporcionalidad. Lo anterior define una ecuacion diferencial,donde la incognita es obviamente la funcion poblacion en el instante t cualquiera. Resolver laecuacion diferencial consiste en encontrar una funcion P (t) que satisfaga la condicion anteriorsobre la derivada y ademas satisfaga la condicion inicial P (t = 0) = P0. Esta es una ecuaciondiferencial ordinaria.

Ejemplo 7.1.2 Supongamos que las productividades marginales de una funcion de produccionson PMG1(x1, x2) = x2

1 +x2 y que PMG2(x1, x2) = x21− 2x2. Encontrar entonces la funcion de

produccion correspondiente consiste en resolver una ecuacion diferencial en derivadas parciales:1Ya veremos el detalle de las definiciones2Que son los que trataremos!

149

Page 151: Libro Matematicas Para Economistas

150 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

∂f(x1, x2)∂x1

= x21 + x2;

∂f(x1, x2)∂x2

= x2 − 2x2.

En este caso, las condiciones iniciales son que f(0, 0) = 0 ya que es funcion de produccion.

En todo lo que sigue nos vamos a ocupar solo de ecuaciones diferenciales ordinarias, las queformalmente se pueden plantear de la siguiente manera.

Para no confundir derivadas de una funcion con potencias de la misma, en lo que sigue lak-esima derivda de una funcion y(t) sera denotada por

y(k)

mientras que la potencia k de la misma por

yk.

Definicion 7.1.1 Ecuacion diferencial ordinaria. El problema consiste en encontrar unafuncion y : IR → IR que satisface la siguiente condicion:

F (y(t), y′(t), y′′(t), ..., y(N)(t)) = f(t)

donde F es una funcion dada que toma como variables la funcion y(t) y sus derivadas, N es elmaximo grado en que se deriva la funcion y f(t) es una funcion conocida.

Definicion 7.1.2 El grado (u orden) de una ecuacion diferencial ordinaria es el mayor indicede derivacion de la funcion que aparece en la ecuacion. La funcion F se llama operador de laecuacion diferencial.

Ejemplo 7.1.3 La siguiente es una ecuacion diferencial ordinaria de orden 2

y(t) +y′(t)

1 + y′′(t)= e2t + t2.

En este caso, f(t) = e2t + t2, mientras que el operador diferencial de segundo orden es

F (y, y′, y′′) = y +y′

1 + y′′.

Ejemplo 7.1.4 La siguiente es una ecuacion diferencial de tercer orden

1 + y(t)sin(t)

− y′′(t) · et − y(3)(t)y(t)2 + 1

= cos(t).

En ella, se tiene que

F (y(t), y′(t), y′′(t), y(3)(t)) =1 + y′(t)sin(t)

− y′′(t) · et − y(3)(t)y(t)2 + 1

,

mientras que f(t) = cos(t). Note que F (α, β, γ, δ) = 1+βsin(t) − γ · et − δ

α2+1− cos(t). Ası, los

coeficientes del operador no tienen por que ser constantes. En el siguiente ejemplo,tenemos un operador con coeficientes constantes

Page 152: Libro Matematicas Para Economistas

7.1. ECUACIONES DIFERENCIALES: INTRODUCCION 151

2y(3)(t)− y′′(t)y′(t)− y(t)

= t2.

En ella,F (y(t), y′(t), y′′(t), y(3)(t)) = 2y(3)(t)− y′′(t)y′(t)−y(t) y f(t) = t2. 2

En lo que sigue vamos a introducir una escritura muy simple para la derivada, lo que sim-plificara las notaciones y nomenclaturas para el analisis de las ecuaciones diferenciales.

Definicion 7.1.3 El operador derivada.Definamos el operador derivada como aquel que dada la funcion entrega la derivada de la

misma. Para notarlos utilizaremos D. Luego,

D(y(t)) = y′(t).

Con lo anterior, podemos definir el operador derivada N-esima como:

DN (y(t)) = y(N)(t), N ∈ IN.

El operador D0 sera simplemente la identidad, es decir,

D0 = I ⇔ D0y(t) = Iy(t) = y(t).

Ejemplo 7.1.5 Volviendo a los ejemplos anteriores, nuestros operadores generales F se puedere-escribir como:

F (y(t), y′(t), y′′(t), y(3)(t)) =1 + y′(t)sin(t)

−y′′(t) · et− y(3)(t)y(t)2 + 1

→[1 + D

sin(t)−D2 · et − D3

I2 + 1

]y(t)

F (y(t), y′(t), y′′(t), y(3)(t)) = 2y(3)(t)− y′′(t)y′(t)− y(t)

→[2D3 − D2

D − I

]y(t).

Si definimos F1 =[

1+Dsin(t) −D2 · et − D3

I2+1

]y F2 =

[2D3 − D2

D−I

], nuestras ecuaciones difer-

enciales se pueden re-escribir como

F1y(t) = cos(t), F2y(t) = t2,

que sera el tipo de notacion que de ahora en adelante vamos a asumir.

Con todo lo anterior, dado el operador derivada D, notemos que cualquier ecuacion diferencialordinaria de orden N se podra escribir de la siguiente forma

F (I, D,D2, ..., DN )y(t) = f(t).

Para simplificar la notacion, escribiremos usualmente F (D) ≡ F (I, D, D2, ..., DN ). Quedara claroen el contexto del problema el orden y la forma del operador.

Definicion 7.1.4 Diremos que

a.- el operador diferencial F (D) es a coeficientes constantes si todos los coeficientes que lodefinen son valores numericos,

Page 153: Libro Matematicas Para Economistas

152 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

b.- el operador diferencial F (D) es lineal si se cumplen las dos siguientes condiciones

b.1.- Para todo λ ∈ IR,[F (D)] (λy(t)) = λ · [F (D)] y(t).

b.2.- Para todo y1(t), y2(t),

[F (D)] (y1(t) + y2(t)) = [F (D)] y1(t) + [F (D)] y2(t).

Note que las dos condiciones anteriores se pueden resumir exigiendo que para todoλ ∈ IR y para todo par de funciones y1(t), y2(t) se cumpla que

[F (D)] (y1(t) + λy2(t)) = [F (D)] y1(t) + λ · [F (D)] y2(t).

c.- Diremos que la ecuacion diferencial [F (D)] y(t) = f(t) es a coficientes constantes si eloperador es a coficientes constantes; diremos que es lineal si el operador es lineal.

d.- Diremos que la ecuacion diferencial [F (D)] y(t) = f(t) es homogenea si f(t) = 0.

Ejemplo 7.1.6 La ecuacion diferencial

t2 · y(4)(t)− eαty′(t) = cos(t)− t2

es una ecuacion diferencial lineal, con coeficientes variables, de grado 4 y no homogenea. Quesea no - homogenea, de grado 4 y que no tenga coeficientes constantes es obvio. Lo que no esobvio es la linealidad. Veamos esto en detalle. En primer lugar, notemos que el operador en estecaso es

F (D) = t2 ·D4 − eαt ·D.

Luego, dadas las funciones y1(t), y2(t) y dado λ ∈ IR se tiene que

F (D)(y1 + λy2)(t) = t2 · (y1 + λy2)(4)(t)− eαt(y1 + λy2)

′(t) =[t2 · y(4)

1 (t)− eαty′1(t)]+

[t2 · (λy2)

(4)(t)− eαt(λy)′(t)]

=[t2 · y(4)

1 (t)− eαty′1(t)]+ λ

[t2 · y(4)

2 (t)− eαty′2(t)]

= F (D)y1(t) + λF (D)y2(t).

Recuerde que para todo k se cumple que

(y1 + y2)(k)(t) = y

(k)1 (t) + y

(k)2 (t),

es decir, la derivada simple de cualquier orden es lineal. De todo lo anterior, nuestro operadorF (D) es lineal. 2

Del ejemplo anterior, podemos inferir la siguiente proposicion.

Proposicion 7.1.1 Todo operador diferencial lineal de grado N es de la forma

[F (D)] = a0(t)I + a1(t)D + a2(t)D2 + ... + aN (t)DN ,

donde las funciones aj(t), j = 0, 1, ..., N (los coeficientes) son dadas. Mas aun, todo operadordiferencial lineal de grado N con coeficientes constantes es de la forma

[F (D)] = a0I + a1D + a2D2 + ... + aNDN ,

donde aj , j = 0, 1, ..., N son valores constantes dados.

Page 154: Libro Matematicas Para Economistas

7.2. RESOLUCION DE EDOLCC 153

Ejemplo 7.1.7 Un ejemplo de ecuacion diferencial no lineal.La siguiente es una ecuacion diferencial no lineal, aun con coeficientes constantes:

y(2)(t)1 + y′(t)

− y(t) = 2t.

En efecto, el operador correspondiente es

F (D) =D2

1 + D− I.

Luego3,

F (D)(y1 + y2) =

[D2

1 + D− I

](y1 + y2) =

y(2)1 + y

(2)2

1 + (y′1 + y′2)− (y1 + y2),

que es diferente de

y(2)1

1 + y′1− y1 +

y(2)2

1 + y′2− y2.

Por lo tanto, el operador no es lineal ya que F (D)(y1 + y2) 6= F (D)y1 +F (D)y2. Otra formade ver que no es lineal es simplemente a traves de la proposicion anterior: el operador en cuestionno tiene la forma indicada. 2

Como se ha senalado resolver una ecuacion diferencial puede ser un problema muy complejoy que no necesariamente tiene solucion. Un caso particular muy importante, y simple, es aquelde las ecuaciones diferenciales lineales con coeficientes constantes. Si bien es cierto que este tipode ecuaciones son muy particulares, no por ello dejan de ser importantes en sus aplicaciones talcomo ser vera mas adelante. Ası, por razones de simplicidad, practicidad y porque disponemosde un metodo simple, solo nos vamos a ocupar de este tipo de ecuaciones en todo lo que sigue.De hecho, para este efecto no se requiere en principio trabajar con ecuaciones de grado N , sinoque toda la generalidad esta en las ecuaciones de segundo grado tal como se justificara masadelante. En resumen, en todo lo que sigue nos ocuparemos de resolver ecuaciones diferencialesordinarias de segundo orden lineales con coeficientes constantes, es decir, de la forma

y′′(t) + αy′(t) + βy(t) = f(t)

donde α, β ∈ IR dados y f es una funcion conocida. Estas ecuaciones seran conocidas comoEDOLCC.

7.2. Resolucion de EDOLCC

Para resolver una ecuacion diferencial ordinaria lineal y a coeficientes constantes, vamos aproceder en dos etapas. En primer lugar, vamos a resolver la ecuacion homogenea asociada, esdecir, buscar una funcion yh tal que

y′′h(t) + αy′h(t) + βyh(t) = 0.

3Salvo que sea necesario, omitiremos la variable t de la notacion.

Page 155: Libro Matematicas Para Economistas

154 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

Con esta, en la segunda etapa se procede a buscar lo que se llama una solucion particularde la ecuacion, es decir, buscar una funcion yp cualquiera que resuelva la ecuacion

y′′p (t) + αy′p(t) + βyp(t) = f(t).

Por que se procede en dos etapas si la ecuacion ya esta resuelta cuando se calculayp? La razon es que al encontrar yp(t) no necesariamente estamos resolviendo la e.d4. En efecto,supongamos que hemos encontrado yp e yh y definamos

y(t) = yp(t) + a · yh(t)

donde a ∈ IR es un valor cualquiera. En tal caso, notemos que5:

y′′(t) + αy

′(t) + βy(t) = (yp + a · yh)

′′(t) + α(yp + a · yh)

′(t) + β(yp + ayh)(t),

es decir,

yp′′(t) + αyp

′(t) + βyp(t) + a · [yh

′′(t) + αyh

′(t) + yh(t)] = f(t) + a · 0 = f(t).

Luego, la solucion de la ecuacion diferencial tiene necesariamente dos componentes: aquellaparticular y la homogenea. Resolver la ecuacion implica encontrar ambas soluciones, lo queanalizamos en detalle y por separado en las siguientes secciones solo para el caso de ecuacionesdiferenciales ordinarias, lineales y con coeficientes constantes.

7.2.1. Solucion de la homogenea

Dada la ecuacion diferencial homogenea, lineal, de segundo orden y a coeficientes constantes

y′′(t) + αy′(t) + βy(t) = 0

supongamos en primer lugar que hemos encontrado dos soluciones, digamos yh,1(t), yh,2(t). Ental caso, note que, dados c1, c2 ∈ IR dos constantes cualesquiera, entonces:

[c1yh,1(t) + c2yh,2(t)]′′

+ α[c1yh,1(t) + c2yh,2(t)]′ + β[c1yh,1(t) + c2yh,2(t)] =

c1[y′′h,1(t) + αy′h,1(t) + βyh,1(t)] + c2[y

′′h,2(t) + αy′h,2(t) + βyh,2(t)] =

c10 + c20 = 0,

con lo cual, cualquier combinacion lineal de soluciones de la homogenea es tambien una solucionde esta. Ahora bien, para el problema que nos ocupa, supongamos que la solucion de la homogeneaes de la forma

y(t) = eλt

donde λ es un parametro a determinar6. Reemplazando esta solucion en la ecuacion diferencialse tiene que

4Esto es analogo a pretender resolver un sistema de ecuaciones Ax = b sin preocuparnos por el nucleo de lamatriz.

5Linealidad de la ecuacion diferencial.6Se puede intuir que la solucion es de la forma exponencial pues al derivar estas funciones la forma funcional

no cambia y por ende al multiplicarlas y sumarlas. Luego, una opcion para que resulte cero el resultado es quela funcion y sus derivadas no deben ser muy distinas, es decir, al menos mantener la forma. Por ejemplo, es claroque para la homogenea no podrıa ser un polinomio pues al derivar este se disminuyen los grados y en tal caso nohay forma de que una combinacion lineal no nula resulte cero.

Page 156: Libro Matematicas Para Economistas

7.2. RESOLUCION DE EDOLCC 155

(eλt

)′′+ α

(eλt

)′+ β

(eλt

)= 0.

Calculando entonces las derivadas, resulta que

λ2eλt + αλeλt + βeλt = [λ2 + αλ + β] · eλt = 0.

Ahora bien, como la exponencial no puede ser cero, se concluye que

λ2 + αλ + β = 0.

Definicion 7.2.1 Dada la ecuacion diferencial

y′′(t) + αy′(t) + βy(t) = 0

se define el polinomio caracterıstico de la misma como

p(λ) = λ2 + αλ + β.

Las soluciones de la ecuacion

λ2 + αλ + β = 0

se llamaran raices caracterısticas de la ecuacion diferencial.

Obviamente la ecuacion algebraica anterior es una de segundo grado, que, como sabemos,tiene dos soluciones, digamos λ1 y λ2

7.Dado esto, existen tres posibilidades para los valores resultantes

(a.) λ1, λ2 ∈ IR, λ1 6= λ2.

(b.) λ1, λ2 ∈ IR, λ1 = λ2.

(c.) λ1, λ2 ∈ C, λ1 = a + bi, λ2 = a− bi8.

De esta manera, a partir de los casos anteriores y considerando la linealidad de la ecuaciondifrencial homogenea, sabemos que la solucion de la homogenea es una combinacion lineal delas ya encontradas, que para cada uno de los casos mencionados corresponde a

a.- yh(t) = c1eλ1t + c2e

λ2t.

b.- yh(t) = c1eλ1t + c2te

λ1t.

c.- yh(t) = c1e(a+bi)t + c2e

(a−bi)t.

7Recordemos que dada la ecuacion

x2 + ax + b = 0

las soluciones son x1 =−a+

√a2−4b

2y x2 =

−a−√

a2−4b

2.

8Recuerde que si un complejo a + bi es raız de una ecuacion polinomica, entonces su conjugado a− bi tambienes solucion de la misma ecuacion.

Page 157: Libro Matematicas Para Economistas

156 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

donde c1 y c2 son constantes arbitrarias.Los casos [a] y [c] son claros por la forma en que hemos procedido. Sin embargo, el segundo

caso puede resultar contra-intuitivo. Veamos que esto con detalle mostrando que efectivamenteteλ1t es solucion de la homogenea. Para ello reemplacemos directamente en la ecuacion diferen-cial:

[teλ1t]′′

+ α[teλ1t]′+ β[teλ1t] = [eλ1t + tλ1e

λ1t]′+ α[eλ1t + tλ1e

λ1t] + β[teλ1t] =

[λ1eλ1t + λ1e

λ1t + tλ21e

λ1t] + α[eλ1t + tλ1eλ1t] + β[teλ1t] =

teλ1t[λ21 + αλ1 + β] + eλ1t[2λ1 + α].

Pero λ21 + αλ1 + β = 0 y, por otro lado, como la suma de las soluciones de una ecuacion

de segundo grado es igual a menos el coeficiente de λ (α en este caso), considerando que lassoluciones son iguales se tiene que λ1 + λ1 = 2λ1 = −α y luego la expresion anterior es nula.Con esto se concluye que teλ1t resuelve la homogenea9.

Ahora bien, puesto que

ea+bi = ea · ebi = ea · [cos(b) + i sin(b)],

se tiene que para el caso complejo [c], la solucion de la ecuacion diferencial es entonces de laforma

yh(t) = c1e(a+bi)t + c2e

(a−bi)t = eat[c1(cos(bt) + i sin(bt)] + [c2(cos(−bt) + i sin(−bt)].

Ahora, considerando que cos(−bt) = cos(bt) y sin(−bt) = − sin(bt), la expresion anterior seconvierte en

yh(t) = eat ·[(c1 + c2)

2cos(bt) + i

(c1 − c2)2

sin(bt)].

De esta manera, considerando la arbitrariedad de las constantes involucradas, re-escribiendo loanterior utilizando c1 y c2 (constantes arbitrarias, abuso de notacion) se tiene que, para el casocomplejo ((c.)]), finalmente la solucion es de la forma

yh(t) = eat · [c1 cos(bt) + c2 sin(bt)].

Ası, en resumen, tenemos la siguiente proposicion.

Proposicion 7.2.1 Dada la ecuacion diferencial y′′(t) + αy′(t) + βy(t) = 0 y dadas λ1, λ2 las

soluciones de λ2 + αλ + β = 0, se tiene que

(a.) Si λ1, λ2 ∈ IR, λ1 6= λ2

yh(t) = c1eλ1t + c2e

λ2t.

b.- Si λ1, λ2 ∈ IR, λ1 = λ2

yh(t) = c1eλ1t + c2te

λ1t.

9Dada la ecuacion de segundo grado x2 + ax + b = 0, si las soluciones son x1 y x2, entonces se tiene quex1 + x2 = −a y x1 · x2 = b.

Page 158: Libro Matematicas Para Economistas

7.2. RESOLUCION DE EDOLCC 157

c.- Si λ1 = a + bi (⇒ λ2 = a− bi) entonces

yh(t) = eat · [c1 cos(bt) + c2 sin(bt)].

Ejemplo 7.2.1 Resolver las siguientes ecuaciones diferenciales:

y′′(t)− 3y′(t) + 2y(t) = 0 [1]

y′′(t) + y′(t) + y(t) = 0 [2]

y′′(t)− 4y′(t) + 4y(t) = 0 [3].

Paras estas ecuaciones, las ecuaciones y raices respectivas son

λ2 − 3λ + 2 = 0 [1] → λ1 = 2, λ2 = 1

λ2 + λ + 1 = 0 [2] → λ1 =−1 +

√3i

2, λ2 =

−1−√3i

2

λ2 − 4λ + 4 = 0 [3] → λ1 = 2, λ2 = 2.

Luego, las soluciones son

[1] : yh(t) = c1 · e2t + c2 · et

[2] : yh(t) = c1et·−1+

√3i

2 + c2et−1+

√3i

2 = e−12

t[c1 · cos(√

32

t) + c2 · sin(√

32

t).

[3] : yh(t) = c1 · e2t + c2 · t · e2t.

Nota. 7.2.1 Para la ecuacion diferencial lineal, homogenea, con coeficientes constantes y deorden n, es decir de la forma

y(n)(t) + an−1y(n−1)(t) + an−2y

(n−2)(t) + ... + a1y′(t) + a0y(t) = 0

el polinomio caracterıstico es

λn + an−1λn−1 + an−2λ

n−2 + ... + a1λ + a0 = 0.

Si las raıces son λi, i = 1, ..., n se tiene que la solucion generica de la ecuacion diferencial es10:

yh(t) =n∑

i=1

cieλit.

Si hubiera raıces repetidas, se multiplica la exponencial por potencias de t segun la cantidadde raices repetidas. A modo de ejemplo, si n = 6 y λ1 = 2, λ2 = λ3 = λ4 = −5, λ5 = 3 + 4i yλ6 = 3− 4i, entonces la solucion generica de la ecuacion es

10Suponiendo que todas las raıces son distinas.

Page 159: Libro Matematicas Para Economistas

158 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

yh(t) = c1e2t + c2e

−5t + c3te−5t + c4t

2e−5t + c5e(3+4i)t + c6e

(3−4i)t.

Cual es la relevancia de las constantes? Como hemos visto, la solucion de la ecuacionhomogenea depende de ciertos parametros (c1 y c2 para caso segundo orden), razon por lacual mas que obtener una solucion se obtiene una familia de soluciones. Ahora bien, sifuera el caso que existen condiciones iniciales sobre la funcion (condiciones de frontera),estas constantes usualmente quedaran determindas al imponer la igualdad respectiva definidapor dichas restricciones iniciales. Las condiciones iniciales son tıpicamente sobre la funcion y laderivada, evaluadas en algun punto (usualmente, t = 0). Ellas pueden representar requerimientosiniciales a la funcion dados exogenamente en forma independiente de la dinamica en cuestion.Por lo tanto, resolver la homogenea en presencia de estas condiciones es obviamente encontraruna funcion que satisfaga simultaneamente la ecuacion diferencial y las condiciones iniciales quese impongan.

Una formulacion general de este problema con condiciones inciales consiste en encontrar unafuncion que satisfaga la ecuacion diferencial

y′′(t) + αy′(t) + βy(t) = 0

y que ademas cumpla con

y(0) = y0, y′(0) = y1

donde y0 e y1 son valores dados11.De esta manera, dado el problema con restricciones iniciales, y dada la solucion generica

yh(t) = c1eλ1t + c2e

λ2t, las constantes c1 y c2 se deben elegir de tal forma que se cumpla con

y(0) = c1e0 + c2e

0 = c1 + c2 = y0

y′(0) = c1λ1e0 + c2λ2e

0 = c1λ1 + c2λ2 = y1.

Lo anterior es un sistema de ecuaciones en c1, c2 que, resolviendolo, nos permite encontrarsus valores y con ello la unica funcion que a la vez cumple con la ecuacion diferencial y ademascon las condiciones iniciales.

Ejemplo 7.2.2 Resolver la ecuacion diferencial y′′(t) − 4y(t) = 0, considerando que y(0) = 1,

y′(0) = 0.

Solucion. En este caso, el polinomio caracterıstico es λ2 − 4λ = 0. Sus raıces son λ1 = 2 yλ2 = −2. En tal caso, la solucion generica es

yh(t) = c1e2t + c2e

−2t.

Al imponer las condiciones iniciales se tiene que:

y(0) = c1e0 + c2e

0 = c1 + c2 = 111Podriamos esciribir condiciones mas generales de la forma

y(t0) = y0, y′(t1) = y1

donde t0, t1, y0, y1 son valores dados a priori.

Page 160: Libro Matematicas Para Economistas

7.2. RESOLUCION DE EDOLCC 159

y′(0) = c12e0 − c12e0 = 2c1 − 2c2 = 0

cuya solucion es c1 = c2 = 12 . Luego, la solucion que verifica las condiciones iniciales es:

yh(t) =12e2t − 1

2e−2t.

Graficamente la siguiente figura ilustra lo anterior:

Famila deSoluciones

Solución que cumplelas condicionesiniciales

y(0) = 1y'(0) = 0

1

El la figura de la izquierda ilustramos la familia de soluciones de la ecuacion diferencial; ala derecha se ilustra la unica solucion (elemento de la familia) que cumple con las condicionesiniciales impuestas.

Para terminar esta sub-seccion, vamos a analizar el comportamiento asintotico12 delas soluciones de una ecuacion diferencial homogenea con coeficientes constantes. Resumiendo,dicho comportamiento esta estrechamente relacionado con los valores de las raıces del polinomiocaracterıstico tal como se muestra en la siguiente proposicion:

Proposicion 7.2.2 Dada la ecuacion diferencial

y′′(t) + αy′(t) + βy(t) = 0

y dadas λ1, λ2 las raıces del polinomio caracterıstico, se tiene que si la parte real de cada unade ellas es menor que cero, entonces la solucion yh(t) converge a un valor finito cuando t →∞.

A partir de los tres casos sobre los valores de las raıces del polinomio caracterıstico, se tieneentonces que

a.- Si λ1, λ2 ∈ IR, entonces lımt→∞ yh(t) existe siempre y cuando λ1 < 0 y λ2 < 013. Por el

contrario, si alguna de las raıces es positiva, entonces la solucion diverge.

b.- Si las raıces son complejas, digamos λ1 = a + bi y λ2 = a− bi, entonces lımt→∞ yh(t) existe

si a < 0 (parte real negativa). Si a = 0 entonces la solucion oscila sin converger, mientrasque si a > 0 la solucion diverge cuando t →∞.

12Es decir, como se comportan las soluciones de la ecuacion diferencial cuando t →∞.13Mismo caso si las raıces son iguales ya que teλ1t converge si λ1 < 0. Recuerde ademas que la parte real un

numero real es el mismo numero.

Page 161: Libro Matematicas Para Economistas

160 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

La siguiente figura ilustra lo anterior:

1: raiz < 0: solución real

2: a = 0: sol. compleja

3: raiz > 0: solución real

4: a < 0: sol. compleja

5: a > 0: sol. compleja

Ejemplo 7.2.3 Dada la ecuacion diferencial con condiciones iniciales:

y′′(t)− µy(t) = 0

y(0) = 0, y′(0) = 1

donde µ > 0. Luego, se tiene que la solucion generica de la misma es

y(t) = c1 · e√

µt + c2 · e−√

µt.

De las condiciones iniciales, se tiene que

c1 + c1 = 0, c1√

µ− c2√

µ = 1

y luego, c1 = 12√

µ , c2 = − 12√

µ y con ello la solucion de la ecuacion es

y(t) =1

2√

µ· e√

µt − 12√

µ· e−

õt.

Note que en este caso, si t → ∞ entonces la segunda componente de la solucion tiende acero, mientras que primera de ellas tiende a infinito. Luego, no hay convergencia de la solucioncuando t →∞.

Ejercicio 7.2.1

(a) Rosolver la ecuacion diferencial y′′+2y′+y = t+2, considerando las restricciones inicialesy(0) = y0 e y′(0) = 0.

(b) Resolver la ecuacion diferencial 4[y′′ + y′ − 1] = 5(t− y) sujeto a que y(0) = 1, y′(0) = a2 .

(c) Muestre que la ecuacion de segundo orden ty′′+y′+ty = 0 tiene como una de sus solucionesy(t) = t.

(d) Resolver la ecuacion diferecial y′′ − 4y′ + 4y = 2e2t + cos(t).

Page 162: Libro Matematicas Para Economistas

7.2. RESOLUCION DE EDOLCC 161

7.2.2. Solucion particular

Consiremos ahora el problema de encontrar la solucion particular yp(t) de la ecuacion difer-encial

y′′(t) + αy′(t) + βy(t) = f(t).

Para ello consideraremos solo cuatro casos especiales donde dicha solucion es simple deencontrar: un tratamiento general (es decir, una funcion f(·) cualquiera) no es posible en terminosanalıticos. Los casos particulares que vamos a considerar son los siguientes:

a.- Cuando f(t) es un polinomio

b.- Cuando f(t) es una suma de exponenciales

c.- Cuando f(t) es una suma de senos y cosenos.

d.- Cuando f(t) es una combinacion de los casos anteriores.

Para cada uno de los casos anteriores, la forma de proceder es la siguiente:

a.- f(t) es un polinomio

Si f(t) = antn + an−1tn−1 + an−2t

n−2 + ... + a1t1 + a0, entonces la solucion particular de

la ecuacion diferencial y′′(t) + αy′(t) + βy(t) = f(t) es un polinomio de la forma:

yp(t) = bn+2tn+2 + bn+1t

n+1 + bntn + ... + b1t1 + b0,

donde bn+2, bn+1, bn, ..., b1, b0 son coeficientes que se obtienen del sistema de ecuacionesque se genera al reemplazar yp anterior en la ecuacion diferencial e imponer la igualdadcon f(t).

b.- f(t) es una suma de exponenciales.

Si f(t) = a1eµ1t + a2e

µ2t + ... + akeµkt entonces se tiene que

yp(t) = b1eµ1t + b2e

µ2t + ... + bkeµkt

donde b1, b2, ..., bk son coeficientes que se obtienen del sistema de ecuaciones que se generaal reemplazar yp anterior en la ecuacion diferencial e imponer la igualdad con f(t).

c.- f(t) es una suma de senos y cosenos

Si f(t) =p∑

i=1ai cos(µit) +

q∑j=1

bi cos(νit) entonces la solucion particular es de la forma:

yp(t) =p∑

i=1

αi cos(µit) +q∑

j=1

βj cos(νit) +p∑

i=1

γi sin(µit) +q∑

j=1

δj sin(νit),

donde αi, βj , γi y los δj son coeficientes que se obtienen del sistema de ecuaciones que segenera al reemplazar yp anterior en la ecuacion diferencial e imponer la igualdad con f(t).

d.- f(t) es una combinacion aditiva de los casos anteriores

En tal caso se procede sumando los casos anteriores.

Page 163: Libro Matematicas Para Economistas

162 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

Ejemplo 7.2.4 Resolver la ecuacion diferencial

y′′(t)− 4y′(t) + 5y(t) = t2 + 1− cos(2t) + sin(5t)− 4e4t

Solucion.En primer lugar procedemos a resolver la homogenea. El polinomio caracterıstico es λ2 −

4λ + 5 = 0 y las raıces son λ1 = 2 + i y λ2 = 2− i. Luego, la solucion de la homogenea es de laforma

yh(t) = e2t · [c1 cos(1 · t) + c2 sin(1 · t)].Para la particular, como hay una mezcla de los casos analizados, la solucion es tambien una

mezcla de las soluciones genericas presentadas. La solucion es entonces de la forma:

yp(t) = a4t4 + a3t

3 + a2t2 + a1t + a0 + b1 cos(2t) + b2 sin(2t) + d1 cos(5t) + d2 sin(5t) + e1e

4t

donde los coeficientes se determinan a partir de la igualdad

y′′p (t)− 4y′p(t) + 5y(t) = t2 + 1− cos(2t) + sin(5t)− 4e4t

es decir,

[a4t4 + a3t

3 + a2t2 + a1t + a0 + b1 cos(2t) + b2 sin(2t) + d1 cos(5t) + d2 sin(5t) + e1e

4t]′′

4 · [a4t4 + a3t

3 + a2t2 + a1t + a0 + b1 cos(2t) + b2 sin(2t) + d1 cos(5t) + d2 sin(5t) + e1e

4t]′

+

5[a4t4 + a3t

3 + a2t2 + a1t + a0 + b1 cos(2t) + b2 sin(2t) + d1 cos(5t) + d2 sin(5t) + e1e

4t]

=

t2 + 1− cos(2t) + sin(5t)− 4e4t.

Al desarrollar la derivada de la izquierda e imponer la igualdad con el lado derecho, seobtiene un sistema de ecuaciones que viene de igualar los terminos correspondientes uno a uno,cuestion que finalmente permite encontrar los coeficientes indicados. Queda propuesto seguircon el ejericicio.

Ejercicio 7.2.2 Resuelva completamente y′′ +√

12y′ − y = 0 considerando las condicionesiniciales y(0) = 1 e y′(0) = 2. Resuelva ademas las siguientes ecuaciones diferenciales y′′+4y′+9y = t2 + 3t y′′ + y′ + y = t3et.

Page 164: Libro Matematicas Para Economistas

7.3. SISTEMAS DE ECUACIONES DIFERENCIALES 163

Ejercicio 7.2.3 ∗ ∗ ∗Considere la ecuacion diferencial lineal con coeficientes variables

t2y′′ + α1ty′ + α0y = 0.

Haga el reemplazo u = Ln(t) y dado esto, re-escriba la ecuacion diferencial anterior. Conesto, aplique el metodo ya conocido para presentar un esquema general que nos permita resolvereste tipo de ecuaciones. Apliquelo para mostrar que la solucion de la ecuacion

t2y′′ + ty′ = t + t2

esy(t) = t + t2/2 + c1 + c2Ln(t).

Ejemplo 7.2.5 Ecuacion lineal, con coeficientes constantes, de orden n.Para resolver una ecuacion diferencial lineal, de orden n y con coefientes constantes, es decir,

de la forma:

y(n)(t) + an−1y(n−1)(t) + an−2y

(n−2)(t) + ... + a1y′(t) + a0y(t) = f(t),

se procede en forma similar a lo hecho para el caso segundo orden, considerando que ahora elpolinomio caracterıstico es

λn + an−1λn−1 + an−2λ

n−2 + ... + a1λ + a0 = 0.

En tal caso, si las raıces son λi, i = 1, ..., n, la solucion de la homogenea sera la suma de lasexponenciales de las mismas, considerando que si la raız se repite (raices multiples), entoncesse debe multiplicar la exponenial por potencias sucesivas de la variable. Para el caso de laparticular, el metodo es el mismo anteriormente descrito, solo que ahora se debe considerar queexisten derivadas de orden mayor.

Ejemplo 7.2.6 Ecuacion lineal de primer orden con coeficientes no necesariamenteconstantes.

Para el caso de una ecuacion diferencial lineal cuyos coeficientes no son necesariamenteconstantes, existe una forma explicita para la solucion. En efecto, dada la ecuacion diferencial

y′(t) + p(t)y(t) = q(t)

se tiene que

y(t) =[c1 +

∫q(t)

(e∫

p(t)dt)]· e−

∫p(t)dt.

7.3. Sistemas de ecuaciones diferenciales

En lo que sigue vamos a resolver un sistema de ecuaciones diferenciales lineales con coefi-cientes constantes. Supongamos ası dadas y1, y2, ..., yn : IR → IR n funciones tales que:

y′1(t) = a11y1(t) + a12y2(t) + ... + a1nyn(t) + b1

y′2(t) = a21y1(t) + a22y2(t) + ... + a2nyn(t) + b2

· · ·

Page 165: Libro Matematicas Para Economistas

164 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

y′i(t) = ai1y1(t) + ai2y2(t) + ... + ainyn(t) + bi

· · ·

y′n(t) = an1y1(t) + an2y2(t) + ... + annyn(t) + bn

Definamos entonces las siguientes matrices:

Y (t) =

y1(t)y2(t)

.

.yn(t)

, A =

a11 a12 · · · a1n

a21 a22 · · · a2n

· · · ·an1 an2 · · · ann

, B =

b1

b2

··

bn

En tal caso, el sistema anterior se puede re - escribir de la siguiente forma:

Y ′(t) = A · Y (t) + B.

En el caso n = 1 y dado y(0) = y0, la solucion del sistema anterior es:

y(t) = y0eat − b

a.

Por analogıa14, se tiene que para el sistema de ecuaciones anterior, la solucion deberıa ser:

Y (t) = eA·t · Y (0)−A−1 ·B,

donde eA·t es la exponencial de la matriz A · t.Para una matriz M dicha exponencial se define por la serie infinita:

eM = I + M +M2

2!+

M3

3!+ ... +

Mn

n!+ ....

Luego, el problema de resolver un sistema de ecuaciones diferenciales de la forma anteriorse reduce a calcular la exponencial de una matriz segun la definicion anterior. En general, esteno es un problema trivial, salvo para dos casos muy importantes: cuando la matriz es diagonalo cuando es simetrica15. Veamos ambos casos en el siguiente ejemplo.

Ejemplo 7.3.1 Calculo de exponencial de matriz diagonal.

Supongamos dada una matriz diagonal D de la forma:

D =

d1 0 · · · 00 d2 · · · 0· · · ·0 0 · · · dn

14En realidad, por un analisis mas formal del tema.15Recordemos que M es simetrica si M t = M .

Page 166: Libro Matematicas Para Economistas

7.3. SISTEMAS DE ECUACIONES DIFERENCIALES 165

Entonces, siguiendo la definicion se tiene que:

eD =

1 0 · · · 00 1 · · · 0· · · ·0 0 · · · 1

+

d1 0 · · · 00 d2 · · · 0· · · ·0 0 · · · dn

+ 1

2!

d1 0 · · · 00 d2 · · · 0· · · ·0 0 · · · dn

2

+

13!

d1 0 · · · 00 d2 · · · 0· · · ·0 0 · · · dn

3

+ · · ·+ 1k!

d1 0 · · · 00 d2 · · · 0· · · ·0 0 · · · dn

k

+ · · ·

es decir,

eD =

∑∞k=0

dk1

k! 0 · · · 0

0∑∞

k=0dk2

k! · · · 0· · · · · ·0 0 · · · ∑∞

k=0dk

nk!

=

ed1 0 · · · 00 ed2 · · · 0· · · · · ·0 0 · · · edn

En otras palabras, la exponencial de una matriz diagonal es la matriz diagonal de las exponen-ciales. 2

Ejemplo 7.3.2 Exponencial de una matriz simetrica.

Supongamos dada A simetrica. Entonces, por un resultado de algebra lineal que hemosmencionado anteriormente, sabemos que existe una matriz P ortogonal16 tal que A = P ·A ·P t,donde D es la matriz diagonal con los valores propios de A, los cuales, dada la simetr’ıa de A,son reales. Entonces, siguiendo la definicion de exponencial, se tiene que:

eA = I + (P ·A · P t) +(P ·A · P t)2

2!+

(P ·A · P t)3

3!+ ... +

(P ·A · P t)n

n!+ ....

Ahora bien, note que:

(P ·A · P t)n = (P ·A · P t) · (P ·A · P t) · (P ·A · P t) · .... · (P ·A · P t) =

PA ·A ·A · ... ·A · P t = P ·AnP t.

ya que los terminos intermedios P t · P son iguales a la identidad I.De esta manera, aplicando lo anterior para cada una de las potencias indicadas, se deduce

que:

eA = PeDP t

donde D es la diagonal de los valores propios de A.

16Es decir, P t = P−1.

Page 167: Libro Matematicas Para Economistas

166 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

Si bien es cierto que calcular la exponencial de una matriz puede resultar complejo para uncaso general, muchas veces solo interesa saber del comportamiento asintotico de las solucionesdel sistema de ecuaciones diferenciales. En otras palabras, determinar la convergencia o no de lasolucion Y (t) del sistema cuando t → ∞. Este comportamiento se relaciona estrechamente conlos valores propios de la matriz que define el sistema, independientemente de si es simetrica ono. La propiedad que se tiene al respecto es la siguiente:

Proposicion 7.3.1 Dado el sistema de ecuaciones diferenciales

Y ′(t) = AY (t) + B,

sea Ys(t) la solucion del problema. Entonces, si todos los valores propios de A tienen parte realnegativa, se cumple que

lımt→∞Ys(t) = −A−1B.

Si el sistema es de la forma Y ′(t) = A ·Y (t), entonces bajo las condiciones anteriores se tieneque Ys(t) → 0.

Mas adelante se retomara el tema de sistemas de ecuaciones diferenciales cuando se estudienlos diagramas de fase.

Ejemplo 7.3.3 Consideremos una ecuacion diferencial ordinaria lineal de orden n y con coefi-cientes constantes:

y(n)(t) + an−1y(n−1)(t) + an−2y

(n−2)(t) + ... + a1y′(t) + a0y(t) = 0,

Definamos entonces las siguientes variables

yk = y(k), k = 0, 1, 2, ..., n.

Entonces, note que

y′0 = y1 = 0y0 + 1y1 + 0y2 + ... + 0yn

y′1 = y2 = 0y0 + 0y1 + 1y2 + ... + 0yn

y′2 = y3 = 0y0 + 0y1 + 0y2 + 1y3 + ... + 0yn

y′k = yk+1 = 0y0 + 0y1 + 0y2 + 0y3 + ... + 1yk+1 + 0yk+2 + ... + 0yn

.

.

.

y′n−1 = −an−1y(n−1) − an−2y(n−2) + ... + a1y1 + a0y0.

Definamos entonces

Y (t) =

y0

y1

.

.

.yn−1

, A =

0 1 0 0 . . . 00 0 1 0 . . . 00 0 0 1 . . . 0. . . . . . . .. . . . . . . .. . . . . . . .0 0 0 0 . . 1 0−a0 −a1 −a2 . . . −an−2 −an−1

.

Page 168: Libro Matematicas Para Economistas

7.3. SISTEMAS DE ECUACIONES DIFERENCIALES 167

Con esto, el sistema anterior se puede re-escribir como

Y ′(t) = AY (t).

Por lo tanto, podemos decir que toda ecuacion diferencial ordinaria, lineal, de orden n, con coe-ficientes constantes y homogenea se puede escribir como un sistema de ecuaciones diferenciales.

Ejercicio 7.3.1 Considere el siguiente modelo economico:

Y = E(Y − T, r − πe) + GM/p = L(Y, r).

Suponga que en esta economıa, el mercado de bienes no se ajusta correctamente, es decir,

Y = α[E(Y − T, r − πe) + G− Y ] α > 0.

Por el contrario, el mercado del dinero se ajusta con gran velocidad, por lo que se puederesolver para r, obteniendose r = r(Y, p,M). Siguiendo a Tobin, se asume que las expectativassobre el cambio en precios son formadas de la siguiente forma

πe = β(π − πe) β > 0.

Finalmente, se plantea la siguiente relacion entre el producto(Y ), el producto natural (Y ∗)y la inflacion (π)

π = γ(Y − Y ∗) + πe γ > 0.

Responda entonces a lo siguiente:

1. De una interpretacion economica al modelo

2. Encuentre una condicion necesaria y suficiente para que esta economıa tenga una solucionestable (estado estacionario)

Ejercicio 7.3.2 Considere la siguiente estructura para una economıa cerrada:

y = −a(i− p)m− p = −kip = θy.

Asuma que aθ < 1.

1. Determine el signo de los parametros e interprete.

2. Asuma que inicialmente y = i = y = m = p = 0. Suponga que en t0 existe un cambiopermanente de m, tal que m1 < m0.

a) ¿Cuales son los valores de y y i en t0?. ¿Como afecta un cambio en la velocidad deajuste (θ) a y0?. Explique intuitivamente.

b) ¿Cual es la senda de y luego de y0?

3. Suponga que estamos midiendo la volatilidad total del producto causado por un cambio enm a traves de V =

∫∞t=0 y2

t dt.¿Como se afecta V por un cambio en la velocidad de ajuste?

Page 169: Libro Matematicas Para Economistas

168 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

7.4. Breve introduccion a las ecuaciones en diferencia

El problema que nos ocupa ahora es similar al de las ecuaciones diferenciales solo que ahoraen vez de trabajar con funciones definidas en IR trabajaremos con funciones definidas en IN17.En tal caso, en vez de notar y(t) la imagen de la funcion y en t, denotaremos yt para indicar talvalor.

Por otro lado, en este tipo de problemas discretos, en vez de trabajar con el operador derivadase trabaja con aquel de diferencia, es decir:

y′(t) → yt+1 − yt.

Finalmente, con lo anterior, el problema de resolver una ecuacion diferencial de segundoorden, lineal, con coeficientes constantes, se convierte en resolver una ecuacion en diferencias desegundo orden con coeficientes constantes, cuya forma general es la siguiente:

yt+2 + αyt+1 + βyt = at

donde at es una sucesion conocida y los coeficientes α y β no dependen de t.Para resolver este problema se procede en forma analoga a lo hecho para las ecuaciones

diferenciales: se resuelve la homogenea y luego la particular. Para la ecuacion homogenea:

yt+2 + αyt+1 + βyt = 0

supongamos, por analogıa con la e.d, que la solucion es de la forma

yt = λt

donde λ es un parametro por determinar. Si esto es ası, reemplazando yt = λt en la ecuacion setiene que:

λt+2 + αλt+1 + βλt = 0.

Luego, factorizando por λt e igualando a cero, se tiene que

λ2 + αλ + β = 0

que es la misma ecuacion caracterıstica que habıamos encontrado para la ecuacion diferencial.Luego, si denotamos por λ1 y λ2 las raıces caracterısticas del problema, existen tres casosposibles:

a.- λ1, λ2 ∈ IR, λ1 6= λ2.

b.- λ1, λ2 ∈ IR, λ1 = λ2.

c.- λ1, λ2 ∈ C, λ1 = a + bi, λ2 = a− bi.

De esta manera, a partir de los casos anteriores, y siguiendo el mismo argumento utilizadopara las ecs. diferenciales, la solucion de la ecuacion homogenea es:

a.- yt,h = c1 · λt1 + c2 · λt

2.

17Es decir, sucesiones.

Page 170: Libro Matematicas Para Economistas

7.4. BREVE INTRODUCCION A LAS ECUACIONES EN DIFERENCIA 169

b.- yt,h = c1 · λt1 + c2 · t · λt

1.

c.- yt,h = c1 · (a + bi)t + c2 · (a− bi)t.

Para tener una expresion razonable que nos permita hacer el calculo en el caso [c.−], utilice-mos la forma polar del complejo, es decir:

a + bi = r · [cos(θ) + i sin(θ)]

donde r =√

a2 + b2 y θ = arctan(

ba

).

Luego, a partir de esta forma del complejo, reemplazando directamente en la expresion, setiene que para el caso [c.−]:

yt,h = rt · [ (c1 + c2)2

cos(θt) + i(c1 − c2)

2sin(θt)].

Abusando nuevamente de la notacion debido a la arbitrariedad de los coeficientes, la expresionanterior se puede re - escribir como

yt,h = rt · [c1 cos(θt) + c2 sin(θt)].

Por otro lado, para encontrar la solucion particular, solo consideraremos dos casos18.

a.- Caso en que at = γµt, con γ y µ constantes.

b.- Caso en que at es un polinomio en t:

at = αntn + αn−1tn−1 + αn−2t

n−2 + ... + α1t + α0.

En ambos casos, la solucion particular tiene la misma forma que la sucesion at,donde los coeficientes de la solucion se debe determinar al imponer la igualdad respectiva,cuestion analoga a lo hecho con la solucion particular de la ecuacion diferencial.

De esta manera, para el caso exponencial, basta con asumir que yp,t = δµt, donde δ esel coeficientes a determinar. Para el caso del polinomio, es necesario asumir que y,t = ηntn +ηn−1t

n−1 +ηn−2tn−2 + ...+η1t+η0, donde los coeficientes ηi se determinan, tal como se ha dicho,

al imponer la igualdad de la recurrencia con la sucesion at.

Ejemplo 7.4.1 Resolver la ecuacion en diferencias

yt = yt−1 + yt−2 + t2 + 1,

considerando que y0 = 1 e y1 = 0.

Solucion. Note que el problema se puede escribir en forma equivalente como:

yt+2 − yt+1 − yt = (t + 2)2 + 1 = t2 + 4t + 5.

La ecuacion caracterıstica es λ2−λ−1 = 0, cuyas raıces son λ1 = 1+√

52 y λ2 = 1−√5

2 . Luego,la solucion de la homogenea es:

18Para un tratamiento mas general, aunque no mucho mas, se recomienda ver el libro de Sargent, MacroeconomicTheory, Sec. Edition, Chapter IX, Academic Press.

Page 171: Libro Matematicas Para Economistas

170 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

yh,t = c1

(1 +

√5

2

)t

+ c2

(1−√5

2

)t

.

Al imponer las condiciones iniciales determinamos los valores de c1 y c2. Para encontrar lasolucion particular, supongamos que yp,t = η2t

2 + η1t + η0. Luego, reemplazando en la ecuacionse tiene que:

[η2(t + 2)2 + η1(t + 2) + η0]− [η2(t + 1)2 + η1(t + 1) + η0]− [η2t2 + η1t + η0] = (t + 2)2 + 1.

Desarrollando la expresion se obtiene un sistema de ecuaciones para los coeficientes η2, η1 yη0 que nos permite encontrar la solucion particular, que sumada a la solucion homogenea nosentrega la solucion del problema.

Nota. 7.4.1 a.- La linealidad de la ecuacion en diferencias indicada se prueba en forma sim-ilar a lo hecho para las ecuaciones diferenciales.

b.- Si uno define el operador de rezagos L como aquel que rezaga la sucesion en un instante,es decir, L(yt) = yt−1

19, se tiene entonces que nuestra ecuacion en diferencias de orden 2se puede escribir como:

[L2 + αL + β

](yt) = at.

La obtencion de las raıces caracterısticas es analogo a lo hecho para la ecuacion diferencial,es decir, determinar λ1 y λ2 tal que

L2 + αL + β = (L− λ1)(L− λ2).

Que la ecuacion en diferencias sea lineal significa que el operador que define la ecuacionen diferencias es lineal. Un ejemplo de ecuacion no lineal es el siguiente:

yt

yt−1 − 2t+ 3 · yt−2 = 2t + t2.

c.- Para una ecuacion en diferencias cualquiera, el orden de la misma se define como la mayordiferencia de rezagos que existe entre las componentes de la variable (la variable en sı ysus rezagos).

d.- El metodo de resolucion es analogo si la ecuacion en diferencias es lineal, de orden n ycon coeficientes constantes. En dicho caso, el polinomio caracterıstico es de orden n y seprocede en forma similar a lo hecho para ecuaciones diferenciales, pero considerando queahora las expresiones de las soluciones de la homogenea tienen una forma distinta20.

Ejercicio 7.4.1 Considere la siguiente ecuacion en diferencia

yt = t1yt−1 + t2yt−2.

19Y con ello, Ln(yt) = yt−n.20Para las ecuaciones diferenciales, la solucion es, en general, una exponencial; en el caso de recurrencias, se

trata de exponentes.

Page 172: Libro Matematicas Para Economistas

7.5. EJERCICIOS ADICIONALES 171

1. Encuentre la expresion para el polinomio caracterıstico.

2. Factorice el polinomio caracterıstico, para eso expreselo en terminos de 1λ1

y 1λ2

. Encuentrelas relaciones entre los parametros de la factorizacion y los iniciales.

3. Encuentre y grafique las condiciones que deben encontrarse entre t1 y t2 para que laecuacion en diferencia converja.

4. Encuentre de que forma las soluciones (raices) del polinomio caracterıstico se relacionan

con la matriz A =

(t1 t21 0

).

5. Simule una ecuacion en diferencia de segundo orden. Grafique y observe como se alteranlas conclusiones obtenidades en funcion de los distintos valores que pueden imponerse a t1y t2.

Ejercicio 7.4.2 Muestre que la solucion de la ecuacion

yt − ayt−1 = αt + β

es

yt =αt + β

1− a− aα

(1− a)2+ Aat,

con A una constante que depende de las condiciones iniciales.

Ejercicio 7.4.3 Si la solucion de yt + ayt−1 + btt−2 = f(t) es Yt = yt + yHt , mostrar que

yt =α2

α2 + aα + bαt

cuando f(t) = αt y que

yt =αt + β

1 + a + b+ α

a + 2b

(1 + a + b)2

cuando f(t) = αt + β.

7.5. Ejercicios Adicionales

P1.- Ecuaciones Diferenciales

1. Resuelva completamente:y +

√12y − y = 0 (7.1)

considerando las condiciones iniciales y0 = 1 e y = 2.

2. Resuelva las siguientes ecuaciones diferenciales.

y + 4y + 9y = x2 + 3x (7.2)y + y + y = x3ex (7.3)

Para su solucion particular utilice el metodo de coeficientes indeterminados.

Page 173: Libro Matematicas Para Economistas

172 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

P2.- Ecuaciones en Diferencia de Segundo Orden.

Considere la siguiente ecuacion en diferencia:

yt = t1yt−1 + t2yt− 2 (7.4)

1. Encuentre la expresion para el polinomio caracterıstico.

2. Factorice el polinomio caracterıstico, para eso expreselo en terminos de 1λ1

y 1λ2

.Encuentre las relaciones entre los parametros de la factorizacion y los iniciales.

3. Encuentre y grafique las condiciones que deben encontrarse entre t1 y t2 para que laecuacion en diferencia converja.

4. Encuentre de que forma las soluciones (raices) del polinomio caracterıstico se relacio-

nan con la matriz A =

(t1 t21 0

).

5. Simule una ecuacion en diferencia de segundo orden. Grafique y observe como sealteran las conclusiones obtenidades en funcion de los distintos valores que puedenimponerse a t1 y t2.

P3.- Sistemas de Ecuaciones Diferenciales.

Considere el siguiente modelo economico:

Y = E(Y − T, r − πe) + G (7.5)M/p = L(Y, r) (7.6)

Suponga que en esta economıa, el mercado de bienes no se ajusta correctamente, es decir,

Y = α[E(Y − T, r − πe) + G− Y ] α > 0 (7.7)

Por el contrario, el mercado del dinero se ajusta con gran velocidad, por lo que se puederesolver para r, obteniendose r = r(Y, p, M). Siguiendo a Tobin(75), se asume que lasexpectativas sobre el cambio en precios son formadas de la siguiente forma:

πe = β(π − πe) β > 0 (7.8)

Finalmente, se plantea la siguiente relacion entre el producto(Y ), el producto natural (Y ∗)y la inflacion (π):

π = γ(Y − Y ∗) + πe γ > 0 (7.9)

Responda

1. De una interpretacion economica al modelo

2. Encuentre una condicion necesaria y suficiente para que esta economıa tenga unasolucion estable (estado estacionario)

P4.- Considere la siguiente estructura para una economıa cerrada:

y = −a(i− p) (7.10)m− p = −ki (7.11)

p = θy (7.12)

Asuma que aθ < 1.

Page 174: Libro Matematicas Para Economistas

7.5. EJERCICIOS ADICIONALES 173

1. Determine el signo de los parametros e interprete.

2. Asuma que inicialmente y = i = y = m = p = 0. Suponga que en t0 existe un cambiopermanente de m, tal que m1 < m0.

a) ¿Cuales son los valores de y y i en t0?. ¿Como afecta un cambio en la velocidadde ajuste (θ) a y0?. Explique intuitivamente.

b) ¿Cual es la senda de y luego de y0?

3. Suponga que estamos midiendo la volatilidad total del producto causado por uncambio en m a traves de V =

∫∞t=0 y2

t dt.¿Como se afecta V por un cambio en lavelocidad de ajuste?

Page 175: Libro Matematicas Para Economistas

174 CAPITULO 7. ECUACIONES DIFERENCIALES Y EN DIFERENCIA

Page 176: Libro Matematicas Para Economistas

Capıtulo 8

Diagramas de Fase

8.1. Nociones basicas

La idea es ilustrar el comportamiento en el tiempo de un sistema de ecuaciones diferencialessin que necesariamente lo resolvamos. De esta manera, la construccion de un diagrama de fasesdel sistema considerado puede ser muy util toda vez que deseemos hacer un analisis prospectivoy aproximado del mismo. Muchas veces la complejidad del sistema de ecuaciones diferencialesno permite una solucion analıtica del mismo, de tal forma que la unica alternativa que tenemosde hacer su estudio del mismos es por medio de los diagramas de fase.

Para fijar ideas, vamos a considerar un sistema de ecuaciones lineales de la forma

y′1 = α11y1 + α12y2 + β1

y′2 = α21y1 + α22y2 + β2.

Note que para cualquier punto donde y′1 > 0, la funcion y1 es creciente; en cambio si y′1 < 0,la funcion y1 es decreciente en la region respectiva. Por ultimo, si y′1 = 0, la funcion y1 esconstante, de tal forma que podemos afirmar que esta en equilibrio. De hecho, en todos aquellospuntos donde simlutaneamente ambas derivadas son iguales a cero diremos que el sistema esta enequilibrio, de lo contrario alguna de las funciones puede crecer o decrecer en el tiempo con locual no hemos llegado al estado estacionario.

El problema consiste en determinar aquellas regiones donde la derivada es positiva, negativao cero.

Para ello, en primer lugar debemos considerar el siguiente hecho, que es fundamental parael analisis:

dada una funcion g : IR → IR entonces el espacio es dividido en tres regiones queson complementarias1:

todos aquellos puntos que estan en el grafico de la funcion: region R1 de la figura

todos aquellos puntos que estan sobre el grafico de la funcion: region R2 de la figura

todos aquellos puntos que estan bajo el grafico de la funcion: region R3 de la figura1Es decir, la union de todas ellas es el espacio y la interseccion es vacıa.

175

Page 177: Libro Matematicas Para Economistas

176 CAPITULO 8. DIAGRAMAS DE FASE

RR

R

12

3

x

y

z

(x,y)

w

g

(x ,x )1 2

(x ,x )1 2

(x ,x )1 2

Note que el punto (x, z) ∈ R1 lo cual implica que g(x) = z. Por otro lado, el punto (x,w) ∈R3. Como w < z se tiene que, en forma equivalente, w < g(x). En forma analoga podemosconcluir que y > g(x). En consucuencia, dado cualquier punto (x1, x2) ∈ IR2 se tiene que,

(a) o bien g(x1) = x2 (es decir, g(x1)− x2 = 0)

(b) o bien g(x1) < x2 (es decir, g(x1)− x2 < 0)

(c) o bien g(x1) > x2 (es decir, g(x1)− x2 > 0).

En otras palabras, si definimos la funcion2 G : IR2 → IR tal que

G(x1, x2) = g(x1)− x2,

el espacio puede ser dividio en tres regiones:

todos aquellos puntos donde G(x1, x2) = 0

todos aquellos puntos donde G(x1, x2) < 0

todos aquellos puntos donde G(x1, x2) > 0

Ası, en general, dada una funcion de dos variables h(x1, x2), al igualarla a cero obtenemosuna curva en el plano, la que divide el espacio en tres regiones como antes se indico en detalle.

De esta manera, volviendo a nuestro problema original, dado el sistema de ecuaciones difer-enciales

y′1 = α11y1 + α12y2 + β1

y′2 = α21y1 + α22y2 + β2.

veamos la derivada como una funcion de dos variables (y1, y2). Para determinar entonces lastres regiones mencionadas, consideremos en primer lugar la region cero, que en este caso es unarecta en el plano y1 - y2 ya que

y′1 = 0 ⇔ α11y1 + α12y2 + β1 = 0

2Note que toda funcion real puede ser vista como una de dos variables igualada a cero.

Page 178: Libro Matematicas Para Economistas

8.1. NOCIONES BASICAS 177

Analogo con la otra derivada. De esta manera, en todos los puntos de la recta ya indicada laderivada es cero, y por lo tanto en los puntos que estan sobre la recta, la derivada es, o bienpositiva o bien negativa. Veamos la figura

y' = 0

¿y': +, -?

¿y': +, -?

y

y2

1

1

Para determinar la region positiva y/o negativa, una forma de proceder es evaluar en y1 =y2 = 0 y determinar el signo del resultado. Si este es positivo se trata de la region positiva;analogo con la negativa. Para el caso, el resultado es β1 para la primera recta y β2 para lasegunda. Luego, si por ejemplo β1 > 0 y el origen esta por abajo de la recta, se tiene quetoda la region que esta debajo de la recta corresponde a la region positiva y por ende la derivada(funcion G en nuestro caso) es positiva. Con esto se tiene de inmediato que la region sobre larecta es la negativa, es decir, aquella donde la derivada correspondiente es negativa.

y' = 0

y

y2

1

1

β1

> 0

-+

En forma analoga podemos considerar las distintas combinaciones que se producen cuandoahora incorporamos la segunda recta que representa a la derivada y′2 = 0. Con ello el espacioqueda dividido en cuatro regiones, en cada una de las cuales estan claramente definidos los signosde las derivadas. Supongamos los signos de derivadas y las regiones de la siguiente figura:

Page 179: Libro Matematicas Para Economistas

178 CAPITULO 8. DIAGRAMAS DE FASE

+-

+-

(1)

(2)

(3)

(4)

y' = 01

y' = 02

y

y

1

2

De la figura se tiene entonces lo siguiente:

en la region (1) y′1 > 0 e y′2 > 0

en la region (2) y′1 > 0 e y′2 < 0

en la region (3) y′1 < 0 e y′2 < 0

en la region (4) y′1 < 0 e y′2 > 0

Luego, por ejemplo, en la region (2) se tiene que y1 es creciente (representaremos→) mientrasque y2 es decreciente (representaremos ↓)3.

La siguiente figura ilustra las ideas y conceptos anteriores, donde las flechas indican el sentidodel crecimiento (→ o ↑ segun la funcion) o el sentido del decrecimiento (← o ↓).

+-

+-

y' = 01

y' = 02

y

y

1

2

Ejemplo 8.1.1 Supongamos el sistema de ecuaciones diferenciales

y′1 = 4y1 + 2y2 − 6

y′2 = 12y1 − 3y2 − 9

3Para y1 usaremos flechas horizontales mientras que para y2 seran flechas verticales.

Page 180: Libro Matematicas Para Economistas

8.1. NOCIONES BASICAS 179

En este caso, las rectas y′1 = 0 e y′2 = 0 corresponden a y2 = −2y1 + 3 e y2 = 4y1 − 3respectivamente. La solucion del sistema de ecuaciones (interseccion de las rectas) es y1 = 1 ey2 = 1. Para la primera recta, el origen (0, 0) esta por debajo y, evaluando en y1 = y2 = 0 seobtiene 3 > 0. Luego, la region debajo de la recta es positiva (y por ende la derivada de y1

positiva, es decir, y1 creciente en dicha region. Para la segunda recta, el origen esta sobre larecta y evaluando en cero se obtiene −3. Luego, la region que esta sobre la recta corresponde aderivada de y2 negativa. La siguiente figura ilustra todo lo anterior:

+

- +-

y' = 01y' = 02

y

y

1

2

(1,1)

(A)

(B)

(C)

(D)

Como interpretar el resultado anterior? En primer lugar, debemos tener presente que faltauna variable en todo este analisis: el tiempo. Sin embargo, el diagrama de fase anterior nos diceque, en primer lugar, si las funciones y1 e y2 alcanzan el valor 1 entonces ellas permaneceranen dicho valor ya que no existen fuerzas que motiven el cambio (la derivada es cero): este esel llamado punto de equilibrio del sistema de ecuaciones diferenciales. Por otro lado,si inicialmente el valor de las funciones esta en la region (B) de la figura anterior, entonces,en la medida que el tiempo transcurra, ambas funciones se alejaran del punto de equilibrio(creceran desde el valor inicial). Por otro lado, si el valor inicial de ambas funciones estuvieraen la region (D) sucederıa lo mismo, pero ahora ambas funciones decrecerian alejandose delpunto de equilibrio. Las unicas posibilidades para converger eventualmente al equilibrio estanen aquellas trayectorias cuyos puntos iniciales (valores iniciales) esten localizados en las regiones(A) o (C).

Pero no todos los puntos de dicho tipo de regiones son tales que en la medida que el tiempotranscurre las trayectorias que parten de ellos nos llevan al equilibrio. Para fijar ideas, veamosla siguiente figura y supongamos que el punto (a, b) de la region (A) es aquel que nos llevaal equilibrio. Entonces, aquellos puntos en que la primera componente es mayor que a serandesviados hacia la region (B), mientras que aquellos puntos de la region (A) donde la primeracomponente es menor que a en algun momento cortaran la trayectoria de equilibrio, de modo queseran atraidos por este. Situacion analoga ocurre con un punto (c, d) que nos lleva al equilibrioen la region (C).

Page 181: Libro Matematicas Para Economistas

180 CAPITULO 8. DIAGRAMAS DE FASE

+

- +-

y' = 01y' = 02

y1

y2 (A)

(B)

(C)

(D)

(a,b)

(c,d)

Para el caso de sistemas de ecuaciones diferenciales no necesariamente lineales, la forma enque se construye el diagrama de fases es similar a lo realizado. La diferencia obvia viene delhecho en este caso, las rectas son reemplazadas por curvas. Para determinar las regiones dondelas derivadas son negativas o positivas la idea de evaluar en el origen sigue siendo valida, lo quenos permite concluir toda vez que podemos localizar el origen a uno u otro lado de la curva.

8.2. Ejercicios Adicionales

P1.- Considere una economıa con curva de Phillpis aumnetada por expectativas adaptativas entiempo continuo descrito po las siguientes ecuaciones:

π = πe + α(µ− µ) (8.1)

µ = −γ(g − g) (8.2)

g = θ − π (8.3)

πe = β(π − πe) (8.4)

donde π es inflacion, µ es desempleo, g es la tasa de crecimiento del PIB, θ la tasa decrecimiento del dinero y el superındice e denota esperanza.

1. Interprete economicamente las ecuaciones planteadas. Determine ademas el signo delos distintos parametros.

2. Reduzca el sistema a uno de dos ecuaciones para π2 y µ y grafique el diagrama defase correspondiente. Determine las condiciones adecuadas sobre los parametros queconsidere apropiados.

3. Determine graficamente la trayectoria de la inflacion, el desempleo y el crecimientoluego de un aumento de θ = θ1 a θ = θ2, con θ2 > θ1.

4. ¿Como cambiarıa su respuesta si los agentes anticipan que este cambio sucedera enel futuro cercano?

5. Si bien el modelo es planteado en tiempo continuo, de la estructura en tiempo discretopara el mismo.

Page 182: Libro Matematicas Para Economistas

8.2. EJERCICIOS ADICIONALES 181

6. Utilizando su computador, y dada su respuesta en la pregunta anterior, simule elcambio en las variables de inters cuando existe un cambio no esperado y permanenteen la tasa de emision de dinero.

P2.- Dado el sistema de ecuaciones diferenciales

π = h(1− Mdt

M st

) (8.5)

ut =Md

t

M st

=aPtQt

M st

(8.6)

donde las variables son aquellas utilizadas normalmente en Macroeconomıa (inflacion, masamonetaria, precios, etc.). Dado lo anterior, se pide:

1. Interprete economicamente cada una de las relaciones

2. Exprese la economıa como un sistema de ecuaciones diferenciales en π y u

3. Suponga h > 0, dibuje e interprete el diagrama de fase de esta economıa. ¿Que tipode trayectoria se presenta? ¿Es convergente?

P3.- Sea H el stock de casa, I la tasa de inversion, pH el precio de las casas y R el valor delarriendo. Asuma que I es creciente en pH , por lo que I = I(pH), con I ′() > 0 y H = I−γH.Asuma ademas que el arriendo es una funcion decreciente de H : R = R(H), R′() < 0.Finalmente asuma que (R+ ˙pH)

pH= r, donde r es la tasa de interes.

1. Interprete intuitivamente la ultima expresion.

2. Muestre el conjunto de puntos en el espacio (H, pH) que cumplan con H = 0. Realicelo mismo para ˙pH = 0

3. Presente la dinamica para las variables H y pH en cada region del diagrama dibujadoen la anterior pregunta.

4. Suponga que el mercado esta inicialmente en el equilibrio de largo plazo, y que sepresenta un inesperado aumento permanente en r. ¿Que ocurre con H y pH cuandose produce el cambio? ¿Que ocurre con las variables luego del cambio?

5. Suponga que el mercado esta inicialmente en el equilibrio de largo plazo, y que sehace conocido el hecho que existira un aumento permanente en r en el momento T(futuro). ¿ Que ocurre con H y pH en el momento de conocerse la noticia? ¿Comose comportan las variables entre el momento de la noticia y el momento en quese produce el cambio? ¿que ocurre con las variables cuando el cambio se produce?¿que ocurre luego de ocurrido el cambio?

Page 183: Libro Matematicas Para Economistas

182 CAPITULO 8. DIAGRAMAS DE FASE

Page 184: Libro Matematicas Para Economistas

Capıtulo 9

Calculo Variacional

9.1. Introduccion

En el problema de optimizacion que ahora nos ocupa la incognita no es punto de IRn, comoen el caso anterior, si no mas bien una funcion. El siguiente ejemplo ilustrara el tipo de problemaque nos interesa.

Ejemplo 9.1.1 Problema de distancia mınima entre dos puntos.

Supongamos dados dos puntos del plano, digamos (a1, b1) y (a2, b2). El problema que nosinteresa consiste en encontrar aquella curva que une ambos puntos de tal forma que la longitudde la misma sea mınima: en otras palabras, encontrar la curva que define el camino mas cortoentre los puntos indicados. Obviamente hay muchas curvas que unen ambos puntos tal como semuestra en la siguiente figura:

a a

b1

b2

1 2

(1)

(2)

(3)

Ahora bien, note que cualquiera de ellas correspondera al grafo de alguna funcion quedeseamos determinar. Por lo tanto, la incognita ahora es precisamente dicha funcion que cumplecon la condicion de minimalidad de la distancia. Precisamente ese criterio es aquel que nosayudara a encontrarla. Entrando en detalle, en primer lugar en lo que sigue denotaremos lasfunciones por x(t). Ası, lo primero que debe cumplir la funcion que sea la solucion de nuestroproblema es obviamente que pase por los puntos indicados, es decir,

183

Page 185: Libro Matematicas Para Economistas

184 CAPITULO 9. CALCULO VARIACIONAL

x(a1) = b1, x(a2) = b2.

Ahora, para fijar el criterio de longitud, notemos en primer lugar que una aproximacion dela longitud de una curva cualquiera (Ver figura) es simplemente la suma de los largos de lapoligonal que se construye tomando puntos de la curva. Ası, para el caso de una funcion x(t)dada y una poligonal con 5 puntos (ver figura siguiente), la longitud aproximada de la curva es

L ' L1 + L2 + L3 + L4.

a1 a2

b

b2

1

t

x(t)

t = t t t =0 1 2 43t

L

L

L L

1

2

3 4

x(t )1

x(t )2 x(t)

Note ahora que, por ejemplo, para L2 se cumple que, por Teorema de Pitagoras,

L22 = (t2 − t1)

2 + (x(t2)− x(t1))2 ⇔ L2 =

√(t2 − t1)

2 + (x(t2)− x(t1))2 =

√1 +

(x(t2)− x(t1)

t2 − t1

)2

· (t2 − t1).

Luego, para una particion t0 = a1 < t2 < t3 < ... < ti < ti+1 < ... < tn = a2 del intervalo[a1, a2] se tiene que para un intervalo i = 1, 2, ..., n cualquiera, la longitud del mismo es

Li =

√1 +

(x(ti)− x(ti−1)

ti − ti−1

)2

· (ti − ti−1).

Si x(·) es derivable en el sub intervalo, entonces por Teorema del Valor Medio sabemos queexiste ξi ∈ [ti−1, ti] tal que

x′(ξi) =(

x(ti)− x(ti−1)ti − ti−1

)

y por lo tanto, para ese ξi se cumple que

Li =√

1 + x′(ξi)2 · (ti − ti−1).

Por lo tanto, una buena aproximacion de la longitud de la curva definida por la funcion x(t)es simplemente1

1Reemplazar el cuociente indicado por la derivada.

Page 186: Libro Matematicas Para Economistas

9.1. INTRODUCCION 185

L 'n∑

i=0

√1 + x′(ξi)

2 · (ti − ti−1).

Cuando el numero de puntos de esta particion tiende a infinito obtendremos la longitudexacta de la curva. Precisamente esta suma cuando el numero de elementos de la particion

tiende a infinito es la integral definida de la funcion√

1 + x′(t)2 en el intervalo [a1, a2],que se representa por

L =∫ a2

a1

√1 + (x′(t))2dt.

Luego, todo nuestro problema consiste en encontrar una funcion x(t) que pase por ambospuntos y que ademas sea de longitud mınima es decir, encontrar x(t) tal que se resuelva elsiguiente problema de optimizacion:

mın∫ a2a1

√1 + [x′(t)]2dt

s.a x(a1) = b1,x(a2) = b2

Note que en el problema anterior, la funcion objetivo se expresa a traves de una integralque depende de una funcion incognita y de sus derivadas. Haciendo abstraccion de lo anterior,podemos pensar que el problema general que nos ocupa es encontrar una funcion x(t) queoptimice una integral de la forma

∫ t2

t1F (t, x(t), x′(t))dt

donde F (·) es una funcion conocida que depende de tres variables: t, x(t) y su derivada x′(t).En el ejemplo anterior, se tenıa que

F (α, β, γ) =√

1 + γ2.

Definicion 9.1.1 Problema de calculo de variaciones. El problema de calculo de varia-ciones de una variable se define como2:

mın∫ t2t1

F (t, x(t), x′(t))dts.a x(t1) = x1,x(t2) = x2

Como hemos dicho, en el caso anterior la funcion F (·) corresponde a:

F (t, x(t), x′(t)) =√

1 + (x′(t))2,

la cual obviamente no depende de t ni de x(t), consideradas estas como argumentos de la misma:en este caso la dependencia explıcita es solo en x′(t) y no en t ni en x(t).

2En rigor, en lo que sigue estableceremos condiciones necesarias de optimalidad que son validas para unproblema de maximizacion como de minimizacion. Por comodidad mantendremos la idea de minimizacion. Porotro lado, en lo que sigue tambien asumiremos que el problema que estamos planteando esta expresado en la formacorrecta en el sentido que no se requeriran condiciones de segundo orden para analizar si la solucion encontradaes una que minimiza o maximiza.

Page 187: Libro Matematicas Para Economistas

186 CAPITULO 9. CALCULO VARIACIONAL

9.2. Condiciones necesarias de optimalidad del problema de CV

Antes de seguir adelante y establecer las condiciones necesarias de optimalidad del problemade Calculo de Variaciones (y posteriomente para el problema de Control optimo), necesitamosrepasar brevemente algunos conceptos de integracion.

9.2.1. Nociones basicas de integracion.

Dado el intervalo [a, b] ⊆ IR, diremos que el conjunto de puntos Tn = tini=0 es una malla

en el intervalo si se cumple que

a.- t0 = a y tn = b

b.- a = t0 < t1 < t2 < ... < ti < ti+1 < ... < tn = b.

Graficamente es como sigue:

t t t t t=a =b0 1 i i+1 nt2

Si a la malla original Tn le agregamos un nuevo punto que satisface la condicion [b.−] anterior,denotaremos Tn+1. Esta nueva malla (y cualquier otra que cumpla las condiciones) se llamara unrefinamiento de Tn. Equivalentemente, diremos que Tn+1 es una malla mas fina que Tn.

Con esto, dada la malla Tn = tini=0 y dado un punto cualquiera ti ∈ [ti, ti+1], una suma

de Riemann de la funcion en el intervalo I = [a, b] se define como

S(f, I, Tn) =n∑

i=1

[f(ti)] · (ti+1 − ti).

Si la funcion f : [a, b] → IR es positiva, una suma de Riemann se puede entender como unaaproximacion del area que encierra la curva y el eje x como se ilustra en la siguiente figura3:

= at t t t t t = bt i

_

0 1 i+1i n-1 n

f( )t i

_

Note que mientras mas fina es una malla, mejor es la aproximacion del area bajo la curvatal como se ha definido. En principio, si el numero de puntos de la malla tiende a infinito, laaproximacion sera exacta y con ello obtendremos el area bajo la curva indicada. Si efectivamenteeste lımite existe diremos que la funcion es integrable en el intervalo [a, b].

3La altura del rectangulo i corresponde a f(ti) mientras que el largo de la base es simplemente (ti+1 − ti).

Page 188: Libro Matematicas Para Economistas

9.2. CONDICIONES NECESARIAS DE OPTIMALIDAD DEL PROBLEMA DE CV 187

Definicion 9.2.1 Diremos que una funcion f : IR → IR es integrable en el intervalos [a, b] si ellimite

lımn→∞

n∑

i=1

[f(ti)] · (ti+1 − ti)

existe, independientemente de como escojamos ti. Se entiende que Tn es una malla que se refinaen la medida que n aumenta. Si la funcion es integrable, el valor lımite anterior se denota como

b∫

a

f(t)dt = lımn→∞

n∑

i=1

[f(ti)] · (ti+1 − ti)

y se llama Integral definida de f en [a, b]. 2

En principio, calcular integrales definidas puede ser un problema muy complejo: es el lımitede una suma cuyos elementos pueder ser complejos de evaluar. Sin embargo, existe una tecnicaextraordinaria que nos permite hacer este calculo en forma relativamente sencilla para muchoscasos de interes. Esta tecnica pasa por la definicion de derivada de una funcion.

Definicion 9.2.2 Diremos que una funcion F : IR → IR es una primitiva de f : IR → IR si

F ′(t) = f(t),

es decir, si la derivada de F es f . Normalmente una primitiva de f(t) se representara por∫

f(t)dt.

Ejemplo 9.2.1 En lo que sigue se muestra a la funcion f y una de sus primitivas4:

f(t) = eat → ∫f(t)dt = 1

aeat.

f(t) = xn → ∫f(t)dt = 1

n+1xn+1, n 6= −1;

f(t) = 1t →

∫f(t)dt = Ln(t).

f(t) = sen(at) → ∫f(t)dt = − 1

acos(at) f(t) = cos(at) → ∫f(t)dt = 1

asen(at)

En general, saber calcular primitivas es un arte ya que muchas veces requiere de muchoingenio y eventualmente de experiencia. De hecho, hay muchas funciones a las cuales no se lespuede calcular en forma explicita una primitiva, en el sentido de expresarla en forma cerrada yfinita por una combinacion de funciones conocidas. A modo de ejemplo, las siguientes funcionesno tienen primitiva en el sentido anterior:

f(t) = et2 ; f(t) =sen(t)

t.

Algunas reglas que pueden resultar utiles para calcular primitivas de funciones mas compli-cadas a partir de otras mas simples se resumen en la siguiente proposicion.

4Note que si F (t) es una primitiva de f(t) entonces para toda constante c ∈ IR la funcion G(t) = F (t) + ctambien es una primitiva ya que G′(t) = F ′(t) + 0 = f(t). Luego, de existir primitivas, estas pueden ser infinitas:es solo cuestion de sumar constantes.

Page 189: Libro Matematicas Para Economistas

188 CAPITULO 9. CALCULO VARIACIONAL

Proposicion 9.2.1 Dadas funciones f, g y dada una constante α se cumple que:

a.-∫[f(t) + αg(t)]dt =

∫f(t)dt + α

∫g(t)dt: la primitiva es lineal.

b.-∫ f ′(t)

f(t) dt = Ln(f(t))

c.-∫

f(t)g′(t)dt = f(t)g(t)− ∫[g(t)f ′(t)dt]: regla de integracion por partes.

Cual es la relevancia de las primitivas? La respuesta viende dada por el llamado TeoremaFundamental del Calculo.

Teorema 9.2.1 Teorema Fundamental del CalculoDada una funcion integrable f : IR → IR y dada F una primitiva de f se tiene entonces que

b∫

a

f(t)dt = F (b)− F (a) ≡ [F (t)]ba ,

es decir, el calculo de la integral definida consiste en evaluar una primitiva cualquiera en losextremos de integracion y restar los valores.

El teorema anterior nos entrega una poderoza herramienta para calcular integrales definidas.El problema es que la complejidad se traspasa al calculo de primitivas.

Ejemplo 9.2.2 Notemos queα∫0

x2dx =[

x3

3

0= α3

3 . Notemos ademas que

α∫

1

1zdz = [Ln(z)]α1 = Ln(α).

Con esto, dado un real α > 1 se tiene que Ln(α) es simplemente el area bajo la curva 1x

entre 1 y α. La siguiente figura ilustra esto:

1 a

1

1/a Ln(a) f(x) = 1/x

Ejemplo 9.2.3 Calcular la siguiente integral:

b∫

a

x2eαx3

1 + Ln(x)dt.

Page 190: Libro Matematicas Para Economistas

9.2. CONDICIONES NECESARIAS DE OPTIMALIDAD DEL PROBLEMA DE CV 189

La respuesta es obvia: la funcion x2eαx3

1+Ln(x) no depende de la variable de integracion t ypor lo tanto esta expresion es constante en la integral. Luego,

b∫

a

x2eαx3

1 + Ln(x)dt =

x2eαx3

1 + Ln(x)

b∫

a

dt =x2eαx3

1 + Ln(x)· [t]ba =

x2eαx3

1 + Ln(x)(b− a).

Ejemplo 9.2.4 Calculemosa∫

1

tetdt.

Para ello, calculemos primero la primitiva de la funcion f(t) = tet y luego evaluemos en loslımites de integracion. En este caso, apliquemos la regla de integracion por parte:

∫tetdt → f(t) = t, g′(t) = et → g(t) = et, f ′(t) = 1

luego,∫

tetdt = tet −∫

etdt = tet − et = et(t− 1)

y por lo tanto,

a∫

1

tetdt = ea(a− 1)− 0 = ea(a− 1).

Note que en el ejemplo anterior hemos definido implıcitamente una funcion que depende dela variable a sobre la base del calculo de la integral:

g(a) =a∫

1

tetdt = ea(a− 1).

Haciendo abstraccion de lo anterior, un caso general de una funcion definida a partir de unaintegral es una expresion del siguiente tipo:

I(x) =

β(x)∫

α(x)

f(x, t)dt

donde f(x, t) es una funcion que depende de dos variables.

Ejemplo 9.2.5 Calculemos

I(x) =2x+1∫

x2

(x2t +

e2t

x

)dt.

En este caso, α(x) = x2, β(x) = 2x + 1, f(x, t) = x2t + e2t

x . Note que para efectos de laintegral, x es una constante. Luego, la primitiva de la expresion es:

Page 191: Libro Matematicas Para Economistas

190 CAPITULO 9. CALCULO VARIACIONAL

∫ (x2t +

e2t

x

)dt = x2 · t2

2+

e2t

2x.

En consecuencia,

I(x) =2x+1∫

x2

(x2t +

e2t

x

)dt =

[x2 · t2

2+

e2t

2x

]2x+1

x2

=

[x2 · (2x + 1)2

2+

e2(2x+1)

2x

]−

[x2 · (x2)2

2+

e2(x2)

2x

].

La siguiente regla nos permite derivar expresiones como la anterior sin necesariamente tenerque calcular la integral. La proposicion es la siguiente.

Proposicion 9.2.2 Dado

I(x) =∫ b(x)

af(t, x)dt

se tiene que

I ′(x) =∫ b(x)

a

∂f(t, x)∂x

dt + f(b(x), x) · b′(x).

Casos particulares de lo anterior son cuando b no depende de x (el segundo termino es cero) ocuando f no depende de x (el primer terminos es cero).

Ejercicio 9.2.1 Derivar la funcion

I(x) =2x+1∫

x2

(x2t +

e2t

x

)dt

directamente a partir del calculo de la integral ya hecho y aplicando la regla. Ver que amboscoinciden. 2

Ejercicio 9.2.2 Demostrar la proposicion anterior sobre regla de derivacion, llamada Reglade Euler.

Para terminar con esta seccion, necesitamos un ultimo resultado tipo continuidad para inte-grales.

Proposicion 9.2.3 Si para toda funcion continua g definida en [a, b] tiene que∫ ba f(t)g(t)dt = 0

entonces necesariamente f debe ser cero en el intervalo [a, b].

9.2.2. Las condiciones de optimalidad de primer orden

Nuestro objetivo en lo que sigue es establecer las condiciones de optimalidad de primer ordenpara el problema de Calculo de Variaciones (CV)

mın∫ t2t1

F (t, x(t), x′(t))dts.a x(t1) = x1,x(t2) = x2

Page 192: Libro Matematicas Para Economistas

9.2. CONDICIONES NECESARIAS DE OPTIMALIDAD DEL PROBLEMA DE CV 191

donde t1, t2, x1, x2 son dados a priori, supongamos que x∗(t) es la solucion del mismo. En loque sigue vamos a perturbar dicha solucion con el fin de establecer las condiciones necesarias deoptimalidad. De esta manera, supongamos dada una funcion g definida en [t1, t2] tal que g escontinua y g(t1) = g(t2) = 0. Entonces, dado a ∈ IR, definamos la siguiente funcion:

h(t) = x∗(t) + a · g(t).

Es claro que la funcion h(t) es factible para el problema (es decir, cumple las condicionesiniciales)5. Luego, con lo anterior definamos el siguiente funcional integral que depende de a:

I(a) =∫ t2

t1F (t, h(t), h′(t))dt.

Esta funcion I(a) es a valores reales y su mınimo se tiene en a = 0. Luego, derivando loanterior respecto de a, evaluando en a = 0 e igualando a cero se tiene la condicion de optimalidadque buscamos. Primero derivemos c.r al parametro a, para lo cual aplicamos la regla de Euler,caso simple en el cual los limites de integracion no dependen de la variable de derivacion:

dI(a)da

=∫ t2

t1

dF (t, h(t), h′(t))da

dt.

Utilizando regla de la cadena se tiene que:

dI(a)da

=∫ t2

t1

dF (t, h(t), h′(t))da

dt =∫ t2

t1

[∂F (t, h(t), h′(t))

∂xg(t) +

∂F (t, h(t), h′(t))∂x′

g′(t)]dt.

Luego, como en a = 0 se tiene el optimo6 se debe cumplir necesariamente que dI(a)da = 0. Ası,

∫ t2

t1

[∂F (t, x∗(t), x∗′(t))

∂xg(t) +

∂F (t, x∗(t), x∗′(t))∂x′

g′(t)

]dt = 0,

lo cual es valido para toda funcion g que verifica las condiciones iniciales.Para simplificar notacion, las derivadas parciales seran escritas con sub-ındices:

Fα :=∂F

∂α.

La idea ahora es dejar todo en funcion de g de modo que el termino con g′ sea eliminado.Para ello, se considera la integracion por partes del segundo termino de la integral anterior.Aplicando la regla con f = ∂F (t, x∗(t), x∗′(t))∂x′ y g′ = g′ se tiene que:

∫ t2

t1

[∂F (t, x∗(t), x∗′(t))

∂x′g′(t)

]dt = Fx′g|t1t0 −

∫ t2

t1

[dFx′(t, x∗(t), x∗

′(t))

dt

]g(t)dt.

Como g(t0) = g(t1) = 0 se tiene que Fx′g|t1t0 = 0 y luego, reemplazando todo lo anterior en laintegral original se concluye que:

∫ t2

t1

[Fx(t, x∗(t), x∗

′(t))− dFx′(t, x∗(t), x∗

′(t))

dt

]g(t)dt = 0.

5Esta es la perturbacion de la solucion que hemos mencionado.6Cuando a = 0, h(t) = x∗(t) que es el optimo.

Page 193: Libro Matematicas Para Economistas

192 CAPITULO 9. CALCULO VARIACIONAL

Como lo anterior es valido para todo g se tiene que (ver pie de pagina de integracion) elintegrando debe ser cero, es decir,

Fx(t, x∗(t), x∗′(t))− dFx′(t, x∗(t), x∗

′(t))

dt= 0,

que es la ecuacion de Euler del problema considerado.Ahora bien, aplicando la regla de la cadena a la relacion anterior y, omitiendo el punto de

evaluacion, se tiene que:

dFx′

dt=

∂Fx′

∂t+

∂Fx′

∂x· ∂x

∂t+

∂Fx′

∂x′· ∂x′

∂t,

es decir,

dFx′

dt= Ftx′ + Fxx′ · x′ + Fx′x′ · x′′ .

Luego, la ecuacion de Euler se puede re- escribir como:

Fx = Ftx′ + Fxx′ · x′ + Fx′x′ · x′′ ,que es una ecuacion diferencial de segundo orden, no homogenea y que en general tiene coefi-cientes no constantes. Note que originalmente existen dos coniciones iniciales. Como la ecuaciondiferencial es de segundo orden, esto, en principio, nos permitira encontrar los parametros de lahomogenea de tal forma que la solucion de nuestro problema sea unica. Con todo lo anterior,hemos demostrado que

Proposicion 9.2.4 Condiciones de Euler del problema de CV. Dado el problema de CV

mın∫ t2t1

F (t, x(t), x′(t))dts.a x(t1) = x1,x(t2) = x2

se tiene que una funcion satisface las condiciones necesarias de optimalidad si satisface lascondiciones iniciales y la siguiente ecuacion diferencial, conocida como ecuacion de Euler parael problema de CV:

Fx = Ftx′ + Fxx′ · x′ + Fx′x′ · x′′ .

Ejemplo 9.2.6 Consideremos el siguiente problema de optimizacion:

mın∫ t2t1

(tx′(t) + (x′(t))2)dts.a x(t0) = x0,x(t1) = x1

En este caso, F (t, x, x′) = tx′ + (x′)2. Luego, Fx = 0 y, por lo tanto, Fx′x = 0. Por otro lado,Fx′ = t + 2x′ y luego Ftx′ = 1. Finalmente, Fx′x′ = 2. De esta manera, la ecuacion de Euler es:

0 = 1 + 0x′ + 2x′′ ⇔ x′′ = −1/2.

Para resolverla, primero la homogenea y luego la particular. Ası, puesto que λ2 = 0 implica queλ1 = λ2 = 0 se tiene que la solucion de la homogenea es xh(t) = c1e

0t + c2te0t = c1 + c2t. Para la

Page 194: Libro Matematicas Para Economistas

9.2. CONDICIONES NECESARIAS DE OPTIMALIDAD DEL PROBLEMA DE CV 193

particular, note que el lado derecho es un polinomio de grado cero, luego la solucion deberıa serun polinomio de segundo grado de la forma a0 + a1t + a2t

2. Derivando lo anterior dos veces setiene que 2a2 = −1/2 y luego a2 = −1/4. Como a0 y a1 son libres y ya tenıamos que la solucionde la homogenea es una recta, se tiene finalmente que la solucion de la ecuacion es

x(t) = c1 + c2t− 1/4t2.

Como debemos imponer condiciones iniciales, se debe cumplir que

c1 + c2t0 − 1/4t20 = x0, c1 + c2t1 − 1/4t21 = x1.

Con esto, queda unıvocamente determinada la solucion del problema. 2

Ejemplo 9.2.7 Volvamos al problema de motivacion:

mın∫ a2a1

√1 + [x′(t)]2dt

s.a x(a1) = b1,x(a2) = b2

En este, F (t, x, x′) =√

1 + [x′]2. Note que F solo depende x′. De la ecuacion de Euler

Fx = Ftx′ + Fxx′ · x′ + Fx′x′ · x′′

sabemos entonces que Fx = Ftx′ = Fxx′ = 0, y por lo tanto la ecuacion queda 0 = Fx′x′ · x′′ ⇔x′′ = 0 ya que Fx′x′ = 1

[1+(x′)2]32. Luego, la solucion es x(t) = c1 + c2t que, considerando las

condiciones iniciales, es simplemente una recta que pasa por los puntos (a1, b1) y (a2, b2), cuestionque conociamos intuitivamente, al menos. 2

Page 195: Libro Matematicas Para Economistas

194 CAPITULO 9. CALCULO VARIACIONAL

9.3. Casos mas generales: condiciones de transversalidad.

Consideremos ahora el caso muy importante donde alguna de las condiciones iniciales noesta explicitada en el problema. Sin perdida de generalidad supondremos que la condicion finalesta abierta. En tal caso, diremos que el problema que nos ocupa tiene horizonte libre.

Note que la indeterminacion puede venir de tres formas:

a.- en el problema, el periodo final t2 esta indeterminado mientras que la condicion final x2

esta prefijada.

b.- en el problema, el valor final x2 esta indeterminado mientras que el periodo final t2 esta pre-fijada.

c.- en el problema, ni el periodo t2 ni el valor final x2 son conocidos.

Informalmente, en el primer caso se conocen metas pero no plazos, en el segundo caso seconocen plazos pero no metas mientras que en el tercer caso no se conocen ni metas ni plazos7.

Considerando el caso [c.−] anterior, el problema de CV que nos ocupa tiene entonces laforma:

mın

∫ t2t1

F (t, x(t), x′(t))dts.a x(t1) = x1

donde t1 y x1 son dados a priori, siendo en este caso las incognitas la funcion x(t) queresuelve el problema, t2 periodo final y x2 valor final. Note que, de hecho, al determinar t2queda obviamente determinado el valor de x2 ya que se debe cumplir que x2 = x∗(t2). Viceversadado x2 y el valor de t2. En lo que sigue, supongamos que el objetivo es encontrar la trayectoriay el plazo t2.

De esta manera, para encontrar las condiciones de optimalidad de este problema, supongamosque el optimo (solucion) es x∗(t) y que el periodo final es t∗2. La idea es entonces perturbar esteoptimo de manera analoga a lo ya realizado en el caso anterior. La diferencia escencial es queahora, ademas de perturbar el integrando, estamos perturbando los lımites de integracion. Deesta manera, definamos lo siguiente:

h(t) = x∗(t) + a · g(t)

T2 = t∗2 + a · δtdonde g es tal que g(t1) = 0 y δ es una cantidad pequena. De esta manera, definiendo el funcional:

I(a) =∫ T2

t1F (t, h(t), h′(t))dt,

sabemos que el optimo se encuentra cuando a = 0. Para derivar este funcional, consideremos laregla general de derivacion (Regla de Euler) dada anteriormente:

I(x) =∫ b(x)

af(t, x)dt

7A pesar de lo anterior, es claro que los grados de libertad entre plazos y metas estaan relacionados entre sı porcuanto, por ejemplo, dado un periodo final y dada una solucion x(t) del problema, claramante obtenemos el valorde termino.

Page 196: Libro Matematicas Para Economistas

9.3. CASOS MAS GENERALES: CONDICIONES DE TRANSVERSALIDAD. 195

entonces

I ′(x) =∫ b(x)

a

∂f(t, x)∂x

dt + f(b(x), x) · b′(x).

En nuestro caso, b(x) → b(a) = T2 = t∗2 + a · δt y ademas f(t, x) → x∗(t) + a · g(t) (x cambiapor a).

Ası, derivando, lo anterior c.r a la variable a se tiene que:

I ′(a) =∫ T2

t1

∂F (t, h(t), h′(t))∂a

dt + F (t, h(t), h′(t))|T2 · δt.

Aplicando la regla de la cadena se concluye que

∫ T2

t1

∂F (t, h(t), h′(t))∂a

dt =∫ T2

t1

[∂F (t, h(t), h′(t))

∂xg(t) +

∂F (t, h(t), h′(t))∂x′

g′(t)]dt.

Luego, evaluando en a = 0 e igualando a cero y siguiendo un razonamiento analogo al casoanterior se tiene que:

∫ t∗2

t1

[∂F (t, x∗(t), x∗′(t))

∂x− dFx′(t, x∗(t), x∗

′(t))

dt

]g(t)dt+

−Fx′g|t∗2

t1 + F (t, h(t), h′(t))|t∗2δt = 0.

Como ambos terminos son independientes, para tener la igualdad a cero, cada uno de ellos debeser igual a cero. De esta manera, las condiciones de optimalidad son:

∫ t∗2

t1

[∂F (t, x∗(t), x∗′(t))

∂x− dFx′(t, x∗(t), x∗

′(t))

dt

]g(t)dt = 0

−Fx′g|t∗2

t1 + F (t, h(t), h′(t))|t∗2δt = 0.

La primera condicion implica que el integrando debe ser nulo, es decir, la ecuacion de Euler:

∂F (t, x∗(t), x∗′(t))∂x

− dFx′(t, x∗(t), x∗′(t))

dt= 0.

La segunda condicion es la llamada condicion de transversalidad del problema. La idea esentonces desarrollar esta expresion de modo de hacerla independiente de g. Para ello, en primerlugar notemos que g(t1) = 0 y luego solo queda por estimar el valor de la expresion en t∗2. Ası,considerando una perturbacion de la funcion x∗ en a · g(t) (es decir, x(t) = x∗(t) + ag(t)) y det∗2 en δt (es decir, T2 = t∗2 + aδt). Sin perdida de generalidad, supongamos que a = 18. Con estodefinamos el cambio en el estado como:

δx := x(T2)− x∗(t∗2).

En este caso se puede probar9 que, para δt suficientemente pequeno se cumple que

g(T2) = δx− x′(t∗2) · δt.8Simplifica la notacion, no altera el analisis.9Visto en clases.

Page 197: Libro Matematicas Para Economistas

196 CAPITULO 9. CALCULO VARIACIONAL

Luego, reemplzando en lo anterior, la condicion de transversalidad se convierte en:

[F − x′Fx′

]t=t∗2

· δt + [Fx′ ]t=t∗2· δx = 0

que es la condicion de transversalidad que buscbamos.En resumen, se tiene la siguiente proposicion.

Proposicion 9.3.1 Las condiciones necesarias de optimalidad del problema:

mın∫ t2t1

F (t, x(t), x′(t))dts.a x(t1) = x1

son:

a.- Ecuacion de Euler:

Fx(t, x∗(t), x∗′(t))− dFx′(t, x∗(t), x∗

′(t))

dt= 0.

b.- Condicion de transversalidad:

[F − x′Fx′

]t=t∗2

· δt + [Fx′ ]t=t∗2· δx = 0

La condicion de transversalidad anterior se agrega a la condicion inicial x(t1) = x1. Con estodisponemos de dos condiciones para la ecuacion diferencial de segundo orden que es dada por lacondicion de Euler.

Algunos casos interesante de la condicion de transversalidad son los siguientes:

Proposicion 9.3.2 a.- Si el estado final es conocido (es decir, existe libertad en los plazos noen las metas), se tiene que δx = 0 y luego la condicion se convierte en [F − x′Fx′ ]t=t∗2

·δt = 0.Pero esto es valido para cualquier δt. Luego se tiene que

[F − x′Fx′

]t=t∗2

= 0.

b.- Si el periodo final es conocido (es decir, existe libertad en las metas y no en los plazos), setiene que δt = 0 y luego la condicion se convierte en [Fx′ ]t=t∗2

· δx = 0. Como esto es validopara todo δx se tiene que

[Fx′ ]t=t∗2= 0.

c.- Si existe una relacion funcional entre plazos y metas, digamos, xt∗2 = φ(t∗2), entonces lacondicion de transversalidad se convierte en:

[F + (φ′ − x′)Fx′

]t=t∗2

= 0.

Page 198: Libro Matematicas Para Economistas

9.4. EL PROBLEMA DE CV CON VARIAS VARIABLES 197

Vamos a presentar las condiciones de transversalidad del problema de CV cuando la condicionque se tiene sobre el valor final o el periodo final es una desigualdad de la forma xt∗2 ≥ xmin y/ot∗2 ≤ tmax

10.

d.- Si el plazo es fijo, entonces para el problema de minimizacion se tiene que:[Fx′ ]t=t∗2

≥ 0, xt∗2 ≥ xmin y ademas(xt∗2 − xmin

)· [Fx′ ]t=t∗2

= 0

e.- Si la meta es fija, entonces para el problema de minimizacion se tiene que:[F − x′Fx′ ]t=t∗2

≤ 0, t∗2 ≤ tmax y ademas (t∗2 − tmax) · [F − x′Fx′ ]t=t∗2= 0.

9.4. El problema de CV con varias variables

El problema que nos ocupa ahora es:

mın∫ t2t1

F (t, x1(t), x2(t), ..., xk(t), x′1(t), x′2(t), ..., x′k(t))dts.a xi(t1) = x1,i,

xi(t2) = x2,i, i = 1, ..., k

es decir, el problema de CV donde existen k funciones que definen la integral. En el caso yaanalizado, k = 1.

Para determinar las condiciones necesarias de optimalidad en este problema se procede enforma analoga a lo ya realizado para el caso k = 1. Ası, dada una solucion del problema denotadapor x∗i (t), i = 1, ..., k, la idea nuevamente es perturbarla utilizando una funcion gi(t) tal quegi(t1) = gi(t2) = 0. En este caso, siguiendo el mismo razonamiento anterior se puede concluirque, para todo i = 1, ..., k se tiene que:

Fxi(t,−→x∗,

−→x∗

′)− dFx′i

(t,−→x∗,

−→x∗

′)

dt= 0,

donde−→x∗ = (x∗1(t), x∗2(t), ..., x∗k(t)) y

−→x∗

′= (x∗′1 (t), x∗′2 (t), ..., x∗′k (t)).

Omitiendo la evaluacion en el optimo, la condicion anterior se puede re-escribir como:

Fxi = Ftx′i + Fxix′i · x′i + Fx′ix′i · x′′i , i = 1, ..., k.

En resumen, cuando el problema es de varias variables, las condiciones de Euler debenser validas para cada una de ellas, lo cual genera un sistema de lineal de ecuaciones difer-enciales de segundo orden con coeficientes no necesariamente constantes.

Para el problema en varias variables donde no existe restriccion sobre el punto terminal,las condiciones de transversalidad deben ser impuestas sobre cada una de las variables enforma agregada. Siguiendo el razonamiento hecho en el caso de una variables, podemos concluirque la condicion de transversalidad para este caso es la siguiente:

10El porque de estas condiciones proviene del hecho que en algunos problemas solo tenemos informacion parcialsobre las metas o los plazos: despues de desarrollado el proceso, el valor optimo final no puede ser menor quetal o cual cantidad o, para el caso plazos, el proceso no puede durar mas que cierta cantidad de tiempo. Laidea es buscar la trayectoria optima considerando estas restricciones de desigualdad. Note que si la restriccionde desigualdad esta en los plazos, tenemos dos soluciones posibles: el periodo optimo puede ser maximo posible(solucion de frontera) o ser menor que este valor maximo admisible (solucion interior). Analogo con condicionessobre las metas si los plazos estan fijos.

Page 199: Libro Matematicas Para Economistas

198 CAPITULO 9. CALCULO VARIACIONAL

[F − x′1Fx′1 − x′2Fx′2 − ...− x′kFx′k

]t=t∗2

δt +

[Fx′1 ]t=t∗2δx1 + [Fx′2 ]t=t∗2

δx2 + ... + [Fx′k ]t=t∗2δxk = 0.

En forma analoga a lo ya realizado podemos considerar diversas combinaciones en que yasea que el horizonte sea fijo o que las metas sean fijas. En dichos casos, o bien δt = 0 o bienalgun δxi = 0.

Ejemplo 9.4.1 Encontrar los puntos que satisfacen las condiciones necesarias de optimalidaddel problema:

mın∫ π/20 x′(t)2 + y′(t)2 + 2x(t)y(t)dt

s.a x(0) = 0, y(0) = 0,x(π/2) = 1, y(π/2) = −1

En este caso, F (t, x, y, x′, y′) = x′2 + y′2 + 2xy. Luego, la condicion de Euler c.r a x es

Fx =dFx′

dt,

es decir,

2y =d2x′

dt= 2x

′′

.En forma analoga, la condicion de Euler c.r a y es

2x =d2y′

dt= 2y

′′

.De esta manera, el sistema de ecuaciones diferenciales que se genera es

y = x′′, x = y

′′.

Para resolverlo, diferenciemos dos veces la primera ecuacion:

y′′

= (x′′)′′

= x(4).

Luego, igualando las expresiones queda x(4) = x ⇔ x(4) − x = 0.La ecuacion caracterıstica es λ4−1 = 0. Para resolverla, notemos que λ4−1 = (λ2−1)·(λ2+1).

Luego, las soluciones son λ1 = 1, λ2 = −1, λ3 = i, λ4 = −i.Con esto, encontramos que

x(t) = c1et + c2e

−t + c3 cos(t) + c4 sin(t).

Como y(t) = x′′

se tiene que, derivando lo anterior dos veces,

y(t) = c1et + c2e

−t − c3 cos(t)− c4 sin(t).

Al imponer las condiciones iniciales para determinar los coeficientes queda c1 = c2 = c3 =0, c4 = 1 (propuesto). Luego, la solucion del problema es x(t) = sin(t) e y(t) = − sin(t).

Page 200: Libro Matematicas Para Economistas

9.5. PROBLEMA ISOPERIMETRICO 199

9.5. Problema isoperimetrico

En este caso, el problema que nos interesa resolver es el siguiente:

mın (max)∫ t2t1

F (t, x(t), x′(t))dt

s.a∫ t2t1

G(t, x(t), x′(t))dt = Ax(t1) = x1,x(t2) = x2

es decir, uno donde ademas de las restricciones usuales, hay una nueva restriccion de tipo integral.En este caso, supongamos dado un parametro λ por determinar y definamos F como

F = F − λG.

Con esto, la condicion necesaria de optimalidad del problema anterior es:

Fx =Fx′

dt,

es decir, la ecuacion de Euler en F .

Ejemplo 9.5.1 Supongamos que x(t) es la tasa de estraccion de un cierto recurso (p.ej pesca-dos), A la cantidad inicial del recurso y P (x(t)) el la tasa de beneficio que se tiene en el instantet si el recurso es extraıdo a la tasa x(t). En este caso, la idea es maximizar el beneficio escogiendola tasa de estraccion adecuada en el tiempo, digamos, entre 0 y T . Ası, el problema de la firmaes:

max

∫ T0 e−rtP (x)dt

s.a∫ T0 x(t)dt = A

es decir, maximizar el beneficio descontado sujeto a que la cantidad de recurso esta dada.En este caso, F = e−rtP (x)− λx. Luego, como Fx′ = 0 se tiene que dFx′

dt = 0 y por lo tantola condicion de Euler es

e−rtP ′(x)− λ = 0,

es decir, e−rtP ′(x) = λ. Dado P esta es una ecuacion diferencial que podemos resolver paraencontrar x∗(t), solucion que obviamente depende de λ. Para determinar el valor del multipli-cador, reemplazamos el x∗(t) en la integral restriccion, con lo cual obtenemos una condicionpara determinarlo.

Nota. A partir del analisis de sensitividad, el multiplicador se puede interpretar como la tasade cambio de la solucion optima ante cambios en A. Esto es analogo al caso de optimizacionestatica.

Ejercicio 9.5.1 Dado el problema

mın∫ 10 [x′(t)]2dt

s.a∫ 10 x(t)dt = α

x(0) = 0,x(1) = 2

Page 201: Libro Matematicas Para Economistas

200 CAPITULO 9. CALCULO VARIACIONAL

pruebe que la ecuacion de Euler es λ + 2x′′

= 0 y que la solucion de esta es:

x(t) = −λt2

4+ c1t + c2

Imponiendo las condiciones iniciales y la condicion integral, deducir que c1 = 6α− 4, c2 = 0y λ = 24(α− 1).

9.6. CV con restricciones de igualdad

Consideremos ahora el problema general:

mın

∫ t2t1

F (t, x1(t), x2(t), ..., xk(t), x′1(t), x′2(t), ..., x′k(t))dts.a gi(t, x1, x2, ..., xk, x

′1, x

′2, ..., x

′k) = ci, i = 1, ..., p

es decir, un problema de CV con k variables y p restricciones de igualdad sobre las funciones ysus derivadas.

Definamos el Lagrangeano del problema como

L = F +p∑

i=1

λi(t)(ci − gi).

En este caso se puede demostrar que la condicion necesaria de optimalidad es que la ecuacionde Euler el Lagrangeano se debe cumplir respecto de cada una de las funciones xi, es decir,

Lxi =dLx′i

dt, i = 1, ..., p.

Si el problema tiene condiciones iniciales, estas deben ser impuesta a las soluciones obtenidasa partir de lo anterior con el fin de determinar los parametros.

Nota. Se recalca que en este caso los multiplicadores λi son funciones que dependen de t.

9.7. CV con restricciones de desigualdad

Consideremos ahora el problema general:

mın

∫ t2t1

F (t, x1(t), x2(t), ..., xk(t), x′1(t), x′2(t), ..., x′k(t))dts.a gi(t, x1, x2, ..., xk, x

′1, x

′2, ..., x

′k) ≤ ci, i = 1, ..., p

es decir, un problema de CV con k variables y p restricciones de desigualdad sobre las funcionesy sus derivadas.

Como en el caso anterior (igualdad), definamos el Lagrangeano del problema como:

L = F +p∑

i=1

λi(t)(ci − gi).

En este caso se puede demostrar que la condicion necesaria de optimalidad es que la ecuacionde Euler el Lagrangeano se debe cumplir respecto de cada una de las funciones xi, es decir,

Lxi =dLx′i

dt, i = 1, ..., p

Page 202: Libro Matematicas Para Economistas

9.8. CONDICIONES SUFICIENTES Y DE SEGUNDO ORDEN 201

pero ademas se deben cumplir las condiciones holgura complementaria dadas por las condicionesde Kuhn - Tucker, es decir, ademas de lo anterior se debe cumplir que:

λi(t) · [ci − gi] = 0, ∀i = 1, ..., p.

Note que no se imponen condiciones de signo (positividad) de los multiplicadores. Las condi-ciones de holgura complementaria permiten discriminar entre aquellas restricciones que sonactivas e inactivas tal como en el caso ya visto en optimizacion estatica.

9.8. Condiciones suficientes y de segundo orden

En primer lugar, para el problema de CV con condiciones iniciales sobre el punto inicial yfinal, se tiene la siguiente proposicion muy importante:

Proposicion 9.8.1 Si F (t, x, x′) es concava en x y x′ entonces la condicion de Euler es sufi-ciente para un maximo absoluto del problema de CV. Por el contrario, si F (t, x, x′) es convexaen x y x′ entonces la condicion de Euler es suficiente para un mınimo absoluto del problema deCV.

Este resultado es analogo al caso de optimizacion estatica donde la convexidad o concavidadnos garantizaba que las condiciones necesarias de optimalidad de primer orden (en este caso,condiciones de Euler) eran ademas suficientes para el problema de optimizacion. En terminospracticos, lo anterior implica que si a priori sabemos que el funcional F es, por ejemplo, convexo,entonces al resolver la ecuacion de Euler para el problema dado sabemos de inmediato que lasolucion encontrada resuelve el problema de minimizacion planteado: no se requiere verificarnada adicional. Surge de esta manera la pregunta natural de como verificar si el funcional es ono convexo. Para el caso, remitirse a lo indicado en capıtulo de convexidad donde se estableceque la condicion necesaria y suficiente es que el Hessiano es definido positivo. En nuestro caso,el Hessiano corresponde a la matriz:

HF =

[Fxx Fxx′

Fxx′ Fx′x′

]

Por ultimo, una condicion suficientes muy simple que solo involucra la derivada Fx′x′ puedeser establecida: esta es la condicion de Legendre.

Proposicion 9.8.2 Si x∗ resuelve el problema de CV, version maximizacion, con puntos ex-tremos fijos, entonces [Fx′x′ ]x=x∗ ≤ 0.

Por el contrario, si x∗ resuelve el problema de CV, version mimizacion, con puntos extremosfijos, entonces [Fx′x′ ]x=x∗ ≥ 0.

En rigor, existen condiciones mas generales de segundo orden para el problema de CV cono sin restricciones y con varias variables. Detallar estas condiciones escapa a los objetivos delapunte. Sin embargo, para nuestra tranquilidad, la mayor parte de los problemas de CV sonaquellos donde el funcional F es o bien concavo o bien convexo de tal forma que dichas condi-ciones de segundo orden son automticamente satisfechas.

Page 203: Libro Matematicas Para Economistas

202 CAPITULO 9. CALCULO VARIACIONAL

9.9. El caso de horizonte infinito

En lo que sigue nos ocuparemos del problema de CV cuando el periodo terminal (t2) esinfinito. En lo que sigue estableceremos las condiciones para el problema con una variables paraluego generalizar los resultados. De esta manera, el problema que no ocupa consiste en

opt

∫∞t1

F (t, x(t), x′(t))dts.a x(t1) = x1

Como no se ha explicitado condicion de termino necesitaremos fuertemente de las condicionesde transversalidad para resolverlo.

Previo a proceder, veamos algo basico sobre integrales impropias11. En primer lugar, ladefinicion de integral impropia es la siguiente:

∞∫

t1

f(t)dt := lımt2→∞

t2∫

t1

f(t)dt.

El problema basico con las integrales impropias se relaciona con la convergencia de lamisma12. Es claro que una condicion necesaria para la convergencia de la integral anterior esque la funcion f(t) tienda a cero cuando t →∞, y que de lo contrario simpre estarıa sumando ala integral con lo cual diverge. Sin embargo, esta condicion no es suficiente para que la integralconverja. En efecto, basta considerar el siguiente ejemplo:

∞∫

1

1t

dt = lımt2→∞

t2∫

1

1t

dt := lımt2→∞

[ln(t)]t21 = lımt2→∞

ln(t2)− ln(1) = ∞

es decir, la integral no converge a pesar que lımt2→∞

1t2

= 0.

El problema es que para garantizar la convergencia de la integral debemos garantizar quef(t) converge a cero, pero en forma muy rapida de tal forma que la cola de la funcion no aportemucho a la suma. La siguiente condicion es util en el momento de considerar la convergencia deintegrales impropias:

Proposicion 9.9.1 Supongamos que

a.- f(t) es acotada en todo el espacio

b.- f(t) es cualquier polinomio en t

c.- f(t) ≥ 0 para todo t y ademas lımt→∞ f(t) = 0

entonces para todo α > 0 la integral

∞∫

t1

e−αtf(t)dt

converge. Mas aun, si g(t) es cualquier funcion positiva tal que 0 ≤ g(t) ≤ e−αt, ∀t ∈ [t1,∞[entonces

11Es decir, integrales donde alguno de los lımites de integraion es infinito.12Es decir, que sea finita.

Page 204: Libro Matematicas Para Economistas

9.9. EL CASO DE HORIZONTE INFINITO 203

∞∫

t1

e−αtg(t)dt

tambien converge13.

Con esto tenemos algunas condiciones que nos permiten garantizar la convergencia (finitud)de la integral impropia anterior.

Volvamos al problema de CV con horizonte infinito. En primer lugar, la condicion de Eulerdebe seguir siendo valida. Todo el asunto esta en las condiciones de transversalidad. La propiedadse resume en lo siguiente:

Proposicion 9.9.2 Para el problema de CV

opt∫∞t1

F (t, x(t), x′(t))dts.a x(t1) = x1

siguiendo el mismo razonamiento hecho en el caso de horizonte finito, las condiciones necesariasde optimalidad de primer orden son:

a.- Ecuacion de Euler:

Fx =dFx′

dt.

b.- Condicion de transversalidad:

[F − x′Fx′

]t→∞ · δt + [Fx′ ]t→∞ · δx = 0

Como cada termino de [b.−] debe ser cero y, por otro lado, no existe condicion de terminosobre el plazo (δt 6= 0), entonces necesariamente [F − x′Fx′ ]t→∞ = 0. Por otro lado, si la metaesta fija en el infinito, es claro que no se requiere de condicion de transversalidad pues la condicionsobre el problema lım

t→∞x(t) = x∞, donde x∞ es un valor conocido, nos entrega la segundacondicion para resolver nuestra ecuacion diferencial. Si no es el caso, es decir, no existe restriccionsobre la meta ( lım

t→∞x(t) no es especificado, de modo que δx es cualquiera), entonces la condicion

de transversalidad adicional es [Fx′ ]t→∞ = 0.En resumen, la condicion de transversalidad en este problema es:

i.- Si no hay restriccion sobre metas entonces [F − x′Fx′ ]t→∞ = 0 y [Fx′ ]t→∞ = 0.

ii.- Si existe condicion sobre metas entonces la condicion es lımt→∞x(t) = x∞, donde x∞ es un

valor dado a priori.

13Note como en muchos problemas de economıa con horizonte infinito aparece la funcion objetivo multiplicadapor la exponencial, la cual es interpretada como una tasa de descuento continua. Esto se justifica sobre la basede lo anterior: necesitamos condiciones para garantizar que la integral impropia sea convergente.

Page 205: Libro Matematicas Para Economistas

204 CAPITULO 9. CALCULO VARIACIONAL

9.10. Ejercicios Adicionales

P1.- Encuentre el extremal del funcional

V [y] =∫ 5

0[3t + (y′)0,5]dt (9.1)

con las condiciones de borde y(1) = 3 y y(5) = 7

P2.- Demuestre que la distancia mas corta entre dos punto (A y Z) es una lınea recta. Ayu-da:Recuerde Teorema de Pitagoras.

P3.- Considere una firma monopolista que produce un unico bien con costos cuadraticos deltipo:

C = αQ2 + βQ + γ (α, β, γ > 0) (9.2)

La expresion para Q viene dada por la demanda 14

Q = a− bPt + hP ′t (9.3)

1. El objetivo de la firma es encontrar una senda de precios que le permita maximizar suutilidad total durante un perıodo de tiempo [0, T ]. Ademas, la firma tiene un preciofinal (P0) y uno final (PT ) dados. Es decir, el problema de la firma puede ser escritocomo:

max∏

[P ] =∫ T

0π(P, P ′)dt (9.4)

sujeto a N

P (0) = P0 (9.5)P (1) = P1 (9.6)

con P0, PT y T dados. Ud. debera resolver el problema de la firma.

2. Considere ahora que las funciones de costos y demanda toman las siguiente forma:

C =110

Q2 + 1000 (9.7)

Q = 160− 8 + 100P ′ (9.8)

,y que las condiciones de transversalidad son P0 = 1149 , PT = 154

9 y T = 2. Encuentrelas constantes para su respuesta en (1) y el precio en terminal.

3. Adopte una condicion de transversalidad del tipo PT ≥ 10 (manteniendo P0 = 1149),

¿como se altera su respuesta anterior?

P4.- Considere que el nivel de producto ideas es Yf , acorde con un nivel de inflacion de 0. Lafuncion de perdida social puede ser escrita como:

λ = (Yf − Y )2 + απ2 α > 0 (9.9)

La curva de Phillips aumentado esta representada por la expresion:

π = −β(Yf − Y ) + π2 β > 0 (9.10)

14No existen inventarios, luego producto es igual a demanda

Page 206: Libro Matematicas Para Economistas

9.10. EJERCICIOS ADICIONALES 205

Las expectativas de inflacion se forman de forma adaptativas, es decir,

πe = j(π − πe) 0 < j ≤ 1 (9.11)

De esta forma, la funcion de perdida social puede expresarse como:

λ(πe, πe) = (πe

βj)2 + α(

πe

j+ πe)2 (9.12)

El problema del gobierno es entonces el de encontrar la senda optima de πe que minimizala perdida social. Es decir,

Λ(πe) =∫ T

0λ(πe, πe)e−ρtdt (9.13)

1. Resuelva el problema del gobierno si es que π(0) = π0 (π0 > 0) y π(T ) = 0 (T dado)

2. ¿Como se altera su respuesta si es que la condicion de transversalidad se modificapara considerar el caso de una lınea terminal vertical?

P5.- Considere

V [y] =∫ 1

0(y + yy + y + 0,5y2)dt y(0) = 2 y(1) = 5 (9.14)

1. Resuelva el problema

2. Considere ahora que el problema es de lınea terminal en t = 1. Escriba la condicionde transversalidad adecuada y encuentre el valor de las nuevas constantes

P6.- Considere el funcional V [y] =∫ T0 (t2 + y2)dt

1. Encuentre la solucion general para y∗(t)

2. Encuentre el extreal si la condicion inicial es y(0) = 4 y la condicion final es T = 2con yT libre

3. ¿Como se altera su resultado si es que la condicion final fuese T = 2, yT ≥ 3 ?

4. Altere las condiciones finales tal que yT = 5 y T sea libre. Encuentre el nuevo extremal.¿Cual es el valor de T ∗?

P7.- Resuelva el problema

mın∫ t1

0

(1− x2)0,5

xdt con x(0) = 0, x(t1) = t1 − 5 (9.15)

P8.- Considere el problema

mın∫ 3

1x2(1− x)2dt x(1) = 0 x(3) = a (9.16)

1. Encuentre la solucion si es que a = 0 y a = 2

2. Muestre que si 0 < a < 2, la solucion es de esquina.

3. ¿Que ocurre si a > 2?

Page 207: Libro Matematicas Para Economistas

206 CAPITULO 9. CALCULO VARIACIONAL

P9.- Suponga que una firma quiere maximizar sus beneficios en forma dinamica. Para estoella debe seleccionar las sendas de capital y trabajo optimas de acuerdo a su objetivo.Considere que el costo en nuevo capital es m, el salario de mercado es W y que la funcionde produccion es concava. Por ultimo, la tasa de descuento de la firma es ρ y la tasa dedepreciacion del capital es γ. Luego el problema de la firma puede escribirse como

V [K,L] =∫ ∞

0[PQ(K,L)−WL−m(K + γK)]e−ρtdt (9.17)

1. ¿Cual es la importancia de ρ?

2. Resuelva e interprete las condiciones de Euler que se derivan del problema

3. Suponga Q = KαLβ. Encuentre las expresiones para las sendas optimas de K y L

P10.- Suponga que la firma en sus decisiones de contratacion de capital internaliza los costos deplaneamiento y ajuste. Si los beneficios de esta son de la forma π = αK−βK2 (α, β > 0),mientras que los costos son expresados como C = aK2 + bK

1. Encuentre una expresion para la senda optima de capital (suponga una tasa de des-cuento igual a ρ), tal que la firma maximize sus beneficios

2. Considere como condicion de transversalidad K0 fijo. ¿que ocurre en el infinito? (Ayu-da: Evalue los posibles montos de beneficios que la firma puede obtener)

Page 208: Libro Matematicas Para Economistas

Capıtulo 10

Control optimo

10.1. Introduccion

En lo que sigue vamos a considerar el siguiente problema general de de optimizacion, llamadoproblema de control optimo con horizonte libre:donde son conocidos F , f , t1, x1 y U . En version general, obviamente las incognitas del problemason las funciones x(t), u(t), el periodo final t2 y el valor final x2. La funcion x(·) se denominavariable de estado mientras que u(·) recibe el nombre de variable de control. Las solucionesdel problema, digamos, x∗(t) y u∗(t) reciben el nombre de variable de estado optima y controloptimo respectivamente.

Finalmente, la ecuacion diferencial

x′(t) = f(t, x(t), u(t))

se denomina dinamica del problema de control optimo.

Notas.

a.- Un caso particular interesante del problema anterior es cuando t2 y x2 son conocidos.

b.- Note que el problema de Caculo de Variaciones es un caso particular del problema decontrol optimo tal como se ha planteado. En efecto, basta con que la dinamica sea

f(t, x(t), u(t)) = u(t)

para que el problema de CO se convierta en uno de CV, ya que en ese caso x′(t) = u(t) yluego la funcion objetivo es

∫ t2

t1F (t, x(t), u(t))dt →

∫ t2

t1F (t, x(t), x′(t))dt.

c.- Note que, a partir de la dinamica y de las condiciones iniciales, dada una trayectoria decontroles u(t) queda entonces perfectamente definida una trayectoria de estado y con ello elvalor de la funcion objetivo. Por lo tanto, en estricto rigor, resolver nuestro problema con-siste basicamente en encontrar la trayectoria de control optimo. Ademas, dado el problemageneral, el problema consiste en encontrar ademas los momentos optimos y con ello el valorde la variable de estado en dicho periodo final. La ecuacion diferencial x′(t) = f(t, x(t), u(t))es una restriccion del problema y por lo tanto siempre debe cumplirse.

207

Page 209: Libro Matematicas Para Economistas

208 CAPITULO 10. CONTROL OPTIMO

En lo que sigue, trataremos el problema en la generalidad anterior. De esta manera, las condi-ciones de optimalidad que se obtendran seran, por un lado, aquellas que permiten determinarla familia de trayectorias optimas (analogo a las condiciones de Euler para el problema de CV)y, por otro lado, aquellas de transversalidad, dado que el horizonte final no esta especificado enel planteamiento del problema.

10.2. Condiciones de optimalidad; principio del maximo

Previo a establecer las condiciones de optimalidad, notemos que dado un estado factible x(t)(es decir, que verifica las restricciones del problema), se debe cumplir que para todo λ(t) ∈ IR:

λ(t) · [f(t, x(t), u(t))− x′(t)] = 0

y luego,∫ t2

t1λ(t) · [f(t, x(t), u(t))− x′(t)]dt = 0.

Definiendo

V :=∫ t2

t1F (t, x(t), u(t)) dt

de lo anterior sigue que

V =∫ t2

t1F (t, x(t), u(t)) dt +

∫ t2

t1λ(t) · [f(t, x(t), u(t))− x′(t)] dt

es decir,

V =∫ t2

t1F (t, x(t), u(t)) + λ(t) · [f(t, x(t), u(t))− x′(t)] dt.

Definicion 10.2.1 El Hamiltoniano del problema de control optimo dado se define como

H(t, x(t), u(t), λ(t)) = F (t, x(t), u(t)) + λ(t) · f(t, x(t), u(t)).

Por lo tanto, de lo anterior se tiene que

V =∫ t2

t1H(t, x(t), u(t), λ(t)) dt−

∫ t2

t1λ(t) · x′(t) dt.

Integrando por partes la segunda integral se tiene que∫ t2

t1λ(t) · x′(t) dt = [λ(t) · x(t)]t2t1 −

∫ t2

t1λ′(t) · x(t) dt

es decir,∫ t2

t1λ(t) · x′(t) dt = λ(t2) · x(t2)− λ(t1) · x(t1)−

∫ t2

t1λ′(t) · x(t) dt.

Reemplazando todo lo anterior en la expresion de V se deduce

Page 210: Libro Matematicas Para Economistas

10.2. CONDICIONES DE OPTIMALIDAD; PRINCIPIO DEL MAXIMO 209

V =∫ t2

t1H(t, x(t), u(t), λ(t)) dt− λ(t2) · x(t2) + λ(t1) · x(t1) +

∫ t2

t1λ′(t) · x(t) dt,

es decir,

V =∫ t2

t1[H(t, x(t), u(t), λ(t)) + λ′(t) · x(t)] dt− λ(t2) · x(t2) + λ(t1) · x(t1).

Con la finalidad de establecer las condiciones de optimalidad del problema, procederemosen forma analoga a lo realizado en el caso CV: perturbaremos la solucion del problema con unparametro, de tal forma que cuando este valga cero recuperamos la solucion original. Asumiremosque dicha perturbacion en el control optimo y la variable de estado sigue siendo factible para elproblema. De esta manera, suponiendo dados un control optimo u∗(t), una variable de estadooptima x∗(t), un periodo de termino optimo t∗2 (con lo cual queda ademas determinado el valoroptimo de termino x∗2 = x∗(t∗2)), definamos las perturbaciones de la siguiente forma

x(t) = x∗(t) + εp(t)

u(t) = u∗(t) + εq(t)

t2 = t∗2 + εδt

x2 = x∗2 + εδx

donde p(·) y q(·) son funciones continuas tal que p(t1) = 0, ε es un valor real pequeno, mientrasque δt y δx son valores reales arbitrarios (perturbaciones del tiempo y del estado). Note quex(t1) = x1 ya que p(t1) = 0.

Con las perturbacion anterior, definamos V (ε) como V (·) evaluado en las perturbacionesanteriores, es decir

V (ε) =∫ t2

t1[H(t, x(t), u(t), λ(t)) + λ′(t) · x(t)] dt− λ(t2) · x(t2) + λ(t1) · x1.

Derivando esta expresion c.r a ε se tiene que1:

dV (ε)dε

=∫ t2

t1

[∂H(t, x(t), u(t), λ(t))

∂ε+ λ′(t) · ∂x(t)

∂ε

]dt+

[H(t, x(t), u(t)) + λ′(t) · x(t)

]t=t2

· δt− ∂[λ(t2) · x(t2)]∂ε

.

La derivada de λ(t1) · x1 es cero pues esta expresion no depende de ε.De la definicion de las perturbaciones, y aplicando la regla de la cadena, se tiene que

1Recordemos que si I(x) =∫ b(x)

af(t, x)dt entonces

dI(x)

dx=

∫ b(x)

a

∂f(t, x)

∂xdt + f(b(x), x) · b′(x).

Page 211: Libro Matematicas Para Economistas

210 CAPITULO 10. CONTROL OPTIMO

[∂H(t, x(t), u(t), λ(t))

∂ε+ λ′(t) · ∂x(t)

∂ε

]=

∂H(t, x(t), u(t))∂x

· p(t) +∂H(t, x(t), u(t))

∂u· q(t) + λ′(t) · p(t).

Por otro lado, aplicando regla del producto y nuevamente la regla de la cadena, se tiene que

∂[λ(t2) · x(t2)]∂ε

= λ(t2) · δx + x(t2) · ∂λ(t2)∂t

· δt.Ordenando los terminos, y simplificando, resulta finalmente que:

dV (ε)dε

=∫ t2

t1

[(∂H(t, x(t), u(t), λ(t))

∂x+ λ′(t)

)· p(t) +

∂H(t, x(t), u(t), λ(t))∂u

· q(t)]

dt

+

[H(t, x(t), u(t), λ(t))]t=t2· δt− λ(t2) · δx.

Evaluando en ε = 0, igualando la derivada cero, y considerando que cada elemento por separadodebe ser nulo, se concluye que2:

∂H(t, x∗(t), u∗(t), λ(t))∂x

+ λ′(t) = 0

∂H(t, x∗(t), u∗(t), λ(t))∂u

= 0

[H(t, x∗(t), u∗(t), λ(t))]t=t2· δt = 0

λ(t2) · δx = 0

Si a lo anterior agregamos que3:

∂H(t, x∗(t), u∗(t), λ(t))∂λ

= x∗(t)

se obtienen las condiciones necesarias de optimalidad del Problema de Control Opti-mo.

Proposicion 10.2.1 Las condiciones necesarias de optimalidad (Pontryiaguin).Dado el el problema de control optimo

opt∫ t2t1

F (t, x(t), u(t))dts.a x(t1) = x1

x′(t) = f(t, x(t), u(t))u(t) ∈ U

las siguientes son las condiciones necesarias de optimalidad:2Cuando ε = 0 se tiene que x = x∗, u = u∗.3Recuerde que H = F + λf y luego, ∂H

∂λ= f , pero x′ = f y ası se obtiene lo indicado.

Page 212: Libro Matematicas Para Economistas

10.2. CONDICIONES DE OPTIMALIDAD; PRINCIPIO DEL MAXIMO 211

[1]∂H(t, x∗(t), u∗(t), λ(t))

∂x+ λ′(t) = 0

[2]∂H(t, x∗(t), u∗(t), λ(t))

∂u= 0

[3]∂H(t, x∗(t), u∗(t), λ(t))

∂λ= x∗(t).

[4] [H(t, x∗(t), u∗(t), λ(t))]t=t2· δt = 0

[5] λ(t2) · δx = 0

Nota. 10.2.1

a.- En estrıcto rigor, la forma mas general de la condicion [2] ∂H∂u = 0 corresponde a decir que

el control optimo optimiza (vale decir, maximiza o minimiza segun si el problema orginales una maximizacion o una minimizacion) it el Hamiltoniano sobre el conjunto factible decontroles U . Tal como esta escrita, la condicion de optimalidad [2] asume implicitamenteeste hecho, ya que la derivada igual a cero es condicion necesaria para optimizar. Porlo tanto, la condicion [2] equivale a maximizacion (o minimizacion segun corresponda)toda vez que, por ejemplo, el control optimo sea interior al conjunto factible U , y ademasel Hamiltoniano sea concavo (o convexo segun el tipo de problema) en la variable. Estacondicion general de optimalidad se denomina Principio del Maximo de Pontryaguin,en honor al matematico ruso que obtuvo por primera vez las condiciones de optimalidaddel problema considerado4. De esta manera, reemplazaremos la condicion [2] ∂H

∂u = 0 porla siguiente5:

[2] u∗ ∈ arg maxu∈U

H(t, x, u, λ).

b.- Las condiciones [1] a [3] son las condiciones de optimalidad del problema, que juegan elrol analogo a las condiciones de Euler para el problema de Calculo de Variaciones. Lascondiciones [4] y [5] son las condiciones de transversalidad dado que en nuestra versiongeneral el horizonte es libre.

Nota. 10.2.2 Cual es la diferencia entre un problema de Control Optimo y uno deCV?

En primer lugar, el problema de CV es un caso particular del problema de CO.En efecto, cuando en el problema de CO se tiene que f(t, x, u) = u entonces u = x′ y luego seobtiene el problema de CV6.

4Pontryaguin, L.S., et al, The mathematical theory of optimal procces, Interscience, N.Y, 1962.5Se insiste que condicion de derivada nula es solo un caso particular importante. Por ejemplo, perfectamente

podrıa ser que el Hamiltoniano no sea derivable respecto del control optimo o, en su defecto, no es concavo oconvexo respecto del mismo, de tal forma que la derivada igual a cero no necesariamente garantiza que H esmaximizado en el control optimo. Por otro lado, cuando explıcitamente existe una restriccion sobre el control,digamos, u ∈ U , entonces no necesariamente la condicion ∂H

∂u= 0 garantiza que el Hamiltoniano es maximizado

en dicho conjunto. Si el Hamiltoniano es diferenciable, concavo en u y, como caso particular, no existe restriccionsobre el control, entonces la condicion con la derivada es valida.

6Reemplazar en u = x′ en la integral.

Page 213: Libro Matematicas Para Economistas

212 CAPITULO 10. CONTROL OPTIMO

Por otro lado, en el problema de CO note que lo relevante es determinar el control optimo,ya que, dado este, podemos encontrar la trayectoria optima a partir del hecho que x′(t) =f(t, x(t), u(t)). Esta situacion es frecuente en economıa por cuanto, en general, el planificadordispone de herramientas de control que permiten orientar una determinada polıtica de desarrollo.En el problema de CV no existe control sobre el estado del sistema: la trayectoria optima sedetermina por la ecuacion de Euler (ecuacion diferencial autoreferente respecto de la variablede estado) y por las condiciones iniciales (o de transversalidad segun sea el caso). 2

Respecto de las condiciones de transversalidad para el problema de control, en forma analogaal problema de calculo de variaciones, se tienen los siguientes casos particulares:

a.- Metas pero no plazos.

En este caso esta dada la condicion de termino en el estado (x2 conocido) de tal forma queδx = 0 y por lo tanto la condicon que queda es

[H]t=t2· δt = 0.

Como δt es arbitrario, se concluye que en este caso la condicion de transversalidad es

[H]t=t2= 0

b.- Plazos pero no metas.

En este caso esta dada la condicion de termino en el periodo (t2 conocido) de tal formaque δt = 0 y por lo tanto la condicon que queda es

λ(t2) · δx = 0.

Como δx es arbitrario se concluye que la condicion de transversalidad es

λ(t2) = 0.

c.- Existe relacion entre plazos y metas.

Supondremos que x2 = φ(t2) (curva terminal). En tal caso, se tiene que δx = φ′(t2) · δt.Luego, reemplazando en la condicion de transversalidad

[H]t=t2· δt− λ(t2) · δx = 0

se tiene que:

[H]t=t2· δt− λ(t2) · φ′(t) · δt = 0

es decir, [H − λφ′]t=t2· δt = 0, de lo cual se concluye que:

[H − λφ′

]t=t2

= 0.

Page 214: Libro Matematicas Para Economistas

10.2. CONDICIONES DE OPTIMALIDAD; PRINCIPIO DEL MAXIMO 213

d.- Condicion de desigualdad en el borde

Cuando hay plazo fijo (t2 conocido) y la condicion terminal es de la forma x2 ≥ xmin

entonces la condicion de transversalidad es:

λ(t2) ≥ 0, x2 := xt2 ≥ xmin, (x2 − xmin) · λ(t2) = 0.

Cuando hay meta fija (x2 = xt2 conocido) y la condicion terminal es de la forma t2 ≤ tmax

entonces la condicion de transversalidad es:

[H]t=t2 ≥ 0, t2 ≤ tmax, (t2 − tmax) · [H]t=t2 = 0.

e.- Horizonte infinito. Para el problema

max∫∞t1

F (t, x(t), u(t))dts.a x(t1) = x1

x′(t) = f(t, x(t), u(t))

la condicion de transversalidad es

lımt→∞[H]t · δt− lım

t→∞λ(t) · δx = 0.

Como casos particulares, si hay plazos pero no metas, entonces

lımt→∞λ(t) = 0

y si hay metas pero no plazos,

lımt→∞[H]t = 0.

Ejemplo 10.2.1 Encontrar las condiciones de optimalidad del siguiente problema

max∫ 10 −u2(t)dt

s.a x(0) = 1, x(1) = 0x′(t) = x(t) + u(t)

Solucion. En este caso, H = −u2 + λ(x + u). Como el Hamiltoniano es concavo en u7 y noexiste retriccion sobre el control, la condicion ∂H

∂u = 0 es la que prevalece para garantizar lamaximizacion de H en terminos en el control. Luego, ∂H

∂u = −2u + λ = 0 implica que u(t) =1/2 · λ(t). Por otro lado, de la condicion −λ′ = ∂H

∂x se tiene que λ′ = −λ. Luego, λ(t) = c1 · e−t.Como x′ = x + u se tiene que x′(t) = x(t) + 1/2c1 · e−t. Luego, x′(t) − x(t) = 1/2c1 · e−t.La solucion de esta ecuacion diferencial es x(t) = c2e

t − 1/4c1e−t. Imponiendo las condiciones

iniciales, se tiene que c1 = 4e2

1−e2 , c2 = 11−e2 .

Ejercicio 10.2.1 Para el problema anterior note que u = x′ − x. Reemplace esto en la integraly vea el problema como uno de CV. Resuelva este problema de CV y vea que la solucion es lamisma.

7 ∂2H∂u2 = −2.

Page 215: Libro Matematicas Para Economistas

214 CAPITULO 10. CONTROL OPTIMO

10.3. El problema de CO en varias variables

En este caso, el problema es de la forma:

max∫ t2t1

F (t,−→x (t),−→u (t))dts.a −→x (t1) = −→x1−→x (t2) = −→x2−→

x′ (t) = f(t,−→x (t),−→u (t))−→u (t) ∈ U

donde

−→x (t) =

x1(t)x2(t)

.

.xp(t)

, −→u (t) =

u1(t)u2(t)

.

.uq(t)

, −→x1 =

x11

x12

.

.x1p

−→x2 =

x21

x22

.

.x2p

y ademas:

f(t,−→x (t),−→u (t)) =

f1(t,−→x (t),−→u (t))f2(t,−→x (t),−→u (t))

.

.fp(t,−→x (t),−→u (t))

es decir, un problema de CO donde hay p variables de estado y q controles. En este caso lascondiciones de optimalidad son similares al caso ya analizado de tal forma que definiendo

H(t,−→x ,−→u ,−→λ ) = F (t,−→x ,−→u ) +

p∑

j=1

λjfj(t,−→x ,−→u ),

donde −→λ es el vector cuyas componentes son λj , se tiene que

max−→uH

x′i =∂H

∂λi, i = 1, ..., p

λ′i = −∂H

∂xi, i = 1, ..., q.

En el caso de existir libertad en plazos y metas, la condicion de transversalidad es:

[H]t=t2δt− λ1(t2) · δx1 − λ2(t2) · δx2 − ...− λp(t2) · δxp = 0,

donde δxi denota el cambio en el valor de termino del estado i-esimo.En forma analoga se pueden deducir condiciones de transversalidad para casos especiales,

como lo desarrollado para el caso de un estado y un control (algunos plazos pero no metas,algunas metas y no plazos, etc. Queda propuesto como ejercicio plantear estas condiciones).

Note que las condiciones de optimalidad se deben tener para cada control y para cada estadoen forma simultanea. Esto genera un sistema de ecuaciones diferenciales no lineales que debe serresuelto para encontrar la solucion del problema.

Page 216: Libro Matematicas Para Economistas

10.4. EL PROBLEMA AUTONOMO 215

10.4. El problema autonomo

Este caso especial es de gran importancia practica. Diremos que el problema de CO esautonomo cuando las funciones F y f no dependen explicitamente de t, es decir:

F (t, x, u) → F (x, u), f(t, x, u) → f(x, u).

En este caso8, notemos que:

d H

dt=

∂H

∂t+

∂H

∂x· x′ + ∂H

∂u· u′ + ∂H

∂λ· λ′.

Pero, ∂H∂u · u′ = 0 en el optimo ya que u maximiza y luego ∂H

∂u es cero. Por otro lado,nuevamente en el optimo se tiene que x′ = ∂H

∂λ y λ′ = −∂H∂x . Combinando esto se deduce que

∂H∂x ·x′+ ∂H

∂λ ·λ′ = 0. Luego, podemos concluir que d Hdt = ∂H

∂t . Pero H no depende explicitamentede t, luego en el optimo se tiene que:

d H

dt= 0 ⇔ H = cte.

10.5. Condiciones suficientes

Las condiciones suficientes de optimalidad del problema de control optimo

max∫ t2t1

F (t, x(t), u(t))dts.a x(t1) = x1

x′(t) = f(t, x(t), u(t))u(t) ∈ U

se relacionan fundamentalmente con supuestos de concavidad de las funciones F , f o H. Losresultados que se tienen al respecto son los siguientes:

Proposicion 10.5.1 Dada el problema de control optimo anterior, si u∗, x∗ y λ∗ denotan elcontrol optimo, la variable de estado optima y el multiplicador optimo, se tiene que:

a.- Si F es concava en x, u y f es lineal, entonces u∗, x∗ y λ∗ resuelven el problema demaximizacion.

b.- Si F y f son concavas (f no necesariamente lineal) en x, u y ademas λ∗(t) ≥ 0, entoncesu∗, x∗ y λ∗ resuelven el problema de maximizacion.

c.- Dado λ, si H∗(t, x, λ) = H(t, x, λ, u∗) es concavo en x para todo t se tiene que u∗, x∗ y λ∗

resuelven el problema de maximizacion.

Si el problema de control optimo fuera uno de minimizacion, las condiciones necesarias deoptimalidad (condiciones de Pontryaguin) no cambian. Sin embargo las condiciones suficientesanteriores si son alteradas. Para ver esto, basta con notar que el problema de minimizar laintegral es equivalente a maximizar dicha integral con signo menos. Ası, para efectos de nuestroanalisis, podemos establecer las condiciones suficientes de minimizacion directamente de aquellasde maximizacion pero considerando que ahora trabajamos con −F en vez de F . Luego, su la

8En lo que sigue, asumiremos que no hay restriccion sobre u o que el control optimo es interior a U . En todocaso, el resultado es similar cuando existe restriccion sobre u.

Page 217: Libro Matematicas Para Economistas

216 CAPITULO 10. CONTROL OPTIMO

condicion para maximizacion es que, por ejemplo, F sea concava, para el caso de minimizacionse tiene que −F debe ser concava, es decir, F debe ser convexa. Note que este cambio en elproblema no tiene impactos en las restricciones.

10.6. El problema de Control Optimo con restricciones

En forma analoga a lo desarrollado para el problema de C.V, vamos a presentar una seriede resultados que muestran las condiciones necesarias de optimilidad del problema de controloptimo, cuando existen, en forma adicional, una serie de restricciones sobre las variables decontrol y estado.

En lo que sigue vamos a utilizar la notacion y las definiciones del problema de control optimocon varios estados y varios controles. Los resultados que se tienen se resumen en la siguienteproposicion:

Proposicion 10.6.1 a.- Restricciones de igualdad sobre el control.

Dado el problema de control optimo

max∫ t2t1

F (t,−→x (t),−→u (t))dts.a −→x (t1) = −→x1−→x (t2) = −→x2−→

x′ (t) = f(t,−→x (t),−→u (t))gj(t,−→x ,−→u ) = cj , j = 1, ..., k−→u (t) ∈ U

definamos el lagrangeano del problema como:

L = F (t,−→x ,−→u ) +p∑

j=1

λjfj(t,−→x ,−→u ) +k∑

j=1

ηj(t)[cj − gj(t,−→x ,−→u )],

es decir, L = H + −→µ t · [c − g], donde −→µ representa el vector de los multiplicadores, c elvector de los cj y g la funcion vectorial de componentes gj .

En tal caso, las condiciones necesarias de optimalidad de primer orden corresponden aaquellas del problema de control con varias variables, donde reemplazamos H por L, esdecir9:

∂L∂uj

= 0, j = 1, ..., q.

x′i =∂L∂λi

, i = 1, ..., p

λ′i = − ∂L∂xi

, i = 1, ..., p

9Asumiendo que el control optimo esta en el interior de U .

Page 218: Libro Matematicas Para Economistas

10.7. EJEMPLO: PROBLEMA NEOCLASICO DE CRECIMIENTO. 217

b.- Restricciones de desigualdad.

Dado el siguiente problema de control optimo:

max∫ t2t1

F (t,−→x (t),−→u (t))dts.a −→x (t1) = −→x1−→x (t2) = −→x2−→

x′ (t) = f(t,−→x (t),−→u (t))gj(t,−→x ,−→u ) ≤ cj , j = 1, ..., k−→u (t) ∈ U

Si definimos el lagrangeano del problema como antes, suponiendo que el control optimoesta en el interior de U las condiciones de optimalidad (Kuhn - Tucker) son:

∂L∂uj

= 0, j = 1, ..., q,

∂L∂ηj

≥ 0, ηj ≥ 0, ηj · ∂L∂ηj

= 0, j = 1, ..., k.

x′i =∂L∂λi

, i = 1, ..., p

λ′i = − ∂L∂xi

, i = 1, ..., p

Las condiciones de cualificacion para est problema10 son cualquiera de las siguientes:

a.- gj es concava en −→u , j = 1, ..., k.

b.- gj es convexa en −→u , j = 1, ..., k y existe −→u0 ∈ intU tal que gj(−→u0) < cj , j = 1, ..., k(condicion de Slater.)

c.- Los gradientes de las restricciones activas con respecto a los controles (∇ugj con jrestriccion activa) y evaluados en la solucion optima deben ser linealmente indepen-dientes (Mangazarian - Fromowitz).

10.7. Ejemplo: problema neoclasico de crecimiento.

Supongamos dada una funcion de produccion homogenea de grado 1 que relaciona la pro-duccion Y de una economıa con el stock de capital K y de empleo L. Supongamos ademas queel empleo crece como la problacion en forma exponenecial11. Ası, definiendo las variables deproducto y capital sobre el trabajo como y = Y

L , k = KL , de la homogeneidad de las funcion de

produccion se tiene que:

Y = f(K,L) ⇔ Y

L=

f(K,L)L

⇔ y = f(K

L, 1) := φ(k).

10En el caso estatico ya analizado, estas condiciones eran que los gradientes de las restricciones fueran lineal-mente independientes.

11Es decir, supondremos que L(t) = L0eηt.

Page 219: Libro Matematicas Para Economistas

218 CAPITULO 10. CONTROL OPTIMO

En lo que sigue, dado k > 0, asumiremos que φ′(k) > 0, φ′′(k) < 0, lım

k→0φ′(k) = ∞,

lımk→∞

φ′(k) = 0. Obviamente, de la definicion de φ se tiene que φ(0) = 0. La siguiente figura

ilustra el tipo de funcion φ que estamos considerando:

y

k

Asumiremos que el producto se distribuye en consumo C e inversion bruta I, de tal formaque Y = C + I. De esta manera, considerando una depreciacion δ del capital, se tiene que lainversion neta corresponde a

K = I − δK

de lo cual se deduce que:

K = Y − C − δK.

Por otro lado, dividiendo lo anterior por L se obtiene que

K

L= y − c− δk,

donde c denota consumo sobre trabajo. Ahora bien, K = d (Lk)dt = k · d L

dt + Ld kdt y luego,

KL = k ·

d LdtL + k. Pero L = αeηt y luego

d LdtL = η. Ası, reemplazando todo lo anterior en la

ecuacion anterior se tiene que:

k · η + k = y − c− δk ⇔ k = φ(k)− c− (η + δ)k.

En lo que sigue supondremos que el nivel per capita de consumo c es lo que determina elnivel de utilidad del sistema. La funcion de utilidad social sera U , de tal forma que U ′ > 0 yU′′

< 0. Asumiremos ademas que lımc→0

U ′(c) = ∞, lımc→∞U ′(c) = 0.

De esta manera, el problema de optimizacion que se tiene es el siguiente:

max∫∞0 e−rtU(c)dt

s.a k(0) = k0

k = φ(k)− c− (η + δ)k0 ≤ c(t) ≤ φ(k(t))

En este caso, la variable de estado del problema es k mientras que c es la variable de control.El Hamiltoniano del problema es

H = e−rtU(c(t)) + λ · [φ(k)− c− (η + δ)k].

Page 220: Libro Matematicas Para Economistas

10.7. EJEMPLO: PROBLEMA NEOCLASICO DE CRECIMIENTO. 219

Luego, las condiciones de optimalidad son:

∂H

∂c= 0 ⇔ e−rtU ′(c(t))− λ = 0 ⇔ U ′(c(t)) = ertλ (1).

Note que H es concavo en c de modo que la condicion anterior garantiza que H es maximizadoen el control bajo la condicion derivada igual a cero.

La siguiente condicion es:

∂H

∂k= −λ′ ⇔ λ′ = λ[φ′(k)− (η + δ)] (2).

Finalmente, se debe cumplir que:

k = φ(k)− c− (η + δ)k (3)

Ahora bien, derivando (1) c.r a t se tiene que (aplicar regla de la cadena y del producto):

d U ′(c(t))dt

=d ertλ

dt⇔ U

′′(c(t)) · c(t) = rertλ + ertλ′.

Pero ertλ = U ′(c(t)). Por otro lado, de (2) se tiene que ertλ′ = ertλ[φ′(k) − (η + δ)] ynuevamente de (1) se concluye que ertλ′ = U ′(c(t))·[φ′(k)−(η+δ)]. Luego, juntando y ordenandotodos los terminos concluimos que:

c(t) = − U ′(c(t)U ′′(c(t))

· [φ′(k)− (r + η + δ)].

De esta manera, el sistema de ecuaciones diferenciales que determinan la solucion de esteproblema es:

k = φ(k)− c− (η + δ)k

c = − U ′(c)U ′′(c)

· [φ′(k)− (r + η + δ)].

En lo que sigue, en primer lugar vamos a construir el diagrama de fases de este sistema deecuaciones. Para ello, notemos que k = 0 ↔ φ(k)− c− (η + δ)k = 0. Luego, en el plano k− c setiene que k = 0 queda representado por la curva c = φ(k)− (η + δ)k. Note que cuando k = 0 setiene que c = 0. Por otro lado, derivando esta relacion c.r a k se tiene que ∂c

∂k = φ′(k) − η − δ

y, ademas ∂2c∂k2 = φ

′′(k) < 0. Luego, la curva que se tiene es concava y vale cero en el origen.

Por otro lado, cuando k → ∞ se tiene que φ′(k) → 0 mientras que −(η + δ)k → −∞. Deesta manera, cuando k → ∞ se tiene que la curva tiene pendiente negativa, es decir, para kgrande debe ser decreciente. En forma analoga podemos concluir que para k chico la curva tienependiente positiva (recuerde que cuando k → 0 se tiene que φ′(k) → ∞). Luego, esta curvaconcava tiene forma de u invertida.

Por otro lado, de la relacion c = 0 concluimos que − U ′(c)U ′′ (c)

· [φ′(k)− (r + η + δ)] = 0, es decir,

[φ′(k)− (r + η + δ)] = 0 ya que U ′(c)U ′′(c)

6= 0. Luego, se tiene que φ′(k) = cte., es decir, por k = k:cte., que es una lınea vertical en el plano c−k. La siguiente figura resume los analisis anteriores:

Page 221: Libro Matematicas Para Economistas

220 CAPITULO 10. CONTROL OPTIMO

c

k

k'(t) = 0

c'(t) = 0

k = k_

Notemos que para c = 0 y k muy grande se tiene que [φ′(k) − (r + η + δ)] < 0 ya quelım

k→∞φ′(k) = 0. Luego, a la izquierda de la recta la derivada de c es negativa y, por ende, a la

derecha es positiva. Por otro lado, siguiendo el mismo argumento, como lımk→∞

φ′(k) = 0 implica

que φ(k) → cte. cuando k →∞. Dado que c = 0 y del hecho que −(η+δ)k se hace cada vez masnegativa cuando k crece, se concluye que para c = 0 y k grande la cantidad φ(k)− c− (η + δ)kdebe ser negativa. La siguiente figura ilustra las direcciones de crecimiento y decrecimiento eneste caso:

c

k

k'(t) = 0

c'(t) = 0

k = k_ + -

+ -

De esta manera, la dinamica de movimiento de las trayectorias es la siguiente:

c

k

k'(t) = 0

c'(t) = 0

k = k_ + -

+ -

Ejercicio 10.7.1 El caso particular U(c) = cα, 0 < α < 1 y F (K, L) = KaLb, con a = 12 =

b queda propuesto encontrar explıcitamente la solucion (control optimo) y variable de estadooptima. Suponga que k(0) = 1.

Page 222: Libro Matematicas Para Economistas

10.8. EJEMPLO: EL MODELO DE RAMSEY 221

10.8. Ejemplo: el Modelo de Ramsey

El problema del agente puede ser escrito como:

max∫ ∞

t=0u(c(t))e−θt (10.1)

s.a f(k(t)) = c(t) + (n + γ)k(t) + ˙k(t) (10.2)

donde u(c(t)) es la funcion de utilidad instantanea, θ es la tasa de descuento, γ es la tasa dedepreciacion del capital y n es la tasa de crecimiento de la poblacion. Ademas, la funcion deproduccion cumple con las condiciones de INADA. De esta forma, al identificar a c(t) como lavariable de control y a k(t) como la variable de estado, se tiene el siguiente Hamiltoniano envalor presente.

H(c(t), k(t), λ(t)) = u(c(t))e−θt + λ(t) · (f(k(t))− (n + γ)k(t)− c(t)) (10.3)

desde donde se obtienen las siguientes condiciones de primer orden:

Hc(t) = 0 ⇔ u′(c(t))e−θt = λ(t) (10.4)

Hk(t) = − ˙λ(t) ⇔ λ(t)(f ′(k(t))− (n + γ)) = − ˙λ(t) (10.5)lım

t−→∞ k(t) · λ(t) = 0 (10.6)

donde la ultima condicion es la de transversalidad. Las dos primeras condiciones, junto conla restriccion intertemporal de la maximizacion, pueden ser utilizadas para obtener las dosecuaciones fundamentales del modelo:

˙c(t)c(t)

= − u′(c(t))u′′(c(t)) · c(t)(f

′(k(t))− (n + θ + γ)) (10.7)

˙k(t) = f(k(t))− (n + γ)k(t)− c(t) (10.8)

y caracterizando el estado estacionario, se requiere analizar:

f ′(k(t∗)) = n + γ + θ (10.9)f(k(t∗)) + (n + γ)k(t∗) = c(t∗) (10.10)

dadas los supuestos realizados sobre la funcion de produccion se tendrıa la siguiente grafica parael estado estacionario:

Page 223: Libro Matematicas Para Economistas

222 CAPITULO 10. CONTROL OPTIMO

kt

ct

ct*

kt*

c(punto)=0

k(punto)=0

E

E

donde EE representa el brazo estable del sistema. De esta forma, la correcta comprensionde esta modelo permite con facilidad responder las preguntas hechas anteriormente.

10.9. Ejercicios

1.- Supongamos que en el problema de C.O

opt∫ t2t1

F (t, x(t), u(t))dts.a x(t1) = x1

x′(t) = f(t, x(t), u(t))u(t) ∈ U

la trayectoria optima es x∗(t) y el control optimo es u∗(t). Supongamos dado t0 < t < t1y definamos el problema

opt∫ t2t1

F (t, x(t), u(t))dts.a x(t) = x∗(t)

x′(t) = f(t, x(t), u(t))u(t) ∈ U

Si x∗∗ y u∗∗ denota la solucion de este problema, que relacion existe entre las solucionesde los problemas mencionados? Justifique.

2.- I denota inversion, K capital y L trabajo. F denotara una funcion de produccion quedepende capital y trabajo. Supondremos que la variacion del stock de capital obedece ala relacion K(t) = Ψ(K(t), I(t)) − δK(t), donde Ψ representa costos de ajuste para lainversion en capital. El problema de control optimo que tenemos en tal caso es:

max∫∞0 e−rt[pF (K(t), L(t))− wLL(t)− wII(t)]dt

s.a K(t) = Ψ(K(t), I(t))− δK(t)K(0) = K0 dado

Page 224: Libro Matematicas Para Economistas

10.9. EJERCICIOS 223

2.1.- Muestre que las condiciones de optimalidad del problema son:

K = Ψ(K,L)− δK

λ = (r + δ)λ− pFK − λΨK

FL(K, L) = wL/p

wI = λΨI

lımt→∞λ(t)K(t)e−rt = 0

Asuma para lo anterior que F y Ψ son concavas.2.2.- Pruebe que

d(λ(t)K(t)e−rt

)

dt= [λK(t) + λK − rλK]e−rt.

2.3.- Suponiendo que F y Ψ son homogeneas de grado 1, utilizando los puntos anterioresconcluya que:

d(λ(t)K(t)e−rt

)

dt= −[pF − wLL− wII]e−rt

2.4.- Concluya a partir de lo anterior que λ(0)K0 = V , donde

V =∞∫

0

[pF − wLL− wII]e−rt]dt.

3.- Encuentre la curva que mida la distancia mas cercana entre un punto fijo (digamos (0, P )y una funcion lineal (sin perdida de generalidad suponga que la lınea es vertical)12. Enotras palabras, resuelva el siguiente problema, a traves del control optimo:

maxV =∫ T

0−(1 + y2)0,5dt (10.11)

sujeto a y = u, y(0) = A, y(T ) libre y con A, T dado.

4.- Encuentre el control optimo que

maxV =∫ 2

0(2y − 3u)dt (10.12)

sujeto a

y = y + u (10.13)y(0) = 4 (10.14)

y(2) libre (10.15)

considere ademas u(t) ∈ = = [0, 2], es decir, suponga que puede existir una soluacion deesquina.

12Si Ud. recuerda este problema fue resuelto a traves del calculo de variaciones

Page 225: Libro Matematicas Para Economistas

224 CAPITULO 10. CONTROL OPTIMO

5.- Resuelva el siguiente problema

maxV =∫ 1

0(x + u)dt (10.16)

sujeto a

x = 1− u2 (10.17)x(0) = 1 (10.18)

6.- Suponga que la tasa a la que nuevos productos pueden ser vendidos en cualquier tiempo tes f(p(t))g(Q(t)) donde p es el precio y Q son las ventas acumuladas. Se asumira f ′(p) < 0;las ventas varıan inversamente respecto del precio. Tambien se cumple que g′(Q) < o > 0para Q < O > Q1. Para un precio dado, las ventas corrientes crecen con las ventas pasadasa medida que la gente aprende del bien al consumirlo. Pero como las ventas acumuladasse incrementen, existe una cada en el numero de personas que no ha consumido el bien.Eventualmente, la tasa de ventas para cada precio cae, a medida que el mercado se satura.El costo unitario de produccion es c, y puede ser constante o puede caer con las ventasacumuladas si la firma aprende como producir menos costosamente con la experiencia:c = c(Q), c′(Q) ≤ 0. Caracterice la poltica de precios ptima, es decir p∗(t), con 0 ≤ t ≤ T ,que maximiza los beneficios sobre un determinado perıodo de tiempo T . Es decir, resuelva:

max∫ T

0(p− c(Q))f(p)g(Q)dt (10.19)

sujeto a Q′ = f(p)g(Q), Q(0) = Q0 > 0

7.- Suponga que la economıa es de agentes representativos que viven por infinitos perıodos, yque presentan una funcion de utilidad instantanea de u(C) = C1−θ−1

1−θ . Suponga ademas quela funcion de produccion de esta economıa es de la forma Y = AKαH1−α con 0 ≤ α ≤ 0,donde K es capital fısico y H es capital humano. El producto de esta economıa puede serdedicado al consumo, a la inversion en capital humano y a la inversion en capital fısico.La tasa de crecimiento de la poblacion es igual a cero, y las ecuaciones de movimiento delas variables de capital son:

K = IK − γK (10.20)H = IH − γH (10.21)

1. Plantee el problema a resolver por un planificador central. Suponga que la tasa dedescuento de los hogares es ρ.

2. Presente la funcion Hamiltoniana y presente las condiciones de primer orden

3. Encuentre la tasa de crecimiento del producto, e interpretela

4. Demuestre que en este modelo, la tasa de crecimiento del consumo es solo funcion delos parametros del modelo 13.

5. Muestre que la funcion de produccion puede ser escrita como Y = AK(1−αα )1−α

13Esta caracterıstica es lo que consideran en parte los modelos de crecimiento endogeno

Page 226: Libro Matematicas Para Economistas

10.9. EJERCICIOS 225

8.- Sean la funcion de produccion y la funcion de utilidad de una economıa dadas por:

Y = AKαL1−α, (0 < α < 1)

U = U − 1bc−b, (b > 0)

1. Encuentre la funcion de produccion percapita y la funcion U ′(c). Determine laspropiedades de ambas funciones.

2. Escriba el problema de control optimo especıfico.3. Aplique el principio del maximo (utilize indistintamente el Hamiltoniano en valor

corriente o en valor presente)4. Derive el sistema de ecuaciones diferenciales en k y c. Resuelva para el estado esta-

cionario.

9.- La variable I denota inversion, K capital y L trabajo, mientras que F (·) denotara unafuncion de produccion que depende del capital y el trabajo. Supondremos que la variaciondel stock de capital obedece a la relacion K = Ψ(K(t), I(t)− γK(t)), donde Ψ representacostos de ajuste para la inversion en capital. El problema de control optimo que tenemosen tal caso es:

max∫ ∞

0e−rt[pF (K(t), L(t))− wLL(t)− wII(t)]dt (10.22)

s.a K = Ψ(K(t), I(t)− γK(t)) K(0) = k0

1. Encuentre las condiciones de optimalidad del problema

2. Pruebe que d(λ(t)K(t)e−rt)dt = [λK(t) + λK − rλK]e−rt

3. Suponiendo que F y Ψ son homogeneas de grado 1, y utilizando los resultados ante-riores pruebe que

d(λ(t)K(t)e−rt)dt

= −[pF − wLL− wII]e−rt

4. Concluya a partir de lo anterior que λ(0)K0 = V , donde V =∫∞0 [pF − wLL −

wII]e−rtdt.

10.- Considere el siguiente problema de polıtica economica:

max∫ T

0ν(U, p)ertdt (10.23)

sujeto a

p = φ(U) + απ (10.24)π = b(p− π) (10.25)

con condiciones de transversalidad π(0) = π0, π(T ) libre (π0, T dado). En las anterioresexpresiones p representa la inflacion efectiva, U la tasa de desempleo y π la tasa de inflacionesperada. 14

14Los parametros cumplen con: φ′ < 0, 0 < α ≤ 1, b > 0.

Page 227: Libro Matematicas Para Economistas

226 CAPITULO 10. CONTROL OPTIMO

1. Escriba la ecuacion Hamiltoniana para el problema planteado.

Suponga que ν(U, p) = −U2 − hp con h > 0, y que φ(U) = j − kU con j, k > 0.

2. Escriba la nueva ecuacion Hamiltoniana

3. Encuentre las condiciones de primer orden orden para el problema

4. Muestre de que forma se puede afirmar que el problema de polıtica economica puederesolverse como sin restricciones.

11.- Considere el siguiente problema:

max∫ T

0−1dt (10.26)

sujeto a

y = y + u (10.27)y(0) = 5 (10.28)

y(T ) = 11 (10.29)

con T libre y u(t) ∈ [−1, 1].

1. Escriba la funcion Hamiltoniana. Note que es un problema restringido.

2. Plantee las condiciones de primer orden

3. ¿De que depende el valor optimo de la variable de control?

12.- A un agente que vive por infinitos perıodos y tiene una tasa de descuento de θ, se le debeasegurar la trayectoria de consumo que maximize su utilidad intertemporal. Para esto elplanificador sabe que tal asignacion debe estar condicionada a la restriccion presupuestariaintertemporal, que plantea que en terminos agregados, la produccion total debe ser iguala la inversion mas el consumo. Considere ademas que la funcion de produccion es concavay que utiliza solo los insumos capital y trabajo, que no existe depreciacion del capital yque la poblacion crece a una tasa n .

1. Plantee el problema del planificador central.

2. Encuentre las condiciones necesarias de primer orden para alcanzar la senda optimade consumo. Suponga luego que la funcion de utilidad instantanea es una CRRA, conparametro σ.

3. Utilice un diagrama de fase para caracterizar el equilibrio.

13.- Considere un agente que vive para siempre en un mundo en que el tiempo es continuo yno hya incertidumbre. La funcion de utilidad instantanea del agente, es del tipo CARA(constant absolute risk aversion) con parametro α, es decir,

u(ct) = − 1α

e( − αct) α > 0 (10.30)

1. Plantee y desarrolle el problema de Ramsey, desde el punto de vista del planificadorcentral.

2. Determine el nivel de consumo del instante t, a partir del desarrollo del problemadescentralizado. Sea preciso en su desarrollo.

Page 228: Libro Matematicas Para Economistas

10.9. EJERCICIOS 227

14.- Suponga queYt = Ka

t (eθtLt)1−a (10.31)

donde θ recoge la idea de progreso tecnico en la productividad del trabajo. Asuma que lapoblacion crece a tasa n, y que la funcion de utilidad del agente representativo es:

u(ct

lt) =

( ctlt

)1−γ

1− γ(10.32)

Determine e interprete la condicion de regla de oro, a partir del desarrollo del caso cen-tralizado.

15.- Describa como afectan a las funciones c = 0 y k = 0, y luego a las sendas de consumo ycapital, los siguientes hechos.

1. Un aumento en la tasa de descuento instantanea(θ).2. Una reduccion en la productividad marginal de la funcion de produccion (y = f(k)),

sin que se altere su coeficiente de posicion.3. El aumento en la tasa de depreciacion desde γ0 a γ1.

16.- Suponga una economıa de agente representativo que vive para siempre en la poblaciones constante y es igual a 1. La funcion de utilidad instantanea es u(ct) = ln(ct), la tasade descuento instantanea es θ, la tasa de depreciacion del capital es γ y la funcion deproduccion es y = f(kt) = Akα

t con α ∈ [0,1].

1. Determine la regla optima para la evolucion del consumo como funcion del stock decapital que escogerıa un planificador central y el estado estacionario de esta economıa.

2. Utilizando el diagrama de fase del sistema, determine la evolucion del consumo y delstock de capital si, estando en su estado estacionario, la economıa tiene un shock enque A aumenta en forma permanente a A∗.

3. Utilizando el diagrama de fase del sistema determine la evolucion del consumo y delstock de capital si , estando en su estado estacionario, la economıa sufre un shock enque A aumenta en forma transitoria (no esperada) a A∗ entre t0 y t1 con t1 > t0.¿Existe diferencia con el caso anterior?.

17.- Utilize el diagrama de fase para analizar el impacto de las siguientes polıticas:

1. En t0, el gobierno anuncia que se implantara un impuesto de tasa τ a los ingresos porconcepto de inversion. El anuncio tambien menciona que el impuesto se aplicara solodesde t0 hasta t1.

2. En t0 el gobierno anuncia que se implantara un impuesto de tasa τ a los ingresos porconcepto de inversion. Este impuesto sera aplicado solamente entre los perıodos t1 yt2.

18.- Considere que el gasto del gobierno y el consumo privado son perfectos sustitutos. Es-peciıficamente, suponga la siguiente funcion de utiilidad para el individuo:

U = B

∫ ∞

t=0eθt (ct + Gt)1−ρ

1− ρdt (10.33)

Si la economıa esta inicialmente on su senda de estado estacionario y si las preferencias delos hogares, estan dadas por U , ¿cual es el efecto de incrementos temporales en los gastosde gobierno, sobre las sendas de capital, consumo y tasa de interes?.

Page 229: Libro Matematicas Para Economistas

228 CAPITULO 10. CONTROL OPTIMO

19.- Suponga una funcion de utilidad CRRA (constant relative risk aversion). Es decir, supongapor ejemplo:

u(ct) =c1−σt − 11− σ

σ > 0 (10.34)

1. Derive la regla de oro modificada de una economıa don de los agentes viven infinitosperıodos, la tasa de creciietno de la poblacion es n, el descuento es θ y la funcion deproduccion cumple las condiciones de INADA.

2. Interprete intuitiva y graficamente un aumento en σ. (Ayuda: Refierase a la aversional riesgo y a la decisiones de aplanar consumo (smooth consumption).

20.- Considere una economıa en donde los agentes viven infinitos perıodos y poseen una funcionde utilidad instantanea del tipo:

u(ct) =c1−γt − 11− γ

∀γ > 0, γ 6= 1 (10.35)

Las firmas existentes en la economıa presentan una funcion de produccion (en terminosagregados) puede ser escrita como:

Y (Kt, Lt) = AKαt L1−α

t 1 > α > 0 (10.36)

Ademas la tasa de depreciacion del capital es igual a σ, la tasa de crecimiento de lapoblacion es n y la tasa de descuento instantanea de los agentes es θ.

1. Plantee el problema del planificador central y encuentre las condiciones de primerorden. Muestre graficamente el equilibrio de esta economıa.

2. Considere a continuacion la incorporacion del gobierno. En el instante t0 el gobiernoanuncia que existira un impuesto a los ingresos del capital de tasa τ , desde t0 hastat1. Luego de t1, el impuesto desaparecera. Determine el efecto de esta polıtica sobreel consumo y el stock de capital. ¿Como se altera su anterior respuesta si es que elanuncio en t0, es relativo a un impuesto sobre las ganancias del capital a aplicarseentre t1 y t2, con t0 < t1 < t2?.

3. Para el desarrollo anterior, Ud. debio haber supuesto que el gasto del gobierno noafecta la utilidad que proviene del consumo privado. Considere a continuacion el casocontrario, es decir, la utilidad instantanea de los agentes es:

u(ct, Gt) =(ct + Gt)1−σ − 1

1− σ(10.37)

4. Considere el nivel de Gasto como fijo. Escriba las condiciones de primer orden delproblema del planificador central.

5. Suponga que el nivel de gasto inicial es G0 constante y que la economıa esta en suestado estacionario en t0. Determine el efecto sobre el consumo, la tasa de interes y elstock de capital, de un aumento transitorio (entre t0 y t1) del gasto del gobierno, desdeG0 hasta G1, con G0 < G1. Utilice graficos si estima conveniente. (Ayuda: Considereque no es optimo para los hogares que utilidad marginal sufra saltos discontinuos ent1).

6. Mencione cual es la relacion entre consumo privado y gasto del gobierno.

Page 230: Libro Matematicas Para Economistas

Capıtulo 11

Programacion Dinamica

11.1. Introduccion

A partir del problema de control optimo (a tiempo continuo):

max∫ T0 F (t, x(t), u(t))dt

s.a x(0) = x0

x′(t) = f(t, x(t), u(t))u(t) ∈ U

en lo que sigue vamos a realizar una formulacion en tiempo discreto1.Para ello, en primer lugar denotaremos xt en vez de x(t) para indicar el valor del estado en

el instante t = 0, 1, .... Por otro lado, del hecho que x′(t) ' x(t+δ)−x(t)δ , con δ pequeno, podemos

aproximar la derivada por xt+1 − xt (considere δ = 1 en la expresion anterior).Note ahora que en el problema de control, la funcion objetivo F depende explıcitamente del

tiempo, de tal forma que el objetivo varıa en cada instante. A modo de ejemplo, suponiendoque F representa una funcion de utilidad, la dependencia en el tiempo nos indica que nuestraspreferencias pueden ir cambiando en cada instante, lo cual es bastante razonable para cada unode nosotros. Ası, en la discretizacion del problema, continuaremos asumiendo que las funcionesobjetivo, y de restriccion, dependen explıcitamente del tiempo, de tal forma que F (t, x(t), u(t))(caso continuo) se convierte en Ft(xt, ut) (caso discreto).

Finalmente, la integral del problema de control se convierte en una suma y de esta manerala version discreta del problema de control optimo serıa la siguiente:

maxT∑

t=0Ft(xt, ut)

s.a x0 = x0 : datoxt+1 − xt = ft(xt, ut)

Notemos ahora que xt+1− xt = ft(xt, ut) es equivalente a decir que xt+1 = xt + ft(xt, ut); esdecir, xt+1 = ft(xt, ut), con ft(xt, ut) = xt + ft(xt, ut). Abusando de la notacion, mantendremosf en vez de f .

Por otro lado, dada la estructura del problema, el valor final del estado (xT ) queda completa-mente determinado por los valores del estado inicial x0 y la trayectoria de los controles optimos

1Es decir, el tiempo sera hora una variable discontinua en vez de continua, como en el caso del problema decontrol optimo y de calculo de variaciones que hemos visto. En otras palabras, la idea es que ahora t solo puedetomar los valores 0, 1, 2, ..., lo cual implica que las variables de control y estado solo seran evaluadas en dichosparametros del tiempo.

229

Page 231: Libro Matematicas Para Economistas

230 CAPITULO 11. PROGRAMACION DINAMICA

u0, u1, ..., uT−1, no necesitandose de un control especıfico para dicho estado terminal2. De estamanera, en lo que sigue haremos explıcita la diferencia entre los estados intermedios (que estansujetos al control del periodo anterior) y el estado final, para lo cual reformularemos nuestroproblema, suponiendo que la funcion objetivo es aumentada en una cantidad que depende solodel valor del estado final xT+1, digamos W (xT+1).

Ası, la version discreta del problema de control optimo reformulado es:

maxT∑

t=0Ft(xt, ut) + W (xT+1)

s.a x0 = x0 : datoxt+1 = ft(xt, ut)

Definicion 11.1.1 El problema de optimizacion discreto

maxT∑

t=0Ft(xt, ut) + W (xT+1)

s.a x0 = x0 : datoxt+1 = ft(xt, ut)

se llemara problema de programacion dinamica a horizonte finito, determinıstico ydiscreto3.

11.2. Las condiciones de optimalidad

Para nuestro problema, el Lagrangeano es:

L =T∑

t=0

Ft(xt, ut) +T∑

t=0

λt · [ft(xt, ut)− xt+1],

y luego, al derivar c.r a los estados y los controles e igualar a cero, las condiciones de optimalidadson

∂L∂ut

= 0 ⇔ ∂Ft

∂ut+ λt

∂ft

∂ut= 0, t = 0, ..., T. (1)

∂L∂xt

= 0 ⇔ ∂Ft

∂xt+ λt

∂ft

∂xt− λt−1 = 0, t = 1, ..., T. (2)

∂W (xT+1)∂xT+1

− λT = 0. (3)

∂L∂λt

= 0 ⇔ xt+1 = ft(xt, ut), t = 0, ...T. (4)

De la ecuacion (2) tenemos que ∂Ft∂xt

+ λt∂ft

∂xt= λt−1 = 0, t = 1, ..., T , es decir,

λt =∂Ft+1

∂xt+1+ λt+1

∂ft+1

∂xt+1t = 0, ..., T − 1,

2Si disponemos de x0 y la trayectoria de controles, entonces de la dinamica discreta anterior todos los es-tados sub-siguientes quedan determinados. Sin embargo, el estado final no requiere de un control extra puesquedo definido con el estado y el control en T − 1.

3Como contraparte, mas adelante tendremos problemas a horizonte infinito y problemas estocasticos.

Page 232: Libro Matematicas Para Economistas

11.2. LAS CONDICIONES DE OPTIMALIDAD 231

con lo cual, considerando la ecuacion (3), podemos encontrar λT−1 en funcion del estado y loscontroles. En efecto, como λT = ∂W (xT+1)

∂xT+1se tiene que:

λT−1 =∂FT

∂xT+

∂W (xT+1)∂xT+1

· ∂fT

∂xT.

Siguiendo en forma recursiva, podemos obtener λt a partir de la relacion que liga el multipli-cador actual con el siguiente: recursividad hacia atras. Con esta trayectoria de multiplicadores,al reemplzar en la ecuacion (1) se obtiene una relacion que solo liga los estados y los controles enen cada instante. A modo de ejemplo, si remplazamos los valores de λT y λT−1 ya encontradosse obtiene que:

∂FT

∂uT+

∂fT

∂uT

∂W (xT+1)∂xT+1

= 0

∂FT−1

∂uT−1+

∂fT−1

∂uT−1·[∂FT

∂xT+

∂W (xT+1)∂xT+1

· ∂fT

∂xT

]= 0.

De la primera ecuacion, y considerando que xT+1 = fT (xT , uT ), si fuera que xT es cono-cido, entonces podemos despejar xT+1 y uT en funcion de xT . El sistema que se resuelve es,obviamente:

∂FT (xT , uT )∂uT

+∂fT (xT , uT )

∂uT

∂W (xT+1)∂xT+1

= 0

xT+1 = fT (xT , uT )

(dos ecuaciones, dos incognitas: xT+1 y uT ). En forma analoga, si fuera conocido xT−1, de larelacion xT = fT−1(xT−1, uT−1) y de las ecuaciones anteriores, podriamos determinar xT y uT−1

con lo cual, a su vez, determinamos xT+1 y uT . Las ecuaciones que ligan las variables son:

∂FT (xT , uT )∂uT

+∂fT (xT , uT )

∂uT

∂W (xT+1)∂xT+1

= 0,

xT+1 = fT (xT , uT ),

∂FT−1(xT−1, uT−1)∂uT−1

+∂fT−1(xT−1, uT−1)

∂uT−1·[∂FT (xT , uT )

∂xT+

∂W (xT+1)∂xT+1

· ∂fT (xT , uT )∂xT

]= 0,

xT = fT−1(xT−1, uT−1),

es decir, cuatro ecuaciones y cuatro incognitas: uT−1, uT , xT y xT+1.En forma recursiva, si fuera conocido xt, la trayectoria optima de estados y controles (en

este caso, ut, ut+1, ..., uT y xt+1, xt+2, ..., xT+1) queda perfectamente determinada a partir de larecuerrencia que existe entre las variables, tal como hemos ilustrado en el caso anterior para losultimos dos periodos.

El sistema de ecuaciones se va construyendo al eliminar el multiplicador y reemplzar en laecuacion que proviene de imponer las condiciones de optimalidad sobre el control.

Page 233: Libro Matematicas Para Economistas

232 CAPITULO 11. PROGRAMACION DINAMICA

11.3. Principio de optimalidad y ecuacion de Bellman

De esta manera, dado x∗t en la trayectoria optima, se tiene que x∗t+1 = f(x∗t ) y u∗t = gt(x∗t ),donde las funciones anteriores se obtienen del despeje del sistema de ecuaciones correspondiente.Luego,

dado x0, la trayectoria optima (solucion del problema) x∗t=1,...,T+1; u∗t=0,...,T estaunıvocamente determinada por el estado inicial.

Mas aun, siguiendo con esta idea, tambien es claro que a partir de una determinada soluciondel problema, que depende de la condicion inicial, si truncamos la funcion objetivo a partir deun cierto instante, digamos t∗, de tal forma que el problema de optimizacion es ahora:

maxT∑

t=t∗Ft(xt, ut) + W (xT+1)

s.axt+1 − xt = ft(xt, ut), t = t∗, ..., T

y consideramos que la condicion inicial es ahora xt∗ = x∗t (valor optimo del problema originalen el instante t∗), entonces el resto de la trayectoria del problema truncado coincide con latrayectoria original. Este es el denominado principio de optimalidad de Bellman para el problemade programacion dinamica, principio que se tiene obviamente a partir de la estructura particulardel problema.

Veamos ahora el problema desde una optica algo distinta, esto con el fin de plantear unmetodo de analisis que puede ser util en algunos casos4. En primer lugar, de la formulacion delproblema, nuestro objetivo es maximizar:

maxu0,u1,...,uT

F0(x0, u0) + F1(x1, u1) + F2(x2, u2) + F3(x3, u3) + ... + FT (xT , uT ) + W (xT+1)

sujeto a las restricciones impuestas por la dinamica del problema. Ahora bien, ya sabemos que elcontrol u0 afecta toda la trayectoria del problema (desde 0 hasta T +1), mientras que el controlu1 no afecta la primera componente de la funcion objetivo pero si de la segunda en adelante(desde 1 hasta T +1), el control u2 no afecta los dos primeros valores de la funcion obetivo, perosi del tercero en adelante (es decir, desde 2 hasta T + 1), etc. Con esto, el problema original sepuede re-escribir de la siguiente manera:

maxu0F0(x0, u0) + max

u1F1(x1, u1) + max

u2F2(x2, u2)

+

maxu3

F3(x3, u3) + ... + maxuT

FT (xT , uT ) + W (xT+1)...

Definamos en forma recursiva la funcion valor optimo como:

V1(xT ) = maxuT

FT (xT , uT ) + W (xT+1)

Vj+1(xT−j) = maxuT−j

FT−j(xT−j , uT−j) + Vj(xT−j+1),

4Se insiste que, a partir de las ecuaciones anteriores, en estricto rigor disponemos de un metodo que nos permiteresolver, en principio, cualquier problema de p.d.

Page 234: Libro Matematicas Para Economistas

11.3. PRINCIPIO DE OPTIMALIDAD Y ECUACION DE BELLMAN 233

donde la maximizacion se considera sujera a la restriccion xt+1 = ft(xt, ut).A modo de ejemplo, consideremos que T = 2, el problema de optimizacion es:

maxu0F0(x0, u0) + max

u1F1(x1, u1) + max

u2F2(x2, u2) + W (x3),

sujeto a las restricciones de la dinamica. De esta manera, se tiene que:

V1(x2) = maxu2F2(x2, u2) + W (x3) (1)

V2(x1) = maxu1F1(x1, u1) + V1(x2) (2)

V3(x0) = maxu0F0(x0, u0) + V2(x1) (3),

cada una con su respectiva restriccion. En la ecuacion (1), las variables son x3 y u2, de modoque si x2 fuera conocido entonces podrıamos determinal los valores del estado y el controlconsiderados. De esta manera, dado x2, tanto x3 como u2 son funciones de x2 (digamos, x3 =f2(x2), u2 = g2(x2)), las cuales se obtienen de despejar las incognitas de las condiciones deoptimalidad del problema V1, considerando que x3 = f2(x2, u2), es decir, resolviendo:

maxu2F2(x2, u2) + W (x3)

s.ax3 = f2(x2, u2)

En este caso, L = F2(x2, u2) + W (x3)+ λ[f2(x2, u2)− x3] y las condiciones de optimlidad(derivada c.r a u2, x3 y λ) nos generan un sistema de tres ecuaciones con tres incognitas.

Otra forma mas simple de abordar este caso es reemplazar directamente x3 = f2(x2, u2) enla funcion objetivo y derivar c.r a u2, igualando a cero:

maxu2F2(x2, u2) + W (f2(x2, u2))Derivando c.r a u2 se tiene que:

∂F2(x2, u2)∂u2

+ W ′(f2(x2, u2)) · ∂f2(x2, u2)∂u2

= 0,

con lo cual obtenemos u2 en funcion de x2 (u2 = g2(x2)). Con esto tenemos que x3 = f2(x2, g2(x2)) :=f2(x2) que es lo buscado.

En resumen, se tiene que:

V1(x2) = F2(x2, g2(x2)) + W (f3(x2, g2(x2)))que es obviamente una funcion de x2.

Dado V1(x2) (que podemos encontrar a partir de lo anterior), se tiene que:

V2(x1) =

maxu1F1(x1, u1) + V1(x2)

s.ax2 = f2(x1, u1)

Al imponer las condiciones de optimalidad para este problema, en forma analoga al casoanterior, podemos encontrar una relacion funcional entre u1 y x2 en funcion de x1, es decir,u1 = g1(x1) y x2 = f2(x1). Con esto,

Page 235: Libro Matematicas Para Economistas

234 CAPITULO 11. PROGRAMACION DINAMICA

V2 = F1(x1, g1(x1)) + V1(f2(x1))que es obviamente una funcion de x1. Finalmente, al resolver el problema:

V3(x0) =

maxu0F0(x0, u0) + V2(x1)

s.ax1 = f1(x0, u0)

encontramos que tanto x1 como u1 dependen de estado inicial x0 de modo que u0 = g0(x0) yx1 = f0(x0, g0(x0)).

Con todo lo anterior, dado x0 queda completamente determinada la trayectoria de estadosy controles de los periodos siguientes. De hecho, la trayectoria optima es:

x0 →

x1 = f0(x0, g0(x0)) → x2 = f0(x1, g1(x1)) → x3 = f2(x2, g2(x2))

u0 = g0(x0) u1 = g1(x1) u2 = g2(x2)

En general, para el problema de T periodos, se tiene algo completamente similar: dado x0

se determinan las trayectorias optimas de controles y estados de manera que

xt+1 = ft(xt, gt(xt)

ut = gt(xt)

x0 dado

La relacion que existe entre las funciones valor optimo entre distinos periodos

Vj+1(xT−j) = maxuT−j

FT−j(xT−j , uT−j) + Vj(xT−j+1)

se denomina Ecuacion de Bellman para el problema de programacion dinamica considerado.

Ejemplo 11.3.1 Consideremos el caso particular en que:

Ft(xt, ut) = βtF (xt, ut), ft(xt, ut) = f(xt, ut),

es decir, cuando la dependencia en el tiempo de la funcion objetivo se puede interpretar como unvalor descontado y la dinamica es autonoma en el tiempo5. En tal caso, la ecuacion de Bellmanes:

Vj+1(xT−j) = maxuT−j

βT−jF (xT−j , uT−j) + Vj(xT−j+1)

es decir,

βT−jVj+1(xT−j) = maxuT−j

F (xT−j , uT−j) + βT−jVj(xT−j+1) =

maxuT−j

F (xT−j , uT−j) + β · βT−j+1Vj(xT−j+1).

5Es decir, no existe dependencia explicita del tiempo en la dinamica.

Page 236: Libro Matematicas Para Economistas

11.4. HORIZONTE INFINITO 235

Si definimos Wj+1(xT−j) = βT−jVj+1(xT−j), la expresion anterior se transforma en:

Wj+1(xT−j) = maxuT−j

F (xT−j , uT−j) + β ·Wj(xT−j+1),

donde se debe cumplir que xT−j+1 = f(xT−j , uT−j), con xT−j dado.

11.4. Horizonte infinito

Siguiendo con la filosofıa anterior, para el problema de programacion dinamica con hor-izonte infinito, no es necesario asumir que existe una funcion de termino que solo depende delestado final (W (xT+1)) . De esta manera, el problema general tiene la forma:

maxu0,u1,u2,...

∞∑t=0

Ft(xt, ut)

s.a x0 = x0 : datoxt+1 = ft(xt, ut), t ≥ 0

La ecuacion de Bellman para este problema tiene la misma forma anterior, es decir:

Vj+1(xT−j) = maxuT−j

FT−j(xT−j , uT−j) + Vj(xT−j+1),

la cual, para el caso particular autonomo con descuento, es:

Wj+1(xT−j) = maxuT−j

F (xT−j , uT−j) + β ·Wj(xT−j+1), t ≥ 0

donde Wj+1(xT−j) = βT−jVj+1(xT−j), t ≥ 0.

Con la finalidad de definir el estado estacionario para un problema de prog. dinamica conhorizonte infinito, supongamos que hemos resuelto el problema anterior (caso general o partic-ular), econtrando una trayectoria de estados y controles xtt=0,1,2,..., utt=0,1,2,.... Con estopodemos definir ademas una secuencia de funciones de valor optimo Vj .

Definicion 11.4.1 Diremos que el valor x es un estado estacionario del problema de P.D si

lımt→∞xt = x.

En forma complementaria, el control u es un control estacionario si lımt→∞ut = u.

La siguiente figura ilustra la idea de estado estacionario para el problema:

t

xt

x_

x0

Page 237: Libro Matematicas Para Economistas

236 CAPITULO 11. PROGRAMACION DINAMICA

Considerando el problema autonomo en la dinamica (ft → f), en el estado estacionario sedebe cumplir que

x = f(x, u).

Por otro lado, bajo el supuesto Ft = βtF y asumiendo que Vt → V , donde Vt denota lafuncion valor en el instante t, mientras que V un valor optimo en la cola de la sucecion, se tieneque el estado estacionario debe cumplir ademas con

V (x) = maxuf(x, u) + βV (x).

Estas dos ecuaciones caracterizan el valor del estado y el control estacionario para el problemaa horizonte infinito, para el caso particular en que ft = f y Ft = βtF .

11.5. Problemas estocasticos

Para considerar problemas estocasticos en este contexto, la formulacion general corre-sponde a asumir que es dada una variable aletoria εt, la cual afecta la dinamica de transicion,es decir,

xt+1 = ft(xt, ut, εt+1).

Con esto, la funcion objetivo resulta aleatoria y, por ende, el problema se convierte enmaximizar el valor esperado de la sumatoria dada la dinamica anterior:

maxut

E

[ ∞∑t=0

Ft(xt, ut)]

s.a x0 = x0 : datoxt+1 = ft(xt, ut, εt+1), t ≥ 0

Un caso particular muy importante del problema anterior es cuando εt toma dos valores,digamos 0, 1 con probabilidades pt y (1 − pt). En tal caso, quedan definidas dos dinamicas detransicion:

pt : xt+1 = ft(xt, ut, 0) := ft,0(xt, ut)

(1− pt) : xt+1 = ft(xt, ut, 1) := ft,1(xt, ut)

lo cual debe ser considerado en la funcion objetivo. Como se trata de un valor esperado, laesperanza consiste en sumar el producto de la probabilidad por el valor de la funcion objetivocuando se sigue la dinamica respectiva. En otras palabras, el problema consiste ahora en6:

maxut

[ ∞∑t=0

pt−1Ft(ft−1,0(xt−1, ut−1), ut) + (1− pt−1)Ft(ft−1,0(xt−1, ut−1), ut)]

s.a x0 = x0 : dato

Las condiciones de optimalidad vienen de derivar la expresion anterior respecto de ut (o delos controles que existan) y, a partir de esto, obtener las recurrencias (ver un Ejemplo anterior).

6Recuerde que segun nuestra notacion, pt define la dinamica para t + 1. Es solo una cuestion de notacion.

Page 238: Libro Matematicas Para Economistas

11.6. EJEMPLOS Y PROBLEMAS PROPUESTOS 237

11.6. Ejemplos y problemas propuestos

Ejemplo 11.6.1 Supongamos que una determinada unidad publica (de servicios) es evaluadapor los usuarios sobre la base de la cantidad de servicio que recibe. Supongamos que los usuariosson identicos y que en el instante t su cantidad es ηt. Si la unidad evaluada entrega una cantidadtotal qt de servicio al publico en el instante t, cada usuario recibe

ct =qt

ηt

cantidad del servicio. La unidad debe decidir sobre un plan de inversiones en el tiempo, It. Conesto, se puede modificar la cantidad de servicio qt de la siguiente forma:

qt+1 = (1− r)qt + It

(las inversiones las hago hoy, pero tienen efecto en el perıodo siguiente; la cantidad de servicioque tengo hoy se deprecia a tasa (1− r) para el periodo siguiente). Luego, se tiene que:

ct+1ηt+1 = (1− r)ctηt + It,

es decir,

ct+1 = ct · (1− r)ηt

ηt+1+

1ηt+1

It.

Definiendo µt = ηt

ηt+1, el problema de la unidad es encontrar la trayectoria optima de inver-

siones (control) de tal forma que se maximice la funcion de utilidad (percepcion de los usuarios)definida en el tiempo, es decir:

maxIt

∞∑t=0

βtU(ct)

s.a c0 datoct+1 = ct · (1− r)µt + 1

ηt+1It, t ≥ 0

Supongamos que U(c) = cα, 0 < α < 1 y supongamos que ηt = η0λt. En tal caso, el problema

anterior se traduce en:

maxIt

∞∑t=0

βtcαt

s.a c0 datoct+1 = ct · (1− r)λ + 1

η0λ−tIt, t ≥ 0

Derivando directamente la funcion objetivo c.r a ct, se tiene que

βtαcα−1t + βt+1(α + 1)[ct · (1− r)λ +

1η0

λ−tIt]α(1− r)λ = 0,

es decir,

αcα−1t + β(α + 1)[ct · (1− r)λ +

1η0

λ−tIt]α(1− r)λ = 0.

Esto define una relacion de recurrencia entre el estado ct y el control It. Dado c0 se puededeterminar la trayectoria optima que resuelve el problema.

Page 239: Libro Matematicas Para Economistas

238 CAPITULO 11. PROGRAMACION DINAMICA

Ejemplo 11.6.2 Supongamos que un individuo tiene una trayectoria de salarios wt conociday que debe pagar impuestos Tt en cada periodo. Las deciciones en cada instante del tiemposon sobre cuanto consumir (ct) o, equivalentemente, sobre cuanto ahorrar en cada periodo (st).Cuando ahorra, supondremos que para el proximo periodo recibe se actualiza segun una tasa deinteres rt. De esta manera, el ingreso disponible en el periodo t es igual a:

It = wt + st−1(1 + rt−1)− Tt.

Por otro lado, se debe cumplir que It = ct + st. De esta manera:

ct + st = wt + st−1(1 + rt−1)− Tt,

es decir,

ct+1 = wt+1 + st(1 + rt)− Tt+1 − st+1.

Luego, el problema del individuo es:

maxst

∞∑t=0

βtU(ct)

s.a ct+1 = wt+1 + st(1 + rt)− Tt+1 − st+1

Asumiremos que la variable de control es el ahorro en el instante t. De esta manera, derivandodirectamente la expresion anterior c.r a st se tiene que7:

βt+1U ′(ct+1)(1 + rt)− βtU ′(ct) = 0.

Luego, β(1 + rt)U ′(ct+1) = U ′(ct), lo que define una recurrencia en ct y por ende entre lasvariables del problema. En lo que sigue vamos a realizar un analisis de este problema.

a.- Primer Enfoque: caso U particular

Supongamos que, por ejemplo, U(c) = ln(c). En tal caso, la condicion de optimalidad setraduce en

β(1 + rt)ct+1

=1ct

,

de lo cual es tiene que ct+1 = β(1 + rt)ct. De esta manera8,

ct = βt−1t−1∏

i=1

(1 + ri) · c0.

En el caso particular rt = r: cte., se tiene que ct = βt−1(1 + r)t−1c0 = (b(1 + r))t−1c0.

Dado el caso particular, notemos que cuando β(1 + r) > 1 implica que lımt→∞ ct = ∞. En

cambio, cuando β(1 + r) < 1, lımt→∞ ct = 0. En cambio, cuando β(1 + r) = 1, ct = c0, ∀t.

7Hay st en ct y ct+1.8Resolver la recurrencia por remplazos sucesivos.

Page 240: Libro Matematicas Para Economistas

11.6. EJEMPLOS Y PROBLEMAS PROPUESTOS 239

b.- Recurrencia en el ahorro.

De hecho queβ(1 + rt)

ct+1=

1ct

,

se concluye que:

β(1 + rt) · [wt + st−1(1 + rt−1)− Tt − st] = wt+1 + st(1 + rt)− Tt+1 − st+1,

es decir,

st+1−st[(1+ rt)+β(1+ rt)]+st−1[β(1 + rt)2] = wt+1−β(1+ rt) ·wt−Tt+1 +β(1+ rt) ·Tt.

Supongamos, para simplificar ideas, que Tt = T : cte., rt = r: cte. y que wt = (1 + rw)tw0.En tal caso, el problema es:

st+1 − st[(1 + r) + δ] + st−1[δ(1 + r)] = (1 + rw)t+1w0 − δ · (1 + rw)tw0 − T + δ · T

donde δ = β(1 + r).

Si definimos α = [(1 + rw) − δ]w0, β = δ − 1, a = −[(1 + r) + δ] y b = [δ(1 + r)], larecurrencia anterior es:.

st+1 + ast + bst−1 = α(1 + rw)t + βT,

es decir,

st+2 + ast+1 + bst = α(1 + rw)t + βT,

donde α = α(1 + rw).

Dados los parametros podemos encontrar la solucion de la ecuacion de recurrencia anterior(ver capıtulo de Ecuaciones de Recurrencia). Esto queda propuesto.

c.- Analisis de estado estacionario

En una primera aproximacion, notemos que bajo el supuesto U(c) = ln(c) se tiene que

β(1 + rt)ct+1

=1ct

.

De esta manera, si t →∞ y suponemos que el consumo converge, digamos ct → c, entonces,bajo el supuesto9 rt = r se debe cumplir que

β(1 + r)c = c ⇔ (1− β(1 + r))c = 0.

9En rigor, bastarıa con suponer que rt → r.

Page 241: Libro Matematicas Para Economistas

240 CAPITULO 11. PROGRAMACION DINAMICA

Luego, si 1 6= β(1 + r), la solucion de largo plazo es c = 0, cuestion que ya sabiamos de laparte a.− En esta parte no podemos obtener mas informacion.

El resultado anterior sigue siendo valido cuando se considera una funcion de utilidad Utal que U ′(0) = 0, ya que de la condicion de optimalidad:

β(1 + rt)U ′(ct+1) = U ′(ct),

si ct converge entonces, bajo el supuesto rt = r, se tiene que:

β(1 + r)U ′(c) = U ′(c).

Si hay convergencia se debe cumplir que U ′(c) = 0 y luego c = 0 cuando β(1 + r) = 1.

Queda propuesto analizar el comportamiento asintotico del ahorro st.

Ejemplo 11.6.3 Siguiendo con el problema anterior, denotemos por It = wt + (1 + rt)st−1 elingreso antes de impuesto y supongamos ahora que Tt es proporcional al ingreso declarado, conconstante de proporcionalidad µt. Si el ingreso declarado es una fracion λt del ingreso antesde impuesto, supondremos que con probabilidad pt se encuentra la falta y en tal caso en elperiodo siguiente se cobra el impuesto no pagado, ajustado a tasa (1 + Rt), mas una multaMt. Supondremos ademas que si el individuo es encontrado en falta, en el periodo siguientedeclarara todo el ingreso. Por el contrario, si el individuo no es pillado en falta, en el periodosiguiente podrıa volver a sub-declarar.

A partir de lo anterior, con probabilidad pt el ingreso disponible en el periodo siguiente sera:

ID1t+1 = (1− µt+1)It+1 − (1 + Rt)µt(1− λt)It −Mt+1

mientras que con probabilidad (1− pt) este ingreso sera:

ID2t+1 = (1− λt+1 µt+1) It+1.

De esta manera, puesto que IDt+1 = ct+1 + st+1, con probabilidad pt tendremos una deter-

minada trayectoria de consumo y con probabilidad (1 − pt) dicha trayectoria sera diferente.Denotemos por ct,1 el consumo en el primer caso y por ct,2 en el segundo. Por otro lado, de lasdefiniciones anteriores, las variables de control que tiene el individuo son la tasa de ahorro st yla fraccion de ingreso que declara λt. De esta manera, el problema de optimizacion que se tienees el siguiente10:

maxst,λt

∞∑t=0

βt[pt−1U(ct,1) + (1− pt−1)U(ct,2)]

s.a ct,i = IDit − st, i = 1, 2

es decir,

maxst,λt

∞∑t=0

βt[pt−1U(ct,1) + (1− pt−1)U(ct,2)]

s.a ct,1 = (1− µt)It − (1 + Rt−1)µt−1(1− λt−1)It−1 −Mt − st

ct,2 = (1− λt µt) It − st

10Maximizacion de la utilidad esperada dadas las posibles trayectorias de consumo. Note que las probabilidadespt y (1− pt) afectan el periodo siguiente.

Page 242: Libro Matematicas Para Economistas

11.7. EJERCICIOS ADICIONALES 241

donde It = wt + (1 + rt)st−111

Derivando con respecto a st y λt se obtienen las condiciones de optimalidad que definen ladinamica del problema. Para ello, re-escribamos las restricciones considerando la definicion deIt:ct,1 = (1− µt)[wt + (1 + rt)st−1]− (1 + Rt−1)µt−1(1− λt−1)[wt−1 + (1 + rt−1)st−2]−Mt − st

ct,2 = (1− λt µt) [wt + (1 + rt)st−1]− st

Luego, derivando c.r a st se tiene que:

βtpt−1U′(ct,1) · [−1] + βt+1ptU

′(ct+1,1)[(1− µt+1)(1 + rt+1)] +

βt+2pt+1U′(ct+2,1)[−(1 + Rt+1)µt+1(1− λt+1)(1 + rt+1)] +

βt(1− pt−1)U ′(ct,2) · [−1] + βt+1(1− pt)U ′(ct+1,2)[(1− λt+1µt+1)(1 + rt+1)] = 0

Por otro lado, derivando c.r a λt se tiene que:

βt+1ptU′(ct+1, 1)[(1 + Rt)µt][wt + (1 + rt)st−1] + βt(1− pt−1)U ′(ct,2)[−µt(wt + (1 + rt)st−1)] = 0

En lo que sigue, queda propuesto:

Ejercicio 11.6.1 a.- Justifique el modelo anterior y verifique que las relaciones obtenidasestan correctas (derivadas y demases).

b.- Supongamos que la tasa de ahorro es constante, digamos st = s, que Rt = R, rt = r,µt = µ, pt = p y Mt = M . Plantee en tal caso las nuevas condiciones de optimalidad parael problem anterior (la variable de control es ahora λt).

c.- Con lo anterior, suponga que U(c) = ln(c). Desarrolle las condiciones de optimalidad praobtener una recuerrencia en λt. Haga los supuestos simplificatorios necesarios para quedicha ecuacion en difrencias pueda ser resuelta.

d.- Realice un analisis de largo plazo siguiendo el esquema del problema anterior.

e.- Como cambiarian las relaciones (restricciones y condiciones de optimlidad) del problemageneral si la tasa de impuestos fuera constante e igual a T , independiente del ingreso?

f.- Siguiendo lo desarrollado, plantee un modelo en el cual si el individuo es pillado en faltaen el periodo t, en el periodo t + 1 debe pagar las multas e intereses como en el casoanalizado, pero ahora le es factible seguir eludiendo impuesto, es decir, no necesariamentepaga impuesto por todo el ingreso del periodo.

11.7. Ejercicios Adicionales

P1.- Considere un agente que vive para siempre y que presenta una funcion de utilidad de

la forma u(ct) = c1−γt1−γ (CRRA). Suponga que el tiempo es discreto y que la restriccion

dinamica del agente es At+1 = (1 + r)(Yt + At − ct), donde r es la tasa de interes de laeconomıa, Yt es el ingreso (aleatorio), At son los activos netos a comienzos del perıodo t.El individuo ademas tiene una tasa de descuento intertemporal igual a θ.

11En el planteamiento estamos omitiendo la restriccion λt ∈ [0, 1]: asumiremos solucion interior.

Page 243: Libro Matematicas Para Economistas

242 CAPITULO 11. PROGRAMACION DINAMICA

1. Escriba e interprete la ecuacion de Bellman para el problema del agente y presentela condicion de primer orden.

2. Suponga que el consumo en t + 1 se distribuye como una log-normal, es decir,log(c(t + 1) ∼ N(E(log(ct+1), σ2). Determine la relacion entre log(ct) y E(log(ct+1)).

Ayuda: Si x ∼ N(µ, σ2) entonces E(ex) = eµ+σ2

2 .

3. Suponga que θ = r.Determine de que forma se altera la tasa de crecimiento delconsumo12 , cuando aumenta la incertidumbre respecto del consumo (aumenta σ2).¿Depende de γ? Explique intuitivamente su resultado y comparelo con el caso defunciones de utilidad cuadraticas.

4. Considere que θ < r y que σ2 −→ 0 ¿es la tasa de crecimiento del consumopositiva?.¿Depende de γ? Explique intuitivamente su resultado.

P2.- Considere el problema de minimizar la suma de los cuadrados de variables no negativassujeta a la restriccion que su suma debe ser un numero especıfico, es decir, considere:

maxJ = −t1∑

t=t0

u2t (11.1)

s.a ut ≥ 0, t = t0, t+1, .., t1 y∑t1

t=t0 ut = c.

P3.- Un determinado material es pasado a traves de dos hornos. Denote por x0 a la temperaturainicial del material, por xk(k = 1, 2) a la temperatura del material a la salida del horno ky por uk−1(k = 1, 2) a la temperatura existente mientras el material esta en el horno k.Se asumira ademas un ecuacion del tipo xk+1 = (1 − a)xk + auk, k = 0, 1 donde a esalgun escalar en el intervalo (0, 1). El objetivo es encontrar una temperatura x2 cercanaa un lımite T , gastando la menor cantidad de energıa durante los dos perıodos anteriores.De esta forma se puede plantear que el objetivo es minimizar la funcion de costos:

r(x2 − T )2 + u20 + u2

1 (11.2)

con r > 0.

P4.- Considere el problema de eleccion de una senda para el consumo c, que maximize

∞∑

t=0

βt(ln ct + γ ln ct−1), 0 < β < 1, γ > 0 (11.3)

s.a.ct + kt+1 ≤ Akα

t A > 0, 0 < α < 1, k0 > 0 (11.4)

considere ademas que c−1 es dado.

1. Sea v(k0, c−1) el valor de la funcion objetivo para el consumo que comienza en 0 conun stock de capital k0 y un rezago de consumo c−1, cuando las decisiones son optimas.Formule la ecuacion de Bellman en v(k, c−1).

2. Pruebe que la solucion de la ecuacion de Bellman es de la forma v(k, c−1) = E +F ln k + G ln c−1 y que la polıtica optima es de la forma ln kt+1 = I + H ln kt, dondeE, F,G, H e I son constantes. Encuentre las expresiones para las constantes en funcionde los parametros del modelo.

12si es aclaratorio para Ud., considere una tasa de crecimiento esperada

Page 244: Libro Matematicas Para Economistas

11.7. EJERCICIOS ADICIONALES 243

P5.- Considere un agente que vive para siempre en un mundo en el que el tiempo es discretoy que tiene una funcion de utilidad con aversion relativa al riesgo constante (U(ct) =c(1−γ)t

(1−γ) ). Suponga que la tasa de interes es constante (y no necesariamente igual a la tasade descuento θ). El ingreso Y es aleatorio, la persona tiene un factor de descuento β, latasa de interes bruta es fija e igual a R y los cativos netos a comienzos del perıodo t sedenotan por At.

1. Escriba la ecuacion de Bellman de este problema y determine la relacion entre U ′(ct)Y E(U ′(Ct+1)).

2. Utilizando la ecuacion de Euler determine la relacion entre ct y la esperanza de ct+1.

3. Suponga que el logaritmo de ct+1 se distribuye como una normal con varianza σ2.Determine el valor de ct en funcion de E(ct+1), σ2, θ, r y σ. 13.Por que importa σ2?

P6.- Considere un agente que vive para siempre en un mundo en el que el tiempo es discretoy que consume solo bienes durables. El consumidor maximiza E(

∑∞t=1

U(Kt)(1+θ)t ), donde Kt

es el stock de durables que el agente mantiene en el perıodo. Denotando las compras dedurables en t por Xt, el stock evoluciona segun Kt = (1−γ)Kt +Xt, donde γ es la tasa dedepreciacion. Los activos netos del agente evolucionan segun: At+1 = (1+rt)(At+Yt−Xt).

1. Determine las condiciones de primer orden del problema

2. Suponga que la funcion de utilidad es cuadratica, r = rt = θ y γ = 0. Muestre quemientras el consumo de durables sigue una caminata aleaoria, el gasto en durables esruido blanco. Explique.

3. En la realidad se observa que el gasto en durables se aproxima mas a una caminataaletaria. Explique.

P7.- Considere una economıa de agente representativo, donde se busca el maximizar:

Et

∞∑

t=0

βtu(ct) , 0 < β < 1 (11.5)

donde ct es el consumo en t, Et es el operador de esperanza condicionado a la informacionen t y u(ct) es la funcion de utilidad instantanea, que satisface u′ > 0 y u′′ < 0. El objetivodel agente es el de maximizar la esperanza del valor descontado de su utilidad, sujeta aque At+1 = R(Ay + yt − ct), con t = 0, 1, .... y A0 dado. Donde R > 1, representa la tasade retorno del ahorro entre el perıodo t y t + 1, At es la posesion de activos en t, e yt es elingreso del trabajo en el correspondiente perıodo. Ademas, Ud. debe suponer que yt sigueun proceso estocastico, fuera del control del agente.14

1. Plantee a traves de una ecuacion de Bellman, el problema a resolver por el agenterepresentativo. (Es importante que entregue intuicion tras su respuesta).

2. Escriba las condiciones de primer orden del problema

Suponga ahora que la funcion de utilidad instantanea es de la forma u(ct) = u0 +u1ct − u2

2 c2t con u0, u1, u2 > 0.

13Ayuda: Si x tiene una distribucion normal N(u, σ2), entonces E(ex) = eu+0,5σ2

14Adicionalmente puede Ud. considerara que E0At ≥ M > −∞ para todo t, y que lımj−→∞Etyt+jβj = 0 para

todo t

Page 245: Libro Matematicas Para Economistas

244 CAPITULO 11. PROGRAMACION DINAMICA

3. ¿Por que puede ser importante el suponer que Et∑∞

j=0 R−jyt+j < u1u2

?. Explique conintuicion.

4. Presenta la ecuacion de Euler para el caso particular de la funcion de utilidad dadaanteriormente. Exprese el consumo esperado en t + j como una funcion del consumot y los parametros del modelo.

5. Suponga que βR = 1. Encuentre el plan de consumo optimo para el agente. Interpretesus resultados desde el punto de vista de la teorıa de ingreso permanente. ¿Espera Ud.encontrar una martingala para el consumo?.(Ayuda: No olvide utilizar la restricciondinamica y que el agente vive por infinitos perıodos)

6. Considere que la funcion de utilidad se modifica, siendo ahora u(ct) = u0+u1ct−u22 ct+

ctat, donde at es un proceso aleatorio no correlacionado serialmente con media iguala cero.¿Cree Ud. que sus respuesta anteriores se pueden alterar? (Ayuda: Refierasea sus conclusiones respecto a Ingreso Permanente y a la martingala. No es necesarioque desarrolle matematicamente este problema, aunque esto puede ayudarlo).

Page 246: Libro Matematicas Para Economistas

Capıtulo 12

Correspondencias

12.1. Introduccion

En lo que sigue vamos a estudiar un tipo de funciones que extiende la nocion usual quede ellas tenemos. Para fijar ideas, cuando definimos una funcion f : IR → IR establecemos unarelacion entre un numero real x y otro numero real f(x). Cuando definamos una correspondenciaΓ : IR 7→ IR, estableceremos una relacion entre un numero real x y un subconjunto de IR.Claramente esta idea de asociar numeros a conjuntos extiende la idea de funcion: basta coninterpretar f(x) como el conjunto f(x) (singleton formado por el unico elemento f(x).

Ejemplo 12.1.1 Consideremos el siguiente problema de optimizacion:max) u(x1, x2)s.ap1x1 + p2x2 = I

Dependiendo de la funcion u el problema podra tener una unica solucion o multiples soluciones.Note ademas que dichas soluciones dependen de los parametros del problema. La siguiente figurailustra diversas alternativas para este problema:

1 2 3

En el caso 1, hay solucion unica; en el caso 2 hay dos soluciones mientras que en el caso 3 hayinfinitas soluciones al problema anterior. De esta manera, dados los parametros p1, p2, I al definiruna funcion que les asocie las soluciones del problema anterior, nos encontramos en la necesidadde tener que ampliar el concepto de funcion permitiendo que ahora las imagenes puedan serconjuntos. Esto nos fuerza a tener que introducir correspondencias segun lo ya mencionado. Deesta manera, en el ejemplo anterior, hemos definido la correspondencia de demanda que asociaa los parametros del problema (precios p1, p2 e ingreso I) los valores posibles de demanda dadospor la solucion del problema anterior, es decir, hemos definido

245

Page 247: Libro Matematicas Para Economistas

246 CAPITULO 12. CORRESPONDENCIAS

Γ : IR+ × IR+ × IR+ 7→ IR2 |de modo que

Γ(p1, p2, I) = argmax u(x1, x2) | p1x1 + p2x2 = I.

En terminos generales, una correspondencia1 Γ : A 7→ B es simplemente una funcion queasocia a cada elemento de a ∈ A un subconjunto Γ(a) ⊆ B2.

A partir de esto, dadas las correspondencias Γ1 : A 7→ B y Γ2 : B 7→ C, se definen lossiguientes conceptos basicos:

a.- Dominio de la correspondencia

dom(Γ1) = x ∈ A | Γ1(x) 6= φ.

b.- Grafo de la correspondencia

Gr(Γ1) = (a, b) ∈ A×B | a ∈ dom(Γ1), b ∈ Γ1(a).

c.- Composicion de correspondencias

(Γ2 Γ1)(x) =⋃

y∈Γ1(x)

Γ2(y).

Finalmente diremos que la correspondencia es cerrada si los valores que toma son cerrados;compacta si sus valores son compactos; convexa si sus valores son convexos, etc.

Ejemplo 12.1.2 Dadas f, g : IR → IR dos funciones, dado x ∈ IR, definamos (f∧

g)(x) =maxf(x), g(x) y (f

∨g)(x) = mınf(x), g(x). Dado esto, definamos la correspondencia Γ :

IR 7→ IR como:

Γ(x) = [(f∨

g)(x) = mınf(x), g(x), (f∧

g)(x)]

La siguiente figura ilustra esta correspondencia:

f

g

x y

1Tambien llamada multiaplicacion o multifunci’on.2Insisto en que como caso particular se tienen las funciones, donde para cada a ∈ A, el valor de Γ(a) es un

singleton.

Page 248: Libro Matematicas Para Economistas

12.1. INTRODUCCION 247

Ejemplo 12.1.3 Ejemplo Importante: cono normal

Supongamos dado un conjunto cerrado Y ⊆ IR` cuya frontera denotaremos por fr[Y ].Supongamos y0 ∈ fr[Y ] y definamos el siguiente conjunto:

N(y0, Y ) = q ∈ IR` | q · (y − y0) ≤ 0, ∀y ∈ Y que es el llamado cono normal a Y en y0. La siguiente figura ilustra el cono normal al conjuntoY de la figura:

Y

N

NN

N

De esta manera, dado y0 ∈ fr[Y ] hemos definido una correspondencia N(·, Y ) : fr[Y ] 7→ IR`

tal que a y0 en la frontera le asocia el cono normal respectivo. Note que dado p ∈ N(y0, Y ) setiene que

p · (y − y0) ≤ 0 ⇔ p · y ≤ p · y0, ∀y ∈ Y,

es decir, y0 maximiza p · y con y ∈ Y . En un modelo de equilibrio general, donde Y representael conjunto de produccion de una firma, si el conjunto es convexo, dadas las cantidades y0

de equilibrio, los precios de equilibrio deben necesariamente pertenecer al cono normal antesdefinido. 2

Ejemplo 12.1.4 Otro ejemplo de correspondencia es el siguiente:

Γ1(x)

[−1, 1] si x 6= 00 si x = 0

Γ2(x)

0 si x 6= 0[−1, 1]0 si x = 0

Los graficos de las mismas son:

[]

0 0

(1) (2)

Page 249: Libro Matematicas Para Economistas

248 CAPITULO 12. CORRESPONDENCIAS

En este caso, note que en el primer caso la correspondencia colapsa bruscamente en x = 0mientras que en el segundo caso la correspondencia se dilata bruscamente en x = 0. Este tipo decomportamiento irregular refleja un tipo de discontinuidad que serıa deseable evitar o precaverpara efectos de los analisis que nos puedan interesar.

Siguiendo con la idea anterior, y haciendo abstraccion de lo mismo, se definen dos conceptosde gran importancia para las correspondencias: la semi - continuidad superior (s.c.s) y la semi- continuidad inferior (s.c.i).

Definicion 12.1.1 Diremos que Γ : A 7→ B es s.c.s en a ∈ A si dada una bola abierta C talque Γ(a) ⊆ C, entonces existe una vecindad V de a tal que para todo a′ ∈ V se verifica queΓ(a′) ⊆ C3.

Diremos ademas que Γ : A 7→ B es s.c.i en a ∈ A si dada una bola abierta C tal queΓ(a)

⋂C 6= φ, entonces existe una vecindad V de a tal que para todo a′ ∈ V se verifica que

Γ(a′)⋂

C 6= φ4.

Ejemplo 12.1.5 Supongamos las correspondencias Γ, Ξ : IR 7→ IR cuyos grafos son los sigu-ientes:

x x1 2

a

b

c

d

[]

[]

(1) (2)

Veamos que la (1) es s.c.s en x1 pero no es s.c.i en el punto. En efecto, sabemos que Γ1(x1) =[a, b]. Tomemos cualquier bola C tal que Γ1(x1) ⊆ C (por ejemplo, la bola C =]2a, 2b[). En talcaso, de la figura, para puntos cercanos a x1 (digamos, x ∼ x1) es claro que Γ(x) ⊆ C. Para verque no es s.c.i notemos que dada la bola C de la figura anterior, se tiene que Γ1(x1)

⋂C 6= φ,

pero para puntos cercanos a x1 no se tiene la propiedad anterior. En forma analoga se puede verque para el segundo caso la correspondencia es s.c.i en x2 pero no es s.c.s en el punto.

Ejemplo 12.1.6 En el ejemplo del cono normal anterior, la correspondencia de la figura no ess.c.i pero si es s.c.s.

Generalizando las definciones anteriores (que son definiciones puntuales), se tiene lo siguiente:

Definicion 12.1.2 a.- Correspondencia s.c.s

Diremos que Γ : A 7→ B es s.c.s si lo es en todo punto de su dominio.3Es decir, si la imagen de a ∈ A esta contenida en una bola abierta C, entonces para puntos cercanos la imagen

tambien esta contenida en dicha bola. En terminos de sucesiones, la s.c.s de Γ en a corresponde a decir que dadauna sucesion an → a y dada bn ∈ Γ(an) tal que bn → b entonces b ∈ Γ(a).

4En terminos de sucesiones, la s.c.i de Γ en a corresponde a decir que dada una sucesion an → a y dadab ∈ Γ(a) entonces existe una sucesion bn tal que bn ∈ Γ(an) y ademas bn → b.

Page 250: Libro Matematicas Para Economistas

12.2. PROBLEMA GENERAL DE ELECCION Y PUNTOS FIJOS 249

b.- Correspondencia s.c.i

Diremos que Γ : A 7→ B es s.c.i si lo es en todo punto de su dominio.

c.- Correspondencia continua

Diremos que Γ : A 7→ B es continua en un punto a ∈ A si es s.c.s y s.c.i en el punto ydiremos que es continua si lo es en todo punto de su dominio.

Nota Importante. En el caso particular que la correspondencia sea una funcion, las nocionesde s.c.s y s.c.i son equivalentes a la continuidad de la misma. Recordemos que la continuidadde una funcion f : IR → IR en un punto x0 se puede definir de varias formas equivalentes:f : IR → IR es continua en x0 si y solo si cualquiera de las siguientes:

a.- Caracterizacion por sucesiones

Si dada cualquier sucesion xn → x0 se tiene que lımn→∞ f(xn) = f(x0)5.

b.- Caracterizacion por ε− δ

Si para todo ε > 0, existe δ > 0 tal que si |x− x0| ≤ δ entonces |f(x)− f(x0)| ≤ ε.

c.- Si en particular se cumple la definicion de s.c.s dada para las correspondencias.

d.- Si en particular se cumple la definicion de s.c.i dada para las correspondencias.

NOTA. Recordemos informalmente que la idea de continuidad se asocia con el hecho que siempresucede lo que tiene que suceder. 2

Previo a mostrar el resultado mas importante sobre correspondencias que se relaciona con losobjetivos del curso, en primer lugar vamos a ver en terminos abstractos el problema de eleccionen economıa, siendo la idea representar este problema como uno de punto fijo.

12.2. Problema general de eleccion y puntos fijos

Uno de los supuestos fundamentales en el modelo de Arrow - Debreu es la convexidad delos conjuntos de produccion. Este supuesto, desde un punto de vista practico, se relaciona es-trechamente con procesos productivos que tienen rendimientos decrecientes de escala y con elhecho que los bienes son perfectamente divisibles. Bajo esta hipotesis se quiere representar unmarco economico competitivo, es decir, un marco en el cual las firmas son tomadoras de pre-cios -no tienen injerencia particular sobre cual sera su valor- siendo una de las implicancias lamaximizacion del beneficio en el equilibrio.

Con la finalidad de resumir los resultados existentes en el modelo clasico, supongamos dadoun sistema social general compuesto por un numero finito de n agentes (que pueden ser entendi-dos como consumidores o productores) y supongamos ademas que cada agente i ∈ N := 1, ..., npuede escoger elementos en un conjunto no vacıo, convexo y compacto Ai ⊆ IR` (para fijar ideas,podemos pensar que ` representa la cantidad de bienes del mercado). Cuando el resto de losagentes escoge acciones (a1, ..., ai−1, ai+1, ..., an) ∈ ΠN\i, asumiremos que la eleccion de i ∈ Nesta restringida a un subconjunto no vacıo de Ai, el cual correspondera a la imagen de unacorrespondencia φi : A =

∏j Aj → Ai, la que asumiremos continua con valores convexos.

5Es decir, lımn→∞

f(xn) = f( lımn→∞

xn).

Page 251: Libro Matematicas Para Economistas

250 CAPITULO 12. CORRESPONDENCIAS

La utilidad resultante del agente i ∈ N sera fi(a), donde fi(·) se asume continua en A ycuasiconcava con respecto a su i-esima variable ai. El objetivo de cada agente es, dadas lasacciones de los demas agantes aN\i, maximizar su utilidad f(ai, aN\i) sobre el conjunto φi(a),con a = (ai, aN\i). En otras palabras, cada agante i ∈ N tiene como objetivo buscar un elementode

µi(a) = x ∈ φi(a) | fi(x, aN\i) = maxy∈φi(a)

fi(y, aN\i).

Un elemento a∗ ∈ A es un equilibrio para el sistema social si para todo i ∈ N , a∗i maximizafi(·, a∗N\i) en φi(a∗). Al definir µ : A → A de modo que µ(a) = ×i∈Nµi(a), a∗ es un equilibrio siy solo si es un punto fijo de µ, es decir,

a∗ ∈ µ(a∗).

De esta manera, en el problema economico general ya mostrado, surge de manera naturalbuscar elementos que son puntos fijos de correspondencias. En tal sentido, el resultado masgeneral sobre el tema es el Teorema de Punto Fijo de Kakutani que enunciamos a continuacion:

TEOREMA DE PUNTO FIJO DE KAKUTANISea S ⊆ IR` un conjunto no vacıo, convexo y compacto de IR` y sea Γ : S 7→ S una

correspondencia semicontinua superior a valores convexos; entonces existe s ∈ S tal que s ∈ Γ(s).

La siguiente figura ilustra la idea anterior:

_s

S

S

De esta manera, bajo supuestos de convexidad y semi - continuidad adecuados, podemosgarantizar que el problema de existencia de equilibrio tiene solucion para situaciones muy gen-erales, donde no necesariamente se requiere la diferencibilidad de los entes considerados.

12.3. Ejercicios Adicionales

En lo que sigue, suponga que A ⊆ IRm, B ⊆ IRn y C ⊆ IRp.

P1.- Pruebe que Γ : A 7→ B es s.c.s en A si y solo si su grafo es cerrado en A×B.

Page 252: Libro Matematicas Para Economistas

12.3. EJERCICIOS ADICIONALES 251

P2.- Supongamos que Γ1 : A 7→ B y Γ2 : B 7→ C son s.c.s. Pruebe que Γ2 Γ1 : A 7→ C es s.c.s.

P3.- Suponga que K ⊆ IRm es compacto y que Γ : IRm 7→ IRn es una correspondencia a valorescompactos. Pruebe que

Γ(K) :=⋃

k∈K

Γ(k) := y ∈ IRn | ∃k ∈ K, y ∈ Γ(k)

es un conjunto compacto en IRn.

P4.- Diremos que Γ : A 7→ B es una correspondencia cerrada en x si para todo par de sucesionesxn → x e yn → y tales que yn ∈ Γ(xn) entonces y ∈ Γ(x). Pruebe que si Γ es s.c.s en xentonces es cerrada en x.

P5*.- Supongamos dadas fi : IR → IRm, i = 1, ..., n funciones continuas. Definamos

Γ(x) = cof1(x), f2(x), ..., fn(x)

envoltura convexa de los puntos f1(x), f2(x), ..., fn(x)6. Pruebe en tal caso que Γ es con-tinua.

P6*.- Supongamos que Γ : A 7→ B es una correspondencia continua a valores compactos. Supong-amos ademas que f : A×B → IR es una funcion continua. Pruebe que la funcion M definidacomo:

M(x) := maxf(x, y) | y ∈ Γ(x)

es una funcion continua.

Pruebe ademas que la correspondencia Ξ definida por:

Ξ(y) := y ∈ Γ(x) | f(x, y) = M(x)

es a valores compactos y s.c.s.

6La envoltura convexa de a1, a2, ..., an se define como

coa1, a2, ..., an := n∑

i=1

λiai, λi ≥ 0,

n∑i=1

λi = 1

Page 253: Libro Matematicas Para Economistas

252 CAPITULO 12. CORRESPONDENCIAS

Page 254: Libro Matematicas Para Economistas

Capıtulo 13

Respuestas y Comentarios aEjercicios

13.1. Sobre Capıtulo 6

P 1.1- El problema puede plantearse como:

mınl,k

lw + rl s.a. y = f(l, k) = Akαlβ (13.1)

por lo que la funcion lagrangiana puede ser escrita como:

= : lw + rk + λ(y −Akαlβ) (13.2)

Las condiciones de primer orden son:

k : r − λαAkα−1lβ = 0 (13.3)

l : w − λβAkαlβ−1 = 0 (13.4)

λ : y −Akαlβ = 0 (13.5)

P 1.2- La funcion de costos queda:

C(w, r, y) =( y

A

) 1α+β

( βr

αw)

αα+β w +

(αw

βr)

βα+β r

(13.6)

Por otra parte, las funciones de demandas condicionadas de factores quedan:

kc =( y

A( rβwα)β

) 1α+β (13.7)

Lc =( y

A(wαrβ )α

) 1α+β (13.8)

253

Page 255: Libro Matematicas Para Economistas

254 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

P 1.3- Recuerde que una funcion es homogenea de grado r, si se cumple:

f(λ~x) = λrf(~x) (13.9)

P 1.4- Basta demostrar que:∂C(w, r, y)

∂y≥ 0 (13.10)

lo que es trivial, dada la funcion de costos presentada anteriormente.

P 1.5- Considrese para la respuesta la siguiente matriz Hessiana 1

(∂2C(w,r,y)

∂w2∂2C(w,r,y)

∂r∂w∂2C(w,r,y)

∂w∂r∂2C(w,r,y)

∂r2

)=

(y(α− 1)(α)rαw−α−1φ(α) yα(1− α)rα−1w−αφ(α)yα(1− α)rα−1w−αφ(α) y(α− 1)(α)rα−2w1−αφ(α)

)

con φ(α) = ( α1−α)−α + ( α

1−α)1−α.

Luego, la concavidad a partir del analisis de menores es directa.

P 1.7- Es trivial, pues la concavidad de f(·) requiere que α ≤ 0, β ≤ 0, α + β ≤ 1. Luego, dadoque:

∂2C(w, r, y)∂y2

=( 1α + β

)(1− α− β

α + β

)y

(1−α−β

α+β

)Ω(w, r, α, β) (13.12)

se asegura bajo las condiciones de concavidad de f(·), la convexidad de C(w, r, y) respectode Y .

P 2.2- Las condiciones de primer orden son:

pαxα−11 x2β − w1 = 0 (13.13)

pβxα1 x2β − 1− w2 = 0 (13.14)

P 2.3- Las demandas derivadas de factores quedan:

xd1 =

(w1

(w2α

w1β

)β) 1α+β−1 (13.15)

xd2 =

(w1

(w1β

w2α

)α−1) 1α+β−1 (13.16)

Luego, la funcion de beneficios se encuentra a partir de:

Π = pf(xd1, x

d2)− w1x

d1 − w2x

d2 (13.17)

Los valores optimos en terminos de la maximizacion de la funcion objetivo son xd1 =

29,47, xd2 = 13,26,Π = 176,87

1Es conveniente re-escribir la funcion de costos como:

C(w, r, y) = yrαw1−α((α

1− α)−α + (

α

1− α)1−α) (13.11)

Page 256: Libro Matematicas Para Economistas

13.1. SOBRE CAPITULO 6 255

P 2.4(a)- La matriz hessiana presenta la siguiente forma y valor:

(pα(α− 1)xα−2

1 xβ2 pαβxα−1

1 xβ−12

pαβxα−11 xβ−1

2 pβ(β − 1)xα−11 xβ−1

2

)=

(−0,254 0,3390,339 −0,475

)

Los menores toman los valores H111 = −0,25,H221 = −0,475,H2 = 0,005, por lo que dadoque f(·) es concava si y solo si D2=(·) es semidefinida negativa, es decir (−1)r|rMπ

r | ≤ 0para todo r = 1, ...N y para toda permutacion π.

P 2.4(b)- Dado que se cumple:λ1λ2......λN = Det(HNN ) (13.18)

siendo λi el i-esimo valor propio de la matriz H simetrica, basta asegurar que los dosvalores propios de la matriz sean negativos. Los valores encontrados son λ1

1 = −0,254, λ12 =

−0,475, λ21 = −0,72 y λ2

2 = −0,008. De esta forma se asegura el cumplimiento de lacondicion presentada en 3-4-(a).

P 2.5- Se tendra:

1 4 7 10 13 16 19 22 25 28 31 34

1

23-500

-400

-300

-200

-100

0

100

200

Funcion Objetivo y su Valor Máximos

P 3- Recuerde que las condiciones de Kuhn-Tucker plantean en su caso general, que si el prob-lema es del tipo:

maxx

F (x) (13.19)

sujeto a

Page 257: Libro Matematicas Para Economistas

256 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

g(x) ≤ 0 (13.20)x ≥ 0 (13.21)

las condiciones de primer orden son:

∂F

∂x∗− y∗

∂g

∂x∗≤ 0 (13.22)

( ∂F

∂x∗− y∗

∂g

∂x∗)x∗ = 0 (13.23)

b− g(x∗) = 0; y∗ ≥ 0 (13.24)x∗ ≥ 0 (13.25)

donde y representa el vector de multiplicadores de Lagrange.

Los resultados finales son x∗ = 5, y∗ = −1 y F (−5, 1) = 78.

P 12.1- Las ecuaciones presentadas representan simplemente expresiones para la demanda agrega-da y para la oferta agregada, teniendo tras ellas la logica estandar (se complementa con eldesarrollo presentado a continuacion).

Nota:El siguiente desarrollo supone una funcion de perdida Ψ = E[α(πt − π∗)2 + (1 −α)(yt − y∗)2], que no es mas que el caso general de lo expresado en el enunciado.

P 12.2- La autoridad debera resolver

mınrt

Ψ(yt(rt)πt(rt)) = mınrt

Ψ(rt) = E[α(πt − π∗)2 + (1− α)(yt − y∗)2] (13.26)

o tomando las ecuaciones para el logaritmo del producto y la inflacion

mınrt

Ψ(rt) = E[α(−(rt − dt)− wst − π∗)2 + (1− α)(γ(rt − dt) + st − y∗)2] (13.27)

Considerando que

∂yt

∂dt= −γ > 0 (13.28)

∂πt

∂dt= 1 > 0 (13.29)

∂yt

∂st= 1 > 0 (13.30)

∂πt

∂st= −w < 0 (13.31)

Page 258: Libro Matematicas Para Economistas

13.1. SOBRE CAPITULO 6 257

observamos que existe un movimiento en la misma direccion de las variables inflacion yproducto respecto del shock de demanda, cosa que no ocurre en el caso del shock de oferta.Por lo tanto, observando que

∂yt

∂rt= γ < 0 (13.32)

∂πt

∂rt= −1 < 0 (13.33)

se puede concluir que dado que las acciones de polıticas afectan en la misma direccion alas variables de interes (tal como ocurre con el shock de demanda agregada) , sera el shockde oferta el que mas debe preocupar a la autoridad, producto que este implica un dilemarespecto de cuan efectiva puede ser la polıtica.

P 12.3- La condicion de primer orden queda Ψ′(r∗t ) = E[−2α[−(r∗t − dt) − wst − π∗] + 2(1 −α)γ[γ(r∗t − dt) + st − y∗]] = 0, desde donde se puede concluir que

α[−(r∗t − dt)− wst − π∗] = (1− α)γ[γ(r∗t − dt) + st − y∗]

r∗t [(1− α)γ2 + α] = [γ2(1− α) + α]dt − [γ(1− α) + wα]st + γ(1− α)y∗ − απ∗

r∗t =γ2(1− α) + α

(1− α)γ2 + αdt +

(−γ(1− α)− wα)(1− α)γ2 + α

st + γ(1− α)y∗ − απ∗

desde donde se observa la relacion lineal entre la tasa optima o regla de polıtica y los shocks.En particular, se tiene que r∗t = adt+bst+c, donde a = 1 producto de la relacion enunciadaen la parte (1) respecto de la posibilidad de contrarrestar one by one los efectos de shocksde demanda agregada vıa los movimientos tasa de interes. Por otro lado b = (−γ(1−α)−wα)

(1−α)γ2+α,

apreciandose entonces el trade-off para la polıtica respecto de los shocks de oferta, y quedepende de las pendientes de la demanda (w) y oferta agregada (γ) y de la aversion de laautoridad (α).

P 12.4- Reemplazando r∗t = adt + bst + c en yt = γ(rt − dt) + st y en π= − (rt − dt)−wst, se tiene

yt = γadt + (1 + γb)st + c1 y πt = (1− a)dt − (b + w)st + c2

con c1 y c2 constantes. Recordando que los movimientos en la tasa de interes eliminarancualquier efecto de los shocks de demanda agregada, se tendra que solo la varianza delos shocks de oferta tendran efectos sobre la inflacion y el producto, por lo que aplicandooperador varianza a ambos lados de las expresiones anteriores se tendra:

σ2y = (1 + γb)2σ2

sσ2π = (b + w)2σ2

s

A partir de b = (−γ(1−α)−wα)(1−α)γ2+α

, la expresion σ2y

σ2π

= (1+γb)2

(b+w)2, puede expresarse como:

σ2y

σ2π

=(1 + γ (−αw−(1−α)γ)

(α+(1−α)γ2))2

( (−αw−(1−α)γ)(α+(1−α)γ2)

+ w)2(13.34)

σ2y

σ2π

=α2

(1− α)2γ2(13.35)

Page 259: Libro Matematicas Para Economistas

258 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

Luego, si α = 0 se tiene que σ2y

σ2π

= 0, dado que la autoridad solo se preocupa de la

variabilidad del producto y del mismo modo, si α = 1 se tiene que σ2y

σ2π

= 1, dado que laautoridad en este caso solo se preocupa de la variabilidad de la inflacion. Ambas ideas sedesprenden de la forma de la funcion objetivo.

13.2. Sobre Capıtulo 7

P 1.1- Las expresiones finales son:

yT = (1 +√

128

)e−√12+4

2x −

√128

e−√12−4

2x (13.36)

yT = yH + yP = e−2x(c1 cos√

5x + c2 sin√

5x) +x2

9+

19x

81− 94

729(13.37)

yT = yH + yP = e−x2 (c1 cos

√34

+ c2 sin√

34) +

x3ex

3− x2ex +

4xex

3− 2ex

3(13.38)

P 2 Lo mas importante es el considerar que el resultado general que determina la caracterısticadel proceso tras la ecuacion en diferencia es:

λ1 =t1 +

√t21 + 4t2

2(13.39)

λ2 =t1 −

√t21 + 4t2

2(13.40)

y que el requisito fundamental para que el proceso sea estacionario, es que tanto λ1 comoλ2, tengan un modulo menor en valor absoluto a 1.

A continuacion se presentan dos simulaciones. La primera considera a t1 = 0,2 y t2 = 0,4.El segundo considera a t1 = 1,1 y t2 = 0,9.

Page 260: Libro Matematicas Para Economistas

13.2. SOBRE CAPITULO 7 259

Page 261: Libro Matematicas Para Economistas

260 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

P 4.1- La primera ecuacion representa el equilibrio en el mercado de bienes (IS), la segundamuestra el equilibrio en el mercado del dinero (LM) y la ultima, representa la ecuacion demovimiento para los precios, es decir, la ecuacion para inflacion. Los parametros son talque a > 0, k > 0 y θ > 0.

P 4.2(a)- Utilizando el modelo, y resolviendo se tiene:

yt = a(mt − pt)(1− θa)k

(13.41)

por lo que dado que los precios no pueden saltar en t0, se tendra:

y0 = a(m1)

(1− θa)k< 0 (13.42)

Page 262: Libro Matematicas Para Economistas

13.3. SOBRE CAPITULO 8 261

De la misma forma, la tasa de interes sera:

i0 =−m1

k> 0 (13.43)

Respecto a la respuesta de y0 ante un cambio en θ, notar:

∂y0

∂θ=

a2m1

k(1− θa)2< 0 (13.44)

La intuicion para tal resultado, proviene del aumento en la tasa de intereres real en t0.

P 4.2(b)- Para t ≥ 0, se tiene:

yt = a(mt − pt)(1− θa)k

(13.45)

y diferenciando respecto al tiempo se tiene:

yt =−aθyt

k(1− aθ)(13.46)

resolviendo para yt se obtiene la trayectoria para t ≥ 0:

yt = e( −aθ

k(1−aθ)t) am1

k(1− aθ)(13.47)

P 4.3- Reemplazando el resultado anterior en V y resolviendo la integral se obtiene:

V =∫ −∞

t0y2

t dt =∫ −∞

t0e( −aθ

k(1−aθ)t) am1

k(1− a)θdt =

a(m1)2

2k(θ − aθ2)(13.48)

Por lo que claramente:∂V

∂θ= −(1− 2aθ)2k

a(m1)2

(2k(θ − aθ2))2(13.49)

Por lo tanto, el signo de la derivada quedera en funciøn de si 12a <=> θ.

13.3. Sobre Capıtulo 8

P 1.1- Las ecuaciones corresponden a una curva de phillpis aumentada (ecuacion 1), Ley deOkun (ecuacion 2), Teorıa Cuantitativa ((ecuacion 3) y expectativas adaptativas sobre lainflacion esperada (ecuacion 4).

Los parametros deben cumplir con: α < 0, β > 0 y γ > 0.

P 1.2- El sistema puede ser re-escrito como:

u = −γ(θ − πe − α(u− µ)− g) (13.50)

π2 = αβ(µ− µ) (13.51)

El diagrama de fase se presenta en la Figura 1.

Page 263: Libro Matematicas Para Economistas

262 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

u

pi(e) a

ab

b

u*

Figura 1

La recta aa representa el locus de punto donde πe = 0, mientras que bb corresponde a µ = 0.

La condicion sobre los parametros debe asegurar la exstencia de un espiral convergente.Tomando luego la matriz A del sistema, tal que,

A =

(αγ γαβ 0

)

y asegurando que los valores propios que de ella se obtengan sean complejos, con su partereal menor que cero, se tiene que β > −αγ

4 .

P 1.3- La figura 2, muestra el efecto sobre el sistema descrito anteriormente:

u

pi(e) a

ab

b

u*

b'

b'

u*=g*=0

g

u

u,g

tiempo

tiempo

pi,pi(e)pi

pi(e)pi=pi(e)=theta0

c

c

Figura 2

t0 t1

Page 264: Libro Matematicas Para Economistas

13.3. SOBRE CAPITULO 8 263

P 1.4- Su respuesta no se altera, pues las expectativas son adaptativas.

P 1.5- Para tales efectos se puede plantear:

πt = πet + α(µt − µ) (13.52)

µt − µt−1 = −γ(gt − g) (13.53)

gt = θ − πt (13.54)

πet − πe

t−1 = β(πt−1 − πet−1) (13.55)

por lo que si se resuelve, se llega a:

πet = πe

t−1 + β(πt−1 − πet−1) (13.56)

µt =µt−1 − γ(θ − (1− β)πe

t−1 − βπt−1 + αu− g)1− αγ

(13.57)

gt = θ − πt (13.58)

πt = πet−1 + β(πt−1 − πe

t−1) + α(µt − u) (13.59)

P 1.6- Si es que simulamos la estructura presentada en la pregunta anterior, con los siguientesvalores para los parametros: α = −0,7, β = 0,9, γ = 1,09 y tomando 20 repeticiones,tendremos 2:

2Se presenta a la linea segmentada a trazos largos como el desempleo, segmentada a trazos cortos como lainflacion, con puntos separados a la tasa de crecimiento de la economıa y la ultima linea (los puntos juntos)representa la inflacion esperada.

Page 265: Libro Matematicas Para Economistas

264 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

13.4. Sobre Capıtulo 9

Es importante que recuerde que si la funcion integrante es F (y, y, t), entonces la ecuacionEuler queda:

Fyyy(t) + Fyyy(t) + Fty − Fy = 0 ∀t ∈ [0, T ] (13.60)

Tal expresion debe ser adecuada al caso que se este considerando. En cuanto a la condicion detransversalidad, lo importante es recordar que en el caso general es de interes:

[F − yFy]t=T ∆T + [Fy]t=T ∆y(T ) = 0 (13.61)

Page 266: Libro Matematicas Para Economistas

13.5. SOBRE CAPITULO 11 265

desde donde deben considerarse los casos de lınea terminal vertical, lınea terminal horizontal,curva terminal, lınea terminal vertical truncada o lınea terminal horizontal truncada.

13.5. Sobre Capıtulo 11

P 1.1-

La ecuacion de Bellman sera de la forma:

V (At) = U(ct) + (1 + θ)−1Et(V (At+1)) (13.62)

donde V (at) es la funcion de valor correspondiente al perıodo t, y representa el valoroptimo de la funcion objetivo del problema de programacion dinamica (no presentado ex-plıcitamente aquı), es decir, representa el valor de la funcion objetivo evaluada en la sendaoptima de la variable de control ct = c(t).La condicion de primer orden queda U ′(ct) + (1 + θ)−1(−1)(1 + r)V ′(At+1) = 0, desdedonde despejando y aplicando el teorema de la envolvente se obtieneU ′(ct) = 1+r

1+θEt(U ′(ct+1)) o equivalentemente, considerando la funcion de utilidad in-stantanea CRRA:

c−γt =

1 + r

1 + θEt(c

−γt+1) (13.63)

P 1.2- Debe considerarse que E(c−γt+1) = E(elog(c−γ

t+1)). Por otra parte si log(ct+1) ∼ N(E(log(ct+1)), σ2)se cumple que −γlog(ct+1) ∼ N(E(−γlog(ct+1)), γ2σ2). Por lo tanto, de la Ayuda pode-

mos concluir que E(elog(c−γt+1)) = eE(−γlog(ct+1))+

γ2σ2

2 .Luego, si es que aplicamos logaritmo a ambos lados de la condicion de primer orden ytomamos los anteriores resultados se obtiene que

log(c−γt ) = log(

1 + r

1 + θ) + log(Et(ct+1−γ)) (13.64)

log(c−γt ) = log(

1 + r

1 + θ) + log(Et(elog(c−γ

t+1))) (13.65)

log(c−γt ) = log(

1 + r

1 + θ) + log(eEt(−γlog(ct+1))+

γ2σ2

2 ) (13.66)

desde donde se obtiene que

γEt(log(ct+1)) = log(1 + r

1 + θ) + γlog(ct) +

γ2σ2

2(13.67)

P 1.3- Si observamos que θ = r la expresion anterior queda:

γEt(log(ct+1)) = log(1) + γlog(ct) +γ2σ2

2(13.68)

γEt(log(ct+1)) = γlog(ct) +γ2σ2

2(13.69)

por lo que observamos que la incertidumbre existente en la decision de consumo del agente,representado por la presencia de la varianza del consumo en la ecuacion de Euler (o condi-cion de Keynes-Ramsey), afecta la tasa de crecimiento del mismo. En terminos formales, se

Page 267: Libro Matematicas Para Economistas

266 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

puede observar que Et(log(ct+1)) = log(ct) + γ(σ)2

2 ⇐⇒ Et(log(ct+1)− log(ct)) = γσ2

2 ⇐⇒Et(log( ct+1

ct)) = γσ2

2 , por lo que si es que suponemos una tasa de crecimiento del consumoρc (pequea), es decir, ct+1 = (1+ρc)ct ⇐⇒ ct+1

ct= (1+ρc) y recordando que log(1+r) ≈ r,

cuando r es pequeo, se puede concluir que:

Et(log(ct+1

ct)) =

γσ2

2≈ Et(ρc) (13.70)

desde donde se observa que ∂ρc

∂σ2 ≈ γ2 > 0, es decir, la tasa de crecimiento del consumo

aumenta si es que aumenta la varianza del mismo. La intuicion para esto es que la existenciade U ′′′ > 0 hace que el consumidor sea prudente, debido al argumento de ahorro porprecaucion, elevandose luego la utilidad marginal del consumo presente producto de lapresencia de incertidumbre (se consume menos hoy) por lo que el crecimiento esperadodel consumo debe ser mayor. La existencia de γ viene ası validada por su influencia en laconvexidad de la utilidad marginal del consumo. En otras palabras, un mayor (menor) γ(una utilidad marginal mas (menos) convexa) provoca una influencia mayor (menor) dela varianza sobre la tasa de crecimiento del consumo. En el caso de funciones de utilidadcuadratica, la existencia de U ′′′ = 0, asegura la no existencia de influencia de la varianzadel consumo sobre la tasa de crecimiento del mismo, basicamente por la existencia de unamartingala en el consumo.

P 1.4-

Tomando la expresion

(Et(log(ct+1

ct))) =

log(1+r1+θ )γ

+γσ2

2(13.71)

suponiendo θ < r y σ2 −→ 0 se tiene que

Et(log(ct+1

ct) =

log(1+r1+θ )γ

≈ Et(ρc) > 0 (13.72)

es decir, la tasa de crecimiento del consumo es mayor que cero. La intuicion para esto es queel agente observa una tasa de interes de mercado mayor a su tasa de interes subjetiva, porlo que considererara atractiva la idea de posponer su consumo. El efecto de γ en este casoes negativo, producto de que una mayor aversion al riesgo obliga a que el agente aplanemas su consumo, teniendose entonces una menor tasa de crecimiento para el mismo.

P 2 Usando el algoritmo de programacion dinamica, la solucion del problema en el perıodofinal es:

J∗t1(c) = maxut1=c

−u2t1 = −c2 (13.73)

El funcional para el penultimo perıodo sera:

J∗t1−1(c) = max0≤ut1≤c

[−u2t1−1 + J∗t1(c− ut1−1)] (13.74)

pero ocupando el resultado de J∗t1(c) se tendrıa:

J∗t1−1(c) = max0≤ut1−1≤c

[−u2t1−1 − (c− ut1−1)2] (13.75)

Page 268: Libro Matematicas Para Economistas

13.5. SOBRE CAPITULO 11 267

Resolviendo para ut1−1 desde condicion de primer orden se obtiene ut1−1 = 12c, lo cual

es consistente con la condicion 0 ≤ ut1 ≤ c. La respuesta entonces es que la mitad de losrecursos debe ser asignada en cada perıodo. El siguiente funcional serıa:

J∗t1−2(c) = max0≤ut1−2≤c

[−u2t1−2 + J∗t1−1(c− ut1−2)] (13.76)

pero sabemos que J∗t1−1 = −12c2, luego:

J∗t1−2(c) = max0≤ut1−2≤c

[−u2t1−2 −

12(c− ut1−2)2] (13.77)

y para un maximo se debe asegurar ut1−2 = 13c, por lo que se puede afirmar que un tercio

de los recursos se asignara en t1− 2, dejando el resto divido en partes iguales para los dossiguientes perıodos.En general, se puede afirmar que la solucion optima implica:

ut0 = ut0+1 = ut0+2 = ... =c

(t1 − t0) + 1(13.78)

es decir, se debe asignar el mismo monto de recursos a cada perıodo para minimizar lasuma de los cuadrados.

P 3- La idea entonces es la aplicacion de un algoritmo para la resolucion de ejercicios de pro-gramacion dinamica determinıstico. Consideremos para eso que la funcion de costos en elperıodo 2 sera de la forma:

J2(x2) = r(x2 − T )2 (13.79)

Para el perıodo inmediatamente anterior se puede plantear:

J1(x1) = mınu1

[u21 + J2(x2)] (13.80)

J1(x1) = mınu1

[u21 + J2((1− a)x1 + au1)] (13.81)

Sustituyendo entonces por la forma de J2, se tiene:

J1(x1) = mınu1

[u21 + r[(1− a)x1 + au1 − T ]2] (13.82)

Aplicando la condicion de primer orden respecto a u1, se obtiene:

0 = 2u1 + 2ra[(1− a)x1 + au1 − T ] (13.83)

desde donde se encuentra la temperatura optima del ultimo horno:

u∗1(x1) =ra[T − (1− a)x1]

1 + ra2(13.84)

La ultima ecuacion nos muestra el valor optimo para u1 dado el correspondiente valor delestado x1.Sustituyendo el optimo u1 dentro de la expresion para J1 se obtiene:

J1(x1) =r2a2[(1− a)x1 − T ]2

(1 + ra2)2+ r[(1− a)x1 +

ra2[T − (1− a)x1]1 + ar2

− T ]2 (13.85)

J1(x1) =r2a2[(1− a)x1 − T ]2

(1 + ra2)2+ r(

ra2

1 + ra2− 1)2[(1− a)x1 − T ]2 (13.86)

J1(x1) =r[(1− a)x1 − T ]2

(1 + ra2)(13.87)

Page 269: Libro Matematicas Para Economistas

268 CAPITULO 13. RESPUESTAS Y COMENTARIOS A EJERCICIOS

Sabemos por lo tanto, que aplicando el mismo algoritmo en el perıodo anterior tendremos:

J0(x0) = mınu0

[u20 + J1(x1)] (13.88)

J0(x0) = mınu0

[u20 + J1((1− a)x0 + au0)] (13.89)

y por la sustitucion de la expresion encontrada para J1, sera:

J0(x0) = mınu0[u20 +

r[(1− a)2x0 + (1− a)au0 − T ]2

1 + ra2] (13.90)

Minimizando respecto a u0, la condicion de primer orden queda como:

0 = 2u0 +2r(1− a)a[(1− a)2x0 + (1− a)au0 − T ]2

1 + ra2(13.91)

Despejando para la temperatura optima del primer horno:

u0 = u∗0(x0) =r(1− a)a[T − (1− a)2x0]

1 + ra2[1 + (1 + a)2](13.92)

El costo optimo se obtiene reemplazando u∗0 en la expresion para J0. Resolviendo esto seencuentra:

J0(x0) =r[(1− a)2x0 − T ]2

1 + ra2[1 + (1− a)2](13.93)

lo que resuelve el problema.

Page 270: Libro Matematicas Para Economistas

Bibliografıa

[1] Robert Barro y Xavier Sala-i-Martin. Economic Growth. McGraw-Hill Book Company,1995.

[2] Claude Berge.Topological Space. Dover Publications, Inc, 1997.

[3] Dimitri Bertsekas.Dynamic Programming. Prentice Hall Press, 1987.

[4] Dimitri Bertsekas.Dynamic Programming and Optimal Control. Athena Scientfic, Belmont,Massachusetts, 1995.

[5] Olivier Blanchard y Stanley Fisher.Lectures on Macroeconomics. The MIT Press, 1996.

[6] Andrew Browder. Mathematical Analysis, an introduction. Springer Verlag, 1996.

[7] James Hamilton.Times Series Analysis. Princeton University Press, 1994.

[8] Werner Hildenbrand.Core and Equilibria of a Large Economy. Princeton University Press,1974.

[9] Kenneth Hoffman y Ray Kunze.Algebra Lineal. Editorial Prentice/Hall internacional, 1971.

[10] Michael Intriligator.Mathematical Optimization and Economic Theory. Prentice Hall, 1971.

[11] Morton Kamien y Nancy Schwartz.Dynamic Optimization. ELSEVIER, 1991.

[12] Donald Kreider, Robert Kuller y Donald Ostberg.Ecuaciones Diferenciales. Fondo Educa-tivo Interamericano S.A., 1973.

[13] David Luenberger.Programacin Lineal y No Lineal. Addison-Wesley Iberoamericana, 1989.

[14] Andreu Mas-Colell, Michael Whinston y Jerry Green.Microeconomics Theory. Oxford Stu-dent Edition, 1995.

[15] David Romer.Advanced Macroeconomics. McGraw-Hill,1996.

[16] Thomas Sargent.Macroeconomic Theory. Academic Press,1987.

[17] Thomas Sargent.Dynamic Macroeconomic Theory. Harvard University Press,1997.

[18] LaMar Timothy y Blair Bona.State Space Analysis: An Introduction. McGraw-Hill BookCompany, 1968.

[19] Murray Spiegel.Ecuaciones Diferenciales Aplicadas. Prentice Hall,1983.

[20] Akira Takayama.Analytical Methods in Economics. The University of Michigan Press, 1993.

[21] Hal Varian .Microeconomics Analysis. W.W. Norton and Company, 1992.

269