cap´ıtulo 2.11 - gradiente e hessiana · ca´lculo 2 - cap´ıtulo 2.11 - gradiente e hessiana 1...

24
alculo 2 - Cap´ ıtulo 2.11 - Gradiente e hessiana 1 Cap´ ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova nota¸ ao 2.11.4 - O gradiente e as curvas de n´ ıvel 2.11.2 - Gradiente e hessiana 2.11.5 - Interpreta¸ ao econˆ omica do gradiente 2.11.3 - Significado do gradiente Vimos nos ´ ultimos dois cap´ ıtulos como calcular derivadas de primeira e de segunda ordens (de ordens superiores, tamb´ em) de fun¸ oes de duas ou mais vari´ aveis reais. Veremos agora como organizar essas derivadas, em termos do vetor gradiente e da matriz hessiana, de um modo que ser´ util na maximiza¸ ao ou minimiza¸ ao dessas fun¸ oes. Veremos tamb´ em o significado do vetor gradiente. 2.11.1 - Nova nota¸c˜ ao Quando tratamos da derivada de fun¸ oes de uma vari´ avel real, existem dois tipos de nota¸ ao, usadas de acordo com a comodidade e da preferˆ encia da pessoa que as usa: a nota¸ ao de Leibniz, df dx , e a nota¸ ao de Newton, f (x). A primeira enfatiza o fato da derivada ser um limite de uma taxa de varia¸ ao e a segunda ressalta o fato da derivada ser uma fun¸ ao. At´ e o momento, temos usado uma nota¸ ao mais ao estilo de Leibniz para derivadas parciais: ∂f ∂x i . Veremos agora uma nota¸ ao mais ao estilo de Newton. Primeiro, n˜ ao podemos utilizar a nota¸ ao f (x), pois temos que especificar com rela¸ ao a qual vari´ avel estamos derivando. A solu¸ ao ´ e escrever f x = ∂f ∂x e f y = ∂f ∂y . Note que a nota¸ ao utiliza um x como subscrito (letra menor, colocada um pouco abaixo da base da letra f ) para designar a derivada parcial com rela¸ ao a x e um y subscrito para designar a derivada com rela¸ ao a y. Exemplo 1: calcule as derivadas parciais da fun¸ ao f (x, y)= x 3 y 2 . Solu¸ ao: escrevendo f (x, y)=(x 3 y 2 ) 1/2 , calculamos f x = 1 2 (x 3 y 2 ) 1/2 · 3x 2 = 3x 2 2 x 3 y 2 e f y = 1 2 (x 3 y 2 ) 1/2 · (2y)= y x 3 y 2 . Essa nota¸ ao tamb´ em ´ e facilmente generalizada para o caso de fun¸ oes com mais de duas vari´ aveis, como no exemplo a seguir. Exemplo 2: calcule as derivadas parciais da fun¸ ao f (x,y,z)=2 x ln(y z). Solu¸ ao: as derivadas parciais ficam f x =2 x ln 2 ln(y z ) , f y = 2 x y z e f z = 2 x y z . A nota¸ ao para derivadas parciais de segunda ordem ´ e dada a seguir: f xx =(f x ) x = 2 f ∂x 2 , f xy =(f x ) y = 2 f ∂y∂x , f yx =(f y ) x = 2 f ∂x∂y , f yy =(f y ) y = 2 f ∂y 2 .

Upload: nguyenbao

Post on 24-Sep-2018

232 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 1

Capıtulo 2.11 - Gradiente e hessiana

2.11.1 - Nova notacao 2.11.4 - O gradiente e as curvas de nıvel2.11.2 - Gradiente e hessiana 2.11.5 - Interpretacao economica do gradiente2.11.3 - Significado do gradiente

Vimos nos ultimos dois capıtulos como calcular derivadas de primeira e de segunda ordens (de ordenssuperiores, tambem) de funcoes de duas ou mais variaveis reais. Veremos agora como organizar essas derivadas,em termos do vetor gradiente e da matriz hessiana, de um modo que sera util na maximizacao ou minimizacaodessas funcoes. Veremos tambem o significado do vetor gradiente.

2.11.1 - Nova notacao

Quando tratamos da derivada de funcoes de uma variavel real, existem dois tipos de notacao, usadas de

acordo com a comodidade e da preferencia da pessoa que as usa: a notacao de Leibniz,df

dx, e a notacao de

Newton, f ′(x). A primeira enfatiza o fato da derivada ser um limite de uma taxa de variacao e a segundaressalta o fato da derivada ser uma funcao. Ate o momento, temos usado uma notacao mais ao estilo de Leibniz

para derivadas parciais:∂f

∂xi. Veremos agora uma notacao mais ao estilo de Newton.

Primeiro, nao podemos utilizar a notacao f(x), pois temos que especificar com relacao a qual variavelestamos derivando. A solucao e escrever

fx =∂f

∂xe fy =

∂f

∂y.

Note que a notacao utiliza um x como subscrito (letra menor, colocada um pouco abaixo da base da letra f)para designar a derivada parcial com relacao a x e um y subscrito para designar a derivada com relacao a y.

Exemplo 1: calcule as derivadas parciais da funcao f(x, y) =√

x3 − y2.

Solucao: escrevendo f(x, y) = (x3 − y2)1/2, calculamos

fx =1

2(x3 − y2)−1/2 · 3x2 =

3x2

2√

x3 − y2e fy =

1

2(x3 − y2)−1/2 · (−2y) =

−y√

x3 − y2.

Essa notacao tambem e facilmente generalizada para o caso de funcoes com mais de duas variaveis, comono exemplo a seguir.

Exemplo 2: calcule as derivadas parciais da funcao f(x, y, z) = 2x ln(y − z).

Solucao: as derivadas parciais ficam

fx = 2x ln 2 ln(y − z) , fy =2x

y − ze fz =

−2x

y − z.

A notacao para derivadas parciais de segunda ordem e dada a seguir:

fxx = (fx)x =∂2f

∂x2, fxy = (fx)y =

∂2f

∂y∂x, fyx = (fy)x =

∂2f

∂x∂y, fyy = (fy)y =

∂2f

∂y2.

Page 2: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 2

Exemplo 3: calcule as derivadas parciais de segunda ordem da funcao f(x, y) =√

x3 − y2.

Solucao: utilizando as derivadas parciais calculadas no exemplo 1 escritas sob a forma de potencias:

fx =3

2x2(x3 − y2)−1/2 e fy = −y(x3 − y2)−1/2 ,

temos

fxx =3

2· 2x · (x3 − y2)−1/2 +

3

2x2 ·

(

−1

2

)

(x3 − y2)−3/2 · 3x2 = 3x(x3 − y2)−1/2 − 9

4x2(x3 − y2)−3/2 ,

fxy = fyx =3

2x2 ·

(

−1

2

)

(x3 − y2)−3/2 · (−2y) =3

2x2y(x3 − y2)−3/2 ,

fyy = −1 · (x3 − y2)−1/2 − y ·(

−1

2

)

(x3 − y2)−3/2 · (−2y) = −(x3 − y2)−1/2 − y2(x3 − y2)−3/2 .

A notacao para as derivadas parciais de funcoes de mais de duas variaveis, ou a notacao de derivadas parciaisde ordens superiores a dois, pode ser facilmente deduzida a partir daı.

2.11.2 - Gradiente e hessiana

Agora introduziremos dois conceitos que nos serao uteis quando formos trabalhar em otimizacao: os degradiente e hessiana. O gradiente de uma funcao de duas variaveis reais e um vetor (matriz 2 × 1) definidocomo

~∇f(x, y) =

(

fx

fy

)

,

e a hessiana e a matriz

H(f) =

(

fxx fxy

fyx fyy

)

.

Exemplo 1: calcule o gradiente e a hessiana da funcao f(x, y) = xy2 + 2x.

Solucao: o gradiente e a hessiana ficam

~∇f(x, y) =

(

fx

fy

)

=

(

y2 + 22xy

)

, H(f) =

(

fxx fxy

fyx fyy

)

=

(

0 2y2y 2x

)

.

Esses dois conceitos podem ser generalizados para funcoes de n variaveis reais, como veremos a seguir paran = 3.

~∇f(x, y, z) =

fx

fy

fz

, H(f) =

fxx fxy fxz

fyx fyy fyz

fzx fzy fzz

.

Exemplo 2: calcule o gradiente e a hessiana da funcao f(x, y) = x ln(yz).

Solucao: temos

~∇f(x, y, z) =

fx

fy

fz

=

ln(yz)x/yx/z

, H(f) =

fxx fxy fxz

fyx fyy fyz

fzx fzy fzz

=

0 1/y 1/z1/y −x/y2 01/z 0 −x/z2

.

O gradiente e a hessiana podem ser calculados em pontos especıficos, como mostra o exemplo a seguir.

Page 3: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 3

Exemplo 3: calcule o gradiente e a hessiana da funcao f(x, y) = xy2 + 2x em (x, y) = (1,−1).

Solucao: dados o gradiente e a hessiana calculados no exemplo 1, temos

~∇f(1,−1) =

(

(−1)2 + 22 · 1 · (−1)

)

=

(

3−2

)

, H(f) =

(

0 2(−1)2(−1) 2 · 1

)

=

(

0 −2−2 2

)

.

Podemos nos perguntar, com toda a razao, quais sao os significados do gradiente e da hessiana. A respostapara o gradiente e dada a seguir. Para a hessiana, teremos que esperar mais um pouco.

2.11.3 - Significado do gradiente

O gradiente tem uma caracterıstica muito importante, que sera mostrada nos exemplos a seguir.

Exemplo 1: calcule o gradiente de f(x, y) = x2 + y2 em (x, y) = (1, 0), (x, y) = (0, 1), (x, y) = (1, 1) e(x, y) = (0, 0) e desenhe esses vetores sobre as curvas de nıvel da funcao.

Solucao: o gradiente de f(x, y) = x2 + y2 fica

~∇f(x, y) =

(

fx

fy

)

=

(

2x2y

)

.

Calculado nos pontos desejados, temos

~∇f(1, 0) =

(

20

)

, ~∇f(0, 1) =

(

02

)

, ~∇f(1, 1) =

(

22

)

, ~∇f(0, 0) =

(

00

)

.

Note que cada gradiente e um vetor, onde a primeira linha e a sua primeira componente e a segunda linha e asua segunda componente. Por exemplo, ~∇f(1, 0) e um vetor que, a partir do ponto (1, 0), se desloca duas unidades

a direita; o vetor ~∇f(0, 1) se desloca duas unidades para cima a partir do ponto (0, 1). A seguir, representamoscada um desses vetores sobre as curvas de nıvel da funcao. A funcao em tres dimensoes (um paraboloide), com osvetores gradientes, e mostrada na ultima figura a seguir.

x

y

−3 −2 −1 0 1 2 3

−3

−2

−1

1

2

3

b b x

y

−3 −2 −1 0 1 2 3

−3

−2

−1

1

2

3

b

b

x

y

−3 −2 −1 0 1 2 3

−3

−2

−1

1

2

3

b

b

x

y

−3 −2 −1 0 1 2 3

−3

−2

−1

1

2

3

bb

x y

z

1.02.0

3.0

-1.0

-2.0

-3.0

-4.0

1.02.0

3.0

-1.0

-2.0

-3.0

-4.0

1.0

2.0

3.0

4.0

b

b

b

Page 4: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 4

Note que os vetores gradiente sempre idicam a direcao onde a funcao aumenta mais rapidamente e que, noponto onde a funcao e mınima, o vetor gradiente se anula. Vamos verificar esse comportamento em uma outrafuncao.

Exemplo 2: calcule o gradiente de f(x, y) = 4 − x2 − y2 + 2x + y + xy em (x, y) = (1, 0), (x, y) = (0, 1),(x, y) = (1, 1) e (x, y) = (0, 0) e desenhe esses vetores sobre as curvas de nıvel da funcao.

Solucao: o gradiente de f(x, y) = 4 − x2 − y2 + 2x + y + xy fica

~∇f(x, y) =

(

fx

fy

)

=

(

−2x + 2 + y−2y + 1 + x

)

.

Calculado nos pontos desejados, temos

~∇f(1, 0) =

(

02

)

, ~∇f(0, 1) =

(

3−1

)

, ~∇f(1, 1) =

(

10

)

, ~∇f(0, 0) =

(

21

)

.

A seguir, representamos cada um desses vetores sobre as curvas de nıvel da funcao. A funcao em tres dimensoes(um paraboloide elıptico), com os vetores gradientes e mostrada na ultima figura a seguir.

x

y

−2 −1 0 1 2 3 4 5

−2

−1

1

2

3

4

5

b

b x

y

−2 −1 0 1 2 3 4 5

−2

−1

1

2

3

4

5

bb

x

y

−2 −1 0 1 2 3 4 5

−2

−1

1

2

3

4

5

bb

x

y

−2 −1 0 1 2 3 4 5

−2

−1

1

2

3

4

5

b

b

x y

z

1.02.0

3.0

-1.0

-2.0

-3.0

-4.0

1.02.0

3.0

-1.0

-2.0

-3.0

-4.0

1.0

2.0

3.0

4.0

5.0

6.0

b

b

Como no exemplo 1, os vetores gradiente seguem sempre a direcao para onde a funcao cresce mais rapida-mente a partir do ponto dado. Outra caracterıstica e que o vetor gradiente em um determinado ponto sempresegue uma reta perpendicular a curva de nıvel naquele ponto.

Um exemplo pode facilitar a compreensao da utilidade do gradiente: consideremos um aplpinista mıope quequer subri uma montanha. Ele so enxerga claramente ate dois metros de distancia e nao tem como enxergarmais longe que isso. Como ele fara para subir a montanha?

Uma resposta e que ele pode, dentro de seu campo de visao, identificar para onde o terreno tem ummaior aclive (sobe mais rapidamente) e subir um pouco naquela direcao e sentido. Depois, ele para e verificanovamente o terreno em torno de onde ele esta. Segue novamente a direcao para onde o terreno for mai ıngremee repete o processo ate que o terreno nao tenha mais para onde subir.

Essa tatica pode ou nao funcionar, pois o alpinista, caso nao se defronte com algum abismo pelo caminho,pode acabar chegando a um pico (maximo) local, achando que ja chegou ao poco da montanha, quando ainda

Page 5: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 5

esta bem longe dela. A figura a seguir ilustra dois caminhos obtidos usando o gradiente como guia: no primeirocaminho (em vermelho), chega-se ao topo do maior dos dois picos; no segundo (azul), chega-se apenas a ummaximo local.

Concluindo esta secao, o gradiente e um vetor que da a direcao de maior crescimento da funcao a partirde um determinado ponto. Isto sera muito util na maximizacao ou minimizacao de uma funcao (a LeituraComplementar 1.5.1 traz um metodo numerico utilizando o gradiente para determinar maximos e mınimos defuncoes de diversas variaveis). A hessiana servira mais tarde para verificar se um determinado ponto crıtico eum maximo, um mınimo ou um ponto de inflexao (ponto se sela). A demonstracao disto necessita do conceitode derivada direcional e sera feita em uma leitura complementar do Modulo 2 deste curso.

2.11.4 - O gradiente e as curvas de nıvel

Algo que pode ser notado nas figuras dos exemplos da secao anterior e que o vetor gradiente e sempreperpendicular a curva de nıvel da qual ele parte. Isto sera provado agora, utilizando a regra da cadeia,aprendida no Capıtulo 2.8.

A regra da cadeia para uma funcao f(x, y), ou seja, uma funcao f : D(f) ⊂ R2 → R, onde x = x(t) e

y = y(t), e dada pordf

dt(t) =

∂f

∂x(x, y)

dx

dt(t) +

∂f

∂y(x, y)

dy

dt(t) .

Se considerarmos uma curva que seja a imagem de uma funcao vetorial γ (x(t), y(t)), podemos escrever f (γ(t))

e γ′(t) =

(

dx

dt(t),

dy

dt(t)

)

, de modo que a mesma expressao para a regra da cadeia possa ser escrita

df

dt(γ(t)) =

∇f (γ(t)) , γ′(t)⟩

,

isto porque 〈∇f (γ(t)) , γ′(t)〉, o produto interno do gradiente pela derivada da funcao vetorial γ(t), e dado por

∇f (γ(t)) , γ′(t)⟩

=

⟨(

∂f

∂x(x, y),

∂f

∂y(x, y)

)

,

(

dx

dt(t),

dy

dt(t)

)⟩

=∂f

∂x(x, y)

dx

dt(t) +

∂f

∂y(x, y)

dy

dt(t) .

Consideremos agora uma curva de nıvel da funcao f(x, y), que pode ser dada pela equacao f(x, y) =f (γ(t)) = c, onde c e uma constante. Se derivarmos ambos os lados dessa expressao com relacao a t, obtemos

f (γ(t)) = c ⇔ df

dt(γ(t)) = 0 .

Substituindo agora a derivada da esquerda pela expressao compacta da regra da cadeia, ficamos com

∇f (γ(t)) , γ′(t)⟩

= 0 ,

Page 6: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 6

de modo que ∇f (γ(t)) e perpendicular ao vetor γ′(t).

Na figura ao lado, fazemos o grafico de umacurva de nıvel e de um vetor γ′(t0), que e sem-pre tangente a essa curva de nıvel (de acordo como Capıtulo 1.6). Se o gradiente e perpendicular aγ′(t0), entao ele sera perpendicular a curva de nıvelno ponto t0, que e o que querıamos demonstrar.

Esse resultado e, na verdade, bem geral, e podeser aplicado as superfıcies de nıvel de funcoes detres variaveis reais ou as hipersuperfıcies de nıvelde funcoes de mias de tres variaveis. O vetor gradi-ente sera sempre perpendicular a essas superfıciesou hipersuperfıcies de nıvel.

x

y

γ(t0)

γ′(t0)∇f (x(t0), y(t0))

A demonstracao de que o gradiente e o vetor que indica a direcao e o sentido de maior crescimento deuma funcao necessita do conceito de derivada direcional e nao serra feita no texto principal deste capıtulo.Essa demonstracao e feita na Leitura Complementar 2.11.1. Um metodo numerico de busca pelo maximo oumınimo local de uma funcao utilizando o gradiente e explicado na Leitura Complementar 2.11.2. A secao aseguir mostra um significado economico para o gradiente.

2.11.5 - Interpretacao economica do gradiente

O vetor gradiente pode ser aplicado em areas economicas e administrativas indicando que atitudes tomarquando se quer aumentar o valor de uma funcao (como a producao, a utilidade ou o lucro) em diminuı-la (comona diminuicao de custos). Mais especificamente, no caso de uma funcao de producao P (K,L) em termos docapital K investido e do trabalho L, o gradiente pode nos dar a proprocao em que novos investimentos devemser feitos em cada uma dessas areas, como mostra o exemplo a seguir.

Exemplo 1: um industrial tem que decidir onde investir R$ 100.000 e estima que a producao de sua empresa

possa ser modelada pela funcao P (K,L) = 1, 1K0,25L0,75, onde o capital investido K e o trabalho L saomedidos em milhoes de reais. No momento, o capital investido e de 7 milhoes de reais e o gasto em trabalhoe de 6 milhoes de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas areas demodo a maximizar a producao da empresa.

Solucao: o vetor gradiente, calculado a partir do ponto (7, 6), correspondente ao nıvel atual de investimento (7milhoes em capital e 6 milhoes em trabalho) determina a “direcao” de maior crescimento da producao. Portanto,podemos comecar calculando o gradiente da funcao nesse ponto:

~∇P (K, L) =

(

0, 275K−0,75L0,75

0, 825K0,25L−0,25

)

⇒ ~∇P (7, 6) =

(

0, 275 · 7−0,75 · 60,75

0, 825 · 70,25 · 6−0,25

)

≈(

0, 2450, 857

)

.

Portanto, de modo a aumentar a producao ao maximo, deve-se usar uma proporcao de0, 245

0, 857entre o capital e

o trabalho. Escrevendo o dinheiro disponıvel em termos de milhoes de reais, isto significa que deve-se investir

IK =0, 245

0, 245 + 0, 857· 0, 1 ≈ 0, 022 , IL =

0, 857

0, 245 + 0, 857· 0, 1 ≈ 0, 078 ,

isto e, deve-se investir R$ 22.000 em capital e deve-se gastar R$ 78.000 em trabalho.

Page 7: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 7

Exemplo 2: considere que o industrial do exemplo anterior tenha investido R$ 22.000 em capital e tenhagasto R$ 78.000 em trabalho. Agora ele tem mais R$ 100.000 para investir. Onde esse dinheiro deve serinvestido?Solucao: no momento, temos K = 7 + 0, 22 = 7, 22 e L = 6 + 0, 78 = 6, 78, medidos em milhoes de reais. O vetorgradiente ja foi calculado no exemplo anterior, de modo que so temos que calcula-lo para K = 7, 22 e L = 6, 78:

~∇P (K, L) =

(

0, 275K−0,75L0,75

0, 825K0,25L−0,25

)

⇒ ~∇P (7, 22 , 6, 78) =

(

0, 275 · 7, 22−0,75 · 6, 780,75

0, 825 · 7, 220,25 · 6, 78−0,25

)

≈(

0, 2620, 838

)

.

Para aumentar a producao ao maximo, deve-se usar uma proporcao de0, 262

0, 838entre o capital e o trabalho. Isto

significa que deve-se investir

IK =0, 262

0, 262 + 0, 838· 0, 1 ≈ 0, 024 , IL =

0, 838

0, 262 + 0, 838· 0, 1 ≈ 0, 076 ,

isto e, deve-se investir R$ 24.000 em capital e deve-se gastar R$ 76.000 em trabalho.

Note que as proprocoes de quanto deve ser investido em capital ou trabalho mudam de acordo com onıvel previo de investimento. No segundo exemplo, o investimento em trabalho nao foi tao grande quanto noprimeiro. Isto porque, de acordo com a funcao de producao escolhida, investimentos em capital e trabalhotrazem resultados cada vez menores em termos de producao conforme estes aumentam a patamares cada vezmaiores.

Terminamos esta exposicao por aqui. Mais algumas aplicacoes do gradiente podem ser vistas na leituracomplementar deste capıtulo e nos exercıcios. Aplicacoes para a matriz hessian serao vistas mais tarde.

Resumo

• Gradiente: o gradiente de uma funcao f(x, y) e o vetor

~∇f(x, y) =

(

fx

fy

)

O vetor gradiente, quando calculado em um ponto, da a direcao de maior variacao da funcao naqueleponto e e perpendicular a curva de nıvel no mesmo ponto.

• Hessiana: a hessiana de uma funcao f(x, y) e a matriz

H(f) =

(

fxx fxy

fyx fyy

)

.

• Significado do gradiente: o gradiente da, a cada ponto do domınio de uma funcao, a direcao demaior crescimento da funcao a partir daquele ponto. Alem disso, ele e sempre perpendicular a curvade nıvel no ponto onde e calculado.

Todas as definicoes podem ser generalizadas para funcoes de n variaveis reais.

Page 8: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 8

Leitura Complementar 2.11.1 - Derivada direcionale o vetor gradiente

Como ja vimos antes, o gradiente da as derivadas de uma funcao f com relacao a suas variaveis. Maisespecificamente para uma f(x, y), ele fornece as derivadas parciais dessa funcao com relacao as variaveis x e y.Como as derivadas parciais representam uma aproximacao das taxas de variacao da funcao com relacao a suasvariaveis, podemos escrever

~∇f(x, y) =

(

fx

fy

)

≈(

∆f/∆x∆f/∆y

)

=

(

[f(x + ∆x, y) − f(x, y)] /∆x[f(x, y + ∆y) − f(x, y)] /∆y

)

.

Isto significa que o gradiente da, aproximadamente, a variacao da funcao f(x, y) em duas direcoes diferentes:uma com relacao ao eixo x e a outra com relacao ao eixo y.

Mas e se quisermos saber como a funcao varia com relacao a alguma outra direcao? Como podemos medirtal variacao?

Voltemos, agora, ao exemplo pratico de uma funcao de producao de Cobb-Douglas: P (K,L) = AKαL1−α.Podemos calcular, usando derivadas parciais, boas aproximacoes para a produtividade marginal do capital,dada pela taxa de variacao de P com relacao a K, e para a produtividade marginal do trabalho, dada pelataxa de variacao de P com relacao a L, respectivamente dadas por

∆P

∆K=

P (K + ∆K,L) − P (K,L)

∆K≈ ∂P

∂Ke

∆P

∆L=

P (K,L + ∆L) − P (K,L)

∆L≈ ∂P

∂L.

E se quisermos agora calcular a variacao da producao quando fazemos uma variacao ∆K no capital investidoe uma variacao ∆L no gasto com o trabalho? Podemos escrever essa variacao como

∆P = P (K + ∆K,L + ∆L) − P (K,L) .

O problema de como aproximar essa variacao por meio de derivadas parciais e semelhante ao problema dedeterminar a variacao de uma funcao em uma determinada direcao. A solucao para isso e definir uma derivada

direcional.

a) A derivada direcional

A definicao de uma derivada direcional e dada a seguir.

Definicao 1 - Dada uma funcao f(x1, · · · , xn), a sua derivada direcional com relacao a uma direcao

dada pelo vetor u =

(

u1

u2

)

e definida como

Duf(x, y) = limh→0

f(x + hu1, y + hu2) − f(x, y)

h,

quando esse limite existir.

Page 9: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 9

Exemplo 1: calcule a derivada direcional de f(x, y) = x2 − xy + 4x + 8 na direcao u =

(

21

)

.

Solucao: pela definicao 1, temos

Df (x, y) = limh→0

f(x + hu1, y + hu2) − f(x, y)

h=

= limh→0

(x + 2h)2 − (x + 2h)(y + h) + 4(x + 2h) + 8 − x2 + xy − 4x − 8

h=

= limh→0

x2 + 4hx + 4h2 − xy − hx − 2hy − 2h2 + 4x + 8h − x2 + xy − 4x

h=

= limh→0

3hx + 2h2 − 2hy + 8h

h= lim

h→0

(3x + 2h − 2y + 8) = 3x − 2y + 8 .

Uma forma mais simples de se calcular uma derivada direcional e dada pelo teorema a seguir.

Teorema 5 - Dada uma funcao f(x, y) diferenciavel em x e em y e um vetor u =

(

u1

u2

)

, entao

Duf(x, y) = fx(x, y)u1 + fy(x, y)u2 .

Demonstracao: considere a derivada direcional Duf(x, y) = limh→0

f(x + hu1, x + hu2) − f(x, y)

h. Se definirmos a

funcao g(x) = f(x + hu1, y + hu2), entao teremos

g′(0) = limh→0

g(h) − g(0)

h= lim

h→0

f(x + hu1, y + hu2) − f(x, y)

h= Du(x, y) .

Escrevendo agora x = x + hu1 e y = y + hu2, temos g(h) = f(x, y) e, pela regra da cadeia,

g′(h) =dg

dh= fx(x, y)

dx

dh+ fy(x, y)

dy

dh= fxu1 + fyu2 .

Para h = 0, teremos x = x, y = y eg′(0) = fx(x, y)u1 + fy(x, y)u2 .

Comparando agora as duas expressoes para g′(0), concluımos que

Du(x, y) = fx(x, y)u1 + fy(x, y)u2 .

Exemplo 2: calcule a derivada direcional de f(x, y) = x2 − xy + 4x + 8 na direcao u =

(

21

)

.

Solucao: pelo teorema 1, temos

Df(x, y) = fxu1 + fyu2 = (2x − y + 4) · 2 + (−x) · 1 = 4x − 2y + 8 − x = 3x − 2y + 8 .

Exemplo 3: calcule a derivada direcional de f(x, y) = ln(x3 − y) na direcao u =

(

−12

)

.

Solucao: pelo teorema 1, temos

Df(x, y) = fxu1 + fyu2 =1

x3 − y· 3x2 · (−1) +

1

x3 − y· (−1) · 2 =

−3x2

x3 − y− 2

x3 − y=

−3x2 − 2

x3 − y.

O exemplo a seguir mostra os calculos das derivadas direcionais de uma funcao a partir de um ponto aolongo de tres vetores distintos.

Page 10: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 10

Exemplo 4: calcule a derivada direcional de f(x, y) = x2 + y2 − 4x + 2y + 2xy no ponto (3, 1) ao longo dos

vetores u =

(

12

)

, v =

(

11

)

e w =

(

10

)

.

Solucao: primeiro, calculamos fx e fy: fx = 2x − 4 + 2y e fy = 2y + 2 + 2x.Calculadas no ponto (3, 1), temos fx(3, 1) = 2·3−4+2·1 = 6−4+2 = 4 e fy(3, 1) = 2·1+2+2·3 = 2+2+6 = 10.

Agora, fica facil calcular as derivadas direcionais pedidas:

Duf(3, 1) = 4 · 1 + 10 · 2 = 24 , Dv(3, 1) = 4 · 1 + 10 · 1 = 14 , Dw(3, 1) = 4 · 1 + 10 · 0 = 4 .

b) Derivada direcional e o vetor gradiente

O conceito de derivada direcional serve, ainda, para provar que o vetor gradiente indica a direcao de maiorcrescimento de uma funcao. A demonstracao parte do fato de que, usando o vetor gradiente, podemos definira derivada direcional de forma matricial:

Duf =(

u1 u2

)

(

fx

fy

)

.

No entanto, a demonstracao envolve o conceito de produto escalar entre vetores, que e aprendido em cursos dealgebra vetorial e sera visto aqui de modo pragmatico.

Podemos definir o produto escalar entre dois vetores u e v, escrito u · v, de duas formas distintas:

u · v = tr (vtu) ,

onde vt e a transposta do vetor v e v e o traco (soma dos elementos da diagonal principal de uma matriz), ou

u · v = |u||v| cos θ ,

onde |u| e |v| sao os modulos dos vetores u e v, respectivamente, e θ e o angulo entre esses dois vetores.Cada uma dessas definicoes e util, dependendo da forma como os dados do problema sao fornecidos, como

mostram os dois exemplos a seguir.

Exemplo 1: calcule u · v, onde u =

(

−14

)

e v =

(

21

)

.

Solucao: u · v = tr (vtu) = tr(

2 1)

(

−14

)

= tr (2) = 2 .

Exemplo 2: calcule u · v, onde |u| = 2, |v| = 3 e o angulo entre eles e θ = 60o.

Solucao: u · v = |u||v| cos θ = 2 · 3 · cos 60o = 6 · 1

2= 3 .

De acordo com a primeira definicao de produto escalar, podemos escrever a definicao da derivada direcionalcomo

Duf =(

u1 u2

)

(

fx

fy

)

= tr(

~∇f · u)

,

onde ~∇f =

(

fx

fy

)

e u =

(

u1

u2

)

. Alternativamente, poderıamos escrever essa mesma definicao do seguinte

modo:Duf = |~∇f ||u| cos θ ,

onde θ e o angulo entre o vetor gradiente e o vetor u.Da segunda definicao, podemos ver que a derivada direcional e maior quando cos θ e maior. O valor maximo

que cos θ pode ter e 1, o que ocorre quando θ = 0o. Portanto, o vetor gradiente e o vetor u devem ter a mesmadirecao e sentido se quisermos maximizar a derivada direcional Duf . Daı, conclui-se que a direcao e o sentido

Page 11: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 11

de maior valor da derivada direcional Duf , que e a direcao e o sentido de maior crescimento da funcao f , e aolongo do gradiente.

Teorema 6 - Dada uma funcao f(x, y) diferenciavel em x e em y e um vetor u =

(

u1

u2

)

, entao

Duf(x, y) e maxima se u = ~∇f(x, y).

Exemplo 3: determine a direcao de maior crescimento da funcao f(x, y) = 3x ln y no ponto (2, 1).

Solucao: a direcao de maior cresciment e dada pelo vetor gradiente nesse ponto, isto e,

~∇f(x, y) =

(

fx

fy

)

=

(

3 ln y3x/y

)

, de modo que ~∇f(2, 1) =

(

3 · ln 13 · 2/1

)

=

(

06

)

.

Page 12: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 12

Leitura Complementar 2.11.2 - Metodo de busca porgradiente

Veremos agora um metodo bastante eficiente para encontrar maximos e mınimos de funcoes envolvendomais de uma variavel real. Esse metodo e baseado no fato do gradiente sempre apontar a direcao e o sentidode maior crescimento de uma funcao a cada ponto do domınio desta. Faremos esse estudo por meio de algunsexemplos. A teoria sera exposta conforme a necessidade de cada exemplo.

Problema 1: Mınimo de uma paraboloide

Comecemos com um problema bem simples, que e determinar o ponto mınimo do paraboloide dado pelafuncao f(x, y) = x2 + y2 partindo do ponto (1, 1).

O metodo de busca por gradiente segue o seguinte algoritmo:

• Calcula-se o gradiente ~∇f(x, y).• Escolhe-se um ponto inicial ~x0 pertencente ao domınio da funcao.• A partir desse ponto, calculamos o proximo ponto ~x1, dado por

~x1 = ~x0 + λ~∇f(~x0) ,

onde o vetor gradiente da a direcao de maior variacao da funcao e λ e um parametro que indica o sentido a serseguido e o modulo da variacao a ser feita.• Determina-se o valor de λ que maximiza ou minimiza a funcao objetivo, dependendo do problema ser um demaximizacao ou de minimizacao.• Calcula-se ~x1 usando o valor de λ determinado anteriormente. Se |~x1 − ~x0| < ǫ, onde ǫ e um parametro dadopelo problema que indica qual o grau de precisao desejado, entao o problema termina por aı. Senao, repete-setodo o processo.

Apliquemos esse procedimento ao problema em questao. Primeiro, calculamos o gradiente da funcao f(x, y):

~∇f(x, y) =

∂f∂x

∂f∂y

=

(

2x2y

)

.

O ponto inicial ja foi escolhido pelo problema: ~x0 =

(

11

)

. Calculando o gradiente, temos

~∇f(~x0) =

(

2 · 12 · 1

)

=

(

22

)

.

Determinamos entao um novo ponto ~x1:

~x1 = ~x0 + λ~∇f(~x0) =

(

11

)

+ λ

(

22

)

=

(

1 + 2λ1 + 2λ

)

.

Substituindo esse ponto na funcao objetivo, temos

f(~x1) = (1 + 2λ)2 + (1 + 2λ)2 = 1 + 4λ + λ2 + 1 + 4λ + λ2 = 2 + 8λ + 8λ2 .

Note que a funcao so depende agora do parametro λ, de modo que podemos escreve-la como

f(λ) = 2 + 8λ + 8λ2 .

Page 13: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 13

Essa funcao tem um ponto crıtico quando

f ′(λ) = 0 ⇔ 8 + 16λ = 0 ⇔ 16λ = −8 ⇔ λ = −1

2.

Para determinamos se esse ponto crıtico e um mınimo da funcao, calculamos a segunda derivada desta:

f ′′(x) = 16 .

Como esse valor e positivo, a concavidade da funcao e sempre para cima e λ = −12 e um ponto de mınimo.

Substituindo o valor de λ encontrado, temos

~x1 =

1 + 2 ·(

−12

)

1 + 2 ·(

−12

)

=

(

00

)

.

O gradiente de ~x1 fica, entao,

~∇f(~x1) =

(

2 · 02 · 0

)

=

(

00

)

.

O fato do vetor gradiente ser nulo indica que atingimos a solucao otima. Se quisessemos calcular um novoponto ~x2, terıamos

~x1 = ~x1 + λ~∇f(~x1) =

(

00

)

+ λ

(

00

)

=

(

00

)

= ~x1 .

Portanto, nao ha mais como melhorar a solucao e o ponto que minimiza a funcao e ~x1 =

(

00

)

.

Problema 2: Funcao exponencial

Vamos usar o metodo de busca por gradiente para maximizar a funcao f(x, y) = 12e−(x+4)2−y2

. Comecamoscalculando o gradiente da funcao f(x, y):

~∇f(x, y) =

∂f∂x

∂f∂y

.

As derivadas parciais sao dadas por

∂f

∂x= 12 e−(x+4)2−y2 · [−2(x + 4)] = −24(x + 4) e−(x+4)2−y2

,

∂f

∂y= 12 e−(x+4)2−y2 · (−2y) = −24y e−(x+4)2−y2

,

de modo que o gradiente fica

~∇f(x, y) =

−24(x + 4) e−(x+4)2−y2

−24y e−(x+4)2−y2

.

Escolhamos o ponto inicial como sendo: ~x0 =

(

00

)

. Calculando o gradiente, temos

~∇f(~x0) =

−24(0 + 4) e−(0+4)2−02

−24 · 0 · e−(0+4)2−02

=

(

−96 e−16

0

)

.

Determinamos entao um novo ponto ~x1:

~x1 = ~x0 + λ~∇f(~x0) =

(

00

)

+ λ

(

−96 e−16

0

)

=

(

−96 e−16λ0

)

.

Page 14: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 14

Substituindo esse ponto na funcao objetivo, temos

f(~x1) = 12 e−(−96 e−16λ+4)2−02

= 12 e−(−96 e−16λ+4)2 .

A funcao agora so dependedo parametro λ, de modo que podemos escreve-la como

f(λ) = 12 e−(−96 e−16λ+4)2 .

Derivando a funcao com relacao a λ, temos

f ′(λ) = 12 e−(−96 e−16λ+4)2 ·[

−2(−96 e−16λ + 4)(−96 e−16]

= 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 .

Essa funcao tem um ponto crıtico quando

f ′(λ) = 0 ⇔ 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 = 0 ⇔ −96 e−16λ + 4 = 0 ⇔ 96 e−16λ = 4 ⇔

⇔ λ =1

24e16 .

Para determinamos se esse ponto crıtico e um mınimo da funcao, calculamos a segunda derivada desta:

f ′′(x) = 2304 e−16(−96 e−16) e−(−96 e−16λ+4)2 + 2304 e−16(−96 e−16λ + 4) e−(−96 e−16λ+4)2 ··[

−2(−96 e−16λ + 4)(−96 e−16]

=

= −221184 e−32 e−(−96 e−16λ+4)2 + 442368 e−32(−96 e−16λ + 4)2 e−(−96 e−16λ+4)2 .

Substituindo o valor de λ encontrado, temos

f ′′(

e16

24

)

= −221184 e−32 e−(

−96 e−16 e16

24+4)2

+ 442368 e−32

(

−96 e−16 e16

24+ 4

)2

e−(

−96 e−16 e16

24+4)2

=

= −221184 e−32 e−(−4+4)2 + 442368 e−32(−4 + 4)2 e−(−4+4)2 =

= −221184 e−32 e0 + 442368 e−32 · 0 · e0 = −221184 e−32 .

Como esse valor e negativo, a concavidade da funcao nesse ponto e para baixo e λ = e16

4 e um ponto de maximo.Substituindo o valor de λ encontrado, temos

~x1 =

(

−96 e−16 e16

240

)

=

(

−40

)

.

Calculando o gradiente para esse ponto, temos

~∇f(~x1) =

−24(−4 + 4) e−(−4+4)2−02

−24 · 0 · e−(−4+4)2−02

=

(

00

)

.

Como o gradiente e nulo, ~x1 corresponde ao maximo da funcao f(x, y).

Problema 4: Localizacao de um armazem

Vamos, agora, resolver um problema mais pratico envolvendo a minimizacao de uma funcao. Um novoarmazem de uma industria de pesticidas deve ser instalado na regiao que compreende as cidades de Besourinhos,Formigas e Cupinzal. A cidade de Besourinhos tem 400.000 habitantes; a cidade de Formigas, localizada 20km a leste de Besourinhos, tem uma populacao de 250.000; a cidade de Cupinzal tem 140.000 habitantes e ficaa 10 km a leste de Besourinhos e a 100 km ao norte dessa cidade.

a) Formule um problema de pesquisa operacional que minimize as distancias do novo armazem as tres cidadesque serao servidas por ele.

b) Resolva esse problema usando busca por gradiente.

c) Modifique o problema anterior de modo que a funcao-objetivo seja proporcional a populacao de cada cidade.

Page 15: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 15

d) Resolva o problema modificado usando busca por gradiente.

Solucao:

a) O problema consiste em determinar onde deve ser construıdo um armazem que sirva as tres cidades indicadasde modo a minimizar a distancia deste as cidades. Podemos localizar as cidades em um eixo cartesianode coordenadas estabelecendo Besourinhos na origem (0, 0), a cidade formigas no ponto (20, 0) e a cidade deCupinzal em (10, 10). No grafico indicamos coordenadas arbitrarias para a localizacao do armazem que deveraoser determinadas pelo problema.

x

y

010 20

10

b b

b

B F

C

b (x, y)

As variaveis de decisao do problema sao (x, y) =coordenadas do armazem. A funcao-objetivo e minimizar asoma das distancias do armazem aos tres centros urbanos. As distancias do armazem ate Besourinhos, Formigase Cupinzal sao dadas, respectivamente, por

dB =√

(x − 0)2 + (y − 0)2 =√

x2 + y2 ,

dF =√

(x − 20)2 + (y − 0)2 =√

(x − 20)2 + y2 ,

dC =√

(x − 10)2 + (y − 10)2 .

Portanto, o problema fica

min d(x, y) =√

x2 + y2 +√

(x − 20)2 + y2 +√

(x − 10)2 + (y − 10)2 .

O problema nao tem restricoes, pois as variaveis x e y podem assumir quaisquer valores reais.

b) Para resolver o problema por meio de busca por gradiente, precisamos calcular as derivadas parciais dx e dy

da funcao-objetivo:

dx =∂d

∂x=

1

2(x2 + y2)−1/2 · 2x +

1

2

[

(x − 20)2 + y2]−1/2 · 2(x − 20) +

+1

2

[

(x − 10)2 + (y − 10)2]−1/2 · 2(x − 10) =

= x(x2 + y2)−1/2 + (x − 20)[

(x − 20)2 + y2]−1/2

+ (x − 10)[

(x − 10)2 + (y − 10)2]−1/2

,

dy =∂d

∂y=

1

2(x2 + y2)−1/2 · 2y +

1

2

[

(x − 20)2 + y2]−1/2 · 2y +

1

2

[

(x − 10)2 + (y − 10)2]−1/2 · 2(y − 10) =

= y(x2 + y2)−1/2 + y[

(x − 20)2 + y2]−1/2

+ (y − 10)[

(x − 10)2 + (y − 10)2]−1/2

.

O gradiente fica

~∇d(x, y) =

(

dx

dy

)

,

onde dx e dy sao dados pelas equacoes anteriores.Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Quanto mais proximo do ponto otimo

estiver esse ponto inicial, melhores serao as chances da busca terminar logo. Observando o grafico que mostraas posicoes das cidades, vemos que elas sao simetricas com relacao a x = 10. Portanto, podemos partir, por

exemplo, do ponto ~x0 =

(

100

)

. Calculando o gradiente, temos

~∇d(~x0) =

(

0−1

)

.

Page 16: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 16

Determinamos entao um novo ponto ~x1:

~x1 = ~x0 + λ~∇d(~x0) =

(

100

)

+ λ

(

0−1

)

=

(

10−λ

)

.

Substituindo esse ponto na funcao objetivo, temos

d(~x1) =√

102 + (−λ)2 +√

(10 − 20)2 + (−λ)2 +√

(10 − 10)2 + (−λ − 10)2 =

=√

100 + λ2 +√

100 + λ2 +√

(λ + 10)2 = 2√

100 + λ2 + |λ + 10| = d(λ) .

A presenca do modulo mostra que, a direita ou a esquerda do ponto λ + 10 = 0 ⇔ λ = −10, podemos escreveressa funcao como

d(λ) =

{

2√

100 + λ2 − λ − 10 , λ < −10 ;

2√

100 + λ2 + λ + 10 , λ ≥ −10 .

Para λ < −10 a derivada dessa funcao fica

d′(λ) = 2 · 1

2(100 + λ2)−1/2 · 2λ − 1 = 2λ(100 + λ2)−1/2 − 1 .

Para λ > −10, temos

d′(λ) = 2 · 1

2(100 + λ2)−1/2 · 2λ + 1 = 2λ(100 + λ2)−1/2 + 1 .

Note que a derivada nao e definida em λ = −10.Essa funcao tem pontos crıticos quando d′(λ) = 0 ou quando d′(λ) nao existe. Portanto, ela tem um ponto

crıtico em λ = −10, que e onde ela nao e definida. Para λ < −10, temos

d′(λ) = 0 ⇔ 2λ(100 + λ2)−1/2 − 1 = 0 ⇔ 2λ(100 + λ2)−1/2 = 1 ⇔ 2λ = (100 + λ2)1/2 ⇔

⇔ 4λ2 =∣

∣100 + λ2∣

∣⇔ 4λ2 = 100 + λ2 ⇔ 3λ2 = 100 ⇔ λ2 =100

3⇔ λ = ± 10√

3.

So que tanto λ = − 10√3

quanto λ = 10√3

sao maiores que −10, o que indica que para λ < −10 nao ha pontos

crıticos. Para λ > −10,

d′(λ) = 0 ⇔ 2λ(100 + λ2)−1/2 + 1 = 0 ⇔ 2λ(100 + λ2)−1/2 = −1 ⇔ 2λ = −(100 + λ2)1/2 ⇔

⇔ 4λ2 =∣

∣100 + λ2∣

∣⇔ 4λ2 = 100 + λ2 ⇔ 3λ2 = 100 ⇔ λ2 =100

3⇔ λ = ± 10√

3.

No entanto,

d′(

− 10√3

)

= 0 , d′(

10√3

)

= 2 ,

o que mostra que λ = 10√3

nao e um ponto crıtico. Portanto, os pontos crıticos da funcao d(x, y) sao dados por

λ = −10 e λ = − 10√3

.

Para determinamos se algum desses pontos crıticos sao um mınimo da funcao, calculamos a segunda derivadadesta. Para λ > −10, que e o unico caso (fora λ = −10) onde ocorrem pontos crıticos, temos

d′′(λ) = 2(100 + λ2)−1/2 + 2

(

−1

2

)

(100 + λ2)−3/2 · 2λ = 2(100 + λ2)−1/2 − 2λ(100 + λ2)−3/2 .

Substituindo λ = − 10√3, temos

d′′(

− 10√3

)

≈ 0, 104 .

Portanto, λ = − 10√3

e um ponto de mınimo.

Resta ainda analisar o ponto λ = −10, que nao pode ser analisado usando derivadas. Tomando valoresproximos a ele, vemos que d(−10, 1) ≈ 28, 526 e d(−9, 9) ≈ 28, 243. Ja que d(−10) = 28, 284, este nao e um

Page 17: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 17

ponto de mınimo nem de maximo da funcao, mas apenas uma cuspide. Concluımos, entao, que λ = − 10√3

e o

unico ponto de mınimo da funcao d(λ). Para que visualizemos melhor a situacao, segue um grafico da funcaod(λ).

λ

d(λ)

−15 −10 −5 50

5

10

15

20

25

30

35

40

45

Substituindo o valor de λ encontrado, temos

~x1 =

(

1010√

3

)

.

O gradiente de ~x1 fica, entao,

~∇d(~x0) =

(

00

)

=

(

00

)

.

O fato do vetor gradiente ser nulo indica que atingimos a solucao otima. Portanto, nao ha mais como melhorara solucao e o ponto que minimiza a funcao e

~x1 =

(

010√3

)

≈(

05, 774

)

.

O valor mınimo da funcao-objetivo e d ≈ 27, 320. A seguir, fazemos uma descricao grafica dos passos feitospelo problema:

x

y

010 20

10

b b

b

B F

C

b

b

c) O problema agora consiste em determinar onde deve ser construıdo um armazem que sirva as tres cidadesindicadas de forma proporcional as suas populacoes. Podemos fazer isto dando um peso a cada distancia

Page 18: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 18

da funcao-objetivo que seja proprocional a populacao de cada cidade. Usando como variaveis de decisao doproblema (x, y) =coordenadas do armazem, temos, entao,

min d(x, y) = 400√

x2 + y2 + 250√

(x − 20)2 + y2 + 140√

(x − 10)2 + (y − 10)2 .

d) O gradiente e dado por

~∇d(x, y) =

(

dx

dy

)

,

onde

dx =∂d

∂x= 400 · 1

2(x2 + y2)−1/2 · 2x + 250 · 1

2

[

(x − 20)2 + y2]−1/2 · 2(x − 20) +

+140 · 1

2

[

(x − 10)2 + (y − 10)2]−1/2 · 2(x − 10) =

= 400x(x2 + y2)−1/2 + 250(x − 20)[

(x − 20)2 + y2]−1/2

+ 140(x − 10)[

(x − 10)2 + (y − 10)2]−1/2

,

dy =∂d

∂y= 400 · 1

2(x2 + y2)−1/2 · 2y + 250 · 1

2

[

(x − 20)2 + y2]−1/2 · 2y +

+140 · 1

2

[

(x − 10)2 + (y − 10)2]−1/2 · 2(y − 10) =

= 400y(x2 + y2)−1/2 + 250y[

(x − 20)2 + y2]−1/2

+ 140(y − 10)[

(x − 10)2 + (y − 10)2]−1/2

.

Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Partiremos novamente do ponto inicial

~x0 =

(

100

)

. Calculando o gradiente, temos

~∇d(~x0) =

(

150−140

)

.

Determinamos entao um novo ponto ~x1:

~x1 = ~x0 + λ~∇d(~x0) =

(

100

)

+ λ

(

150−140

)

=

(

10 + 150λ−140λ

)

.

Substituindo esse ponto na funcao objetivo, temos

d(~x1) = 400√

(10 + 150λ)2 + (−140λ)2 + 250√

(−10 + 150λ)2 + (−140λ)2 +

+140√

(150λ)2 + (−140λ − 10)2 =

= 400√

100 + 3000λ + 22500λ2 + 19600λ2 + 250√

100 − 3000λ + 22500λ2 + 19600λ2 +

+140√

22500λ2 + 100 + 2800λ + 19600λ2 = d(λ) =

= 400√

100 + 3000λ + 42100λ2 + 250√

100 − 3000λ + 42100λ2 +

+140√

100 + 2800λ + 42100λ2 = d(λ) .

Calculando a derivada da funcao, ficamos com

d′(λ) = 200(3000 + 84200λ)(100 + 3000λ + 42100λ2)−1/2 +

+125(−3000 + 84200λ)(100 − 3000λ + 42100λ2)−1/2 +

+70(2800 + 84200λ)(100 + 2800λ + 42100λ2)−1/2

Teremos que usar um metodo numerico (metodo de Newton) para encontrar as raızes dessa derivada. Paraisso, precisamos calcular sua derivada segunda:

d′′(λ) = 16840000(100 + 3000λ + 42100λ2)−1/2 − 62, 5(−3000 + 84200λ)2(100 − 3000λ + 42100λ2)−3/2 +

+10525000(100 − 3000λ + 42100λ2)−1/2 − 62, 5(−3000 + 84200λ)2(100 − 3000λ + 42100λ2)−3/2 +

+5894000(100 + 2800λ + 42100λ2)−1/2 − 35(2800 + 84200λ)2(100 + 2800λ + 42100λ2)−3/2

Page 19: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 19

Usando o algoritmo de Newton, temos, entao, partindo de λ0 = 0,

λ1 = λ0 −d′(λ0)

d′′(λ0)= 0 − d′(0)

d′′(0)≈ 0 − 42100

1926500≈ −0, 022 ,

λ2 = −0, 022 − d′(−0, 022)

d′′(−0, 022)≈ −0, 022 − −4651, 944

2596943≈ −0, 020 ,

λ3 = −0, 020 − d′(−0, 020)

d′′(−0, 020)≈ −0, 020 − 897, 329

2522698, 865≈ −0, 020 .

Como d′′(−0, 020) = 2522698, 865, que e positivo, este e um mınimo da funcao. Para visualizarmos melhor essafuncao, ela esta representada no grafico a seguir.

λ

d(λ)

−0, 03 −0, 02 −0, 01 0, 010

7000

7500

8000

Substituindo o valor de λ encontrado, temos

~x1 =

(

72, 8

)

.

O gradiente de ~x1 fica, entao,

~∇d(~x0) =

(

73, 14971, 964

)

.

Precisamos fazer uma nova iteracao para encontrar um resultado melhor.Determinamos entao um novo ponto ~x2:

~x2 = ~x1 + λ~∇d(~x1) =

(

72, 8

)

+ λ

(

73, 14971, 964

)

=

(

7 + 73, 149λ2, 8 + 71, 964λ

)

.

Substituindo esse ponto na funcao objetivo, temos

d(~x2) = 400√

(7 + 73, 149λ)2 + (2, 8 + 71, 964λ)2 + 250√

(−13 + 73, 149λ)2 + (2, 8 + 71, 964λ)2 +

+140√

(−3 + 73, 149λ)2 + (−7, 2 + 71, 964λ)2 .

Usando novamente um metodo numerico, descobrimos que esta funcao tem um mınimo em λ = −0, 033.Substituindo novamente na expressao para ~x2, temos

~x2 =

(

4, 5860, 425

)

.

O gradiente fica

~∇d(~x0) =

(

79, 480−78, 066

)

.

Construımos, entao, o ponto ~x3:

~x3 =

(

4, 586 + 79, 480λ0, 425 − 78, 066λ

)

.

A funcao-objetivo fica

d(~x2) = 400√

(4, 586 + 79, 480λ)2 + (0, 425 − 78, 066λ)2 +

+250√

(−15, 414 + 79, 480λ)2 + (0, 425 − 78, 066λ)2 +

+140√

(−5, 414 + 79, 480λ)2 + (−9, 575 − 78, 066λ)2 .

Page 20: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 20

Usando um metodo numerico, descobrimos que esta funcao tem um mınimo em λ = −0, 012. Portanto,

~x3 =

(

3, 6321, 362

)

.

Repetindo o mesmo processo, chegamos ao ponto

~x4 =

(

2, 7600, 362

)

.

A tabela a seguir mostra todos passos do metodo, que vao ate que a precisao de tres casas decimais sejaalcancada.

i xi yi

0 10 01 7 2, 82 4, 586 0, 4253 3, 632 1, 3624 2, 760 0, 3625 2, 242 0, 8146 1, 739 0, 2347 1, 432 0, 5098 1, 112 0, 1549 0, 922 0, 32510 0, 722 0, 10111 0, 601 0, 21012 0, 469 0, 06613 0, 391 0, 13614 0, 305 0, 04315 0, 255 0, 088

i xi yi

16 0, 197 0, 02717 0, 165 0, 05718 0, 128 0, 01819 0, 107 0, 03720 0, 084 0, 01221 0, 070 0, 02422 0, 054 0, 00723 0, 045 0, 01524 0, 032 0, 00425 0, 027 0, 00926 0, 019 0, 00227 0, 016 0, 00528 0, 008 0, 00029 0, 007 0, 00230 0, 000314 −0, 00004431 0, 000301 0, 0000861

Nas ultimas duas linhas foram usadas mais casas decimais para evitar singularidades nas derivadas primeira esegunda da funcao d(x, y). Pode-se ver que a solucao otima, com precisao de duas casas decimais, e

~x =

(

00

)

,

isto e, o armazem deve ser construıdo na cidade de Besourinhos.Uma descricao grafica dos passos feitos pelo problema e feita a seguir:

x

y

0 10 20

10

b b

b

B F

C

Note o comportamento em zigue-zague da busca, tıpica do metodo de busca por gradiente, que torna abusca difıcil e lenta quando nos aproximamos da solucao do problema.

Page 21: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 21

Exercıcios - Capıtulo 2.11

Nıvel 1

Gradiente

Exemplo 1: calcule o gradiente da funcao f(x, y, z) = x cos(yz).

Solucao: temos

fx =∂f

∂x= cos(yz) , fy =

∂f

∂y= −xz sen (yz) , fz =

∂f

∂z= −xy sen (yz) .

Portanto,

~∇f =

fx

fy

fz

=

cos(yz)−xz sen (yz)−xy sen (yz)

.

E1) Calcule os gradientes das seguintes funcoes:

a) f(x, y) = xy3, b) f(x, y) = 2x + cos y, c) f(x, y, z) = 4xz − 8y2, d) f(x, y, z) = 8x√

y − 2 ez .

Exemplo 2: calcule o vetor que da a direcao e sentido de maior crescimento da funcao f(x, y, z) = x cos(yz)no ponto (1, 0, 2).

Solucao: o gradiente da funcao, calculado no exemplo 3, e dado por

~∇f =

cos(yz)−xz sen (yz)−xy sen (yz)

.

O vetor gradiente calculado no ponto desejado da a direcao e o sentido de maior variacao da funcao. Portanto, em(1, 0, 2), temos

~∇f(1, 0, 2) =

cos(0 · 2)−1 · 2 sen (0 · 2)−1 · 0 sen (0 · 2)

=

cos 0−2 sen0

−0

=

100

.

E2) Calcule os vetores que dao as direcoes e sentidos de maior crescimento das funcoes abaixo nos pontosindicados:

a) f(x, y) = xy3 , (1, 1); b) f(x, y) = 2x + cos y , (0, π); c) f(x, y, z) = 4xz − 8y2 , (1, 4, 2);

d) f(x, y, z) = 8x√

y − 2 ez , (2, 1, 0).

Hessiana

Exemplo 3: calcule a hessiana da funcao f(x, y, z) = x cos(yz).

Solucao: as derivadas parciais de segunda ordem ja foram calculadas no exemplo 3. A partir delas, temos

H(f) =

fxx fxy fyz

fyx fyy fyz

fzx fzy fzz

=

0 −z sen (yz) −y sen (yz)−z sen (yz) −xz2 cos(yz) −x sen (yz) − xyz cos(yz)−y sen (yz) −x sen (yz) − xyz cos(yz) −xy2 cos(yz)

E3) Calcule as hessianas das seguintes funcoes:

Page 22: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 22

a) f(x, y) = xy3, b) f(x, y) = 2x + cos y, c) f(x, y, z) = 4xz − 8y2, d) f(x, y, z) = 8x√

y − 2 ez .

Nıvel 2

E1) As figuras a seguir ilustram algumas curvas de nıvel das funcoes f(x, y) = 2x2 + 3y2, g(x) = 3x2 − 2y2 eh(x, y) = 3x−x3 − 3xy2. Desenhe sobre essas curvas de nıvel os vetores gradiente normalizados dessas funcoesnos pontos (0, 0), (1, 0), (0, 1) e (1, 1) com origem nos pontos dados.

x

y

−10

1

−1

1

b

f(x, y) = 2x2 + 3y2

x

y

−3 −2 −10

1 2 3

−4

−3

−2

−1

1

2

3

4

g(x, y) = 3x2 − 2y2

x

y

−2 −1 0 1 2

−2

−1

1

2

b b

h(x, y) = 3x − x3 − 3xy2

E2) Considerando os dados a seguir, calcule, aproximadamente, um vetor que de a direcao e o sentido dogradiente no ponto (0, 0).

x/y −2 −1 0 1 2

−2 −3, 2 −3, 1 −2, 9 −2, 8 −3, 0−1 −2, 9 −2, 7 −2, 7 −2, 6 −2, 80 −1, 6 −1, 4 −1, 2 −1, 4 −1, 61 −0, 4 −0, 6 −0, 4 −0, 7 −0, 62 0, 6 0, 8 0, 7 0, 8 0, 3

E3) O laplaciano de uma funcao f(x, y) e definido como ∇2f = fxx + fyy. Dada f(x, y) =√

x2 + y2, proveque ∇2f = 1

f .

E4) Determine em qual direcao e sentido uma funcao f decresce mais rapidamente.

E5) Determine todos os pontos para os quais a direcao de maior mudanca da funcao f(x, y) = x2 + y2 −x− 3y

e dada por

(

11

)

.

E6) Um industrial tem que decidir onde investir R$ 50.000 e estima que a producao de sua empresa possa sermodelada pela funcao P (K,L) = 1, 3K0,45L0,55, onde o capital investido K e o trabalho L sao medidos emmilhoes de reais. No momento, o capital investido e de 5 milhoes de reais e o gasto em trabalho e de 4 milhoesde reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas areas de modo a maximizara producao da empresa (use uma precisao de um milhar de reais na resposta).

Nıvel 3

E1) Calcule a reta normal e a reta tangente a elipsex2

4+ y2 = 2 no ponto (−2, 1) seguindo as seguintes

instrucoes:

Page 23: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 23

a) Considere que a elipse e uma curva de nıvel da funcao f(x, y) =x2

4+ y2 e calcule o gradiente dessa funcao

no ponto (−2, 1).

b) Usando o fato do gradiente ser perpendicular a curva de nıvel para calcular um ponto da reta normal aelipse no ponto dado.

c) Utilize o ponto (−2, 1) e o novo ponto dado para calcular a equacao da reta normal a elipse naquele ponto.

d) Use o fato da reta tangente ser perpendicular a reta normal calculada para repetir o processo (considerandoagora a reta normal como uma isoquanta de uma funcao adequada) e calcular a equacao da reta tangente.

e) Desenhe em um mesmo grafico a elipse dada, o ponto (−2, 1) e as retas normal e tangente a essa curva nesseponto.

E2) Calcule a reta normal e a reta tangente a curva x3 − 3y = 5 no ponto (2, 1).

E3) Um industrial estima que a producao de sua empresa possa ser modelada pela funcao de producao deCobb-Douglas P (K,L) = 1, 2K0,6L0,4, onde o capital investido K e o trabalho L sao medidos em milhoes dereais. No momento, o capital investido e de 5 milhoes de reais e o gasto em trabalho e de 4 milhoes de reais. Elepretende, nos proximos 6 meses, investir R$ 1.000.000 todo mes. Determine uma estrategia de investimentospara o industrial para os proximos 6 meses de modo a maximizar a sua producao. Assuma nos seus calculosque ele sempre invista em unidades de milhares de reais.

E4) Use busca por gradiente com precisao de duas casas decimais para maximizar a funcaof(x, y) = 4 − x2 − y2 + 2x − 3y partindo do ponto x0 = (0, 0).

E5) Use busca por gradiente com precisao de duas casas decimais para maximizar a funcaof(x, y) = 4 − x2 − y2 + 2x − xy partindo do ponto x0 = (0, 0).

Respostas

Nıvel 1

E1) a) ~∇f =

(

y3

3xy2

)

, b) ~∇f =

(

y2

− sen y

)

, c) ~∇f =

4z−16y4x

, d) ~∇f =

8√

y4x/

√y

−2 ez

.

E2) a) ~∇f(1, 1) =

(

13

)

, b) ~∇f(0, π) =

(

20

)

, c) ~∇f(1, 4, 2) =

8−64

4

, d) ~∇f(2, 1, 0) =

88

−2

.

E3) a) H(f) =

(

0 3y2

3y2 6xy

)

, b) H(f) =

(

0 00 − cos y

)

, c) H(f) =

0 0 40 −16 04 0 0

,

d) H(f) =

0 4√x

04√x

− 2xy3/2

0

0 0 −2 ez

.

Nıvel 2

E1)

x

y

−10

1

−1

1

b

f(x, y) = 2x2 + 3y2

b x

y

−3 −2 −10

1 2 3

−4

−3

−2

−1

1

2

3

4

g(x, y) = 3x2 − 2y2

b x

y

−2 −1 0 1 2

−2

−1

1

2

b b

h(x, y) = 3x − x3 − 3xy2

b

b

Page 24: Cap´ıtulo 2.11 - Gradiente e hessiana · Ca´lculo 2 - Cap´ıtulo 2.11 - Gradiente e hessiana 1 Cap´ıtulo 2.11 - Gradiente e hessiana 2.11.1 - Nova notac¸ao 2.11.4 - O gradiente

Calculo 2 - Capıtulo 2.11 - Gradiente e hessiana 24

E2)

(

0−1

)

.

E3) ∇2f = fxx + fyy =y2

(x2 + y2)3/2+

x2

(x2 + y2)3/2=

x2 + y2

(x2 + y2)3/2=

1

(x2 + y2)1/2=

1

f.

E4) Na direcao dada por −~∇f .

E5) Para os pontos (1, 2) e (0, 1).

E6) Ele deve investir R$ 19.780 em captial e usar R$ 30.220 em trabalho.

Nıvel 3

E1) a) ~∇f(−2, 1) =

(

−12

)

. b) (−3, 3). c) y = −2x − 3. d) y =1

2x + 2. e) x

y

−3 −2 −1 0 1 2 3

−3

−2

−1

1

2

3

b

E2) A reta normal e dada por y = −0, 3x + 1, 6. A reta tangente e dada por y =1

3(x + 1).

E3) A estrategia de investimentos e dada pela tabela a seguir. Os investimentos sao dados em milhares de reais.

Mes K L1 623 3772 623 3773 622 3784 622 3785 623 3776 623 377

E4) a) x = 1 e y = −1, 5, f = 7, 25 (uma iteracao).

E5) a) x = 1, 33 e y = −0, 67, f = 5, 33 (10 iteracoes).