marina calais de freitas moura d programa: estatística ... · métodos desenvolvidos para análise...
TRANSCRIPT
Diagnoacutestico no modelo de regressatildeologiacutestica ordinal
Marina Calais de Freitas Moura
DISSERTACcedilAtildeO DE MESTRADOINSTITUTO DE MATEMAacuteTICA E ESTATIacuteSTICA
DAUNIVERSIDADE DE SAtildeO PAULO
Programa Estatiacutestica
Orientadora Profa Dra Mocircnica Carneiro Sandoval
Satildeo Paulo junho de 2019
Diagnoacutestico no modelo de regressatildeologiacutestica ordinal
Esta versatildeo da dissertaccedilatildeo conteacutem as correccedilotildees e alteraccedilotildees sugeridas
pela Comissatildeo Julgadora durante a defesa da versatildeo original do trabalho
realizada em 11062019 Uma coacutepia da versatildeo original estaacute disponiacutevel no
Instituto de Matemaacutetica e Estatiacutestica da Universidade de Satildeo Paulo
Comissatildeo Julgadora
bull Profa Dra Mocircnica Carneiro Sandoval - IME-USP
bull Prof Dr Gustavo Henrique de Arauacutejo Pereira - UFSCar
bull Prof Dr Joatildeo Ricardo Saito - UFABC
Agradecimentos
A Deus por permitir que continuasse os estudos
Aos meus pais Eivanyr de Moura e Maria Joseacute de Freitas Moura e minhas irmatildes Mocircnica Moura
da Silveira Lima Baacuterbara de Freitas Moura e Ana Maria Moura por todo amor e apoio
Agraves professoras Mocircnica Carneiro Sandoval e Denise Aparecida Botter por todos ensinamentos
A todos professores e amigos que me incentivaram
i
ii
Resumo
MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo
(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-
vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de
regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado
de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do
modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para
este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os
testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita
uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos
logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos
Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-
Robinson versatildeo ordinal do teste Hosmer-Lemeshow
iii
iv
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Diagnoacutestico no modelo de regressatildeologiacutestica ordinal
Esta versatildeo da dissertaccedilatildeo conteacutem as correccedilotildees e alteraccedilotildees sugeridas
pela Comissatildeo Julgadora durante a defesa da versatildeo original do trabalho
realizada em 11062019 Uma coacutepia da versatildeo original estaacute disponiacutevel no
Instituto de Matemaacutetica e Estatiacutestica da Universidade de Satildeo Paulo
Comissatildeo Julgadora
bull Profa Dra Mocircnica Carneiro Sandoval - IME-USP
bull Prof Dr Gustavo Henrique de Arauacutejo Pereira - UFSCar
bull Prof Dr Joatildeo Ricardo Saito - UFABC
Agradecimentos
A Deus por permitir que continuasse os estudos
Aos meus pais Eivanyr de Moura e Maria Joseacute de Freitas Moura e minhas irmatildes Mocircnica Moura
da Silveira Lima Baacuterbara de Freitas Moura e Ana Maria Moura por todo amor e apoio
Agraves professoras Mocircnica Carneiro Sandoval e Denise Aparecida Botter por todos ensinamentos
A todos professores e amigos que me incentivaram
i
ii
Resumo
MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo
(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-
vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de
regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado
de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do
modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para
este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os
testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita
uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos
logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos
Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-
Robinson versatildeo ordinal do teste Hosmer-Lemeshow
iii
iv
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Agradecimentos
A Deus por permitir que continuasse os estudos
Aos meus pais Eivanyr de Moura e Maria Joseacute de Freitas Moura e minhas irmatildes Mocircnica Moura
da Silveira Lima Baacuterbara de Freitas Moura e Ana Maria Moura por todo amor e apoio
Agraves professoras Mocircnica Carneiro Sandoval e Denise Aparecida Botter por todos ensinamentos
A todos professores e amigos que me incentivaram
i
ii
Resumo
MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo
(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-
vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de
regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado
de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do
modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para
este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os
testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita
uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos
logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos
Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-
Robinson versatildeo ordinal do teste Hosmer-Lemeshow
iii
iv
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
ii
Resumo
MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo
(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-
vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de
regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado
de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do
modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para
este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os
testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita
uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos
logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos
Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-
Robinson versatildeo ordinal do teste Hosmer-Lemeshow
iii
iv
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Resumo
MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo
(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-
vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de
regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado
de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do
modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para
este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os
testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita
uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos
logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos
Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-
Robinson versatildeo ordinal do teste Hosmer-Lemeshow
iii
iv
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
iv
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Abstract
MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-
teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019
Ordinal regression models are used to describe the relationship between an ordered categorical
response variable and one or more explanatory variables which could be discrete or continuous
Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model
The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal
logistic regression model with continuous explanatory variables For this case the Lipsitz test the
ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood
ratio tests were proposed This dissertation aims to review the diagnostic techniques available for
the cumulative logit models categories adjacent logit models and continuous ratio logistic models
In addition an application was developed in order to investigate the relationship between hearing
loss balance and emotional aspects in the elderly
Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of
the Hosmer-Lemeshow test
v
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
vi
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Sumaacuterio
Lista de Abreviaturas ix
Lista de Figuras xi
Lista de Tabelas xi
1 Introduccedilatildeo 1
11 Objetivos 2
12 Organizaccedilatildeo do texto 3
2 Modelos de Regressatildeo Logiacutestica Ordinal 5
21 Modelos lineares generalizados 5
22 Modelo de regressatildeo logiacutestica 6
23 Principais modelos ordinais 8
231 Modelo logito cumulativo 8
232 Modelo logito categorias adjacentes 11
233 Modelo logito razatildeo contiacutenua 13
3 Teacutecnicas de Diagnoacutestico 17
31 Conceitos baacutesicos 17
32 Testes da qualidade do ajuste do modelo 18
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18
322 Teste de Lipsitz 20
323 Teste de Pulkstenis-Robinson 22
324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23
325 Comparaccedilatildeo entre os testes 24
33 Teste de proporcionalidade 25
34 Anaacutelise de resiacuteduos 26
35 Criteacuterio de informaccedilatildeo Akaike 27
36 Meacutetodo de seleccedilatildeo 27
4 Aplicaccedilotildees 29
41 Dados utilizados 29
42 Anaacutelise inferencial 30
421 Prova Time Up and Go 30
422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34
5 Conclusotildees e sugestotildees para pesquisas futuras 41
vii
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
viii SUMAacuteRIO
A Anaacutelise descritiva 43
B Coacutedigos usados no software R 47
Referecircncias Bibliograacuteficas 51
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Lista de Abreviaturas
AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)
ix
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
x LISTA DE ABREVIATURAS
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Lista de Figuras
21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10
41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 1 35
42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo
eacute - situaccedilatildeo 2 38
A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44
A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua
audiccedilatildeo eacute 45
Lista de Tabelas
31 Tabela de contingecircncia 17
32 Frequecircncias observadas 24
41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31
42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31
43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32
44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32
45 AIC dos modelos ajustados - Prova Time Up and Go 34
46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34
47 Estimativas dos paracircmetros do modelo final adotado 35
48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -
modelo final 35
49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36
410 Estimativas dos paracircmetros do modelo selecionado 37
411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -
modelo final 37
412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40
A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43
A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43
xi
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
xii LISTA DE TABELAS
A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43
A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43
A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia
comeccedilou a perceber 44
A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44
A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-
ridade 44
A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda
mensal 45
A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45
A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando
a famiacutelia comeccedilou a perceber 45
A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova
de Unterberg com olhos abertos 46
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Capiacutetulo 1
Introduccedilatildeo
Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel
atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer
2006)
No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum
para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados
nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um
paciente
Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O
primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias
natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute
o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas
influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino
fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma
variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20
20-40 40-60 60-80 acima de 80)
Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis
nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a
ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados
meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser
utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias
Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata
variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e
consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos
outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo
O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto
1
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
2 INTRODUCcedilAtildeO 12
por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por
Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um
caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn
(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel
resposta aleacutem da distribuiccedilatildeo normal
Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais
Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo
logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de
comparaccedilatildeo que faz mais sentido para o estudo
Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal
e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel
resposta satildeo comparadas
Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja
verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes
valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada
pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as
variaacuteveis explanatoacuterias sejam categoacutericas
Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al
(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow
para modelos de regressatildeo logiacutestica
Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-
similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas
Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow
Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances
proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo
Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com
chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais
11 Objetivos
Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do
ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em
que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas
observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
12 ORGANIZACcedilAtildeO DO TEXTO 3
ilustrar os meacutetodos estudados a conjuntos de dados reais
12 Organizaccedilatildeo do texto
No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados
na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito
categorias adjacentes e Modelo logito razatildeo contiacutenua
Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2
satildeo discutidos no Capiacutetulo 3
O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos
Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
4 INTRODUCcedilAtildeO 12
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Capiacutetulo 2
Modelos de Regressatildeo Logiacutestica Ordinal
Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos
de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis
respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e
Modelos logito razatildeo contiacutenua
21 Modelos lineares generalizados
Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito
de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem
os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de
atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o
ajuste do modelo natildeo era muitas vezes satisfatoacuterio
Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-
litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees
Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da
distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar
uma ampla variedade de modelos estatiacutesticos
Os Modelos lineares generalizados tecircm trecircs componentes
bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y
Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes
agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma
f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)
em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro
de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi
5
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22
Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada
observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo
de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que
cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o
componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por
exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama
bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores
no modelo
Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-
toacuterias do modelo o qual tem a seguinte forma
ηi =sumj
βjxij i = 1 n e j = 1 p
em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria
e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental
bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do
componente aleatoacuterio
A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual
relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte
forma
ηi = g(microi)
Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo
satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua
funccedilatildeo de ligaccedilatildeo canocircnica correspondente
22 Modelo de regressatildeo logiacutestica
O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria
ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7
de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o
resultado de interesse para o estudo
Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli
em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de
fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)
Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel
explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte
forma
logito[π(xi)] = logπ(xi)
1minus π(xi)= α+ βxi (21)
em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG
Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do
modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila
ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1
indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance
de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute
π(1)
1minus π(1)= eα+β
enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute
π(0)
1minus π(0)= eα
Logo a razatildeo de chances fica dada por
π(1)(1minus π(0))
π(0)(1minus π(1))= eβ
Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter
artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide
Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade
de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter
infarto do miocaacuterdio eacute multiplicada por eβ
Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel
resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees
podem ser verificados em Agresti (2003)
O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica
Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados
Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um
modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva
em conta a ordenaccedilatildeo das categorias
23 Principais modelos ordinais
O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel
resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis
ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em
verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o
estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas
Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias
satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam
descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da
populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal
A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que
utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de
ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas
ligaccedilotildees podem ser verificados em Agresti (2010)
231 Modelo logito cumulativo
Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido
por
logito[P (Yi le j|xi)] = logP (Yi le j|xi)
1minus P (Yi le j|xi)= log
π1(xi) + + πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
23 PRINCIPAIS MODELOS ORDINAIS 9
em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-
senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p
covariaacuteveis comsumc
j=1 πj(xi) = 1
2311 Modelo logito cumulativo com chances proporcionais
O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com
o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)
referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional
odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem
poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou
Modelo logito razatildeo contiacutenua
O Modelo logito cumulativo com chances proporcionais tem a seguinte forma
logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)
em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores
das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel
resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas
P (Yi le j) aumentam em j para cada valor fixo de xi
O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um
intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades
cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico
modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos
separados
Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4
categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos
implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra
a Figura 21
Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma
parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja
logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)
Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e
outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)
Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do
modelo eacute expressar o modelo como
logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)
1minus P (Yi gt j|xi)= αj + β
primexi j = 1 cminus 1
A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-
lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por
L =nprodi=1
cprodj=1
πj(xi)yij
=nprodi=1
cprodj=1
[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij
=
nprodi=1
cprodj=1
[exp(αj + β
primexi)
1 + exp(αj + βprimexi)minus exp(αjminus1 + β
primexi)
1 + exp(αjminus1 + βprimexi)
]yij
em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0
caso contraacuterio comsump
j=1 yij = 1
Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh
(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro
β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica
Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os
modelos descritos a seguir
2312 Modelo logito cumulativo com chances proporcionais parciais
Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
23 PRINCIPAIS MODELOS ORDINAIS 11
parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances
proporcionais e parte natildeo Esse modelo fica expresso por
logito[P (Yi le j|xi)] = αj + βprimexi + γ
prime
jzi j = 1 cminus 1
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo
logito cumulativo
Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances
proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima
verossimilhanccedila
2313 Modelo logito cumulativo sem chances proporcionais
O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as
variaacuteveis explanatoacuterias
logito[P (Yi le j|xi)] = αj + βprime
jxi j = 1 cminus 1 (23)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias
contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria
232 Modelo logito categorias adjacentes
O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na
categoria j dada a resposta na categoria j ou j + 1
logito
[P (Yi = j|xi)
P (Yi = j|xi ou Yi = j + 1|xi)
]= logito
πj(xi)
πj(xi) + πj+1(xi)= log
πj(xi)
πj+1(xi) j = 1 cminus 1
Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria
como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia
tem-se a seguinte equaccedilatildeo
logπj(xi)
πc(xi)= log
πj(xi)
πj+1(xi)+ log
πj+1(xi)
πj+2(xi)+ middot middot middot+ log
πcminus1(xi)
πc(xi) (24)
2321 Modelo logito categorias adjacentes com chances proporcionais
O Modelo logito categorias adjacentes com chances proporcionais eacute definido por
logπj(xi)
πj+1(xi)= αj + β
primexi j = 1 cminus 1 (25)
em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime
eacute um vetor p times 1 de paracircmetros
desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
e j representa cada categoria ordenada da variaacutevel resposta
Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma
logπj(xi)
πc(xi)=
cminus1sumk=j
αk + (cminus j)βprimexi j = 1 cminus 1
A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece
a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo
efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com
chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila
2322 Modelo logito categorias adjacentes com chances proporcionais parciais
O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira
que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas
variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a
propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por
logπj(xi)
πj+1(xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
23 PRINCIPAIS MODELOS ORDINAIS 13
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis
em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de
maacutexima verossimilhanccedila
2323 Modelo logito categorias adjacentes sem chances proporcionais
O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para
as variaacuteveis explanatoacuterias o qual tem a seguinte forma
logπj(xi)
πj+1(xi)= αj + β
prime
jxi j = 1 cminus 1 (26)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor p times 1 de paracircmetros
desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as
categorias da variaacutevel resposta eacute mais informativa para o problema
Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal
crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo
deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a
doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance
de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave
insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo
ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal
severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a
chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a
chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance
de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa
233 Modelo logito razatildeo contiacutenua
O logito razatildeo contiacutenua eacute definido por
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
logito[wj(xi)] = logwj(xi)
(1minus wj(xi))= log
πj(xi)
πj+1(xi) + + πc(xi) j = 1 cminus 1
em que wj(xi) =P (Y = j|xi)
P (Y ge j|xi)=
πj(xi)
πj(xi) + + πc(xi)
ou
logito[wlowastj+1(xi)] = log
wlowastj+1(xi)
(1minus wlowastj+1(xi))
= logπj+1(xi)
π1(xi) + + πj(xi) j = 1 cminus 1
em que wlowastj+1(xi) =
P (Y = j + 1|xi)
P (Y le j + 1|xi)=
πj+1(xi)
π1(xi) + + πj+1(xi)
De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for
caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria
resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo
logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada
e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes
dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois
torna-se ampliada
2331 Modelo logito razatildeo contiacutenua com chances proporcionais
Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua
com chances proporcionais pode ser expresso por
logπj(xi)
πj+1(xi) + + πc(xi)= αj + β
primexi j = 1 cminus 1 (27)
em que β = (β1 β2 βp)prime
eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos
valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da
variaacutevel resposta
Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados
para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros
2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais
Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias
adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais
supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e
parte natildeo Esse modelo pode ser expresso por
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
23 PRINCIPAIS MODELOS ORDINAIS 15
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
primexi + γ
primejzi j = 1 cminus 1
em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em
xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo
das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de
chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados
agraves q variaacuteveis em zi
Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-
lhanccedila
2333 Modelo logito razatildeo contiacutenua sem chances proporcionais
O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por
logP (Yi = j|xi)
P (Yi gt j|xi)= αj + β
prime
jxi j = 1 cminus 1 (28)
em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime
eacute o vetor de p times 1 paracircmetros
desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo
Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos
paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila
Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do
logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos
o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Capiacutetulo 3
Teacutecnicas de Diagnoacutestico
Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos
modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo
de modelos e anaacutelise de resiacuteduos
31 Conceitos baacutesicos
Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e
contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar
uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das
categorias das variaacuteveis explanatoacuterias
Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis
explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis
explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima
combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas
satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da
variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum
j nlj
denotando a frequecircncia marginal da linha l l = 1 k e com n =sum
lj nlj denotando o total da
amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de
resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias
Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total
1 n11 n12 n1c n1
2 n21 n22 n2c n2
k nk1 nk2 nkc nk
Tabela 31 Tabela de contingecircncia
A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da
17
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
18 TEacuteCNICAS DE DIAGNOacuteSTICO 32
variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no
caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por
P (Y le j|zl) =eαj+β
primezl
1 + eαj+βprimezl j = 1 2 cminus 1
Logo
πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)
em quesum
j P (Y = j|zl) = 1
Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj
sendo πlj a estimativa de πlj obtida pelo modelo adotado
32 Testes da qualidade do ajuste do modelo
Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados
321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas
Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo
usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e
a estatiacutestica G2 da razatildeo de verossimilhanccedilas
Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-
das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar
bem ajustado
A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por
X2 =suml
sumj
(nlj minus Elj)2
Elj
Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19
G2 = 2suml
sumj
nljlognljElj
Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti
(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros
do modelo ajustado
Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances
proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de
paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os
mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o
nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2
Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que
k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel
resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva
em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por
Agresti (2010)
Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo
χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)
De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e
G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero
de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel
ocorrecircncia de valores esparsos
Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste
de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo
Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados
quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar
a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e
que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas
contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas
no modelo
Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
20 TEacuteCNICAS DE DIAGNOacuteSTICO 32
322 Teste de Lipsitz
O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)
utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria
Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =
P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para
cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal
ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente
espaccedilados
si = πi1 + 2πi2 + + cπic i = 1 n (31)
Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e
formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores
e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se
g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma
Iiv =
1 se a observaccedilatildeo i estaacute no grupo v
0 caso contraacuterio
para i = 1 n e v = 1 g minus 1
Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras
hij = αj + βprimex+
gminus1sumv=1
γvIv j = 1 cminus 1
em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto
De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais
hij = logπ1(xi) + + πj(xi)
πj+1(xi) + + πc(xi)
Jaacute para o Modelo categorias adjacentes com chances proporcionais
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21
hij = logπj(xi)
πj+1(xi)
e para o Modelo logito razatildeo contiacutenua com chances proporcionais
hij = logπj(xi)
πj+1(xi) + + πc(xi)
A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais
como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log
Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica
escore para testar
H0 γ1 = = γgminus1 = 0
Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado
Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e
com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de
verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1
graus de liberdade
De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma
combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn
i=1 IivYij eacute o nuacutemero de observaccedilotildees
da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn
i=1 Iivπij eacute o nuacutemero
esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v
Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1
graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na
categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g
grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo
acontece a aproximaccedilatildeo χ2 pode ser pobre
Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos
Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10
grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
22 TEacuteCNICAS DE DIAGNOacuteSTICO 32
de grupos seja escolhido no intervalo 6 le g lt n
5c
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances
proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais
323 Teste de Pulkstenis-Robinson
Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e
G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo
presentes simultaneamente no modelo
Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando
somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-
das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo
l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a
cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir
desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio
das foacutermulas descritas abaixo respectivamente
X2PR =
ksuml=1
2sumt=1
csumj=1
(nltj minus Eltj)2
Eltj
G2PR =
ksuml=1
2sumt=1
csumj=1
nltjlognltjEltj
em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos
baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o
nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias
e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta
pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo
ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc
j=1 nltj
observaccedilotildees
As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem
que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel
resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23
devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com
uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis
entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi
sugerido que a maioria (80) dos valores esperados seja maior que 5
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
324 Versatildeo ordinal do teste de Hosmer-Lemeshow
Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -
Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade
estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada
observaccedilatildeo como em (31)
A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de
modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha
as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos
aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios
Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a
Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave
j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes
ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo
ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por
Cg =
gsumv=1
csumj=1
(nvj minus Evj)2
Evj
A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade
em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo
feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em
cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos
interceptos
Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
24 TEacuteCNICAS DE DIAGNOacuteSTICO 32
Categorias de respostaGrupo 1 2 c Total
1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng
Tabela 32 Frequecircncias observadas
logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado
no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o
Modelo logito razatildeo contiacutenua com chances proporcionais
325 Comparaccedilatildeo entre os testes
Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees
Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste
Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances
proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados
obtidos nos artigos supramencionados
No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder
para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance
entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo
quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz
obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo
de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson
obtiveram poder baixo
Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo
tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica
quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com
chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a
versatildeo ordinal do teste Hosmer-Lemeshow
Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel
explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
33 TESTE DE PROPORCIONALIDADE 25
categorias adjacentes e logito razatildeo contiacutenua
Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para
detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito
razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes
Lipsitz e Hosmer-Lemeshow obtiveram poder menor
Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o
Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)
Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-
sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua
enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson
apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-
Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes
de Pulkstenis-Robinson apresentaram poder baixo
Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e
a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta
de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou
O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-
dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua
Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos
de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de
falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi
recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400
33 Teste de proporcionalidade
Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das
variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a
propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses
H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
26 TEacuteCNICAS DE DIAGNOacuteSTICO 35
versus
H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)
Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald
proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)
A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1
denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente
Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de
liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa
e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros
associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados
agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)
Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que
acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o
teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila
somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste
da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald
Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo
proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em
termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem
proacuteximos da linha de intercepto 0 e declive 1
34 Anaacutelise de resiacuteduos
Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias
categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com
o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis
explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute
rlj =nlj minus nlπljradicnlπlj [1minus πlj ]
Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27
como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula
35 Criteacuterio de informaccedilatildeo Akaike
Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por
Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos
O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar
um modelo tal que a quantidade abaixo seja minimizada
AIC = minus2(logL(θ)minus p)
em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-
milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do
modelo
Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como
quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC
penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um
modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas
36 Meacutetodo de seleccedilatildeo
Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como
stepwise forward ou backward ou utilizar o meacutetodo AIC
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
28 TEacuteCNICAS DE DIAGNOacuteSTICO 36
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Capiacutetulo 4
Aplicaccedilotildees
41 Dados utilizados
Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-
zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro
de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva
equiliacutebrio e aspectos emocionais no idoso
Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-
riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade
(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem
renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)
e idade (em anos)
Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas
afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de
depressatildeo (0=natildeo 1=sim)
Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a
perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos
(coacutedigo 3) e mais de dois anos (coacutedigo 4)
Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de
Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha
sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso
conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar
Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova
Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar
de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com
tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem
risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia
29
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
30 APLICACcedilOtildeES 42
parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que
apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas
Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc
diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e
excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo
haver esses resultados na amostra
Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade
renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com
olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc
diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up
and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de
Unterberg com olhos abertos que natildeo era de interesse no estudo
No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma
das variaacuteveis respostas
42 Anaacutelise inferencial
Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito
cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito
categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo
eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de
Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson
estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito
cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados
para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos
nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de
Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de
10 para a seleccedilatildeo das variaacuteveis explanatoacuterias
421 Prova Time Up and Go
Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances
proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de
duas categorias foram tratadas como quantitativas e na segunda como qualitativas
Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
42 ANAacuteLISE INFERENCIAL 31
quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do
ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela
evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224
Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461
G2PR 13 89 11 0 239
Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)
A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001
Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001
Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2
em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem
renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios
miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
32 APLICACcedilOtildeES 42
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a
chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que
11 segundos para realizar a prova
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas
como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os
valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630
Hosmer-Lemeshow 4 79 9 0 852
Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)
Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-
rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que
o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)
A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001
Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179
Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002
Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[P (Yi le j|zi)
1minus P (Yi le j|zi)
]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
42 ANAacuteLISE INFERENCIAL 33
em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo
Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos
Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos
para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com
(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova
bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos
do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance
de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time
Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-
rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute
exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo
demorar menos que 11 segundos para realizar a prova Time Up and Go
bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes
a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar
menos que 11 segundos para realizar a prova Time Up and Go
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar
a prova Time Up and Go
Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-
rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que
considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor
AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas
categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez
que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros
Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as
mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
34 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 20403
Modelo (quantitativa) 19944
Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go
tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias
como quantitativas quanto para o modelo que considera como qualitativas
422 Em geral vocecirc diria que sua audiccedilatildeo eacute
Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias
adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis
explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como
qualitativas
Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade
e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-
quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste
do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os
resultados dessa tabela evidenciam o bom ajuste do modelo completo
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486
Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058
G2PR 12 55 22 0 293
Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor p = 0 179)
Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11
apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram
valores-p superiores a 10
Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve
efeito significativo foi a variaacutevel depressatildeo (X1)
A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o
modelo final ajustado
O modelo final ajustado pode ser expresso em termos dos logitos por
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
42 ANAacuteLISE INFERENCIAL 35
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056
Tabela 47 Estimativas dos paracircmetros do modelo final adotado
log
[P (Yi = j|xi)
P (Yi = j + 1|xi)
]= αj + 0 5927X1 j = 1 2
em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo
Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)
e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados
dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do
modeloTeste Valor da estatiacutestica Graus de liberdade valor p
Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212
Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final
A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno
de zero haacute evidecircncias a favor do modelo
Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute
exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave regular
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
36 APLICACcedilOtildeES 42
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a
mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo pode ser expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5927(3minus j)X1 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo
Quanto agrave interpretaccedilatildeo tem-se que
bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute
exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute
ruim em relaccedilatildeo agrave boa
Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como
qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p
do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado
e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o
modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam
o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson
Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421
Hosmer-Lemeshow 4 98 9 0 836
Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o
teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances
proporcionais parece adequado (valor-p = 0 197)
Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito
categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes
Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que
obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta
de audiccedilatildeo (X2)
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
42 ANAacuteLISE INFERENCIAL 37
A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para
o modelo final ajustado
Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068
Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160
Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049
Tabela 410 Estimativas dos paracircmetros do modelo selecionado
O modelo final ajustado pode ser expresso em termos dos logitos por
log
[πj(x)
πj+1(x)
]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso
contraacuterio
Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-
lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser
visto Tabela 411 indicando evidecircncias a favor do modelo
Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523
Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571
Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final
A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias
da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as
categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor
do modelo
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um
idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79
vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
38 APLICACcedilOtildeES 42
Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular
Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as
mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em
relaccedilatildeo agrave boa
Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Neste caso o modelo fica expresso por
log
[P (Yi = j|xi)P (Yi = 3|xi)
]=
2sumj=1
αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3
+ 1 8146(3minus j)X4 j = 1 2
em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
42 ANAacuteLISE INFERENCIAL 39
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1
se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e
X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso
contraacuterio
Quanto agrave interpretaccedilatildeo tem-se que
bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de
um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19
vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo
agrave boa
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema
de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes
a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer
que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a
audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o
problema de audiccedilatildeo em 6 meses ou em 2 anos
bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para
perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68
vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses
dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa
Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera
as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos
modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as
variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o
qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma
variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como
qualitativas apresentou duas variaacuteveis explanatoacuterias significativas
Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas
variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
40 APLICACcedilOtildeES 42
Modelo AICModelo (qualitativa) 25304
Modelo (quantitativa) 25075
Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute
para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-
tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em
ambos modelos
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Capiacutetulo 5
Conclusotildees e sugestotildees para pesquisas futuras
O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos
principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias
adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta
ordinal e uma ou mais variaacuteveis explanatoacuterias
Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as
variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste
da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo
presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica
G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para
esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de
Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow
Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos
logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos
principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo
de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no
software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais
(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo
logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo
Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no
Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados
Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com
chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para
investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os
modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances
proporcionais
41
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS
Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances
proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas
variaacuteveis explanatoacuterias nos dois modelos
Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos
dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo
ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances
proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias
contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de
regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita
informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de
regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel
resposta
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Apecircndice A
Anaacutelise descritiva
Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo
Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)
Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)
Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade
Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)
gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal
Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total
Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)
Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo
43
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
44 APEcircNDICE A
Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go
Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total
6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)
mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)
Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber
Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total
Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo
Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)
Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)
Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
ANAacuteLISE DESCRITIVA 45
Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total
Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)
gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal
Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute
Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total
Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)
Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo
Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total
6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)
mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
46 APEcircNDICE A
Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total
Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)
Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Apecircndice B
Coacutedigos usados no software R
Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo
1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais
require(MASS)
mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE
+RENDAMENSAL dados2)
2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances
proporcionais
require(generalhoslem)
lipsitztest(mlc g=6)
logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)
pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO
ESCOLARIDADERENDAMENSAL))
3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais
require(VGAM)
mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=TRUEreverse=FALSE) dados2)
mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL
cumulative(parallel=FALSEreverse=FALSE) dados2)
lrtest(mlc2mlc3)
4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais
require(VGAM)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
47
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
48 APEcircNDICE B
5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances
proporcionais
fitted(catadj)
est lt- fitted(catadj)c(123)
matrix lt- cbind(estdados2$ID)
Grupo1 lt-c(rep(123)rep(0115))
Grupo2 lt-c(rep(023)rep(123)rep(092))
Grupo3 lt-c(rep(046)rep(123)rep(069))
Grupo4 lt-c(rep(069)rep(123)rep(046))
Grupo5 lt-c(rep(092)rep(123)rep(023))
Grupo6 lt-c(rep(0115)rep(123))
teste lt-dataframe(est dados2$ID)
teste1 lt-teste[order(teste$est)]
teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)
teste3 lt-teste2[order(teste2$dados2ID)]
ESTlt-fitted(catadj)
colnames(EST)lt-c(EST1EST2EST3)
teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)
catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)
catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+
ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3
+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)
lrtest(catadjLPcatadj)
6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias
adjacentes com chances proporcionais
N1lt-subset(teste4OPINIAO==1)
NN1lt-c(dim(subset(N1Grupo1==1))[1]
dim(subset(N1Grupo2==1))[1]
dim(subset(N1Grupo3==1))[1]
dim(subset(N1Grupo4==1))[1]
dim(subset(N1Grupo5==1))[1]
dim(subset(N1Grupo6==1))[1])
N2lt-subset(teste4OPINIAO==2)
NN2lt-c(dim(subset(N2Grupo1==1))[1]
dim(subset(N2Grupo2==1))[1]
dim(subset(N2Grupo3==1))[1]
dim(subset(N2Grupo4==1))[1]
dim(subset(N2Grupo5==1))[1]
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
COacuteDIGOS USADOS NO SOFTWARE R 49
dim(subset(N2Grupo6==1))[1])
N3lt-subset(teste4OPINIAO==3)
NN3lt-c(dim(subset(N3Grupo1==1))[1]
dim(subset(N3Grupo2==1))[1]
dim(subset(N3Grupo3==1))[1]
dim(subset(N3Grupo4==1))[1]
dim(subset(N3Grupo5==1))[1]
dim(subset(N3Grupo6==1))[1])
OOlt-cbind(NN1NN2NN3)
EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)
sum(subset(teste4Grupo2==1)$EST1)
sum(subset(teste4Grupo3==1)$EST1)
sum(subset(teste4Grupo4==1)$EST1)
sum(subset(teste4Grupo5==1)$EST1)
sum(subset(teste4Grupo6==1)$EST1))
EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)
sum(subset(teste4Grupo2==1)$EST2)
sum(subset(teste4Grupo3==1)$EST2)
sum(subset(teste4Grupo4==1)$EST2)
sum(subset(teste4Grupo5==1)$EST2)
sum(subset(teste4Grupo6==1)$EST2))
EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)
sum(subset(teste4Grupo2==1)$EST3)
sum(subset(teste4Grupo3==1)$EST3)
sum(subset(teste4Grupo4==1)$EST3)
sum(subset(teste4Grupo5==1)$EST3)
sum(subset(teste4Grupo6==1)$EST3))
EElt-cbind(EE1EE2EE3)
sum(((OO-EE)^2)EE)
1-pchisq(sum(((OO-EE)^2)EE)9)
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
50 APEcircNDICE B
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
Referecircncias Bibliograacuteficas
Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8
Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27
Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2
Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na
paacuteg 8 19
Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27
Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26
Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10
Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10
Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25
Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41
Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425
Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2
Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado
na paacuteg 19 21
Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19
Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21
Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26
51
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-
52 REFEREcircNCIAS BIBLIOGRAacuteFICAS
Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21
Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg
29
Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5
Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1
Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26
Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22
R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10
SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado
na paacuteg 10
Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22
Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14
Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10
- Lista de Abreviaturas
- Lista de Figuras
- Lista de Tabelas
- Introduccedilatildeo
-
- Objetivos
- Organizaccedilatildeo do texto
-
- Modelos de Regressatildeo Logiacutestica Ordinal
-
- Modelos lineares generalizados
- Modelo de regressatildeo logiacutestica
- Principais modelos ordinais
-
- Modelo logito cumulativo
- Modelo logito categorias adjacentes
- Modelo logito razatildeo contiacutenua
-
- Teacutecnicas de Diagnoacutestico
-
- Conceitos baacutesicos
- Testes da qualidade do ajuste do modelo
-
- Teste de Pearson e teste da razatildeo de verossimilhanccedilas
- Teste de Lipsitz
- Teste de Pulkstenis-Robinson
- Versatildeo ordinal do teste de Hosmer-Lemeshow
- Comparaccedilatildeo entre os testes
-
- Teste de proporcionalidade
- Anaacutelise de resiacuteduos
- Criteacuterio de informaccedilatildeo Akaike
- Meacutetodo de seleccedilatildeo
-
- Aplicaccedilotildees
-
- Dados utilizados
- Anaacutelise inferencial
-
- Prova Time Up and Go
- Em geral vocecirc diria que sua audiccedilatildeo eacute
-
- Conclusotildees e sugestotildees para pesquisas futuras
- Anaacutelise descritiva
- Coacutedigos usados no software R
- Referecircncias Bibliograacuteficas
-