spss manual de utilização

151
 ESCOLA SUPERIOR AGRÁRIA INSTITUTO POLITÉCNICO DE CASTELO BRANCO SPSS - MANUAL DE UTILIZAÇÃO ARMANDO MATEUS FERREIRA Escola Superior Agrária de Castelo Branco, 1999

Upload: luiscpscribd

Post on 16-Oct-2015

36 views

Category:

Documents


0 download

TRANSCRIPT

  • 5/26/2018 SPSS Manual de Utiliza o

    1/151

    ESCOLA SUPERIOR AGRRIAINSTITUTO POLITCNICO DE CASTELO BRANCO

    SPSS- MANUAL DE UTILIZAO

    ARMANDO MATEUS FERREIRA

    Escola Superior Agrria de Castelo Branco, 1999

  • 5/26/2018 SPSS Manual de Utiliza o

    2/151

    SPSS ndice

    ESACB i

    NDICE

    1 - INTRODUO .......................................................................................... 1

    2 - EDITOR DE DADOS .............................................................................. 3

    2.1 - CRIAR UM FICHEIRO DE DADOS .................................................. 52.1.1 - DEFINIO DE VARIVEIS.................................................................... 52.1.2 - INTRODUO DOS VALORES................................................................ 92.1.3 - GRAVAR O FICHEIRO DE DADOS........................................................ 11

    2.1.4 - ABRIR UM FICHEIRO DE DADOS EXISTENTE.................................... 122.1.5 - ACESCENTAR NOVOS CASOS A UM FICHEIRO DE DADOS............... 132.1.6 - ACRESCENTAR NOVAS VARIVEIS...................................................... 142.1.7 - DEFINIR UMA VARIVEL EM FUNO DE OUTRAS......................... 152.1.8 - ELIMINAR LINHAS E VARIVEIS.......................................................... 16

    2.2 - IMPORTAO DE FICHEIROS EXTERNOS .............................. 172.2.1 - IMPORTAO DE FICHEIROS LOTUS E EXCEL 4.0 ........................... 172.2.2 - IMPORTAO DE FICHEIROS DE DBASE........................................... 182.2.3 - IMPORTAO DE FICHEIROS EXCEL ................................................. 192.2.4 - IMPORTAO DE FICHEIROS ACCESS............................................... 22

    2.2.5 - RECODIFICAO DE VALORES........................................................... 222.2.6 - SELECO DE CASOS........................................................................... 25

    3 - ANLISE DE DADOS ......................................................................... 29

    3.1 - OBTER ESTATSTICAS DESCRITIVAS ....................................... 293.1.1 - PROCEDIMENTO DESCRIPTIVES........................................................ 293.1.2 - PROCEDIMENTO EXPLORE................................................................. 323.1.3 - PROCEDIMENTO EXPLORE COM FACTORES.................................... 363.1.4 - PROCEDIMENTO FREQUENCIES........................................................ 39

    4 - GRFICOS................................................................................................. 44

    4.1 - GRFICOS STANDARDIZADOS .................................................... 444.1.1 - GRFICO DE BARRAS........................................................................... 454.1.2 - HISTOGRAMA ........................................................................................ 504.1.3 - GRFICO DE EXTREMOS-E-QUARTIS................................................. 524.1.4 - GRFICO DE BARRA DE ERROS.......................................................... 544.1.5 - GRFICOS DE PROBABILIDADES........................................................ 564.1.6 - GRFICO DE DISPERSO..................................................................... 59

    4.2 - EDIO DOS GRFICOS STANDARDIZADOS........................ 624.3 - GRFICOS INTERACTIVOS ............................................................ 65

    4.3.1 - GRFICO DE BARRAS........................................................................... 66

    4.3.2 - GRFICO DE DISPERSO..................................................................... 704.4 - EDIO DE GRFICOS INTERACTIVOS ................................... 75

  • 5/26/2018 SPSS Manual de Utiliza o

    3/151

    SPSS ndice

    ESACB ii

    5 - TESTES T ......................................................................................................... 79

    5.1 - TESTE T PARA A MDIA DE UMA AMOSTRA...................................... 825.2 - TESTE T PARA DUAS AMOSTRAS INDEPENDENTES......................... 835.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS......................... 86

    6 - ANLISE DE VARINCIA ........................................................................... 906.1 - ENSAIOS UNI-FACTORIAIS ...................................................................... 90

    6.1.1 - PROCEDIMENTO ONE-WAY ANOVA ................................................. 916.1.2 - PROCEDIMENTO MEANS.................................................................... 96

    6.2 - ENSAIOS MULTI-FACTORIAIS................................................................. 99

    7 - REGRESSO LINEAR................................................................................. 111

    7.1 - INTRODUO............................................................................................ 1117.2 - REGRESSO LINEAR SIMPLES.............................................................. 1157.3 - REGRESSO LINEAR MLTIPLA.......................................................... 1217.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS................................ 131

    8 - MANUSEAR OS RESULTADOS................................................................. 136

    ANEXOS ..................................................................................................................... 143

  • 5/26/2018 SPSS Manual de Utiliza o

    4/151

    SPSS 1 - Introduo

    ESACB 1

    1 - INTRODUO

    O pakage estatstico SPSS para Windows um poderoso sistema de anlises estatsticas emanuseamento de dados, num ambiente grfico, em que a utilizao mais frequente, para a

    maioria das anlises a efectuar, se resume seleco das respectivas opes em menus ecaixas de dilogo. Contudo, o sistema dispe de um editor de comandos, a que o utilizadormais avanado poder recorrer a fim de realizar determinado tipo de anlises maiscomplexas e elaboradas.

    De um modo muito sucinto, o sistema SPSS dispe de:

    Data Editor: Editor de Dados: uma verstil folha de clculo, que permite definir,introduzir, modificar, corrigir e visualizar a informao. O Data Editor abreautomaticamente quando se entra no SPSS.

    Viewer: Janela de Resultados: Todos os resultados estatsticos, tabelas, grficos, sovisualizados numa janela designada por Viewer. Uma janela Viewer abreautomaticamente na primeira vez que o utilizador executar uma tarefa quegera output.

    Na figura seguinte apresenta-se o aspecto da janela de resultados referentesao clculo das estatsticas elementares um conjunto de dados (varivel como nome fosfo). O Viewer composto por duas janelas: esquerda est umorganigrama do output; direita esto os resultados propriamente ditos.

    Neste exemplo, os resultados incluem as instrues necessrias execuo

  • 5/26/2018 SPSS Manual de Utiliza o

    5/151

    SPSS 1 - Introduo

    ESACB 2

    da tarefa: o que se designa por Log1, e que composto pelas seguinteslinhas de instrues:

    DESCRI PTI VESVARI ABLES=f osf o/ STATI STI CS=MEAN SUM STDDEV VARI ANCE RANGE MI N MAX SEMEAN KURTOSI S SKEWNESS .

    Estas instrues foram geradas, no caso, pela seleco de opes nos menusdo programa; contudo, podem ser digitadas, como se de uma linguagem de

    programao se tratasse2.

    Pivot Tables: Tabelas Dinmicas: O programa dispe de uma potente rotina de gerao detabelas dinmicas (ou pivot tables), que permitem que o utilizador exploreos dados, com o re-arranjo de colunas e linhas.

    Grficos: O SPSS permite realizar todos os tipos de grficos usuais em estatstica, afim de realar as anlises efectuadas.

    Acesso a Bases de Dados: O SPSS permite o acesso s bases de dados mais usuais, emformato SQL e ODBC, tais como ficheiros de dados criados em dBase,Access, Excel, Lotus, etc. A importao de ficheiros de texto, Access,Excel, feita atravs de um assistente de importao (wizard).

    1 O Log pode no estar visvel; s aparece na janela Viewer se se tiver configurado o programa para

    mostrar este item.2 O utilizador pode escrever as suas prprias rotinas de anlise; para tal, deve abrir o SPSS Syntax

    Editor, janela de edio de comandos do SPSS.

  • 5/26/2018 SPSS Manual de Utiliza o

    6/151

    SPSS 2 - Edio de Dados

    ESACB 3

    2 - EDITOR DE DADOS

    O Data Editor do SPSS um programa do tipo de folha de clculo que permite facilmente

    criar ou editar ficheiros de dados. O Data Editor abre automaticamente quando se entra noSPSS.

    O aspecto inicial do editor o seguinte:

    Muitas das caractersticas do data editor do SPSS so similares s de qualquer folha declculo em ambiente Windows, tal como o Excel.

    As colunas correspondem s variveis. Inicialmente, todas as colunas, ou variveis, tem omesmo nome genrico, var, tal como mostrado na imagem. O utilizador ir dar os nomess variveis que definir.

    As linhas correspondem aos casos, ou indivduos.

    Cada clula contm um valor ou observao de um indivduo, em relao a umadeterminada caracterstica ou varivel. As clulas podem apenas conter valores (numricosou alfanumricos); no possvel, tal como se faz nas folhas de clculo, definir frmulasem clulas. O SPSS permite definir frmulas, mas que afectam integralmente toda umavarivel ou coluna.

    O ficheiro de dados rigorosamente rectangular, sendo o seu tamanho definido pelonmero de casos e de variveis. O utilizador pode introduzir valores em clulas fora das

  • 5/26/2018 SPSS Manual de Utiliza o

    7/151

    SPSS 2 - Edio de Dados

    ESACB 4

    fronteiras actuais da folha de clculo; contudo, o SPSS automaticamente acrescenta linhase/colunas de modo a que essa nova observao fique includa dentro da estruturarectangular. A fim de ilustrar este aspecto, considere a seguinte imagem referente a umfolha de dados do SPSS, em que existem duas variveis (com os nomes xe y), com 6 casosou observaes. Repare na posio da clula activa.

    Se se introduzir um valor (por exemplo, 25) para esta clula, fora dos limites do ficheirorectangular, o SPSS cria duas novas variveis numricas atribuindo-lhes automaticamenteos nomes var00002 e var00003, e introduz valores em branco para as clulas, de modo aficar um ficheiro rectangular, com 4 variveis e 7 casos (repare que estas clulas tm o

    ponto decimal):

    Estas clulas, aparentemente vazias, so assumidas pelo SPSS como missing values, isto, observaes em falta para algumas variveis. Contudo, e para j, estas clulas noafectam os clculos estatsticos, caso se se trate de variveis numricas. Por exemplo,calculando a mdia da varivel xobter-se- o valor de 15, como lgico, para os valores

    apresentados.

  • 5/26/2018 SPSS Manual de Utiliza o

    8/151

    SPSS 2 - Edio de Dados

    ESACB 5

    2.1 - CRIAR UM FICHEIRO DE DADOS

    Vamos usar os seguintes dados a fim de ilustrar como se cria um ficheiro com o Data Editordo SPSS. Trata-se dos resultados de um ensaio, em que se registaram as produes (kg/ha)de arroz, em funo da variedade (V1: IR8; V2: IR5; V3: C4-63) e de 5 nveis de adubaoazotada (N0: 0 kg/ha; N1: 60 kg/ha; N2: 90 kg/ha; N3: 120 kg/ha; N4: 150 kg/ha). Paracada tratamento fizeram-se 4 repeties.

    Na imagem seguinte, capturada do Excel, estes dados esto perceptveis para o leitor, eesto estruturados para algumas possveis anlises a executar na folha de clculo; contudo,ao serem introduzidos para um ficheiro SPSS, dever-se-o respeitar as normas deste

    programa, de modo a que os dados possam ser analisados.

    Variedade Azoto 1 2 3 4N0 3852 2606 3144 2894N1 4788 4936 4562 4608

    V1 N2 4576 4454 4884 3924N3 6034 5276 5906 5652N4 5874 5916 5984 5518N0 2846 3794 4108 3444N1 4956 5128 4150 4990

    V2 N2 5928 5698 5810 4308N3 5664 5362 6458 5474N4 5458 5546 5786 5932N0 4192 3754 3738 3428N1 5250 4582 4896 4286

    V3 N2 5822 4848 5678 4932N3 5888 5524 6042 4756N4 5864 6264 6056 5362

    Repetio

    Como se referiu atrs, os dados devero ser introduzidos para uma matriz rectangular, emque as colunas so as variveis e as linhas os casos. Neste caso, as variveis so aVariedade, o Azoto, a Repetio e a Produo.

    2.1.1 - DEFINIO DE VARIVEIS

    Vamos comear por definir estas variveis no SPSS dando-lhes nomes vlidos; as regraspara os nomes das variveis so:

    ! nome da varivel tem no mximo, 8 caracteres;! nome da varivel deve comear por uma letra; os restantes caracteres podem ser

    letras (maisculas ou minsculas so iguais), algarismos, ou os smbolos @, #, _, $.No se podem usar espaos em branco, nem os seguintes caracteres: !, ?, , , *, +, -,%, vrgula, ponto e vrgula, \, /, >, *=5%,concluindo-se assim que os ritmos cardacos em repouso, destas duas amostras, soestatisticamente iguais, para um nvel de significncia de 5%.

    O intervalo de confiana a 95% para a diferena entre as mdias [-5.67 , 8.34],podendo teoricamente a diferena ser nula.

    5.3 - TESTE T PARA DUAS AMOSTRAS EMPARELHADAS

    Pretende-se verificar se existem ou no diferenas significativas entre os ritmoscardacos antes e depois de realizao do exerccio fsico, isto :

    0:0:

    ::

    mod1mod0

    mod1mod0

    -&

    .

    -#

    ritritmoaritritmoa

    ritritmoaritritmoa

    xxHxxH

    xxHxxH

    Como anteriormente se fez notar, este teste dever ser efectuando, sem incluir oindivduo n 6, por se suspeitar que o respectivo registo do ritmo cardaco aps

    exerccio est errado. Para tal, fazer:

    DataSelect Cases...

  • 5/26/2018 SPSS Manual de Utiliza o

    89/151

    SPSS 5 - Testes T

    ESACB 87

    Pretende-se excluir o caso n 6 da anlise, isto , incluir na anlise todos os casos com

    excepo do caso n 6. Para tal, na caixa de dilogo seleccionar , edefinir que se seleccionam para anlise todos os cados diferenntes do caso n 6:

    A indicao caso ~= 6 significa todos os casos excepto o caso 6.

    O Data Editor do SPSS criou automaticamente uma varivel designada filter_$, em queindica quais os casos seleccionados e os no includos. Repare-se que a linha 6 esttraada, indicando que este caso est excludo de futuras anlises:

    Note-se que este procedimento de seleccionar casos no exclusivo nem obrigatrio doprocedimento da comparao de mdias de duas amostras emparelhadas. umprocedimento geral a efectuar previamente a qualquer anlise em que haja necessidadede seleccionar ou excluir casos.

    De seguida, passa-se ento comparao das mdias das duas amostras emparelhadas.Tal como o nome indica, deve haver pares de observaes, de modo que ambas asamostras tm o mesmo nmero de observaes.

    Para tal, fazer Statistics Compare Means Paired Samples T Test...:

  • 5/26/2018 SPSS Manual de Utiliza o

    90/151

    SPSS 5 - Testes T

    ESACB 88

    Na caixa de dilogo seguinte, seleccionar as duas variveis emparelhadas cujas mdiasse pretendem comparar:

    O boto serve para definir o intervalo de confiana para a diferena entre asduas mdias (por defeito, (1-*)=0.95).

    Os resultados so os seguintes:

    Paired Samples Statistics

    75.44 39 9.08 1.45

    137.31 39 12.56 2.01

    RITMOA

    RITMOD

    Pair1

    Mean NStd.

    DeviationStd. Error

    Mean

  • 5/26/2018 SPSS Manual de Utiliza o

    91/151

    SPSS 5 - Testes T

    ESACB 89

    Paired Samples Correlations

    39 .544 .000RITMOA & RITMODPair 1N Correlation Sig.

    Paired Samples Test

    -61.87 10.78 1.73 -65.36 -58.38 -35.858 38 .000RITMOA - RITMODPair 1Mean

    Std.Deviation

    Std. ErrorMean Lower Upper

    95% ConfidenceInterval of the

    Difference

    Paired Differences

    t dfSig.

    (2-tailed) No primeiro quadro so apresentados alguns parmetros estatsticos de cada uma dasamostras. Repare-se que foram s levados em conta 39 observaes em cada amostra.

    O quadro seguinte apresenta o valor do coeficiente de correlao de Pearson entre asduas variveis (r=0.544).

    No ltimo quadro apresentado o valor de 87.61mod & ritritmoa xx , o intervalo de

    confiana para a diferena entre mdias ([-65.36 , -58.38]) e o valor da estatstica deteste t-Student t= -35.858, bem como os graus de liberdade do teste e o valor p-value ouverdaddeiro nvel de significncia (0.000). Como |tcalc| = 35.858 > t(0.05,38)=2.025 (ou p-value=0.000 < *=5%) conclui-se que as mdias so significativamente diferentes.

  • 5/26/2018 SPSS Manual de Utiliza o

    92/151

    SPSS 6 - Anova

    ESACB 90

    6 - ANLISE DE VARINCIA

    6.1 - ENSAIOS UNI-FACTORIAIS

    A anlise de varincia uma metodologia estatstica cujo objectivo decidir se existemou no diferenas significativas entre as mdias de vrias amostras de uma varivelnumrica, definidas por diferentes tratamentos ou nveis de influncia de um factor. Estametodologia uma extenso do teste t-Student para duas amostras independentes.

    Isto :

    mdiasasentreivassignificatdiferenasExistem:... 1321:0 HxxxxH T ,#####

    De um modo muito resumido, a metodologia anova calcula a variabilidade totalexistente na caracterstica ou varivel em anlise, e particiona esta variabilidade comosendo devida fundamentalmente a duas causas: uma causa determinista, que o facto deas amostras serem sujeitas a tratamentos distintos (variabilidade entre tratamentos);causas aleatrias ou erro experimental, que engloba todas as restantes fontes devariabilidade, com excepo dos diferentes tratamentos (variabilidade residual ou erroexperimental). Estas variabilidades so estimativas de varincia (entre tratamentos, eresidual, respectivamente). Isto :

    Variabilidade Total = Variabilidade entre Tratamentos + Erro Experimental

    A estatstica de teste a estatstica F, que uma razo entre varincias, que sob opressuposto de que as observaes tm distribuio normal, segue uma distribuio F deSnedecor:

    );;(~Re dennum glglF

    sidualVarincia

    sTratamentoentreVarinciaF

    *#

    Se a estatstica F demasiado grande, ento porque a varincia entre tratamentos preponderante em relao varincia residual, isto , os diferentes tratamentos a que aamostra foi sujeita conduz a resultados estatisticamente diferentes.

    Na sequncia de uma anlise de varincia em que se conclua que existem diferenassignificativas entre as mdias dos diversos tratamentos em anlise, faz-se um testesuplementar a fim de identificar quais so as mdias estatisticamente diferentes. Osmais usuais so os testes LSD (Least Significant Difference, Diferena MnimaSignificativa), HSD-Tuckey (Honnestly Significant Difference), Scheff, Duncan.

    Vamos ilustrar a metodologia de anlise de varincia, usando os valores apresentadosno quadro seguinte, referentes s produes obtidas num ensaio em que se pretende

  • 5/26/2018 SPSS Manual de Utiliza o

    93/151

    SPSS 6 - Anova

    ESACB 91

    estudar o efeito da densidade de sementeira, na cultura de arroz (variedade IR8).Definiram-se 6 densidades de sementeira (kg/ha de semente). Para cada densidade defizeram-se 4 repeties. Todos os restantes factores de produo foram mantidosconstantes no ensaio (adaptado de GOMEZ & GOMEZ, 1984).

    Densidade Repeties25 5113 5398 5307 467850 5346 5952 4719 526475 5272 5713 5483 5049100 5164 4831 4986 4410125 4804 4848 4432 4748150 4254 4542 4919 4098

    A anova simples (ensaios uni-factoriais) pode ser executada no SPSS com doisprocedimentos:

    6.1.1 - PROCEDIMENTO ONE-WAY ANOVA

    Este o procedimento que conduz elaborao tpica da anlise de varincia, e no qual possvel definir a obteno de mais resultados no mbito desta metodologia estatstica.

    A partir do menu principal do SPSS, seleccionar:

    StatisticsCompare Means...One-Way ANOVA...

    Seleccionar para o campo o nome da varivel que contm os valores davarivel que contm os resultados a analisar (no exemplo, producao); no camposelecciona-se a varivel que identifica os diferentes tratamentos (densidad).

    Seleccionar a opo para definir qual ou quais os testes de comparao demdias a efectuar na sequncia da anova. Pode seleccionar-se apenas um ou mais testes.

  • 5/26/2018 SPSS Manual de Utiliza o

    94/151

    SPSS 6 - Anova

    ESACB 92

    No exemplo, pediram-se os testes LSD e Tuckey. O nvel de significncia , por defeito,*=5%, podendo este valor ser definido pelo utilizador:

    Fazer , voltando janela One-Way ANOVA, onde se pode seleccionar o boto

    a fim de definir clculos adicionais; no caso, pediram-se o clculo dosparmetros estatsticos, a realizao do teste de Levene para verificar se as varinciasdos diferentes tratamentos so homogneas e representar graficamente as mdias dosdiferentes tratamentos:

    Os resultados so os seguintes:

  • 5/26/2018 SPSS Manual de Utiliza o

    95/151

    SPSS 6 - Anova

    ESACB 93

    OnewayDescriptives

    Produo (kg/ha)

    4 5124.0000 320.2093 160.1047 4614.4755 5633.5245 4678.00 5398.00

    4 5320.2500 504.7893 252.3947 4517.0176 6123.4824 4719.00 5952.00

    4 5379.2500 284.4414 142.2207 4926.6402 5831.8598 5049.00 5713.00

    4 4847.7500 321.9900 160.9950 4335.3920 5360.1080 4410.00 5164.00

    4 4708.0000 188.4958 94.2479 4408.0611 5007.9389 4432.00 4848.00

    4 4453.2500 360.8798 180.4399 3879.0097 5027.4903 4098.00 4919.00

    24 4972.0833 455.9256 93.0654 4779.5628 5164.6038 4098.00 5952.00

    25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    Total

    N MeanStd.

    Deviation Std. Error LowerBound

    UpperBound

    95% Confidence Intervalfor Mean

    Minimum Maximum

    Test of Homogeneity of Variances

    Produo (kg/ha)

    .418 5 18 .830

    LeveneStatistic df1 df2 Sig.

    ANOVA

    Produo (kg/ha)

    2657880.8 5 531576.167 4.507 .008

    2123087.0 18 117949.278

    4780967.8 23

    Between Groups

    Within Groups

    Total

    Sum ofSquares df

    MeanSquare F Sig.

  • 5/26/2018 SPSS Manual de Utiliza o

    96/151

    SPSS 6 - Anova

    ESACB 94

    Post Hoc TestsMultiple Comparisons

    Dependent Variable: Produo (kg/ha)

    -196.2500 242.8469 .962 -968.0352 575.5352

    -255.2500 242.8469 .894 -1027.0352 516.5352

    276.2500 242.8469 .859 -495.5352 1048.0352

    416.0000 242.8469 .541 -355.7852 1187.7852

    670.7500 242.8469 .111 -101.0352 1442.5352

    196.2500 242.8469 .962 -575.5352 968.0352

    -59.0000 242.8469 1.000 -830.7852 712.7852

    472.5000 242.8469 .408 -299.2852 1244.2852

    612.2500 242.8469 .170 -159.5352 1384.0352

    867.0000* 242.8469 .023 95.2148 1638.7852

    255.2500 242.8469 .894 -516.5352 1027.0352

    59.0000 242.8469 1.000 -712.7852 830.7852

    531.5000 242.8469 .290 -240.2852 1303.2852

    671.2500 242.8469 .110 -100.5352 1443.0352

    926.0000* 242.8469 .014 154.2148 1697.7852

    -276.2500 242.8469 .859 -1048.0352 495.5352

    -472.5000 242.8469 .408 -1244.2852 299.2852

    -531.5000 242.8469 .290 -1303.2852 240.2852

    139.7500 242.8469 .991 -632.0352 911.5352

    394.5000 242.8469 .594 -377.2852 1166.2852

    -416.0000 242.8469 .541 -1187.7852 355.7852

    -612.2500 242.8469 .170 -1384.0352 159.5352

    -671.2500 242.8469 .110 -1443.0352 100.5352

    -139.7500 242.8469 .991 -911.5352 632.0352

    254.7500 242.8469 .895 -517.0352 1026.5352

    -670.7500 242.8469 .111 -1442.5352 101.0352

    -867.0000* 242.8469 .023 -1638.7852 -95.2148

    -926.0000* 242.8469 .014 -1697.7852 -154.2148

    -394.5000 242.8469 .594 -1166.2852 377.2852

    -254.7500 242.8469 .895 -1026.5352 517.0352-196.2500 242.8469 .430 -706.4525 313.9525

    -255.2500 242.8469 .307 -765.4525 254.9525

    276.2500 242.8469 .270 -233.9525 786.4525

    416.0000 242.8469 .104 -94.2025 926.2025

    670.7500* 242.8469 .013 160.5475 1180.9525

    196.2500 242.8469 .430 -313.9525 706.4525

    -59.0000 242.8469 .811 -569.2025 451.2025

    472.5000 242.8469 .067 -37.7025 982.7025

    612.2500* 242.8469 .021 102.0475 1122.4525

    867.0000* 242.8469 .002 356.7975 1377.2025

    255.2500 242.8469 .307 -254.9525 765.4525

    59.0000 242.8469 .811 -451.2025 569.2025

    531.5000* 242.8469 .042 21.2975 1041.7025

    671.2500* 242.8469 .013 161.0475 1181.4525

    926.0000* 242.8469 .001 415.7975 1436.2025-276.2500 242.8469 .270 -786.4525 233.9525

    -472.5000 242.8469 .067 -982.7025 37.7025

    -531.5000* 242.8469 .042 -1041.7025 -21.2975

    139.7500 242.8469 .572 -370.4525 649.9525

    394.5000 242.8469 .122 -115.7025 904.7025

    -416.0000 242.8469 .104 -926.2025 94.2025

    -612.2500* 242.8469 .021 -1122.4525 -102.0475

    -671.2500* 242.8469 .013 -1181.4525 -161.0475

    -139.7500 242.8469 .572 -649.9525 370.4525

    254.7500 242.8469 .308 -255.4525 764.9525

    -670.7500* 242.8469 .013 -1180.9525 -160.5475

    -867.0000* 242.8469 .002 -1377.2025 -356.7975

    -926.0000* 242.8469 .001 -1436.2025 -415.7975

    -394.5000 242.8469 .122 -904.7025 115.7025

    -254.7500 242.8469 .308 -764.9525 255.4525

    (J) Densidade desementeira50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha25 kg/ha

    50 kg/ha

    75 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    (I) Densidade desementeira25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    100 kg/ha

    125 kg/ha

    150 kg/ha

    Tukey HSD

    LSD

    Mean

    Difference(I-J) Std. Error Sig.

    LowerBound

    UpperBound

    95% Confidence Interval

    The mean difference is significant at the .05 level.*.

  • 5/26/2018 SPSS Manual de Utiliza o

    97/151

    SPSS 6 - Anova

    ESACB 95

    Homogeneous SubsetsProduo (kg/ha)

    4 4453.25004 4708.0000 4708.0000

    4 4847.7500 4847.7500

    4 5124.0000 5124.0000

    4 5320.2500

    4 5379.2500

    .111 .110

    Densidade desementeira

    150 kg/ha125 kg/ha

    100 kg/ha

    25 kg/ha

    50 kg/ha

    75 kg/ha

    Sig.

    Tukey HSDa

    N 1 2

    Subset for alpha = .05

    Means for groups in homogeneous subsets are displayed.

    Uses Harmonic Mean Sample Size = 4.000.a.

    Means Plots

    Densidade de sementeira

    150 kg/ha125 kg/ha100 kg/ha75 kg/ha50 kg/ha25 kg/haMeanofProduo(kg/ha)

    5600

    5400

    5200

    5000

    4800

    4600

    4400

    O primeiro quadro de resultados contm a mdias, desvio padro e erro padro da mdiae intervalo de confiana da mdia, mnimo e mximo para cada tratamento.

    De seguida apresentado o teste de homogeneidade de varincias de Levene:

    homogneassonovarinciasAs:: 124

    23

    22

    210 HssssH ###

    Como F=0.418 < F(0.05;5;18) =2.77, ou p-value=0.83 > *=0.05, conclui-se que as

    varincias so homogneas, isto , dentro de cada um dos tratamentos a variabilidade apenas devida a causas aleatrias.

    O quadro que se segue a tabela da anlise de varincia, apresentando a variabilidadeparticionada entre os tratamentos (betwen groups) e residual (within groups). ComoF=4.507 > F(0.05;5;18) =2.77, ou p-value=0.008 < *=0.05, conclui-se que existemdiferenas significativas entre as produes mdias das 6 densidades de sementeira, comum nvel de significncia de 5%.

    Contudo, este resultado no nos permite concluir qual ou quais densidades conduzem aprodues mdias significativamente diferentes de outras. Para concluir tal, h queproceder comparao da mdia de cada um dos tratamentos com todas as restantes.esta comparao feita em termos do valor absoluto das diferenas entre mdias: se esta

  • 5/26/2018 SPSS Manual de Utiliza o

    98/151

    SPSS 6 - Anova

    ESACB 96

    diferena entre duas mdias pequena, ento as mdias no diferem; se a diferena grande, ento as duas mdias so estatisticamente distintas. Este o princpio dequalquer teste de comparaes mltiplas.

    Contudo, h que fixar um critrio que defina a fronteira entre o que uma diferena

    grande e uma diferena pequena. Este critrio estabelecido por cada um dos testes(LSD, Scheff, Tukey, etc), com base em expresses que relacionam a mdia das somasdos quadrados residual (calculada na tabela anova) e com base em funes dedistribuio de probabilidades.

    No quadro dos resultados dos testes de comparaes mltiplas so identificados com osmbolo * quais os tratamentos cujas mdias diferem significativamente. Repare-se queambos os testes acusam como conduzindo a produes mdias diferentes densidades de50 kg/ha e 150 kg/ha (diferena de 867 kg) e 75 kg/ha e 150 kg/ha (diferena de 926kg). Contudo apenas o teste LSD acusa existirem diferenas entre as produesalcanadas com 25 e 150 kg/ha (diferena de 670.75 kg), 50 e 125 kg/ha (diferena de

    612.25 kg), 75 e 100 kg/ha (diferena de 531.5 kg).

    Isto , o teste LSD acusa como diferentes tratamentos cujas mdias esto menosafastadas do que o teste Tuckey, que d, por assim dizer, maior margem de dvida antesde imputar essas diferenas aos efeitos dos tratamentos.

    De seguida aparece um quadro complementar do teste Tukey em que agrupa ostratamentos em grupos homogneos, sendo o critrio de agrupamento o facto de noexistirem diferenas significativas entre os mdias dos tratamentos includos no mesmogrupo. O mesmo tratamento pode pertencer a mais do que um grupo, desde que nodifira dos restantes tratamentos desse grupo. Assim, as densidades de sementeira de150, 125, 100, 25 constituem um grupo de tratamentos, cujas produes mdias so asmais baixas; as densidades de 125, 100, 25, 50, 75 constituem outro grupo, cujas

    produes so as mais altas. claro que alguns dos tratamentos densidades de 125, 100,25) pertencem aos dois grupos6.

    Em termos absolutos, a densidade de sementeira que conduz a maior produo adensidade de 75 kg/ha; contudo, a produo obtida com a densidade de 50 kg/ha nodifere significativamente da anterior, e pode haver vantagens econmicas em usar estadensidade. Contudo, estas so algumas reflexes de ndole tcnica que competem aoanalista desenvolver, no cabendo propriamente no mbito deste manual.

    No final aparece um grfico representado as mdias dos tratamentos, que pode ser tilexplorar no sentido de compreender os resultados, e deles tirar o proveito no mbito daaplicabilidade da Estatstica ao delineamento de ensaios agrcolas.

    6.1.2 - PROCEDIMENTO MEANS

    A partir do menu principal do SPSS, seleccionar:

    6 Deixa-se ao cuidado do leitor a explicao agronmica destas concluses.

  • 5/26/2018 SPSS Manual de Utiliza o

    99/151

    SPSS 6 - Anova

    ESACB 97

    StatisticsCompare Means...

    Means...

    Seleccionar para o campo o nome da varivel que contm os valores davarivel a analisar (no exemplo, producao); no campo selecciona-se avarivel que identifica os diferentes tratamentos (densidad).

    Seleccionar o boto a fim de pedir a elaborao da tabela da anlise devarincia. Por defeito, so calculados os parmetros mdia e desvio padro; o utilizador

    pode seleccionar outras estatsticas a calcular:

    Os resultados so os seguintes:

  • 5/26/2018 SPSS Manual de Utiliza o

    100/151

    SPSS 6 - Anova

    ESACB 98

    MeansCase Processing Summary

    24 100.0% 0 .0% 24 100.0%Produo (kg/ha) *Densidade desementeira

    N Percent N Percent N Percent

    Included Excluded Total

    Cases

    Report

    Produo (kg/ha)

    5124.0000 4 320.2093

    5320.2500 4 504.7893

    5379.2500 4 284.44144847.7500 4 321.9900

    4708.0000 4 188.4958

    4453.2500 4 360.8798

    4972.0833 24 455.9256

    Densidade desementeira25 kg/ha

    50 kg/ha

    75 kg/ha100 kg/ha

    125 kg/ha

    150 kg/ha

    Total

    Mean NStd.

    Deviation

    ANOVA Table

    2657880.8 5 31576.167 4.507 .008

    2123087.0 18 17949.278

    4780967.8 23

    (Combined)Between

    Within Groups

    Total

    Produo (kg/ha) *Densidade desementeira

    Sum ofSquares df

    MeanSquare F Sig.

    Measures of Association

    .746 .556Produo (kg/ha) *Densidade desementeira

    EtaEta

    Squared

    A tabela da anova idntica obtida no procedimento anterior. Contudo, esteprocedimento no permite a obteno dos testes subsequentes que foram obtidos

    previamente.

    A estatstica Eta-Squared a proporo de varincia da varivel dependente que

    explicada pelas diferenas entre os tratamentos; dado pela expressoT

    H

    SS

    SS(isto ,

    razo entre Soma dos Quadrados entre tratamentos (SSH) e a Soma dos Quadrados total(SST). A designao de Eta adoptada pelo SPSS no contexto da anova destina-se a nofazer confuso com o coeficiente de determinao, R2, usado no contexto da regressolinear, e que pode ser obtido a partir da tabela da anova da regresso pela expressoanterior.

  • 5/26/2018 SPSS Manual de Utiliza o

    101/151

    SPSS 6 - Anova

    ESACB 99

    6.2 - ENSAIOS MULTI-FACTORIAIS

    Os organismos biolgicos esto simultaneamente expostos a muitos factores decrescimento. A resposta de um organismo a um nico factor de crescimento pode variar

    com o nvel de outros factores; assim, os delineamentos uni-factoriais so criticadospelo seu pequeno leque de aplicabilidade. Na realidade, os resultados dos delineamentosuni-factoriais so apenas vlidos para o caso particular (e extremamente difceis deconseguir) de todos os restantes factores serem mantidos constantes.

    Neste sentido, quando se espera que a resposta a um factor de interesse varie sobdiferentes nveis de outros factores, devem evitar-se os delineamentos uni-factoriais, econsiderar um delineamento multi-factorial que permita estudar em simultneo dois oumais factores.

    Em ensaios factoriais, h a considerar os efeitos de cada um dos nveis de um dos

    factores, mantendo os nveis dos outros factores constantes (efeitos simples), os efeitosde cada um dos factores, abstraindo da presena dos outros factores (efeitos principais)e interaco entre os nveis dos diversos factores (interaco entre factores).

    Diz-se que existe interaco entre dois factores se a resposta a um dos factores variaconsoante os nveis do outro factor.

    A fim de ilustrar o procedimento de clculo da anlise de varincia multi-factorial,vamos usar o ficheiro arroz.sav, em que se pretende verificar a influncia de trsvariedades (IR8, IR5, CA-63) e 5 nveis de adubao azotada (0, 60, 90, 120, 150 kg/ha)na produo de arroz.

    StatisticsGeneral Linear Model

    GLM General Factorial ...

    Na caixa de dilogo seguinte, seleccionar a varivel dependente a analisar (producao) eos factores de produo cuja influncia se pretende analisar (variedade adubacao):

  • 5/26/2018 SPSS Manual de Utiliza o

    102/151

    SPSS 6 - Anova

    ESACB 100

    De seguida, seleccionar a opo a fim de definir o modelo de anova a

    calcular. Por defeito, est seleccionada a opo , que especifica que a tabelada anova apresentar a os efeitos principais de cada factor, bem como as interaces

    entre factores. a situao mais usual. Optando por o utilizador pode definirque a anova apresente apenas os efeitos principais, ou apenas algumas das interaces a

    definir.

    Por defeito, est definido o mtodo de clculo da soma de quadrados (tipo III); para

    delineamentos em que no haja missing-values deve definir-se esta metodologia declculo.

  • 5/26/2018 SPSS Manual de Utiliza o

    103/151

    SPSS 6 - Anova

    ESACB 101

    A opo deve ser seleccionada (por defeito, est activada). Casose assuma que os dados passam pela origem dos eixos (isto , caso a ausncia dosfactores em anlise conduzam a valor zero da varivel dependente), pode omitir-se estaopo. Da sua incluso no modelo resulta a apresentao de mais uma linha inusitada natabela da anova, que traduz a variabilidade associada varivel dependente para osnveis zero dos factores. As restantes linhas da tabela so as usuais.

    Fazer para regressar janela GLM General factorial, onde se deve

    seleccionar para representar graficamente as mdias de cada um dosfactores e das interaces de factores:

    Para seleccionar o grfico das mdias de um factor, definir esse factor em

    ; fazer para adicionar esse grfico; para definir o grfico dasinteraces, seleccionar um factor para Horizontal Axis e outro factor para Separate

    Lines. Fazer para continuar.

    Optar por para definir os testes de comparaes mltiplas:

  • 5/26/2018 SPSS Manual de Utiliza o

    104/151

    SPSS 6 - Anova

    ESACB 102

    Fazer para continuar. Seleccionar para seleccionar o clculo deparmetros estatsticos, teste de Levene de homogeneidade de varincias e os intervalosde confiana para as mdias:

    Os resultados deste procedimento so os seguintes:

    Univariate Analysis of Variance

  • 5/26/2018 SPSS Manual de Utiliza o

    105/151

    SPSS 6 - Anova

    ESACB 103

    Between-Subjects Factors

    IR8 20

    IR5 20

    C4-63 20

    0 kg/ha 12

    60 kg/ha 12

    90 kg/ha 12

    120 kg/ha 12

    150 kg/ha 12

    1

    2

    3

    Variedade

    0

    1

    2

    3

    4

    Adubao

    ValueLabel N

    Descriptive Statistics

    Dependent Variable: Produo

    3124.0000 532.7939 4

    4723.5000 171.9874 4

    4459.5000 400.2345 4

    5717.0000 334.1237 4

    5823.0000 208.3235 4

    4769.4000 1054.8145 20

    3548.0000 540.9054 4

    4806.0000 443.6124 4

    5436.0000 757.8408 4

    5739.5000 494.9542 4

    5680.5000 217.5462 45042.0000 957.4259 20

    3778.0000 314.1507 4

    4753.5000 414.2411 4

    5320.0000 501.1640 4

    5552.5000 573.7000 4

    5886.5000 385.9374 4

    5058.1000 855.9827 20

    3483.3333 513.9808 12

    4761.0000 331.3680 12

    5071.8333 689.7728 12

    5669.6667 441.1381 12

    5796.6667 271.0335 12

    4956.5000 952.5245 60

    Adubao0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    Total

    0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/haTotal

    0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    Total

    0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    Total

    VariedadeIR8

    IR5

    C4-63

    Total

    Mean

    Std.

    Deviation N

    Levene's Test of Equality of Error Variancesa

    Dependent Variable: Produo

    1.044 14 45 .430F df1 df2 Sig.

    Tests the null hypothesis that the error variance of thedependent variable is equal across groups.

    Design: Intercept+VARIEDAD+AZOTO+VARIEDAD *AZOTO

    a.

  • 5/26/2018 SPSS Manual de Utiliza o

    106/151

    SPSS 6 - Anova

    ESACB 104

    Tests of Between-Subjects Effects

    Dependent Variable: Produo

    44578256a 14 3184161.1 16.005 .000

    1.47E+09 1 1.47E+09 7409.078 .000

    1052784.4 2 526392.200 2.646 .082

    41234745 4 10308686 51.816 .000

    2290726.3 8 286340.783 1.439 .207

    8952613.0 45 198946.956

    1.53E+09 60

    53530869 59

    SourceCorrected Model

    Intercept

    VARIEDAD

    AZOTO

    VARIEDAD * AZOTO

    Error

    Total

    Corrected Total

    Type IIISum of

    Squares df Mean

    Square F Sig.

    R Squared = .833 (Adjusted R Squared = .781)a.

    Estimated Marginal Means1. VariedadeEstimates

    Dependent Variable: Produo

    4769.400 99.736 4568.521 4970.279

    5042.000 99.736 4841.121 5242.879

    5058.100 99.736 4857.221 5258.979

    VariedadeIR8

    IR5

    C4-63

    Mean Std. Error LowerBound

    UpperBound

    95% Confidence Interval

    Pairwise Comparisons

    Dependent Variable: Produo

    -272.600 141.049 .060 -556.686 11.486

    -288.700* 141.049 .047 -572.786 -4.614

    272.600 141.049 .060 -11.486 556.686

    -16.100 141.049 .910 -300.186 267.986288.700* 141.049 .047 4.614 572.786

    16.100 141.049 .910 -267.986 300.186

    (J) VariedadeIR5

    C4-63

    IR8

    C4-63IR8

    IR5

    (I) VariedadeIR8

    IR5

    C4-63

    MeanDifference

    (I-J) Std. Error Sig.aLowerBound

    UpperBound

    95% Confidence Intervalfor Differencea

    Based on estimated marginal means

    The mean difference is significant at the .05 level.*.

    Adjustment for multiple comparisons: Least Significant Difference (equivalent to noadjustments).

    a.

  • 5/26/2018 SPSS Manual de Utiliza o

    107/151

    SPSS 6 - Anova

    ESACB 105

    Univariate Tests

    Dependent Variable: Produo

    1052784.4 2 526392.200 2.646 .082

    8952613.0 45 198946.956

    Contrast

    Error

    Sum ofSquares df

    MeanSquare F Sig.

    The F tests the effect of Variedade. This test is based on the linearlyindependent pairwise comparisons among the estimated marginal means.

    2. Adubao

    Estimates

    Dependent Variable: Produo

    3483.333 128.759 3223.999 3742.6684761.000 128.759 4501.666 5020.334

    5071.833 128.759 4812.499 5331.168

    5669.667 128.759 5410.332 5929.001

    5796.667 128.759 5537.332 6056.001

    Adubao

    0 kg/ha60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    Mean Std. Error LowerBound

    UpperBound

    95% Confidence Interval

  • 5/26/2018 SPSS Manual de Utiliza o

    108/151

    SPSS 6 - Anova

    ESACB 106

    Pairwise Comparisons

    Dependent Variable: Produo

    -1277.667* 182.093 .000 -1644.421 -910.913

    -1588.500* 182.093 .000 -1955.254 -1221.746

    -2186.333* 182.093 .000 -2553.087 -1819.579

    -2313.333* 182.093 .000 -2680.087 -1946.579

    1277.667* 182.093 .000 910.913 1644.421

    -310.833 182.093 .095 -677.587 55.921

    -908.667* 182.093 .000 -1275.421 -541.913

    -1035.667* 182.093 .000 -1402.421 -668.913

    1588.500* 182.093 .000 1221.746 1955.254

    310.833 182.093 .095 -55.921 677.587

    -597.833* 182.093 .002 -964.587 -231.079

    -724.833* 182.093 .000 -1091.587 -358.079

    2186.333* 182.093 .000 1819.579 2553.087

    908.667* 182.093 .000 541.913 1275.421

    597.833* 182.093 .002 231.079 964.587

    -127.000 182.093 .489 -493.754 239.754

    2313.333* 182.093 .000 1946.579 2680.087

    1035.667* 182.093 .000 668.913 1402.421

    724.833* 182.093 .000 358.079 1091.587

    127.000 182.093 .489 -239.754 493.754

    (J) Adubao60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    90 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    (I) Adubao0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    MeanDifference(I-J) Std. Error Sig.

    aLowerBound

    UpperBound

    95% Confidence Intervalfor Difference

    a

    Based on estimated marginal means

    The mean difference is significant at the .05 level.*.

    Adjustment for multiple comparisons: Least Significant Difference (equivalent to noadjustments).

    a.

    Univariate Tests

    Dependent Variable: Produo

    41234745 4 10308686 51.816 .000

    8952613.0 45 198946.956

    Contrast

    Error

    Sum ofSquares df

    MeanSquare F Sig.

    The F tests the effect of Adubao. This test is based on the linearlyindependent pairwise comparisons among the estimated marginal means.

  • 5/26/2018 SPSS Manual de Utiliza o

    109/151

    SPSS 6 - Anova

    ESACB 107

    3. Variedade * Adubao

    Dependent Variable: Produo

    3124.000 223.017 2674.820 3573.180

    4723.500 223.017 4274.320 5172.680

    4459.500 223.017 4010.320 4908.680

    5717.000 223.017 5267.820 6166.180

    5823.000 223.017 5373.820 6272.180

    3548.000 223.017 3098.820 3997.180

    4806.000 223.017 4356.820 5255.180

    5436.000 223.017 4986.820 5885.180

    5739.500 223.017 5290.320 6188.680

    5680.500 223.017 5231.320 6129.680

    3778.000 223.017 3328.820 4227.1804753.500 223.017 4304.320 5202.680

    5320.000 223.017 4870.820 5769.180

    5552.500 223.017 5103.320 6001.680

    5886.500 223.017 5437.320 6335.680

    Adubao0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    VariedadeIR8

    IR5

    C4-63

    Mean Std. Error

    Lower

    Bound

    Upper

    Bound

    95% Confidence Interval

    Post Hoc TestsVariedade

    Multiple Comparisons

    Dependent Variable: Produo

    Tukey HSD

    -272.6000 141.0486 .141 -614.4488 69.2488

    -288.7000 141.0486 .113 -630.5488 53.1488

    272.6000 141.0486 .141 -69.2488 614.4488

    -16.1000 141.0486 .993 -357.9488 325.7488

    288.7000 141.0486 .113 -53.1488 630.5488

    16.1000 141.0486 .993 -325.7488 357.9488

    (J) VariedadeIR5

    C4-63

    IR8

    C4-63

    IR8

    IR5

    (I) VariedadeIR8

    IR5

    C4-63

    MeanDifference

    (I-J) Std. Error Sig.LowerBound

    UpperBound

    95% Confidence Interval

    Based on observed means.

  • 5/26/2018 SPSS Manual de Utiliza o

    110/151

    SPSS 6 - Anova

    ESACB 108

    Homogeneous SubsetsProduo

    Tukey HSDa,b

    20 4769.4000

    20 5042.0000

    20 5058.1000

    .113

    VariedadeIR8

    IR5

    C4-63

    Sig.

    N 1

    Subset

    Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 198946.956.

    Uses Harmonic Mean Sample Size = 20.000.a.

    Alpha = .05.b.

    AdubaoMultiple Comparisons

    Dependent Variable: Produo

    Tukey HSD

    -1277.6667* 182.0929 .000 -1795.0797 -760.2536

    -1588.5000* 182.0929 .000 -2105.9131 -1071.0869

    -2186.3333* 182.0929 .000 -2703.7464 -1668.9203

    -2313.3333* 182.0929 .000 -2830.7464 -1795.9203

    1277.6667* 182.0929 .000 760.2536 1795.0797

    -310.8333 182.0929 .440 -828.2464 206.5797

    -908.6667* 182.0929 .000 -1426.0797 -391.2536

    -1035.6667* 182.0929 .000 -1553.0797 -518.2536

    1588.5000* 182.0929 .000 1071.0869 2105.9131

    310.8333 182.0929 .440 -206.5797 828.2464

    -597.8333* 182.0929 .016 -1115.2464 -80.4203

    -724.8333* 182.0929 .002 -1242.2464 -207.4203

    2186.3333* 182.0929 .000 1668.9203 2703.7464

    908.6667* 182.0929 .000 391.2536 1426.0797

    597.8333* 182.0929 .016 80.4203 1115.2464

    -127.0000 182.0929 .956 -644.4131 390.4131

    2313.3333* 182.0929 .000 1795.9203 2830.7464

    1035.6667* 182.0929 .000 518.2536 1553.0797

    724.8333* 182.0929 .002 207.4203 1242.2464

    127.0000 182.0929 .956 -390.4131 644.4131

    (J) Adubao60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    120 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    90 kg/ha

    150 kg/ha

    0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    (I) Adubao0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    MeanDifference

    (I-J) Std. Error Sig.LowerBound

    UpperBound

    95% Confidence Interval

    Based on observed means.

    The mean difference is significant at the .05 level.*.

  • 5/26/2018 SPSS Manual de Utiliza o

    111/151

    SPSS 6 - Anova

    ESACB 109

    Homogeneous SubsetsProduo

    Tukey HSDa,b

    12 3483.3333

    12 4761.0000

    12 5071.8333

    12 5669.6667

    12 5796.6667

    1.000 .440 .956

    Adubao0 kg/ha

    60 kg/ha

    90 kg/ha

    120 kg/ha

    150 kg/ha

    Sig.

    N 1 2 3

    Subset

    Means for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = 198946.956.

    Uses Harmonic Mean Sample Size = 12.000.a.

    Alpha = .05.b.

    Profile Plots

    Estimated Marginal Means of Produo

    Variedade

    C4-63IR5IR8EstimatedMarginalMeans

    5100

    5000

    4900

    4800

    4700

  • 5/26/2018 SPSS Manual de Utiliza o

    112/151

    SPSS 6 - Anova

    ESACB 110

    Estimated Marginal Means of Produo

    Adubao

    150 kg/ha120 kg/ha90 kg/ha60 kg/ha0 kg/haEst

    imatedMarginalMeans

    6000

    5000

    4000

    3000

    Estimated Marginal Means of Produo

    Adubao

    150 kg/ha120 kg/ha90 kg/ha60 kg/ha0 kg/haEstimatedMarginalMeans

    7000

    6000

    5000

    4000

    3000

    2000

    Variedade

    IR8

    IR5

    C4-63

  • 5/26/2018 SPSS Manual de Utiliza o

    113/151

    SPSS 7 - Regresso Linear

    ESACB 111

    7 - REGRESSO LINEAR

    7.1 - INTRODUO

    Muitos estudos estatsticos tm como objectivo estabelecer uma relao, traduzida poruma equao, que permite estimar o valor de uma varivel, em funo de outra ououtras variveis.

    O caso mais simples traduzir esta relao pela equao de uma recta, quando oacrscimo de uma varivel, designada por dependente e usualmente representada por y,varia linearmente com os acrscimos provocados noutra varivel, designada porindependente, representada por x.

    A equao que traduz esta relao bxay (# ou xbby 10(# , em que os parmetros

    ou coeficientes so a ordenada na origem, a (ou bo), e o declive, b (ou b1).

    Como regra, previamente ao clculo da regresso linear, deve fazer-se uma anlisegrfica aos dados (grfico de disperso ou scatterplot), a fim de ter uma percepovisual da existncia ou no de uma tendncia de dependncia entre as variveis, e comomtodo de detectar possveis observaes outliers ou influentes, que distoram osresultados.

    A representao grfica dos dados, num grfico de pontos (scatterplot) ajuda aidentificar algumas situaes em que a equao de regresso linear simples no tem umajustamento perfeito. De seguida, ilustram-se algumas destas situaes.

    Na situao 1, a observao assinalada um outlier bi-variado, muito embora no o sejaem relao a cada uma das variveis, j que no observao extrema. Contudo, o par(x,y) est deslocado do contexto geral das restantes observaes. Em relao srestantes observaes, o grfico evidencia uma tendncia segundo uma recta crescente.O utilizador dever verificar os dados e corrigir eventuais registos errneos, ousimplesmente desprezar esta observao e efectuar a regresso com os dados restantes.

    Note-se que a incluso desta observao ir provocar uma acentuada variao nodeclive da recta.

  • 5/26/2018 SPSS Manual de Utiliza o

    114/151

    SPSS 7 - Regresso Linear

    ESACB 112

    Situao 1

    0

    50

    10

    Na situao 2 existe uma observao igualmente muito influente em termos do decliveda recta ajustada. Neste caso, a observao assinalada tem tendncia a ser outlier, quer

    bi-variado, quer em relao a cada uma das variveis. Alm disso, eliminando estaobservao, resta uma nuvem de pontos, em que no ntida qualquer tendncia derelao entre as variveis.

    Situao 2

    0

    60

    10

    Na situao 3, a varincia da varivel y no uniforme, ao longo dos valores em x, isto, tomando fatias verticais ao longo do eixo dos xx, a disperso dos valores y vaiaumentando para valores mais elevados de y. Muito embora a normalidade dos dados

    no seja um pressuposto obrigatrio para a estimativa da regresso linear, contudonecessrio que os resduos (yobs yest) tenham distribuio normal e varincia constante.

    Nesta situao, estes pressupostos so violados, invalidando as inferncias que se faama partir da equao estimada.

  • 5/26/2018 SPSS Manual de Utiliza o

    115/151

    SPSS 7 - Regresso Linear

    ESACB 113

    Situao 3

    0

    50

    10

    A situao 4 ilustra uma forte relao entre x e y, mas no de tipo linear, pelo que oajustamento de uma recta para traduzir esta funo de dependncia errada e semsignificado.

    Situao 4

    0

    12

    0 16

    Na situao 5 recolheram-se observaes apenas nas zonas extremas do intervalo devariao de x, no existindo dados para valores intermdios da varivel x. A funo deregresso linear nesta situao fortemente influenciada pelos valores extremos, masno traduz a relao que existe para todo o intervalo de x. Na recolha de dados, devehaver a preocupao de que a amostragem cubra todo o intervalo de variao de x, demodo a evidenciar o comportamento da relao no interior desse intervalo.

    Situao 5

    0

    20

    0 10

  • 5/26/2018 SPSS Manual de Utiliza o

    116/151

    SPSS 7 - Regresso Linear

    ESACB 114

    O objectivo da regresso linear estabelecer a funo bxay (# desta recta, que de ummodo muito aproximado permite estimar o valor de y para dado valor de x. O clculodos coeficientes de regresso faz-se pelo mtodo dos mnimos quadrados, que minimiza

    a soma dos quadrados dos resduos, isto , minimiza a funo $ %8 & 2yyobs , em quey representa o valor estimado pela equao para dado valor x.

    No grfico seguinte representam-se os valores de 24 pares de valores do tipo (x,y), emque no eixo dos xx est representada a varivel % de slidos insolveis em gua e nosyy se representa a % total de slidos, duas caractersticas importantes em molho detomate (adaptado de DERECK PIKE, 19??; os dados so apresentados em anexo):

    % insolveis em gua

    181716151413121110%s

    lidos

    nomolho

    60

    50

    40

    30

    20

    evidente a tendncia do decrscimo da % de slidos no molho com o aumento da %de insolveis em gua, segundo uma relao aproximadamente linear. Pretende-seestabelecer esta relao entre as duas variveis, com os objectivos de (i) descrever a

    relao entre as caractersticas para este tipo de molho, e (ii) poder estimar ou prever a% de slidos do molho (caracterstica bastante difcil de quantificar) mediante a % deinsolveis em gua que o molho contm (caracterstica relativamente fcil dedeterminar).

    A equao de regresso linear uma estatstica, e como tal, tem inerente a componentede erro estatstico. A fim de interpretar a equao estimada, so apresentados uma sriede coeficientes e estatsticas suplementares, que de um modo geral permitem analisar omaior ou menor grau de rigor com que a equao de regresso traduz a relao entre asvariveis em estudo.

    Um dos coeficientes associados equao o coeficiente de correlao linear,representado por r, que representa, na escala ]-1, 1[, a correlao ou associao entre as

  • 5/26/2018 SPSS Manual de Utiliza o

    117/151

    SPSS 7 - Regresso Linear

    ESACB 115

    duas variveis; o quadrado deste coeficiente constitui o coeficiente de correlao total,ou coeficiente de determinao, representado por R2, que traduz, a % de variabilidadeda varivel dependente (y) que explicada pela varivel independente (x).

    apresentado o coeficiente de determinao ajustado, que um estimador no

    enviezado de R2

    (que tende a ser um estimador sobre-avaliado) definido a partir de R2

    pela expresso:

    1

    )1( 222&&

    &

    pN

    RpRRa

    em que p o nmero de variveis independentes; no caso da equao de regressolinear simples bxay (# , p=1.

    So apresentados os intervalos de confiana para os coeficientes a e b, bem como os

    erros-padro e as estatsticas dos seguintes testes de hipteses:

    teste referente ao coeficiente a: 0:0: 10 -# aHaH

    teste referente ao coeficiente b: 0:0: 10 -# bHbH

    O output do procedimento do clculo da equao de regresso apresenta a tabela daanova, que constitui um teste de hipteses existncia ou no de uma relao dedependncia:

    0:0:

    ::

    10

    10

    -#.

    bHbH

    xdedependeyHxdedependenoyH

    A estatstica F tem um valor alto quando a varivel independente ajuda a explicar avariabilidade da varivel dependente.

    Alm disso, a tabela da anlise de varincia fornece a mdia da soma dos quadradosdos resduos, cuja raz quadrada o erro padro da estimativa. A equao de regresso to mais ajustada aos dados, quanto menor for o erro padro da estimativa,comparativamente com o desvio padro da varivel dependente.

    7.2 - REGRESSO LINEAR SIMPLES

    Para proceder ao clculo da equao de regresso linear, executar o seguinteprocedimento7:

    StatisticsRegression

    7 No exemplo usam-se os dados das caractersticas do molho de tomate, em que as variveis soinsoluve(% de insolveis em gua) e solidos(% total de slidos no molho).

  • 5/26/2018 SPSS Manual de Utiliza o

    118/151

    SPSS 7 - Regresso Linear

    ESACB 116

    No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,onde se define a varivel dependente (solidos) e a varivel independente (insoluve) paraos respectivos campos:

    Seleccionar o boto , que abre a seguinte caixa de dilogo, onde seseleccionam as opes Confidence intervals e Descriptives; as opes Estimates eModel fit esto activadas por defeito:

  • 5/26/2018 SPSS Manual de Utiliza o

    119/151

    SPSS 7 - Regresso Linear

    ESACB 117

    Fazer a fim de regressar janela Linear Regression, onde se selecciona:

    Nesta caixa de dilogo, deve seleccionar e para obtero histograma e o grfico do ajustamento normal dos resduos, a fim de verificar se osresduos seguem distribuio normal (pressuposto para a validade da regresso linear)

    para verificar a linearidade e a igualdade de varincia dos resduos, efectuar o grficodos resduos, com os valores estimados standardizados (ZPRED) no eixo dos xx, e os

    resduos standardizados (ZRESID) no eixo dos yy. No final, fazer a fim deregressar janela Linear Regression.

    O boto d acesso seguinte caixa de dilogo, onde se podem definir critriosde selecco ou remoo de variveis independentes (s tm efeito em regressomltipla):

  • 5/26/2018 SPSS Manual de Utiliza o

    120/151

    SPSS 7 - Regresso Linear

    ESACB 118

    Os resultados do procedimento so os seguintes:

    RegressionDescriptive Statistics

    39.7292 5.1826 24

    13.7775 1.8995 24

    % slidos no molho

    % insolveis em gua

    MeanStd.

    Deviation N

    Correlations

    1.000 -.970

    -.970 1.000

    . .000

    .000 .

    24 24

    24 24

    % slidos no molho

    % insolveis em gua

    % slidos no molho

    % insolveis em gua

    % slidos no molho

    % insolveis em gua

    Pearson Correlation

    Sig. (1-tailed)

    N

    % slidosno molho

    %insolveisem gua

    Variables Entered/Removedb

    % insolveis em guaa . Enter Model1

    Variables EnteredVariablesRemoved Method

    All requested variables entered.a.

    Dependent Variable: % slidos no molhob.

  • 5/26/2018 SPSS Manual de Utiliza o

    121/151

    SPSS 7 - Regresso Linear

    ESACB 119

    Model Summaryb

    .970a .941 .938 1.2880Model1

    R R SquareAdjusted R

    Square

    Std. Errorof the

    Estimate

    Predictors: (Constant), % insolveis em guaa.

    Dependent Variable: % slidos no molhob.

    ANOVAb

    581.272 1 581.272 350.378 .000a

    36.498 22 1.659

    617.770 23

    Regression

    Residual

    Total

    Model1

    Sum ofSquares df

    MeanSquare F Sig.

    Predictors: (Constant), % insolveis em guaa.

    Dependent Variable: % slidos no molhob.

    Coefficientsa

    76.193 1.966 38.761 .000 72.117 80.270

    -2.647 .141 -.970 -18.718 .000 -2.940 -2.353

    (Constant)

    % insolveis em gua

    Model1

    B Std. Error

    UnstandardizedCoefficients

    Beta

    Standardized

    Coefficients

    t Sig.LowerBound

    UpperBound

    95% Confidence Intervalfor B

    Dependent Variable: % slidos no molhoa.

    Residuals Statisticsa

    27.9714 47.8478 39.7292 5.0272 24

    -1.5871 3.1522 -3.70E-15 1.2597 24

    -2.339 1.615 .000 1.000 24

    -1.232 2.447 .000 .978 24

    Predicted Value

    Residual

    Std. Predicted Value

    Std. Residual

    Minimum Maximum MeanStd.

    Deviation N

    Dependent Variable: % slidos no molhoa.

  • 5/26/2018 SPSS Manual de Utiliza o

    122/151

    SPSS 7 - Regresso Linear

    ESACB 120

    Charts

    Regression Standardized Residual

    2.502.001.501.00.500.00-.50-1.00

    Histogram

    Dependent Variable: % slidos no molho

    Freque

    ncy

    7

    6

    5

    4

    3

    2

    1

    0

    Std. Dev = .98

    Mean = 0.00

    N = 24.00

    Normal P-P Plot of Regression Standardized Residual

    Dependent Variable: % slidos no molho

    Observed Cum Prob

    1.00.75.50.250.00ExpectedCum

    Prob

    1.00

    .75

    .50

    .25

    0.00

  • 5/26/2018 SPSS Manual de Utiliza o

    123/151

    SPSS 7 - Regresso Linear

    ESACB 121

    Scatterplot

    Dependent Variable: % slidos no molho

    Regression Standardized Predicted Value

    210-1-2-3RegressionStandardizedResidual

    3

    2

    1

    0

    -1

    -2

    A equao da recta estimada xy 647.2193.76 , em que x a % de insolveis emgua e y a % de slidos no molho.

    A anlise e interpretao pormenorizadas dos resultados deixam-se a cargo do leitor.Chama-se apenas a ateno para o facto de os resduos estarem ligeiramente

    desajustados da distribuio normal, como est evidenciado no histograma (nota-se umacentuado enviezamento esquerda, bem como a falta de resduos numa das classescentrais) e no grfico de ajustamento normal (um perfeito ajustamento traduzido

    pela diagonal do grfico; neste caso, os resduos situam-se sistematicamente acima ouabaixo desta linha, em diferentes zonas do grfico). No grfico dos resduosstandardizados versusvalores previstos standardizados nota-se uma tendncia para queos resduos se distribuam segundo uma curva ligeiramente cncava.

    Estas anlise dos resduos sugerem que o modelo linear ajustado (equao de uma recta)no o melhor modelo para traduzir a relao entre estas variveis; a distribuio dosresduos indica que o ajustamento de um modelo linear polinomial de 2 ordem, comuma equao do tipo 2cxbxay ((# aumentar a preciso da estimativa (que traduzida pelo coeficiente de determinao R2=0.941).

    O ajustamento a uma equao de segundo grau ser abordado no pargrafo seguinte.

    7.3 - REGRESSO LINEAR MLTIPLA

    Neste pargrafo ser abordada a metodologia de clculo da equao de regresso linear

    mltipla, do tipo xnxbxbxbxbby (((((# ...3322110 , em que a varivel resposta oudependente funo de vrias variveis independentes.

  • 5/26/2018 SPSS Manual de Utiliza o

    124/151

    SPSS 7 - Regresso Linear

    ESACB 122

    Os coeficientes de regresso b1, b2, ..., bntraduzem o declive ou acrscimo na variveldependente provocado pelo acrscimo unitrio de cada uma das variveisindependentes, x1, x2, ..., xn, respectivamente.

    A metodologia que se vai abordar serve igualmente para estimar uma equao deregresso linear polinomial, do tipo nnxbxbxbxbby (((((# ...

    33

    2210 , em que y

    depende, no de diversas variveis independentes x1, x2, ..., xn, mas de um polinmio damesma varivel independente x. Neste caso, previamente a efectuar o procedimento daregresso linear, devem gerar-se as variveis correspondentes s potncias x2, x3, ..., xnaincluir no modelo. No pargrafo seguinte ser abordada uma metodologia diferente que

    permite o ajustamento de equaes de curvas polinomiais a uma amostra de dados (x,y).

    Quando se ajusta um modelo de regresso mltipla, pode acontecer que se justifiqueestatisticamente incluir na equao de regresso todas as variveis independentes, ou

    que se incluam apenas algumas destas variveis explanatrias. Esta deciso tomadaem funo da significncia do parmetro de regresso de cada uma das variveis, oupelo acrscimo do coeficiente de determinao, R2, provocado pela incluso dessasvariveis.

    De um modo geral, existem duas estratgias a seguir:

    (i) comear por incluir todas as variveis, e analisar a contribuio ousignificncia dos coeficientes de regresso de cada uma das variveisindependentes no modelo; eliminar a varivel independente menossignificativa, desde que a sua contribuio seja inferior a determinado limite

    (normalmente analisado em termos da estatstica F associada a essa varivelna tabela da anova); recalcular de novo o modelo sem esta varivel e, se forcaso disso, eliminar nova varivel, e assim sucessivamente, at que todas asrestantes variveis independentes sejam significativas para a preciso domodelo. Este tipo de estratgia designa-se por processo backward oustepback.

    (ii) comear por calcular um modelo de regresso simples, xbby 10(# ,

    incluindo, se for caso disso, apenas a varivel independente cujo coeficientede regresso mais significativo em termos de preciso; analisar asignificncia da prxima varivel independente mais significativa, e inclu-la, se for caso disso; recalcular de novo o modelo; analisar a significncia da

    prxima varivel independente mais significativa, e inclu-la, se for casodisso, e assim sucessivamente at que mais nenhuma das variveisindependentes seja significativa. Este tipo de metodologia designa-se por

    processo stepwise ou forward.

    Pode acontecer que os modelos obtidos por estes dois tipos de metodologias, para amesma amostra de valores, no sejam inteiramente coincidentes, nomeadamente quandoalguma ou algumas das variveis independentes esto muito prximas do limite quedefine a significncia da sua incluso ou no incluso no modelo.

    Chama-se a ateno que, por vezes, a incluso de muitas variveis explanatrias nomodelo pouco acrscimo trazem em termos de preciso do modelo, e este fica muito

  • 5/26/2018 SPSS Manual de Utiliza o

    125/151

    SPSS 7 - Regresso Linear

    ESACB 123

    pouco funcional e muito fictcio ou artificial, isto , muito bem ajustado amostraparticular de valores usados para o clculo da equao, mas pouco adaptvel populao.

    Para ilustrar o ajustamento de uma equao de regresso linear mltipla, vamos usar o

    seguinte conjunto de dados (adaptado de DRAPPER & SMITH, 1981), em que asvariveis independentes so a temperatura mdia mensal (graus Fahrenheit), a produomensal (toneladas), o nmero de dias teis de trabalho por ms e o nmero deempregados, e a varivel dependente o consumo de gua (m3), observados numadeterminada empresa fabril:

    Temperatura(F)

    Produomensal

    Dias teis doms

    Nmero deoperrios

    Consumo degua (m3)

    58.80 7107.00 20.00 129.00 2967.0065.20 8373.00 20.00 141.00 2828.0070.90 9796.00 20.00 153.00 2891.0077.40 9208.00 20.00 166.00 2994.0079.30 14792.00 22.00 193.00 3282.0081.00 14564.00 23.00 189.00 3498.0071.90 11964.00 21.00 175.00 3302.0063.90 13526.00 22.00 186.00 3260.0054.50 12656.00 21.00 190.00 3211.0039.50 14119.00 21.00 187.00 3286.0044.50 15691.00 22.00 195.00 3432.0043.60 14571.00 23.00 206.00 3425.0056.00 13619.00 22.00 198.00 3256.00

    64.70 14575.00 22.00 192.00 3422.0073.00 14556.00 21.00 191.00 3250.0078.90 16573.00 22.00 200.00 3464.0079.40 15618.00 22.00 200.00 3495.0068.40 14346.00 23.00 185.00 3568.00

    Pretende-se ajustar uma equao do tipo 443322110 xbxbxbxbby ((((# que permita

    estimar o consumo mensal de gua nesta empresa, em funo das variveisindependentes observadas.

    Para estimar uma equao de regresso mltipla executar o seguinte procedimento:

    StatisticsRegression

  • 5/26/2018 SPSS Manual de Utiliza o

    126/151

    SPSS 7 - Regresso Linear

    ESACB 124

    No menu anterior, seleccionar a opo . Aparece a seguinte caixa de dilogo,onde se definem a varivel dependente e as todas as variveis independentes:

    No campo das variveis independentes esto includas todas as variveis explanatrias.O mtodo de clculo seleccionado Enter, que obriga incluso de todas as variveisindependentes no modelo, sejam ou no significativas. Os outros mtodos de clculoso Stepwise e Forward (mtodos de incluso progressiva de variveis independentes),Backward (mtodo de eliminao progressiva de variveis independentes) e Remove(mtodo que calcula o modelo sem incluso de qualquer varivel independente, isto , omodelo resume-se a yy# ):

    A fim de comparar diversos modelos de regresso, vamos comear por incluir todas asvariveis independentes, optando pelo mtodo Enter; seguidamente, deve repetir-se ametodologia, e optar por outros mtodos de clculo, nomeadamente Stepwise eBackward.

    Seleccionar o boto , e tal como descrito para a regressolinear simples.

    Os resultados so os seguintes:

  • 5/26/2018 SPSS Manual de Utiliza o

    127/151

    SPSS 7 - Regresso Linear

    ESACB 125

    RegressionDescriptive Statistics

    3268.3889 218.9502 18

    65.0500 13.1334 18

    13091.89 2716.3310 18

    21.5000 1.0432 18

    182.0000 21.3514 18

    Consumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    MeanStd.

    Deviation N

    Correlations

    1.000 .013 .894 .901 .831

    .013 1.000 -.005 -.022 -.080

    .894 -.005 1.000 .811 .939

    .901 -.022 .811 1.000 .784

    .831 -.080 .939 .784 1.000

    . .480 .000 .000 .000

    .480 . .493 .466 .377

    .000 .493 . .000 .000

    .000 .466 .000 . .000

    .000 .377 .000 .000 .

    18 18 18 18 18

    18 18 18 18 18

    18 18 18 18 18

    18 18 18 18 18

    18 18 18 18 18

    Consumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Consumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Consumo mensal de

    gua (m3)Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Pearson Correlation

    Sig. (1-tailed)

    N

    Consumomensal degua (m3)

    Temperaturamdia

    mensal (F)

    Produomensal(Ton)

    Dias teisno ms

    Nmero deoperrios

    Variables Entered/Removedb

    Nmero de operrios,Temperatura mdia mensal (F),

    Dias teis no ms, Produomensal (Ton)a. Enter

    Model1

    Variables EnteredVariablesRemoved Method

    All requested variables entered.a.

    Dependent Variable: Consumo mensal de gua (m3)b.

    Model Summaryb

    .945a .893 .860 81.8974 .893 27.127 4 13 .000Model1

    R R SquareAdjusted R

    Square

    Std. Errorof the

    EstimateR SquareChange F Change df1 df2

    Sig. FChange

    Change Statistics

    Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F), Dias teis no ms, Produo mensal (Ton)

    a.

    Dependent Variable: Consumo mensal de gua (m3)b.

  • 5/26/2018 SPSS Manual de Utiliza o

    128/151

    SPSS 7 - Regresso Linear

    ESACB 126

    ANOVAb

    727772.930 4 181943.232 27.127 .000a

    87193.348 13 6707.181

    814966.278 17

    Regression

    Residual

    Total

    Model1

    Sum ofSquares df

    MeanSquare F Sig.

    Predictors: (Constant), Nmero de operrios, Temperatura mdia mensal (F),Dias teis no ms, Produo mensal (Ton)

    a.

    Dependent Variable: Consumo mensal de gua (m3)b.

    Coefficientsa

    531.302 619.067 .858 .406 -806.111 1868.714

    .232 1.550 .014 .150 .883 -3.117 3.581 .013 .041 .014

    5.027E-02 .023 .624 2.166 .049 .000 .100 .894 .515 .197

    110.460 32.724 .526 3.376 .005 39.765 181.156 .901 .683 .306

    -1.709 2.801 -.167 -.610 .552 -7.759 4.342 .831 -.167 -.055

    (Constant)

    Temperatura mdia

    mensal (F)Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Model1

    B Std. Error

    UnstandardizedCoefficients

    Beta

    Standardized

    Coefficients

    t Sig.LowerBound

    UpperBound

    95% Confidence Intervalfor B

    Zero-order Partial Part

    Correlations

    Dependent Variable: Consumo mensal de gua (m3)a.

    Residuals Statisticsa

    2890.9719 3499.8154 3268.3889 206.9062 18

    -111.5868 131.9858 1.011E-13 71.6172 18

    -1.824 1.119 .000 1.000 18

    -1.363 1.612 .000 .874 18

    Predicted Value

    Residual

    Std. Predicted Value

    Std. Residual

    Minimum Maximum MeanStd.

    Deviation N

    Dependent Variable: Consumo mensal de gua (m3)a.

    Charts

    Regression Standardized Residual

    1.501.00.500.00-.50-1.00-1.50

    Histogram

    Dependent Variable: Consumo mensal de gua

    Frequency

    5

    4

    3

    2

    1

    0

    Std. Dev = .87

    Mean = 0.00

    N = 18.00

  • 5/26/2018 SPSS Manual de Utiliza o

    129/151

    SPSS 7 - Regresso Linear

    ESACB 127

    Normal P-P Plot of Regression Standardized Residual

    Dependent Variable: Consumo mensal de gua (m3)

    Observed Cum Prob

    1.00.75.50.250.00Exp

    ectedCum

    Prob

    1.00

    .75

    .50

    .25

    0.00

    Scatterplot

    Dependent Variable: Consumo mensal de gua (m3)

    Regression Standardized Predicted Value

    1.51.0.50.0-.5-1.0-1.5-2.0RegressionStandardizedResid

    ual

    2.0

    1.5

    1.0

    .5

    0.0

    -.5

    -1.0

    -1.5

    A equao do modelo ajustado :

    consumo=531.302+0.232temperat+0.05027producao+110.46dias-1.709operario

    sendo R2=0.893 e 86.02 #ajustadoR .

    Repita-se o processo, optando pelo mtodo de clculo Stepwise. Neste caso, chegar-se-ao modelo:

  • 5/26/2018 SPSS Manual de Utiliza o

    130/151

    SPSS 7 - Regresso Linear

    ESACB 128

    consumo=443.965+0.03842producao+107.976dias

    e R2=0.889 e 874.02 #ajustadoR .

    Repare-se que se simplificou o modelo, sem contudo prejudicar a preciso deste comoinstrumento de estimativa da varivel dependente.

    De seguida apresentam-se os resultados completos obtidos com o mtodo stepwise, demodo a possibilitar a comparao com o modelo que inclui todas as variveisindependentes:

    RegressionDescriptive Statistics

    3268.3889 218.9502 18

    65.0500 13.1334 18

    13091.89 2716.3310 18

    21.5000 1.0432 18

    182.0000 21.3514 18

    Consumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Mean

    Std.

    Deviation N

    Correlations

    1.000 .013 .894 .901 .831

    .013 1.000 -.005 -.022 -.080

    .894 -.005 1.000 .811 .939

    .901 -.022 .811 1.000 .784

    .831 -.080 .939 .784 1.000

    . .480 .000 .000 .000

    .480 . .493 .466 .377

    .000 .493 . .000 .000

    .000 .466 .000 . .000

    .000 .377 .000 .000 .

    18 18 18 18 18

    18 18 18 18 18

    18 18 18 18 18

    18 18 18 18 18

    18 18 18 18 18

    Consumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Consumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operriosConsumo mensal degua (m3)

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Dias teis no ms

    Nmero de operrios

    Pearson Correlation

    Sig. (1-tailed)

    N

    Consumomensal de

    gua (m3)

    Temperaturamdia

    mensal (F)

    Produomensal

    (Ton)

    Dias teis

    no ms

    Nmero de

    operrios

  • 5/26/2018 SPSS Manual de Utiliza o

    131/151

    SPSS 7 - Regresso Linear

    ESACB 129

    Variables Entered/Removeda

    Dias teis noms .

    Stepwise (Criteria:Probability-of-F-to-e

    nter = .100).

    Produomensal (Ton)

    .

    Stepwise (Criteria:Probability-of-F-to-enter = .100).

    Model1

    2

    VariablesEntered

    VariablesRemoved Method

    Dependent Variable: Consumo mensal de gua (m3)a.

    Model Summaryc

    .901a .811 .800 98.0273 .811 68.810 1 16 .000

    .943b .889 .874 77.5677 .078 10.554 1 15 .005

    Model1

    2

    R R SquareAdjusted R

    Square

    Std. Errorof the

    EstimateR SquareChange F Change df1 df2

    Sig. FChange

    Change Statistics

    Predictors: (Constant), Dias teis no msa.

    Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)b.

    Dependent Variable: Consumo mensal de gua (m3)c.

    ANOVAc

    661216.554 1 661216.554 68.810 .000a

    153749.724 16 9609.358

    814966.278 17

    724715.124 2 362357.562 60.225 .000b

    90251.154 15 6016.744

    814966.278 17

    RegressionResidual

    Total

    Regression

    Residual

    Total

    Model1

    2

    Sum ofSquares df

    MeanSquare F Sig.

    Predictors: (Constant), Dias teis no msa.

    Predictors: (Constant), Dias teis no ms, Produo mensal (Ton)b.

    Dependent Variable: Consumo mensal de gua (m3)c.

    Coefficientsa

    -796.273 490.549 -1.623 .124 -1836.190 243.643

    189.054 22.791 .901 8.295 .000 140.740 237.369 .901 .901 .901

    443.965 544.446 .815 .428 -716.494 1604.425

    107.976 30.791 .514 3.507 .003 42.346 173.606 .901 .671 .301

    3.842E-02 .012 .477 3.249 .005 .013 .064 .894 .643 .279

    (Constant)

    Dias teis no ms

    (Constant)

    Dias teis no ms

    Produo mensal (Ton)

    Model1

    2

    B Std. Error

    UnstandardizedCoefficients

    Beta

    Standardized

    Coefficients

    t Sig.LowerBound

    UpperBound

    95% Confidence Intervalfor B

    Zero-order Partial Part

    Correlations

    Dependent Variable: Consumo mensal de gua (m3)a.

  • 5/26/2018 SPSS Manual de Utiliza o

    132/151

    SPSS 7 - Regresso Linear

    ESACB 130

    Excluded Variablesc

    .032a

    .290 .776 .075 1.000

    .477a 3.249 .005 .643 .343

    .323a 2.017 .062 .462 .385

    .026b

    .296 .772 .079 .999

    -.176b -.683 .506 -.179 .116

    Temperatura mdiamensal (F)

    Produo mensal (Ton)

    Nmero de operrios

    Temperatura mdiamensal (F)

    Nmero de operrios

    Model1

    2

    Beta In t Sig.Partial

    Correlation Tolerance

    Collinearity

    Statistics

    Predictors in the Model: (Constant), Dias teis no msa.

    Predictors in the Model: (Constant), Dias teis no ms, Produo mensal (Ton)b.

    Dependent Variable: Consumo mensal de gua (m3)c.

    Residuals Statisticsa

    2876.5112 3487.1743 3268.3889 206.4711 18

    -105.6879 130.9278 2.274E-13 72.8621 18

    -1.898 1.060 .000 1.000 18

    -1.363 1.688 .000 .939 18

    Predicted Value

    Residual

    Std. Predicted Value

    Std. Residual

    Minimum Maximum MeanStd.

    Deviation N

    Dependent Variable: Consumo mensal de gua (m3)a.

    Charts

    Regression Standardized Residual

    1.501.00.500.00-.50-1.00-1.50

    Histogram

    Dependent Variable: Consumo mensal de gua (m3)

    Frequency

    5

    4

    3

    2

    1

    0

    Std. Dev = .94

    Mean = 0.00

    N = 18.00

  • 5/26/2018 SPSS Manual de Utiliza o

    133/151

    SPSS 7 - Regresso Linear

    ESACB 131

    Normal P-P Plot of Regression Standardized Residual

    Dependent Variable: Consumo mensal de gua (m3)

    Observed Cum Prob

    1.00.75.50.250.00Exp

    ectedCum

    Prob

    1.00

    .75

    .50

    .25

    0.00

    Scatterplot

    Dependent Variable: Consumo mensal de gua (m3)

    Regression Standardized Predicted Value

    1.51.0.50.0-.5-1.0-1.5-2.0RegressionStandardizedResid

    ual

    2.0

    1.5

    1.0

    .5

    0.0

    -.5

    -1.0

    -1.5

    7.4 - AJUSTAMENTO DE MODELOS PR-DEFINIDOS

    O SPSS dispe de uma rotina que permite o ajustamento de vrios modelos pr-

    definidos a uma amostra de valores bi-variados (x,y). Tais modelos so:

  • 5/26/2018 SPSS Manual de Utiliza o

    134/151

    SPSS 7 - Regresso Linear

    ESACB 132

    ! Linear: xbby .10(#

    ! Quadrtico: 2210 .. xbxbby ((#

    ! Cbico: 332

    210 ... xbxbxbby (((#

    ! Logartmico: xbby ln.10(#

    ! Inverso:xbby 10(#

    ! Potncia: 1.0bxby# . xbby ln.lnln 10(#

    ! Composto (compound): xbby 10 .# . 10 ln.lnln bxby (#

    ! Sigmoidal (S): xb

    bey

    10(

    # .x

    bby 10ln (#

    ! Logstico:xbb

    u

    y

    10 .1

    1

    (

    # . $ %10 ln.ln11

    ln bxbuy

    (#//0

    1223

    4&

    (em que u o limite assimpttico superior, u>0, u>ymax)! Crescimento (growth): xbbey .10(# . xbby .ln 10(#

    ! Exponencial: xbeby .01.# . xbby .lnln 10(#

    Muitos destes modelos so frequentemente usados em modelos economtricos, em quea varivel independente ou causal o decurso do tempo. Se for este o caso, no menuapropriado o utilizador pode definir que x o tempo (ver caixa de dilogo seguinte).

    Para exemplificar esta metodologia, vamos usar os dados referentes s caractersticas do

    molho de tomate (em anexo). Como anteriormente se viu, o grfico denota uma ligeiracurvatura na zona superior dos valores xx, que faz suspeitar que um modelo polinomialtalvez seja melhor ajustado que o modelo linear simples.

    Para tal, fazer:

    StatisticsRegression

    Neste menu, seleccionar a opo Curve Estimation... que d acesso seguinte caixa dedilogo, onde se definem as variveis dependente (solidos) e independente (insoluve) ese seleccionam os modelos que se pretendem obter, e se define para apresentar a tabela

    da anova para cada um dos modelos calculados:

  • 5/26/2018 SPSS Manual de Utiliza o

    135/151

    SPSS 7 - Regresso Linear

    ESACB 133

    Por defeito, os modelos ajustados incluem a constante (coeficiente b0)

    , e apresentado o grfico com os modelos calculados

    .

    O utilizador pode seleccionar um ou mais modelos, com o objectivo de, pela anlise dos

    resultados, nomeadamente R2 e anova, seleccionar o modelo melhor ajustado. Noexemplo, foi solicitado para calcular os modelos linear, quadrtico e cbico. Osresultados so os seguintes:

    MODEL: MOD_1.

    Dependent var i abl e. . SOLI DOS Method. . LI NEAR

    Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 97001R Square . 94092

    Adj ust ed R Square . 93823St andard Er r or 1. 28802

    Anal ysi s of Var i ance:

    DF Sum of Squares Mean Square

    Regr essi on 1 581. 27190 581. 27190Resi dual s 22 36. 49768 1. 65899

    F = 350. 37794 Si gni f F = . 0000

    - - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -

  • 5/26/2018 SPSS Manual de Utiliza o

    136/151

    SPSS 7 - Regresso Linear

    ESACB 134

    Var i abl e B SE B BetaT Si g T

    I NSOLUVE - 2. 646653 . 141393 - . 970010 -

    18. 718 . 0000( Const ant ) 76. 193433 1. 96570738. 761 . 0000Dependent var i abl e. . SOLI DOS Met hod. . QUADRATI

    Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 98637R Square . 97293Adj ust ed R Square . 97035St andard Er r or . 89243

    Anal ysi s of Var i ance:

    DF Sum of Squares Mean Square

    Regr essi on 2 601. 04440 300. 52220Resi dual s 21 16. 72518 . 79644

    F = 377. 33322 Si gni f F = . 0000

    - - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -

    Var i abl e B SE B BetaT Si g T

    I NSOLUVE - 8. 288178 1. 136478 - 3. 037655 -7. 293 . 0000I NSOLUVE**2 . 200730 . 040286 2. 0753704. 983 . 0001( Const ant ) 115. 123024 7. 93094914. 516 . 0000

    Dependent var i abl e. . SOLI DOS Method. . CUBI C

    Li st wi se Del et i on of Mi ssi ng Dat aMul t i pl e R . 98637R Square . 97293Adj ust ed R Square . 97035St andard Er r or . 89243

    Anal ysi s of Var i ance:

    DF Sum of Squares Mean Square

    Regr essi on 2 601. 04440 300. 52220Resi dual s 21 16. 72518 . 79644

  • 5/26/2018 SPSS Manual de Utiliza o

    137/151

    SPSS 7 - Regresso Linear

    ESACB 135

    F = 377. 33322 Si gni f F = . 0000

    - - - - - - - - - - - - - - - - - - - - Var i abl es i n t he Equat i on - - - - - - - - - - - -- - - - - - - -

    Var i abl e B SE B BetaT Si g T

    I NSOLUVE - 8. 288178 1. 136478 - 3. 037655 -7. 293 . 0000I NSOLUVE**2 . 200730 . 040286 2. 0753704. 983 . 0001( Const ant ) 115. 123024 7. 93094914. 516 . 0000

    - - - - - - - - - - - - - - - Var i abl es not i n t he Equat i on - - - - - - - - - - - - -- -

    Var i abl e Bet a I n Par t i al Mi n Tol er T Si gT

    I NSOLUVE**3 - 4. 796852 - . 214795 1. 368E- 05 - . 984. 3371

    Not es:9 Tol erance l i mi t s reached; some dependent var i abl es were

    not ent er ed.

    % slidos no molho

    % insolveis em gua

    201816141210

    60

    50

    40

    30

    20

    Observed

    Linear

    Quadratic

  • 5/26/2018 SPSS Manual de Utiliza o

    138/151

    SPSS 7 - Regresso Linear

    ESACB 136

    Note-se que ao passar do modelo linear y = 76.1934 2.6467x, R2=0.9409 para omodelo quadrtico y = 115.1230 8.2882x + 0.2007x2, R2=0.9729, h um acrscimosignificativo do ajustamento (Tb2=4.983, significativo; F=377.33 significativo);contudo, ao passar para o modelo cbico, a estatstica Tb3=-0.984 no significativa, enem sequer calculado este modelo, sendo apresentados os resultados do modelo

    quadrtico, o que significa que o melhor modelo (dos pedidos) o modelo quadrtico.

  • 5/26/2018 SPSS Manual de Utiliza o

    139/151

    SPSS 8 - Manusear os Resultados

    ESACB 136

    8 - MANUSEAR OS RESULTADOS

    medida que se vo executando tarefas com o SPSS, os resultados vo-se acumulandosucessivamente no Viewer do programa.

    A janela do organigrama apresenta a sequncia de resultados, que comeam naidentificao ; cada rotina ou tarefa aparece identificada com uma marcaidentificativa dos resultados, e respectivo contedo; por exemplo, os resultadoscorrespondentes obteno das estatsticas descritivas identificado no organigrama

    pelo esquema .

    Cada conjunto de resultados comea pela identificao da rotina ou tarefa( ) e com o respectivo contedo; esta rotina apresenta um ttulovisvel (repare que o livro est aberto), e que corresponde linhaDescriptives na janela direita, um conjunto de notas que no esto visveisno output (o livro est fechado), e as estatsticas descritivas visveis na janela deoutput (o livro est aberto). Esta organizao mantm-se para

    os resultados das tarefas seguintes.

  • 5/26/2018 SPSS Manual de Utiliza o

    140/151

    SPSS 8 - Manusear os Resultados

    ESACB 137

    Note que cada rotina tem um conjunto de notas, mas que no esto visualizadas; para asver na janela de output, o utilizador s tem que fazer duplo click sobre , demodo a abrir o livro, e aparecerem as notas na janela direita.

    Repare que as notas incluem a data e hora de obteno dos resultados, a localizao doficheiro de dados usado, o nmero de linhas ou casos do ficheiro de dados, indicaessobre a existncia e tratamento de missing values, e as instrues que originaram osresultados (o utilizador gerou estas instrues, ou programa, seleccionando cons e

    janelas nos menus do programa; contudo, e para utilizaes mais avanadas, o SPSStem um editor de programas, em que o utilizador constri as rotinas de anlise, como se

    de uma linguagem de programao de tratasse). A ltima linha das notas indica o tempode processamento que a CPU do computador levou a executar esta rotina (neste caso,0.99 segundos).

    Para fechar o livro de notas, isto , para que as notas no sejam visualizadas nooutput, fazer duplo click sobre .

    Para condensar a parte de organigrama correspondente a uma rotina de anlise, fazerclick sobre o boto - esquerda da sua identificao; por exemplo, para condensar oorganigrama das estatsticas descritivas, fazer click sobre

    O organigrama fica com o seguinte aspecto:

  • 5/26/2018 SPSS Manual de Utiliza o

    141/151

    SPSS 8 - Manusear os Resultados

    ESACB 138

    Esta condensao do organigrama tem a vantagem de permitir maior rapidez nalocalizao de determinados conjuntos de resultados, pois o utilizador pode condensar

    as partes no relevantes do organigrama, ficando apenas aberta a parte relevante doorganigrama.

    Para expandir, fazer duplo click sobre o boto + correspondente

    Para visualizar resultados subsequentes, o utilizador pode usar a barra de scroll verticalda janela de resultados, ou simplesmente fazer clik no item respectivo do organigrama.Para ter acesso imediato ao diagrama de extremos-e-quartis referente a todos is valores,

    fazer click sobre o item

    A