escrevendo um relatorio

6
Universidade Federala do Amazonas Instituto de Ciˆ encias Exatas - Departamento de Estat´ ıstica Escrevendo um Relat´ orio de Estat´ ıstica 1 Escrevendo um relat´ orio estat´ ıstico Um curso de an´ alise de regress˜ ao ´ e sempre uma primeira oportunidade para o es- tudante realizar uma substancial an´ alise de dados e escrever um relat´ orio estat´ ıstico. Aqui oferecemos algumas observa¸ oes para ajudar a escrever um relat´ orio estat´ ıstico. Em geral, um relat´ orio estat´ ıstico sobre uma an´ alise de dados, consiste das trˆ es seguintes partes: (i) Apresenta¸ ao do problema e dos dados; (ii) An´ alise estat´ ıstica e; (iii) Conclus˜ oes. As trˆ es partes podem ser divididas em subse¸ oes, se necess´ ario. A aplica¸ ao dos m´ etodos e procedimentos estat´ ısticos, pertencem a parte (ii). Na parte (i) apresenta-se o problema e os dados, explicando as circusntˆ ancias sob as quais os dados foram obtidos e principalmente a quest˜ ao que a an´ alise estat´ ıstica deve respon- der. Na parte (iii), os resultados da an´ alise estat´ ıstica s˜ ao discutidos, com referˆ encia as circunstˆ ancias sob as quais os dados foram obtidos, respondendo, tanto quanto poss´ ıvel, a quest˜ ao proposta na parte (i). Note que os itens (i) e (ii) devem ser escritos, na medida do poss´ ıvel, em uma linguagem n˜ ao estat´ ıstica, dirigida essencialmente ao pesquisador que obteve os dados. Jarg˜ oes estat´ ısticos, tais como ”teste”, ”estimador”, ”verossimi- lhan¸ ca”, etc. devem, a medida do poss´ ıvel, serem limitadas ` a parte (ii). Um relat´ orio estatistico deve ser escrito em um texto claro e fluente, tal que ele possa ser entendido por leitores que conhe¸ cam o b´ asico da an´ alise estat´ ıstica de dados, mas n˜ ao necessariamente um curso de estat´ ıstica. Somente os gr´ aficos e tabelas mais importantes devem ser inclu´ ıdos na parte (ii), enquanto os programas de computadores e suas sa´ ıdas devem ser colocados em um apˆ endice. Um relat´ orio estat´ ıstico n˜ ao deve consistir de uma sa´ ıda de computador com anota¸ oes.

Upload: marcos-andrade

Post on 09-Dec-2015

214 views

Category:

Documents


0 download

DESCRIPTION

Manual

TRANSCRIPT

Page 1: Escrevendo Um Relatorio

Universidade Federala do AmazonasInstituto de Ciencias Exatas - Departamento de Estatıstica

Escrevendo um Relatorio de Estatıstica

1 Escrevendo um relatorio estatıstico

Um curso de analise de regressao e sempre uma primeira oportunidade para o es-tudante realizar uma substancial analise de dados e escrever um relatorio estatıstico.Aqui oferecemos algumas observacoes para ajudar a escrever um relatorio estatıstico.

Em geral, um relatorio estatıstico sobre uma analise de dados, consiste das tresseguintes partes:

(i) Apresentacao do problema e dos dados;

(ii) Analise estatıstica e;

(iii) Conclusoes.

As tres partes podem ser divididas em subsecoes, se necessario.

A aplicacao dos metodos e procedimentos estatısticos, pertencem a parte (ii). Naparte (i) apresenta-se o problema e os dados, explicando as circusntancias sob as quaisos dados foram obtidos e principalmente a questao que a analise estatıstica deve respon-der. Na parte (iii), os resultados da analise estatıstica sao discutidos, com referencia ascircunstancias sob as quais os dados foram obtidos, respondendo, tanto quanto possıvel,a questao proposta na parte (i). Note que os itens (i) e (ii) devem ser escritos, na medidado possıvel, em uma linguagem nao estatıstica, dirigida essencialmente ao pesquisadorque obteve os dados. Jargoes estatısticos, tais como ”teste”, ”estimador”, ”verossimi-lhanca”, etc. devem, a medida do possıvel, serem limitadas a parte (ii).

Um relatorio estatistico deve ser escrito em um texto claro e fluente, tal que elepossa ser entendido por leitores que conhecam o basico da analise estatıstica de dados,mas nao necessariamente um curso de estatıstica. Somente os graficos e tabelas maisimportantes devem ser incluıdos na parte (ii), enquanto os programas de computadorese suas saıdas devem ser colocados em um apendice. Um relatorio estatıstico nao deveconsistir de uma saıda de computador com anotacoes.

Page 2: Escrevendo Um Relatorio

Escrevendo um relatrio estatstico 2

Finalmente, uma palavra sobre parcimonia. Um relatorio estatıstico que conseguecomunicar sua mensagem de forma breve e preferıvel a um relatorio extenso e obscuro.O comprimento do relatorio deve estar numa proporcao razoavel do tamanho dos dadosque esta sendo analizado. Uma regra e usar o seguinte:

# paginas ∼ k√

n,

onde n e o numero de observacoes e k e o numero de variaveis independentes nosdados. Entao, uma regressao linear simples com n = 25 e k = 1 raramente mereceum relatorio com mais de cinco paginas. E claro, nem todo relatorio estatıstico deveter este tamanho, mas se seu relatorio e mais longo do que esta regra recomenda,tornando-o mais curto, provavelmente ainda mais evidente. Na realidade, esta regra emuito generosa, especialmente para grandes conjuntos de dados.

Page 3: Escrevendo Um Relatorio

Escrevendo um relatrio estatstico 3

2 Analise dos dados do espinafre

(i) Apresentacao do problema

Os dados da Tabela 1 representam a relacao entre a porcentagem de materia secade espinafre fresco (x) e a porcentagem preservada de acido ascorbico apos a secagema 900C (y). Os dados sao de uma investigacao sobre a preservacao de acido ascorbicoem vegetais durante a secagem e armazenagem, consequentemente a porcentagem pre-servada de acido ascorbico apos a secagem e escolhida como variavel resposta (y). Asquestoes pertinentes a esta investigacao e se a relacao entre x e y pode ser dita linear nointervalo de x em estudo, que varia de 6 a 15 por cento de materia seca, e qual e a mag-nitude do desvio da relacao linear. Alem disso, podemos perguntar como exatamenteos parametros da relacao linear foram estimados.

Tabela 1: Porcentagem de materia seca (x) em espinafre frescoe porcentagem de aciso ascorbico (y) apos a secagem.

x y x y

10,0 70,9 12,5 74,28,9 74,0 12,3 83,18,9 58,6 10,0 66,79,2 80,6 10,2 77,27,8 69,4 11,2 83,810,1 76,0 11,2 67,99,0 66,4 10,0 88,98,2 50,9 10,7 69,09,5 61,9 10,3 69,810,8 65,2 12,9 86,011,1 77,2 11,8 79,911,2 89,6 14,9 88,2

Page 4: Escrevendo Um Relatorio

Escrevendo um relatrio estatstico 4

(ii) Analise estatıstica

A Figura 1 mostra o diagrama de dispersao de y versus x, e como pode-se notar, ografico nao sugere qualquer desvio substancial de um modelo de regressao linear paraestes dados. O modelo estatıstico que utilizamos e, portanto,

Yi ∼ N(β1 + β2xi, σ2) i = 1, 2, . . . , 24,

onde Y1, Y2, . . . , Y24 sao variaveis aleatorias independentes, a observacao yi representauma realizacao da variavel aleatoria Yi.

Uma verificacao da adequacao do modelo pode ser vista nas Figuras 2 e 3, o graficodos resıduos pelos valores ajustados e o grafico de probabilidae normal, respectivamente.

Page 5: Escrevendo Um Relatorio

Escrevendo um relatrio estatstico 5

O primeiro grafico mostra que a variancia e constatnte e o segundo mostra uma boarelacao linear, confirmando a normalidade dos resıduos. Em qualquer caso, e difıcilrejeitar a normalidade com base em uma amostra de apenas 24 observacoes.

Para completar a verificacao do modelo, nos notamos que a suposicao de inde-pendencia das 24 observacoes, requer que os 24 experimentos sejam executados, emalgum sentido, separadamente, no espaco e no tempo, embora nao temos nenhumainformacao especıfica sobre este ponto aqui.

Tabela 2: Estimativa dos parametros do modelo deregressao linear - Dados do espinafre.

Parametro Estimativa Desvio padrao

β1 33,48 11,10β2 3,85 1,04

σ2 = 64, 84 g. l. = 22

As estimativas dos parametros e seus respectivos erros padroes sao dados acima naTabela 2. Com base nestes valores, a relacao linear estimada entre E(Y ) e x e dada por

E(Y ) = 33, 48 + 3, 85x,

com desvio padrao estimado por σ = 8, 05. Um intervalo de 95% de confianca para β2

e [1, 70; 6, 00]. O teste t para a hipotese β2 = 0 e

t(y) =3, 85

1, 04= 3, 70

Page 6: Escrevendo Um Relatorio

Escrevendo um relatrio estatstico 6

com 22 graus de liberdade, o qual da um p-valor menor que 0,01. Existe, entao, umaforte indicacao de que β2 nao e zero.

(iii) Conclusao

A analise estatistica mostrou que os dados podem razoavelmente serem descritos porum modelo de regressao linear, a relacao estimada e dada por E(Y ) = 33, 48 + 3, 85x.As estimativas dos parametros e seus respectivos erros padroes sao dados acima e naosao muito precisas, particularmente a estimativa do intercepto β1. O teste estatısticopara a hipotese de que a inclinacao e zero, rejeita a hipotese. A porcentagem preservadade acido ascorbico depende da porcentagem de materia seca do espinafre fresco, cominclinacao entre 1,7 e 6,0 (com 96% de confianca). Portanto, a equacao E(Y ) = 33, 48+3, 85x pode ser util para predizer y para um dado x, mas um desvio (erro de predicao)em torno de 1, 96 × 8, 05 = 15, 77 seria esperado. Por exemplo, para x = 10, um valorde y entre 56,21 e 87,75 e esperado com probabilidade de 95%, com um valor medio de71,98.

Nos usamos a distribuicao normal como uma base para o intervalo de predicao.Uma discussao mais detalhada de predicao, que sera dada mais a frente, mostra que ointervalo de predicao correto serıa baseado na distribuicao t-Student, embora o enfoqueacima esteja aproximadamente correto.

Referencia

Bent Jørgensen. The Theory of Linear Models. Chapman & Hall. 1993.

Secao 1.6 e Secao 1.7