estatística básica para pesquisa de mercado.doc

34
Estatística básica para pesquisa de mercado INTRODUÇÃO 1. DEFINIÇÕES 2. COLETA DE DADOS 3. POPULAÇÃO E AMOSTRA 3.1 AMOSTRAS RELACIONADAS 3.2 AMOSTRAS NÃO RELACIONADAS 4. AMOSTRAGEM 4.1 NÃO PROBABILÍSTICAS 4.1.1 Acidental ou conveniência 4.1.2 Intencional 4.1.3 Quotas ou proporcional 4.1.4 Desproporcional 4.2 PROBABILÍSTICA 4.2.1 Aleatória Simples 4.2.2 Aleatória Estratificada 4.2.3 Conglomerado 4.3 DIMENSIONAMENTO DA AMOSTRA 5. TIPOS DE DADOS 6. TIPOS DE VARIÁVEIS ESCALARES

Upload: juliana-viol-paulin

Post on 07-Aug-2015

54 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Estatística básica para pesquisa de mercado.doc

Estatística básica para pesquisa de mercado

INTRODUÇÃO

    1. DEFINIÇÕES

    2. COLETA DE DADOS

    3. POPULAÇÃO E AMOSTRA

        3.1 AMOSTRAS RELACIONADAS

        3.2 AMOSTRAS NÃO RELACIONADAS

    4. AMOSTRAGEM

        4.1 NÃO PROBABILÍSTICAS

                4.1.1 Acidental ou conveniência

                4.1.2 Intencional

                4.1.3 Quotas ou proporcional

                4.1.4 Desproporcional

        4.2 PROBABILÍSTICA

                4.2.1 Aleatória Simples

                4.2.2 Aleatória Estratificada

                4.2.3 Conglomerado

        4.3 DIMENSIONAMENTO DA AMOSTRA

    5. TIPOS DE DADOS

    6. TIPOS DE VARIÁVEIS ESCALARES

    7. DISTRIBUIÇÕES DE FREQÜÊNCIAS

            7.1 REGRAS PARA A ELABORAÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS

    8. MEDIDAS DE TENDÊNCIA CENTRAL

Page 2: Estatística básica para pesquisa de mercado.doc

        Média aritmética

    9. VARIABILIDADE

    10. TESTE DE HIPÓTESE

    11. ESTATÍSTICA NÃO PARAMÉTRICA

        11.1 TESTE DE QUI QUADRADO

            11.1.1 Teste de Qui Quadrado para uma amostra

                    11.1.1.1 Condições para a execução do teste

                    11.1.1.2 Procedimento para a execução do teste

            11.1.2 Teste do Qui Quadrado para independência (duas amostras)

                    11.1.2.1 Condições para a execução do teste

                    11.1.2.2 Procedimento para a execução do teste

            11.1.3 Coeficiente de contingência (CC)

    12. TESTE T PARA DUAS AMOSTRAS NÃO RELACIONADAS

            12.1 Condições para aplicação

            12.2 Procedimentos de execução

    13. ANÁLISE DE VARIÂNCIA

    14. REGRESSÃO SIMPLES (RLS)

    15. REGRESSÃO LINEAR MÚLTIPLA (RLM)

    16. EXERCÍCIOS

    17. BIBLIOGRAFIA

Page 3: Estatística básica para pesquisa de mercado.doc

Introdução

O mundo dos negócios, em qualquer que seja a área, de Recursos Humanos a Marketing, não pode mais embasar as tomadas de decisões e assumir risco simplesmente no feeling e no bom-senso dos executivos e gerentes organizacionais. A complexidade da sociedade e dos mercados apresentada atualmente exige que estes agentes se utilizem de recursos precisos e poderosos de forma a minimizar os potenciais riscos da atividade econômica. Neste contexto pode-se destacar a crescente utilização da informática, do método e dos recursos de estatística nas organizações que almejam destacar-se como agentes econômicos de ponta. 

 O barateamento exponencial destes recursos nos últimos anos tem feito que

muitas empresas invistam neste hardware (computadores, pacotes estatísticos, Internet, bases de dados) mas uma menor atenção tem sido dada ao “humanware” ou seja aos indivíduos que efetivamente extrairão deste arsenal tecnológico a informação e o conhecimento que possibilitarão conduzir estas organizações à liderança em seus segmentos. Sem este aprimoramento do “humanware” de muita pouca valia será o investimento feito no aparato tecnológico.

 Este curso tem a intenção de aportar conhecimentos básicos de ferramentas e

métodos relacionados à pesquisa e à análise estatística de dados visando o aprimoramento da utilização de poderosos recursos com a visão gerencial de como, e porque explorar a informação e de como enxergar em um “oceano” de dados aqueles que efetivamente são capazes de promover um diferencial competitivo à organização. Estatística básica para pesquisa de mercado não pretende cobrir todas as possibilidades da análise estatística de dados mas sim de prover uma consistente base sobre a qual novas habilidades podem ser facilmente construídas e desenvolvidas. Bem-vindo ao mundo da análise estatística de dados!!!!

 Marcus Vinicius da Cunha Júnior, Estudante de Doutorado - University of Florida

1. Definições

Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão.

 Enfim, quando se fala de estatística, fala-se de uma ciência presente em todos

os eventos mensuráveis do cotidiano. Muitas vezes ela está tão presente nas atividades rotineiras que não se dá conta de que a mesma encontra-se ali. Por exemplo, em um jogo de futebol, tomando-se a goleira e seu espaço vizinho, tem-se uma distribuição normal. Sim, afinal ao longo do jogo, os chutes a gol, tendem à área delimitada e defendida pelo goleiro. Ao final do jogo se houvesse uma quantificação dos chutes a gol, ter-se-ia a normalidade dos chutes (provavelmente entre 68% a 99% dos chutes para a linha de fundo concentrar-se-iam neste espaço). Este é apenas um

Page 4: Estatística básica para pesquisa de mercado.doc

dos inúmeros exemplos que fazem com a estatística seja mais familiar do que se imagina.

2. Coleta de dados

    Toda e qualquer ação estatística deve estar centrada em objetivos claros. O primeiro passo para um procedimento estatístico é o trabalho que envolve os dados de um estudo.

    Estando estes objetivos definidos, buscam-se os dados que os satisfaçam, sejam eles primários ou secundários. Dados primários são aqueles que foram prospectados sem que não tenha havido um estudo preliminar acerca da amostra em específico, ou seja, são dados originais. Dados secundários são aqueles que estão a nossa disposição oriunda de outros estudos. São fontes de dados secundários; Internet, bancos de dados, cadastros, jornais, revistas, filmes, entre muitas outras fontes.

Basicamente podemos dividir os dados em históricos ou planejados.

3. Populaçao e amostra

    Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra. Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a população, do que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande maioria dos casos, estudar-se a população em virtude de distâncias, custo, tempo, logística, entre outros motivos.

    A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida, é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população, falta de aleatoriedade e erro no dimensionamento da amostra.

 

3.1. Amostras relacionadas

    Quando se retira aleatoriamente, dois elementos de uma mesma população e expõe-se apenas um elemento a um determinado fator (propaganda, por exemplo). Avalia-se o impacto junto aos dois elementos.

 

 3.2. Amostras não relacionadas

    Apenas um elemento é selecionado e exposto ao fator. Uma comparação é feita considerando o antes e o depois.

 

Page 5: Estatística básica para pesquisa de mercado.doc

4. Amostragem

 

Tipos de amostragens

Não Probabilística

1.      Acidental ou conveniência

2.      Intencional

3.      Quotas ou proporcional

4.      Desproporcional

Probabilística

1.      Aleatória Simples

2.      Aleatória Estratificada

3.      Conglomerado

4.1 Não probabilística

    Este tipo de amostra, é determinada por ordem do pesquisador, ou seja não há uma aleatoriedade para a escolha de um elemento da população.

    A escolha de um método não probabilístico, via de regra, sempre encontrará desvantagem frente ao método probabilístico. No entanto, em alguns casos, se faz necessário a opção por este método. Observa-se que no envio de questionários via correio o método é não probabilístico (mesmo que a opção seja por amostragem Probabilística). O respondente pode não querer responder o questionário ou mesmo não ser localizado.

    Fonseca (1996), alerta que não há formas de se generalizar os resultados obtidos na amostra para o todo da população quando se opta por este método de amostragem.

4.1.1 Acidental ou conveniência

        Indicada para estudos exploratórios. Freqüentemente utilizados em super mercados para testar produtos. 

        4.1.2 Intencional

Page 6: Estatística básica para pesquisa de mercado.doc

        O entrevistador dirige-se a um grupo em específico para saber sua opinião. Por exemplo, quando de um estudo sobre automóveis, o pesquisador procura apenas oficinas. 

        4.1.3 Quotas ou proporcional  

        Na realidade, trata-se de uma variação da amostragem intencional. Necessita-se ter um prévio conhecimento da população e sua proporcionalidade. Por exemplo, deseja-se entrevistar apenas indivíduos da classe A, que representa 12% da população. Esta será a quota para o trabalho. Comumente também substratifica-se uma quota obedecendo a uma segunda proporcionalidade.

          4.1.4 Desproporcional

          Muito utilizada quando a escolha da amostra for desproporcional à população. Atribui-se pesos para os dados, e assim obtém-se resultados ponderados representativos para o estudo. Por exemplo, em um mercado de telefones celulares, considerando uma fatia de mercado meramente ilustrativa, obteve-se os resultados conforme descritos a seguir:   

Marcas Participação no mercado Elementos na amostra

    n %

Nokia 60% 50 25%

Ericsson 20% 50 25%

Gradiente 15% 50 25%

Philips 05% 50 25%

Total 100% 200 100%

 

          Objetivando obter os pesos a serem atribuídos a cada marca de telefone celular, para uma análise conjunta de todas as marcas no exemplo acima, obteve-se os seguintes coeficientes: 

   Número de elementos a

serem entrevistados

Peso NokiaPeso EricssonPeso GradientePeso Philips

2,40,80,60,2

120403010

  Total:200

         Fórmula aplicada: Peso = participação no mercado/elementos  na amostra (%)

Page 7: Estatística básica para pesquisa de mercado.doc

4.2 Probabilística

    Para que se possa realizar inferências sobre a população, é necessário que se trabalhe com amostragem probabilística. É o método que garante segurança quando investiga-se alguma hipótese.

Normalmente os indivíduos investigados possuem a mesma probabilidade de ser selecionado na amostra.

 

4.2 Aleatória Simples

    É o mais utilizado processo de amostragem. Prático e eficaz, confere precisão ao processo de amostragem. Normalmente utiliza-se uma tabela de números aleatórios e nomeia-se os indivíduos, sorteando-se um por um até completar a amostra calculada. Utiliza-se comumente o sorteio aleatório disponível em planilhas eletrônicas como o Excel®.

    Uma variação deste tipo de amostragem é a sistemática. Em um grande número de exemplos, o pesquisador depara-se com a população ordenada. Neste sentido, tem-se os indivíduos dispostos em seqüência o que dificulta a aplicação exata desta técnica.

    Quando se trabalha com sorteio de quadras de casas por exemplo, há uma regra crescente para os números das casas. Em casos como este, divide-se a população pela amostra e obtém-se um coeficiente (Ħ). A primeira casa será a de número x, a segunda será a de número x + Ħ; a terceira será a de número x + 3. Ħ.

    Supondo que este coeficiente seja 6. O primeiro elemento será 3. O segundo será 3 + 6. O terceiro será 3 + 2.6. O quarto será 3 + 3.6,  e assim sucessivamente.

4.2 Aleatória Estratificada

    Quando se deseja guardar uma proporcionalidade na população heterogênea. Estratifica-se cada subpopulação por intermédio de critérios como classe social, renda, idade, sexo, entre outros.

 

 4.2.3 Conglomerado

    Em corriqueiras situações, torna-se difícil coletar características da população. Nesta modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto. É exemplo de amostragem por conglomerado, famílias, organizações e quarteirões.

4.3 Dimensionamento da amostra

    Quando deseja-se dimensionar o tamanho da amostra, o procedimento desenvolve-se em três etapas distintas:

Page 8: Estatística básica para pesquisa de mercado.doc

1. Avaliar o instrumento de coleta de dados e julgar a variável mais importante do questionário ou o grupo de variáveis mais significativas;

2. Analisar se é ordinal, intervalar ou nominal;

3. Verificar se a população é finita ou infinita;

Page 9: Estatística básica para pesquisa de mercado.doc

 

Variável intervalar e população infinita

Variável intervalar e população finita

Variável nominal ou ordinal e população infinita

Variável nominal ou ordinal e população finita

 

Obs.: A proporção (p) será a estimativa da verdadeira proporção de um dos níveis escolhidos para a variável adotada. Por exemplo, 60% dos telefones da amostra é Nokia, então p será 0,60.

A proporção (q) será sempre 1 - p. Neste exemplo q, será 0,4. O erro é representado por d.

Para casos em que não se tenha como identificar as proporções confere-se 0,5 para p e q.

5. Tipos de dados

Basicamente os dados de uma pesquisa quantitativa, dividem-se em contínuos e discretos. O primeiro é definido como qualquer valor entre dois limites quaisquer, tal como um diâmetro. Portanto trata-se de um valor que ser “quebrado”. São dados contínuos, questões que envolvem idade, renda, gastos, vendas, faturamento, entre muitas outras.

Quando fala-se em valores discretos, aborda-se um valor exato, tal como quantidade de peças defeituosas. Comumente utiliza-se este tipo de variáveis para tratar de numero de filhos, satisfação e escalas nominais no geral.

O tipologia dos dados determina a variável, ela será portanto contínua ou discreta. Isto quer dizer que ao definir-se uma variável com contínua ou discreta, futuramente já definiu-se que tipo de tratamento se dará a ela. Por exemplo, a variável dependente em uma análise envolvendo Anova, não poderá ser discreta.

6. Tipos de variáveis escalares

Ordinal, Objetiva criar como o próprio nome diz, uma ordem de valor, segundo a preferência do respondente. Por exemplo, em um escala, A é preferido a B, mas não identifica-se o quanto A é menor que B.

Nominal, São as escalas mais comuns em pesquisas de marketing. Seus números servem para identificar a escolha do respondente e não determinar ordem ou mesmo se A é melhor que B. Os números são associados aos pontos de resposta, visando

Page 10: Estatística básica para pesquisa de mercado.doc

criar uma organização nas escalas. É exemplo clássico de escala nominal, questões de sexo e as de dicotomia (sim; não) e diferencial semântico (puro _ _ _ impuro).

Intervalar, São questões que visam comparar intervalos e medir o quanto uma preferência encontra-se distante de outra. Atualmente são objeto de infindáveis discussões entre estatísticos e acadêmicos de marketing quando da aplicação de testes estatísticos, afinal são consideradas discretas mas podem passar por um processo de aproximação e tornarem-se contínuas. Um processo semelhante, é descrito por Cunha (1997), quando o autor aborda a técnica de Análise de Correspondência (AC) e comenta que as variáveis de melhor emprego para tal técnica são as qualitativas ou as que passaram por processo de categorização. Exemplo de escalas intervalares: 1;2;3;4;5, muito insatisfeito; insatisfeito; indiferente; satisfeito; muito satisfeito.

Razão, são as variáveis contínuas. Peso, idade, renda, são exemplos de questões de razão.

Abaixo serão descritos modelos estatísticos possíveis para os tipos de escalas abordadas. 

Tipo de escala Estatística possível

OrdinalTodas de tendência central

Nominal Moda e Qui quadrado

IntervalarMédias, desvio padrão e médio, amplitudes, variância, teste z e t, correlação e regressão.

Razão Todos do anterior

7. Distribuição de frequências

Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe.

O exemplo a seguir apresenta um conjunto de tempos para determinada operação.

 

5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2 6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7 6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2 7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8 7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,3 8,4 8,5 8,5 8,6 8,7 8,8 8,8 8,9 9 9,1 9,2 9,4 9,4 9,5 9,5 9,6 9,8 9,9 10 10,2 10,2

10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9

7.1 Regras para a elaboração de uma distribuição de frequências

Page 11: Estatística básica para pesquisa de mercado.doc

1.   Determina-se o menor e o maior valor para o conjunto:

Valor mínimo: 5,1

Valor máximo: 14,9

2.   Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações:

LI: 5,1

3.   Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações:

LS:15

4.   Definir o número de classes (K), que será calculado usando K = . Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K é igual a 8,94, aproximadamente, 8.

5.   Conhecido o número de classes define-se a amplitude de cada classe:

No exemplo, a será igual a:

6.   Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23.

 

7.                  

Intervalo de Classe Freqüência Absoluta

Freqüência Acumulada

Freqüência Relativa

05,10 a 06,33 13 13 16,25% 06,34 a 07,57 21 34 26,25% 07,58 a 08,81 22 56 27,50% 08,82 a 10,05 15 71 18,75% 10,06 a 11,29 4 75 5,00% 11,30 a 12,53 3 78 3,75% 12,54 a 13,77 1 79 1,25% 13,78 a 15,01 1 80 1,25%

  80   100%

 

8. Medidas de tendência central

Há várias medidas de tendência central, entretanto nesta apostila, será abordado o estudo de apenas aquelas que forem as mais significativas para a teoria de pesquisa mercadológica. As mais importante medidas de tendência central, são a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda, média geométrica, média harmônica, quartis. Quando se estuda variabilidade, as medidas mais importantes são: amplitude, desvio padrão e variância.

 

Page 12: Estatística básica para pesquisa de mercado.doc

Medidas Fórmula Exemplo

Média aritmética Média aritmética para dados agrupados Média aritmética ponderada

4 (4) + 6 (9) = 7

Mediana 1) Se n é impar, o valor é central, 2) se n é par, o valor é a média dos dois valores centrais.

12 13 14  = 13 12 13 14 15 = 13,5

Moda Valor que ocorre com mais freqüência. 22 23 22 22 34 45  =

22 Média geométrica

G = nv X1 X2... 3v12 x 14 x 16 = 13,90

Média harmônica

Quartis  

 

Exemplo de calculo de quartil: Para a amostra abaixo, calcular o primeiro e o terceiro quartis:

1) Valores em ordem crescente e cálculo de p(i).

13,3   13,5   17,2   13,8   12,3   12,7   13,0   14,5   14,9   15,8   13,1   13,3   14,1

12,3   12,7   13,0   13,1   13,3   13,3   13,5   13,8   14,1   14,5   14,9   15,8   17,2

Page 13: Estatística básica para pesquisa de mercado.doc

 

X (i)

 

 

12,3

12,7

13,0

13,1

13,3

13,3

13,5

13,8

14,1

14,5

14,9

15,8

17,2

i

 

 

01

02

03

04

05

06

07

08

09

10

11

12

13

0,038

0,115

0,192

0,269

0,346

0,423

0,500

0,577

0,654

0,731

0,808

0,885

0,962

 

2) Valores imediatamente acima e abaixo de 0,25 (13,0 e 13,1), associados com p(inf) = 0,192 e p (sup) = 0,269

 

Valores imediatamente acima e abaixo de 0,75: x(inf) = 14,5 e x (sup) = 14,9, associados com p(inf) = 0,731 e p(sup)

= 0,808:

 

O valor para o segundo quartil é representado pela mediana (13,5).

9. Variabilidade

Amplitude total: Definida como a diferença entre o maior e o menor valor das observações

Page 14: Estatística básica para pesquisa de mercado.doc

Por exemplo, a amplitude entre 8 12 14 16 18, é 10. Desvio Padrão (DP): O DP é a raiz quadrada da variância. É uma

medida de variabilidade que leva em consideração toda a informação contida na amostra.

Um exemplo como o a seguir ilustra bem a aplicação da medida do desvio padrão.

A média da idade da amostra foi de 15,00 anos, com desvio-padrão de 1,05 anos, o que indica a maioria dos respondentes entre 14 e 16 anos.

 Por exemplo, na amostra (10 12 14 16 18), o desvio padrão será

  ...

10. Teste de hipóteseUma hipótese estatística é uma afirmativa a respeito de um parâmetro de uma distribuição de probabilidade.

Através dos elementos amostrais faz-se um teste que indicará a aceitação ou rejeição da hipótese formulada.

Hipótese estatística é uma suposição de um parâmetro populacional. Por exemplo:

1.     A renda média da população de Forquilhinha é R$ 350,00.Então H: μ = 350,00.

2.     A proporção de alunos reprovados é 35%, ou seja: H:p = 0,35

A contrapartida para uma hipótese alternativa (H1) é a hipótese nula (H0). A primeira sempre é expressa por uma desigualdade e a segunda sempre por uma igualdade.

Utiliza-se o teste de hipótese para casos como comparação de médias, de pares de observação, de variâncias, e de parâmetros, entre outros.

11. Estatística não paramétricaDistintamente da estatística paramétrica que trata de testes para variáveis razão e intervalares, a estatística

paramétrica aborda os testes para variáveis nominais e ordinais.

Conclui-se então que os parâmetros populacionais e as estimativas são desconsiderados nos testes a seguir.

Segundo Fonseca (1996), os testes não paramétricos são muito interessantes para os dados qualitativos quando se trabalha com amostras pequenas, (inferiores a 30).

Os principais representantes desta estatística são os testes de Qui Quadrado, de Wilcoxon, de Mann-Whitney, da Mediana, e de Kruskall-Wallis.

Abordar-se-á apenas o de Qui quadrado por considerar-se o mais importante e popular.

Page 15: Estatística básica para pesquisa de mercado.doc

11.1 Teste do qui quadrado

Este teste objetiva verificar se a freqüência absoluta observada de uma variável é significativamente diferente da distribuição de freqüência absoluta esperada.

 

11.1.1 Teste do qui quadrado para uma amostra

Aplica-se quando se quer estudar a dependência entre duas variáveis, através de uma tabela de dupla entrada ou também conhecida como tabela de contingência.

11.1.1.1 Condições para a execução do teste

Exclusivamente para variáveis nominais e ordinais;

Observações independentes;

Não se aplica se 20% das observações forem inferiores a 5

Não pode haver freqüências inferiores a 1; Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo um

critério em específico.

11.1.1.2 Procedimento para a execução do teste

1.     Determinar H0. Será a negativa da existência de diferenças entre a distribuição de freqüência observada e a esperada;

2.     Estabelecer o nível de significância (µ );

3.     Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ), sendo K – 1 (K = número de categorias). Encontrar portanto, o valor do Qui-quadrado tabelado;

4.     Calcular o Qui Quadrado, através da fórmula:

Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.

Exemplo:

Um vendedor trabalhou comercializando um produto em sete bairros residenciais de uma mesma cidade em um mesmo período do ano.

Seu gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, ou seja, se as diferenças eram significativas nos bairros trabalhados.

A partir deste estudo o gerente poderia então elaborar uma estratégia comercial para cada bairro ou manter uma para todos.

 

Bairro 1 2 3 4 5 Total Valores Observados

9 11 25 20 15 80

Valores Esperados 16 16 16 16 16 80  

H0: não há diferenças significativas entre os bairros

H1: as diferenças observadas para os bairros 3 e 4 são significativamente diferentes para melhor em relação aos demais bairros.

µ = 0,05

g.l = 5 – 1 = 4, onde Qui quadrado tabelado é igual a 9,49.

Χ2 = (9-16)2 + (11 – 16) 2 + (25-16) 2 + (20 – 16) 2 + (15 – 16) 2/16

Χ2 = 72 + 52 +92 + 42 + 12= 172/16 = 10,75

Conclui-se que o Qui quadrado calculado (10,75) é maior do que o tabelado (9,49), rejeita-se H0 em prol de H1.

Page 16: Estatística básica para pesquisa de mercado.doc

Portanto há diferença significativa, ao nível de 0,05, para os bairros 3 e 4. Face ao cálculo o gerente deve elaborar uma estratégia comercial para cada bairro.

11.1.2 Teste do qui quadrado para independência (duas amostras)

A utilização do presente teste em pesquisa visa verificar se as distribuições de duas ou mais amostras não relacionadas diferem significativamente em relação à determinada variável.

 

11.1.2.1 Condições para a execução do teste

Exclusivamente para variáveis nominais e ordinais;

Preferencialmente para amostras grandes, <30;

Observações independentes;

Não se aplica se 20% das observações forem inferiores a 5

Não pode haver freqüências inferiores a 1;

Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo um critério em específico.

11.1.2.2 Procedimento para a execução do teste

Determinar H0. As variáveis são independentes, ou as variáveis não estão associadas;

Estabelecer o nível de significância (µ );

Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ), sendo φ = (L – 1) (C – 1), onde L = números de linhas da tabela e C = ao número de colunas.. Encontrar portanto, o valor do Qui-quadrado tabelado;

Calcular o Qui Quadrado, através da fórmula:

Para encontrar o valor esperado (E), utilizar a fórmula a seguir:

Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.

Há dependência ou as variáveis não estão associadas.

Exemplo:

Um pesquisador deseja identificar se há dependência no consumo de seus chocolates e as cidades de sua região.

 

  Cidades do Vale do Taquari  

Sabor do chocolate Lajeado Santa Cruz Estrela Taquari ∑

Chocolate com caju 60 30 20 40 150

Chocolate com amendoim 45 35 20 10 110

Chocolate com flocos 55 25 47 13 140

Chocolate com passas 70 35 25 20 150

∑ 230 125 112 83 550

 

H0: A preferência pelos sabores independe da cidade

H1: A preferência pelos sabores depende da cidade.

µ = 0,05

φ = (4 – 1) (3 – 1) = 6, onde Qui quadrado tabelado é igual a 12,6.

Page 17: Estatística básica para pesquisa de mercado.doc

 

Calculo dos valores esperados (E). Cidades do Vale do Taquari

Sabor do chocolate Lajeado Santa Cruz Estrela Taquari

Chocolate com caju 62,7 34,1 30,5 22,6 Chocolate com amendoim 46,0 25,0 22,4 16,6 Chocolate com flocos 58,5 31,8 28,5 21,1 Chocolate com passas 62,7 34,1 30,5 22,6

 

Χ2 = (60 – 62,7)2/62,7 + [(30 – 34,1) 2/34,1 ...[(20 – 22,6) 2/22,6 =

0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,29 = 43,72

Conclui-se que o Qui quadrado calculado (43,72) é maior do que o tabelado (12,6), rejeita-se H0  em prol de H1.

Portanto há diferença significativa, ao nível de 0,05, para as cidades.

 

11.1.3 Coeficiente de contingência (CC)

O CC é um indicador do grau de associação entre duas variáveis analisadas pelo Qui quadrado.

Quanto mais próximo de 1, melhor o coeficiente de contingência, que varia de 0 a 1.

No exemplo dado acima o coeficiente seria 0,3442.

 

12. Teste T para duas amostras não relacionadas

O teste t é muito utilizado em pesquisa para verificar se a diferença observada entre duas médias  obtidas nas amostras é considerada grande para ser significativa.

Supondo que dois estabelecimentos discutem qual possui clientes mais satisfeitos. Para mensurara o grau de satisfação junto aos clientes, resolve-se realizar uma pesquisa de satisfação aplicando um questionário com questões intervalares de 5 pontos.

O cliente A obteve média geral 2,85 e o cliente B obteve média geral 3,45. Supostamente, conclui-se que o cliente B possui clientes mais satisfeitos que A.

O teste t visa justamente comprovar se tal diferença é significativa e explicar se as diferenças entre as médias ocorrem devido ao erro amostral ou não.

Quando trabalha-se com amostras pequenas, existe uma tendência para que as médias das amostras seja realmente diferentes, mesmo que originem-se da mesma população. Neste caso o teste t, objetiva justamente verificar se o grau de diferença entre os dois conjuntos  pode ser devido  a fatores outros que não o erro de amostragem.

Page 18: Estatística básica para pesquisa de mercado.doc

12.1 Condições para aplicação

·         Somente para questões intervalares;

·         Quando a variância da população for desconhecida;

·         n pode ser de qualquer tamanho.

 

12.2 Procedimento de execução

1.     Determinar H0, não havendo diferenças entre as médias;

2.     Determinar H1, para a existência de diferença entre as médias;

3.     Estabelecer um nível de significância;

4.     Calcular t, onde os graus de liberdade, φ  = n1 + n2 – 2

onde SQ é a soma dos quadrados e x1 e x2 são as médias de cada grupo.

A fórmula acima pode divergir em alguns livros de estatísticas que abordem amostras desiguais, no entanto, a mesma contempla amostras de tamanhos iguais ou não.

Comparar o t tabelado com t calculado e rejeitar a hipótese nula em prol da alternativa, em caso de encontrar-se t calculado maior que o tabelado.

Exemplo:

A   B 1 3   2 3 2 4   4 3 3 3   5 4 2 2   3 5 4 1   3 3 3 3   4 2 3 4   2 1 3 2   5 3 4 4   4 4 4 2   5 2 T = 57   T = 69 n = 20   n = 20

X = 2,85   X = 3,45 SQ = 18,55   SQ = 24,95

 

Sendo t tabelado igual a 2,02 com 38 graus de liberdade e t calculado igual a 1,77, rejeita-se a hipótese nula em prol da hipótese verdadeira.

Conclui-se, portanto que os dois grupos de clientes estão satisfeitos e que provavelmente as diferenças entre as médias sejam devido ao erro de amostragem.

Page 19: Estatística básica para pesquisa de mercado.doc

13. Análise de variância

A análise de variância é um teste estatístico amplamente difundido entre os analistas, e visa fundamentalmente verificar se existe uma diferença significativa entre as médias e se os fatores exercem influência em alguma variável dependente.

Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a variável dependente necessariamente deverá ser contínua.

Haja visto que trata-se de um teste bastante difundido e inúmeros bons softwares estatísticos e planilhas eletrônicas possuem o recurso disponível, não haverá aprofundamento desta técnica neste capítulo, sendo recomendada literatura especializada.

A principal aplicação da ANOVA (analise of variance) é a comparação de médias oriundas de grupos diferentes, também chamados tratamentos, como por exemplo médias históricas de questões de satisfação, empresas que operam simultaneamente com diferentes rendimentos, entre muitas outras aplicações.

Existem dois métodos para calcular-se a variância: dentro de grupos (MQG) e a variância das médias (MQR).

Em uma Anova, calcula-se esses dois componentes de variância. Se a variância calculada usando a média (MQR) for maior do que a calculada (MQG) usando os dados pertencentes a cada grupo individual, isso pode indicar que existe uma diferença significativa entre os grupos.

Existem dois tipos de problemas a serem resolvidos através da Anova: a níveis fixos ou a níveis aleatórios. A aleatoriedade determinada a questão do problema.

Na grande maioria dos casos trata-se de níveis fixos, afinal o segundo tipo de problema (aleatório) somente surgirá quando ocorrer um estudo envolvendo uma escolha aleatória de fatores (em 10 lotes de produção, escolhe-se apenas 5, entre 15 máquinas de um total de 20, por exemplo).

Tabela de Análise de Variância ou tabela ANOVA.

 

Fonte de Variação SQ GDL MQ Teste F Entre Grupos SQG K – 1 MQG MQG/MQR Dentro dos Grupos SQR N-K MQR   Total SQT N-1  

 

·         SQT = SQG + SQR (mede a variação geral de todas as observações).

·         SQT é a soma dos quadrados totais, decomposta em:

·         SQG soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um efeito dos grupos

·         SQR soma dos quadrados dos resíduos, devidos exclusivamente ao erro aleatório, medida dentro dos grupos.

·         MQG = Média quadrada dos grupos

·         MQR = Média quadrada dos resíduos (entre os grupos)

·         SQG e MQG: medem a variação total entre as médias

·         SQR e MQR: medem a variação das observações de cada grupo

f = MQG

     MQR

Page 20: Estatística básica para pesquisa de mercado.doc

N – 1=(K – 1) + (N – K)

SQT = SQG + SQR

MQG = SQG (K – 1)

A hipótese nula sempre será rejeitada quando f calculado for maior que o valor tabelado. Da mesma forma, se MQG for maior que MQR, rejeita-se a hipótese nula.

Quadro

Fonte de variação SQ (soma dos quadrados) GDL (g.l) MQ (quadrados médio) Teste F Entre Grupos Dentro dos grupos Total

Se o teste f indicar diferenças significativas entre as médias, e os níveis forem fixos, haverá interesse em identificar quais as médias que diferem entre si.

Calcular o desvio padrão das médias;

Sx = , ,onde nc é a soma do número de cada variável (grupo) dividido pelo número de variáveis.

Calcular o limite de decisão (ld)

3 x Sx

Ordenar as médias em ordem crescente ou decrescente e compara-las duas a duas. A diferença será significativa se for maior que Ld.

Se o teste f indicar diferenças significativas entre as médias, e os níveis forem aleatórios, haverá interesse em identificar a estimativa dos componentes de variação.

O valor encontrado acima indicará a variabilidade total entre grupos, indicando se é considerado significativa ou não.

Exemplo (níveis fixos):

Um pesquisador realizou um estudo para verificar qual posto de trabalho gerava mais satisfação para o funcionário. Para isso, durante um mês, 10 funcionários foram entrevistados.  Ao final de um mês os funcionários responderam um questionário gerando uma nota para o bem estar do funcionário.

                                                                                 Postos

Funcionários 1 2 3 1 7 5 8 2 8 6 9 3 7 7 8 4 8 6 9 5 9 5 8 6 7 6 8 7 8 7 9 8 6 5 10 9 7 6 8

10 6 6 9

Page 21: Estatística básica para pesquisa de mercado.doc

                          

RESUMO

Grupo Contagem Soma Média Variância 1 10 73 7,3 0,9 2 10 59 5,9 0,544444 3 10 86 8,6 0,488889

                                        

ANOVA

Fonte da variação SQ gl MQ F valor-P F crítico Entre grupos 36,46667 2 18,23 28,29 2,37E-07 3,35 Dentro dos grupos 17,4 27 0,64      Total 53,86667 29        

 

Como f calculado é maior do que o f tabelado, rejeita-se a hipótese nula em prol da hipótese alternativa ao risco de 5%.

Há diferenças significativas entre os grupos. Observa-se que MQG é muito superior a MQR, indicando uma forte variância entre os grupos.

1.      Calcular o desvio padrão das médias;

2.      Calcular o limite de decisão (Ld)

3 x Sx

3.      Ordenar as médias em ordem crescente ou decrescente e compara-las duas a duas.

5,9

7,3

8,6

x1 – x2 = - 1,4

x1 – x3 = - 2,7

x2 – x3 = - 1,3

As três diferenças são menores que o Ld, conclui-se portanto que as médias diferem entre si.

Page 22: Estatística básica para pesquisa de mercado.doc

14. Regressão simples (RLS)

Em inúmeras problemáticas, o pesquisador depara-se com duas varáveis que proporcionam previsão de comportamentos futuros. Esta previsão pode ser alcançada através de um estudo que envolve a equação da reta de regressão, concebida através das variáveis critério (y, dependente ou de resposta) e a independente (x, também conhecida como prognóstico). Trata-se de uma realidade comum no universo da pesquisa, envolvendo variáveis como renda, idade, gastos, entre muitas outras.

Equação da reta: Y = a1 + a2.x Onde, y é a variável dependente e x a independente. a1 é o valore de y para x e a2.é valor médio de y por unidade x.

A relação linear entre as duas variáveis é medida pelo coeficiente de correlação (R).

R varia de –1 a 1, onde 1 é a correlação perfeita e o oposto indica forte correlação negativa. Valores próximos de zero indicam fraca correlação.

No exemplo abaixo, se existisse um R elevado poderia-se prever y para eventos futuros.

 

Y X Gastos com combustível Km rodados Renda Pessoal Anos de estudo Números de defeitos de peças Horas de treinamentos em qualidade

  O cálculo de R é uma operação bastante simples para softwares com

funções estatísticas, sendo desnecessário o aprofundamento dos procedimentos de calculo.

Neste tipo de análise é importante determinar o quanto a linha de regressão representa os dados. Neste caso, se faz necessário calcular o R2

de Pearson ou coeficiente de determinação. Um R2  igual a 0,80, tem-se que 80% da variabilidade decorre de x.

Inversamente, pode-se dizer que 20% da variância de Y não é atribuível às diferenças em x.

Para obter-se o teste de hipótese, formula-se H0 e H1 da seguinte forma:

H0 :p = 0 H1: p ≠ 0 O cálculo de t é realizado através da formula,

Sendo t calculado maior do que t tabelado, rejeita-se a hipótese nula.

Exemplo: Um motorista deseja prever seus gastos com seu automóvel em

função dos quilômetros que roda por mês.  

Page 23: Estatística básica para pesquisa de mercado.doc

QUILÔMETROS GASTOS (R$) 3203 400 3203 400 2603 340 3105 400 1305 150

804 100 1604 200 2706 300

805 100 1903 200 3203 400 3702 450 3203 400 3203 400

803 100 803 100

1102 130 3202 400 1604 150 1603 200 3203 400 3702 450 3403 440

 

Estatística de regressão R múltiplo 0,993064678  R-Quadrado 0,986177454  R-quadrado ajustado 0,985519237  Erro padrão 127,508336  Observações 23  

Observando a tabela acima, percebe-se uma forte correlação entre as variáveis, onde R está muito próximo de 1. Quilômetros rodados explica 98% da variância de gastos.

15. Regressão linear múltipla (RLM)

Muitos problemas de regressão envolvem mais de uma variável regressora. Por exemplo: a satisfação geral poder ser composta por diversas variáveis independente tais como preço, prazo de entrega, embalagem, entre outras.

Em virtude dos princípios da regressão múltipla serem análogos à da regressão simples, não se abordará aqui as particularidades que envolvem a equação geral da equação da Regressão Múltipla: y = β0 + βx1 + β2x2 + ...+ βkxk + Σ.

Analogamente, a preocupação geral do analista nesta análise, é o R2 que indica a variabilidade total do modelo de regressão, e os R’s que variam de 1 a –1, indicando a variabilidade total, onde haverá uma relação entre a variável de resposta e as regressoras.

Page 24: Estatística básica para pesquisa de mercado.doc

O teste de hipótese baseia-se no já abordado valor do t, onde ocorre a situação do mesmo sendo calculado e maior do que o tabelado, rejeita-se a hipótese nula.

 Exemplo:

Variáveis CoeficientePrazo de entrega 0,154Envolvimento da equipe na solução de problemas

0,135

Preço praticado -0,002Trabalho de pós venda 0,134Embalagem 0,065  Neste exemplo real, objetivava-se mensurar o grau de satisfação dos clientes de uma empresa distribuidora de software, onde a variável de resposta era a satisfação geral e as regressoras eram as acima citadas (para um grupo de fatores).Observa-se que pouca representatividade é exercida por estas variáveis, afinal os coeficientes pouco se afastam de zero. No entanto o R2 é elevado (0,68), conferindo uma boa precisão no cálculo.

 16. Exercícios

 1.     Uma empresa possui quatro equipes de vendedores e deseja avaliar os resultados abaixo discriminados. As vendas deveriam ser as mesmas.  Para testar essa hipótese foram feitas medições nas equipes. Analise os resultados e conclua a respeito de possíveis diferenças entre as equipes.

 

Equipe 1 Equipe 2 Equipe 3 Equipe 4 824 817 822 826 821 830 810 828 829 819 831 810 808 809 824 820 815 825 818 815

 

2.      Supondo que a variável escolhida de um pesquisa, seja nominal e a população finita de 600 indivíduos (onde 60% dos indivíduos são mulheres). Deseja-se trabalhar com um alpha de 5% e um erro amostral de 7%. Calcule o tamanho da amostra.

 

3.      Organize os dados abaixo em uma tabela de distribuição de freqüência, contendo o intervalo de classe, a freqüência absoluta, a freqüência acumulada, a freqüência relativa e a freqüência relativa acumulada.

 

Page 25: Estatística básica para pesquisa de mercado.doc

20,4 22,3 23,1 23,5 23,8 24,1 24,3 24,3 24,6 24,8 24,9 25,0 25,1 25,3 25,3 25,4 25,6 25,7 25,8 26,0 26,0 26,1 26,2 26,2 26,3 26,5 26,6 26,7 26,8 26,9 27,1 27,1 27,3 27,5 27,7 27,9 28,0 28,3 28,7 29,6

 

4.      Três arremessadores de disco, treinam para a Olimpíada. Os atletas arremessam seus discos a 66 metros de distância (em média), com desvio padrão de 6,1 metros.

Qual a probabilidade de um atleta lançar seu disco entre 64 e 67 metros?

 

5.      Uma determinada amostra possui variância de 0,0015 e média de 12,258. Sendo o n igual a 12, construa o intervalo de confiança para média amostral.

 

6.      Um gerente geral de determinada rede de lojas de varejo deseja saber se a estação climática do ano interfere no volume de artigos vendidos. Teste a hipótese da estação do ano interferir no volume vendido.

 

  Verão Outono Inverno Primavera Loja Centro 150 160 165 172 Loja Sul 180 179 177 180 Loja Norte 167 187 123 155 Loja Matriz 199 187 182 176

 

7.      Um automóvel recebeu as notas abaixo junto a leitores de revista especializada. Durante dois meses o pesquisa foi publicada e agora o fabricante deseja saber se há diferenças significativas entre as notas ao longo dos dois meses.

 

Mês Jan Mês de Fev 9 6 8 6 7 6 9 6 7 5 6 5 4 5 9 4 9 3 9 2 9 6 8 5

Page 26: Estatística básica para pesquisa de mercado.doc

8 5 7 8

 

8.      Através de um estudo de share of mind, quatro amostras de telespectadores foram entrevistados, oriundas dos estados de SP, AM, RN e RS. O objetivo do pesquisador é verificar se há diferenças significativas entre as quatro amostras, se houve o mesmo impacto da propaganda nos estados.

 

SP AM RN RS 5,2 5,9 5,2 6,9 5,9 6,3 5,9 6,8 6,6 6,7 6,6 6,7 7,3 7,1 7,3 6,6 8,0 7,5 8,0 6,5 8,7 7,9 8,7 6,4 9,4 8,3 9,4 6,3 7,9 8,7 9,7 6,2 8,3 9,1 5,2 6,1 7,3 9,5 5,9 6,0 8,0 5,9 6,6 5,9 8,7 6,3 7,3 5,8 9,4 6,7 8,0 5,7 7,9 7,1 8,7 5,6 8,3 7,5 9,4 5,5

17. Bibliografia

 

CUNHA, M.V. Análise Multidimensional de Dados Categóricos. In: PPGA, UFRGS, 16. 1997. Porto Alegre, RS

FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo. Atlas.1996

FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998.

KOTLER, P. Administração de Marketing: Análise, Planejamnto, Implementação e controle. São Paulo: Atlas, 1996.

LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998.

MARR, S.L., CROSBY, L.A. Customer Satisfaction Measurement: a management Information system for total quality. Artigo de trabalho da Disciplina de Comportamento do consumidor – PPGA – UFRGS, 1996.

Page 27: Estatística básica para pesquisa de mercado.doc

MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996.

ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte proposição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD,  21., Anais. 1997, Rio das Pedras, RJ. p.124

SLACK, N. Administração da produção. São Paulo: Atlas, 1997.