análise multivariada - pipges · organização de dados e análise descritiva vetores aleatórios...
TRANSCRIPT
Análise Multivariada - PIPGES2o semestre de 2017
Prof. Cibele [email protected]://www.icmc.usp.br/~cibele
Sala 3-113
2. semestre 2017 1 / 22
Principais objetivos do curso
Estudar e desenvolvermétodos estatísticos paradescrever e analisardados multivariados
2. semestre 2017 2 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Programa - 1a parte
Organização de dados e análise descritiva
Vetores aleatórios e álgebra de matrizes
Média e matriz de covariâncias amostrais
Distribuições multivariadas discretas e contínuas.
Inferências sobre um vetor de médias
Análise de variância multivariada
Regressão linear multivariada
2. semestre 2017 3 / 22
Dados multivariados - Exemplo
Fonte: Barroso, L. P. e Artes, R. Análise Multivariada. 2005.Disponível emhttp://www.ime.usp.br/~lbarroso/Livro.pdf.
2. semestre 2017 4 / 22
Programa - 2a parte
Análise de componentes principais
Análise fatorial
Análise de correlação canônica
Análise de agrupamentos
Análise discriminante
Análise de correspondência
2. semestre 2017 5 / 22
Programa - 2a parte
Análise de componentes principais
Análise fatorial
Análise de correlação canônica
Análise de agrupamentos
Análise discriminante
Análise de correspondência
2. semestre 2017 5 / 22
Programa - 2a parte
Análise de componentes principais
Análise fatorial
Análise de correlação canônica
Análise de agrupamentos
Análise discriminante
Análise de correspondência
2. semestre 2017 5 / 22
Programa - 2a parte
Análise de componentes principais
Análise fatorial
Análise de correlação canônica
Análise de agrupamentos
Análise discriminante
Análise de correspondência
2. semestre 2017 5 / 22
Programa - 2a parte
Análise de componentes principais
Análise fatorial
Análise de correlação canônica
Análise de agrupamentos
Análise discriminante
Análise de correspondência
2. semestre 2017 5 / 22
Programa - 2a parte
Análise de componentes principais
Análise fatorial
Análise de correlação canônica
Análise de agrupamentos
Análise discriminante
Análise de correspondência
2. semestre 2017 5 / 22
Programa - 2a parte
Análise de componentes principais (Pearson, 1901)1 Explicar a estrutura de variância e covariância dos dados através
de combinações lineares
2 Redução da dimensão dos dados de p variáveis para kcomponentes principais não correlacionados, ordenadosdecrescentemente pela explicação da variabilidade total dos dados
3 Interpretações
2. semestre 2017 6 / 22
Programa - 2a parte
Análise de componentes principais (Pearson, 1901)1 Explicar a estrutura de variância e covariância dos dados através
de combinações lineares2 Redução da dimensão dos dados de p variáveis para k
componentes principais não correlacionados, ordenadosdecrescentemente pela explicação da variabilidade total dos dados
3 Interpretações
2. semestre 2017 6 / 22
Programa - 2a parte
Análise de componentes principais (Pearson, 1901)1 Explicar a estrutura de variância e covariância dos dados através
de combinações lineares2 Redução da dimensão dos dados de p variáveis para k
componentes principais não correlacionados, ordenadosdecrescentemente pela explicação da variabilidade total dos dados
3 Interpretações
2. semestre 2017 6 / 22
Programa - 2a parte
Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que
meçam aspectos comuns dos dados
2 Com várias motivações na psicologia e psicometria, surgiuinicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)
3 Identificação do número de fatores4 Interpretações5 Pode ser considerada uma extensão da análise de componentes
principais
2. semestre 2017 7 / 22
Programa - 2a parte
Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que
meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu
inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)
3 Identificação do número de fatores4 Interpretações5 Pode ser considerada uma extensão da análise de componentes
principais
2. semestre 2017 7 / 22
Programa - 2a parte
Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que
meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu
inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)
3 Identificação do número de fatores
4 Interpretações5 Pode ser considerada uma extensão da análise de componentes
principais
2. semestre 2017 7 / 22
Programa - 2a parte
Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que
meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu
inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)
3 Identificação do número de fatores4 Interpretações
5 Pode ser considerada uma extensão da análise de componentesprincipais
2. semestre 2017 7 / 22
Programa - 2a parte
Análise fatorial (Spearman, 1904)1 Explicar a variabilidade original dos dados através de fatores que
meçam aspectos comuns dos dados2 Com várias motivações na psicologia e psicometria, surgiu
inicialmente com a necessidade de medir quantidades latentes (porexemplo: ansiedade, inteligência)
3 Identificação do número de fatores4 Interpretações5 Pode ser considerada uma extensão da análise de componentes
principais
2. semestre 2017 7 / 22
Programa - 2a parte
Análise de correlação canônica1 Identificar e quantificar associações entre dois conjuntos de dados
2 Resumir as informações de cada conjunto de dados de modo amaximizar a correlação existente entre ambos
2. semestre 2017 8 / 22
Programa - 2a parte
Análise de correlação canônica1 Identificar e quantificar associações entre dois conjuntos de dados2 Resumir as informações de cada conjunto de dados de modo a
maximizar a correlação existente entre ambos
2. semestre 2017 8 / 22
Programa - 2a parte
Análise de agrupamentos1 Análise de conglomerados ou análise de cluster
2 Dividir os elementos da amostra de forma a ter grupos deelementos similares entre si em relação às variáveis observadas
2. semestre 2017 9 / 22
Programa - 2a parte
Análise de agrupamentos1 Análise de conglomerados ou análise de cluster2 Dividir os elementos da amostra de forma a ter grupos de
elementos similares entre si em relação às variáveis observadas
2. semestre 2017 9 / 22
Programa - 2a parte
Análise de agrupamentos - ExemploDeseja-se agrupar 11 idiomas de acordo com a sua similaridade paraa primeira letra dos numerais de 1 a 10.
Fonte: Johnson e Wichern (2007)
2. semestre 2017 10 / 22
Programa - 2a parte
Análise de agrupamentos - Exemplo
2. semestre 2017 11 / 22
Programa - 2a parte
Análise discriminante
1 Diferenciar populações
2 Classificar objetos em populações pré-definidas
2. semestre 2017 12 / 22
Programa - 2a parte
Análise discriminante
1 Diferenciar populações2 Classificar objetos em populações pré-definidas
2. semestre 2017 12 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Algumas áreas de aplicação de Análise Multivariada
Psicologia
Marketing
Biologia
Esportes
Economia
Controle de Qualidade
2. semestre 2017 13 / 22
Bibliografia principal
Mardia, K. V., Kent, J. T. and Bibby, J. M.(1979). Multivariate Analysis. AcademicPress.
Johnson, R. A. and Wichern, D. W. (2007)Applied Multivariate Statistical Analysis.5th edition. Prentice-Hall
2. semestre 2017 14 / 22
Bibliografia complementar
Mingoti, S. A. (2005). Análise de Dados Através de Métodos deEstatística Multivariada: Uma Abordagem Aplicada. BeloHorizonte: UFMGLattin, J., Carroll, J. D., Green, P. E. (2011) Análise de dadosmultivariados - São Paulo: Cengage Learning.Hair, J. F., Tatham, R. L., Anderson, R. E. and Black, W. (1998).Multivariate Data Analysis, 5th edition, Prentice Hall.Morrison, D. F. (1967). Multivariate Statistical Methods.McGraw-Hill.Greenacre, M. J. (1984). Theory and Applications ofCorrespondence Analysis. London: Academic Press.
2. semestre 2017 15 / 22
Critério de Avaliação
SejamP1: Prova 1;P2: Prova 2.NE: Nota de exercícios (que serão propostos ao longo do semestre)
A média do semestre MS será calculada como
MS =4 P1 + 4 P2 + 2 NE
10
Prova Substitutiva: somente com justificativa oficial, por exemploatestado médico reconhecido pela UBAS.Prova de Recuperação: a combinar.
2. semestre 2017 16 / 22
Critério de Avaliação
SejamP1: Prova 1;P2: Prova 2.NE: Nota de exercícios (que serão propostos ao longo do semestre)
A média do semestre MS será calculada como
MS =4 P1 + 4 P2 + 2 NE
10
Prova Substitutiva: somente com justificativa oficial, por exemploatestado médico reconhecido pela UBAS.Prova de Recuperação: a combinar.
2. semestre 2017 16 / 22
Critério de Avaliação
SejamP1: Prova 1;P2: Prova 2.NE: Nota de exercícios (que serão propostos ao longo do semestre)
A média do semestre MS será calculada como
MS =4 P1 + 4 P2 + 2 NE
10
Prova Substitutiva: somente com justificativa oficial, por exemploatestado médico reconhecido pela UBAS.Prova de Recuperação: a combinar.
2. semestre 2017 16 / 22
Datas importantes
Datas importantes25/09 - Prova 127/11 - Prova 2
Prova Substitutiva: 04/12/16(somente para quem perder uma das provas, com justificativaoficial).Prova de Recuperação: a combinar.
2. semestre 2017 17 / 22
Horários
Aulas: Segundas-feiras das 10h às 12h (sala 4-001) equartas-feiras das 10h às 12h (sala 5-104).Atendimento docente: Mediante agendamento por [email protected]. Mencionar o código da disciplina no assuntoSME0822.Material de apoio: Tidia Aprendizado eletrônico 4.0http://ae4.tidia-ae.usp.br/.
2. semestre 2017 18 / 22
Apoio computacional
2. semestre 2017 19 / 22
Algumas regras
Os alunos devem desligar seus telefones celulares durante a aula
Não é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticasAo enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/
2. semestre 2017 20 / 22
Algumas regras
Os alunos devem desligar seus telefones celulares durante a aulaNão é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticas
Ao enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/
2. semestre 2017 20 / 22
Algumas regras
Os alunos devem desligar seus telefones celulares durante a aulaNão é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticasAo enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822
Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/
2. semestre 2017 20 / 22
Algumas regras
Os alunos devem desligar seus telefones celulares durante a aulaNão é permitido o uso de notebook durante as aulas, exceto empossíveis aulas práticasAo enviar e-mail para a docente, identificar o código da disciplinano assunto SME0822Eventuais dúvidas, consultar Normas da USPhttp://www.usp.br/leginf/
2. semestre 2017 20 / 22
Algumas regras - Sobre provas
Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a prova
Será permitido o uso de calculadora própriaFraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar
2. semestre 2017 21 / 22
Algumas regras - Sobre provas
Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a provaSerá permitido o uso de calculadora própria
Fraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar
2. semestre 2017 21 / 22
Algumas regras - Sobre provas
Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a provaSerá permitido o uso de calculadora própriaFraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)
Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar
2. semestre 2017 21 / 22
Algumas regras - Sobre provas
Será permitido usar 1 folha A4 com anotações próprias, que seráentregue junto com a provaSerá permitido o uso de calculadora própriaFraude em prova (cola, whatsapp, etc) implicará a reprovaçãodireta do(s) envolvido(s)Falsidade ideológica na realização da prova (ou assinatura depresença) implicará abertura de processo disciplinar
2. semestre 2017 21 / 22
Importante: E-mail
E-mail é um canal oficial de comunicação da docente com osalunos.
Checar e-mail cadastrado no Janus regularmente (pelo menosuma vez ao dia).Ao enviar e-mail para a docente, identificar o código da disciplinano assunto EST506.É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.
2. semestre 2017 22 / 22
Importante: E-mail
E-mail é um canal oficial de comunicação da docente com osalunos.Checar e-mail cadastrado no Janus regularmente (pelo menosuma vez ao dia).
Ao enviar e-mail para a docente, identificar o código da disciplinano assunto EST506.É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.
2. semestre 2017 22 / 22
Importante: E-mail
E-mail é um canal oficial de comunicação da docente com osalunos.Checar e-mail cadastrado no Janus regularmente (pelo menosuma vez ao dia).Ao enviar e-mail para a docente, identificar o código da disciplinano assunto EST506.
É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.
2. semestre 2017 22 / 22
Importante: E-mail
E-mail é um canal oficial de comunicação da docente com osalunos.Checar e-mail cadastrado no Janus regularmente (pelo menosuma vez ao dia).Ao enviar e-mail para a docente, identificar o código da disciplinano assunto EST506.É importante como forma de documentar ocorrências. Porexemplo: envio de listas, ausências por problemas de saúde,avisos sobre listas de exercícios, aulas.
2. semestre 2017 22 / 22