Wednesday, February 28, 2018

CURA PARA A ANSIEDADE ESTATÍSTICA? Roteiro para a análise estatística exploratória

Você caiu na asneira de entrar no mestrado e agora não sabe por onde começar a análise dos seus dados?

O diagnóstico é ansiedade estatística.

Aqui pode estar a cura para o seu mal. Desenvolva uma sistemática de análise exploratória. A análise exploratória é a chave do paraíso estatístico. Acredite, isso existe.






ANTES DE TESTAR HIPÓTESES MULTIVARIADAS É PRECISO CONHECER OS DADOS

Conhece os teus dados como a ti mesmo! 



LISTAR E ANALISAR LOGICAMENTE TODAS AS VARIÁVEIS QUE ENTRARÃO NO ESTUDO

É importante ter sempre presente quais são as variáveis disponíveis para análise.

Estabelecer o possível status lógico das variáveis: VD, VI e Confundidoras. Pode ser necessário repetir isso diversas vezes ao longo do prodesso, dependendo da hipótese que for testada. Uma variável pode ser VD em uma análise e VI em outra. Mas é preciso sempre conservar em mente o papel que a variável está desmepenhando na análise.

A análise do papel de cada variável se chama operacionalização das variáveis ou design do estudo. 



FAZER TODAS AS ANÁLISES PARA CADA UMA DAS VARIÁVEIS

Não deixar nenhuma variável ou possível combinação de variáveis sem análise.

Quando forem feitas análises bivariadas, explorar todas as combinações possíveis, usando uma lógica de análise combinatória.

O resultado dessas análises pode, eventualmente, ser irrelevante. Mas ele precisa estar prontamente acessível caso venha à mente uma nova possibilidade de análise, um novo ângulo de observação dos dados. 



COMEÇAR EXPLORANDO A DISTRIBUIÇÃO UNIVARIADA DE CADA UMA DAS VARIÁVEIS

Fazer histogramas e boxplots de cada uma das variáveis.

Se a distribuição for semelhante à normal fazer algum teste estatístico para comprovar isso (Kolmogorov-Smirnoff? - Acho que tem coisa melhor. Tem que ver).

Os boxplots são bons para identificar outliers, mediana e quartis



SOMENTE A SEGUIR FAZER AS ANÁLISES BIVARIADAS

As análises bivariadas obedecem a uma lógica dupla: de associação (correlações) e de dissociação (diferenças entre grupos).



ANÁLISES BIVARIADAS DE ASSOCIAÇÃO

Antes de estimar correlações é importante analisar as distribuições bivariadas através de gráficos de dispersão (scatterplots).

Os gráficos de dispersão são importante porque a associação entre duas variáveis pode, p. ex., ser quadrática e não retilinear. Nesses casos a correlação de Pearson não será significante.

As relações quadráticas (p. Ex., curva em U ou U invertido) são muito freqüentes e interessantes, indicando possíveis interações.

Colocar no gráfico de dispersão no eixo X a variável logicamente independente e no eixo Y a dependente. 

Se os gráficos de dispersão sugerirem associações retilineares, fazer uma tabelão de correlações de Pearson de todas as variáveis com todas as variáveis. 

Dependendo do resultado das análises bivariadas de dissociação pode ser importante repetir essas análises de associação separadamente para cada grupo formado a partir das diferenças encontradas nas análises de dissociação.

Quado aparecerem correlações sugestivas, explorá-as através de regressão simples. 



ANÁLISES BIVARIADAS DE DISSOCIAÇÃO

Explorar possíveis diferenças entre grupos usando boxplots. Existe um tipo de boxplot em que todos os indivíduos são representados como pontos, da mesma forma que em um gráfico de dispersão. Não me lembro o nome. Mas além dos pontos, aparecem também a mediana e os quartis.

Explorar sistematica e combinatorialmente todas as relações possíveis entre variáveis. Uma dada variável deve entrar ora como VI (eixo X), ora como VD (eixo Y).

Quando os gráficos sugerirem diferenças, analisar a significântica estatística através de testes t (dois niveis nas variáveis) ou ANOVAS (quando houver mais de dois níveis nas variáveis). 

Sempre registrar o coeficiente d para os testes t e o eta ao quadrado para as ANOVAs. Se o professor não perguntar, o revisor vai querer saber sobre a magnitude do efeito.



COMEÇAR AS ANÁLISES PELA CARACTERIZAÇÃO SÓCIO-DEMOGRÁFICA DA AMOSTRA

Primeiro aplicar os passos descritos anterioremente para sexo, idade, série, tipo de escola, IDEB, Critério Brasil etc. Somente depois disso repetir a seqüência para as variáveis objeto do estudo. Sempre usar a lógica combinatorial. Nunca deixar nenhuma associação ou dissociação possível sem análise. 



AS ANÁLISES MULTIVARIADAS SÃO A ÚLTIMA ETAPA

Não fazer análises multivariadas sem conhecer muito bem os dados.  Dá eca. Acredite em mim.

As análises multivariadas iniciais consistem de ANOVA, ANCOVA  e regressão múltipla, dependendo de o objetivo ser verificar diferenças entre grupos ou associações entre variáveis.

Para construir os modelos é preciso saber operacionalizar as variáveis em VD, VI e Confundidoras. Isso só pode ser feito a partir de um profundo conhecimento dos próprios dados, da literatura e da formulação explícita de hipóteses de mediação e moderação.

Antes de realizar os testes estatísticos é importante analisar se os dados satisfazem os pressupostos para as análises pretendidas. 

Dependendo dos resultados dessas análises multivariadas pode-se ter um paper pronto ou precisar ir adiante com análises mais sofisticadas.


ORGANIZAR UM LOG COM TODAS SUAS ANÁLISES

Registre e organize o que você fez. Uma boa idéia é organizar tudo em uma apresentação de PowerPoint. É possível então acessar facilmente os resultados das análises preliminares, sempre que os mesmo forem necessários, mostrá-los para seu professor ou co-autores etc.

No comments:

Post a Comment