sábado, 17 de março de 2018

Qual o melhor modelo misto para lidar com autocorrelação espacial?


Muitas vezes quando alguém está analisando dados distribuídos em subparcelas contíguas dentro de um bloco amostral ou transecção, um dos principais vieses a ser considerado é a pseudorepetição espacial. Neste caso, você precisa de um tipo de modelo chamado modelo misto que leva em consideração o viés de você possuir dados distribuídos em pseudoréplicas (ex: subparcelas). Muitos pesquisadores utilizam o GLMM (Generalized linear mixed models) na expectativa de conduzir uma análise estatística mais confiável. No entanto, um ponto importante que é discorrido por Dormann et al. (2007) é que o GLMM não necessariamente corrige a autocorrelação espacial completamente, resolvendo assim a pseudorepetição.

Um tipo de modelo de regressão mais eficiente que o GLMM neste aspecto é o LME (Linear mixed effects) do pacote “nlme”, o qual embasou primariamente o que veio a ser desenvolvido para o GLMM no pacote “lme4”. O LME possui uma eficiente estatística para corrigir autocorrelações espaço/temporais de forma geral que ainda é pouco implementada no pacote "lme4" e por conseguinte, no GLMM. A título de curiosidade, o link abaixo fornece uma comparação entre os pacotes "nlme" e "lme4", mostrando quais suas principais implementações e limitações em LME e GLMM, respectivamente.

http://glmm.wikidot.com/pkg-comparison

Exemplo de um modelo LME sem a estrutura de correlação (CorExp):

Exemplo de modelo nulo e "output" de LME conduzido com uma estrutura de correlação inclusa (CorExp):

Fonte: https://stats.idre.ucla.edu/r/faq/how-do-i-fit-a-variogram-model-to-my-spatial-data-in-r-using-regression-commands/

Uma forma interessante de aumentar a segurança e robustez estatística ainda mais utilizando o LME (selecionado como método base a "Maxmium Likelihood") é fazendo um análise prévia do modelo desejado através de LM (Linear Models) para verificar se há significativa autocorrelação espacial. Esta verificação se faz inserindo no modelo de LM no teste de Moran's I do pacot "lctools". Para isso, no seu arquivo de dados importado para o R, as parcelas devem ter discriminadas duas colunas X e Y relativa às coordenadas UTM obtidas a partir das suas coordenadas geográficas originais. Essas coordenadas é que permitirão que o LM inserido no teste de Moran's I aponte o nível de autocorrelação espacial no seu modelo.

Se o nível de autocorrelação for significativo (p<0.05) você pode inserir na sintaxe do seu LME a função "corExp", por exemplo. Isto irá aumentar e inserir um fator de correção no LME, garantindo que você obtenha relações com p-valores confiáveis e robustos. 


Links e exemplos relacionados:




Referências:

F DORMANN, Carsten et al. Methods to account for spatial autocorrelation in the analysis of species distributional data: a review. Ecography, v. 30, n. 5, p. 609-628, 2007.

Nenhum comentário:

Postar um comentário