sábado, 24 de março de 2018

BIOVEG1: script para análises estatísticas em Biologia Vegetal.



Está disponível para download gratuito o script “BIOVEG-1” para análises estatísticas no software R, aplicadas à Biologia Vegetal em geral com foco especial em Ecologia. O material foi elaborado pelo Dr. Écio Souza Diniz, titulado como doutor em Botânica pela Universidade Federal de Viçosa, O material foi desenvolvido em parceria com o Dr. Jan Thiele (Technical University of Munich e Universirty of Münster, Alemanha), que fez a revisão do conteúdo e ajustes finais.
O objetivo desse script e seu conteúdo é fornecer, por acesso livre, aos estudantes dos programas de Pós-Gradução em Botânica, Ecologia e Biodiversidade e conservação uma espécie de protocolo de vários tipos diferentes de análises estatísticas, que vão desde testes básicos e simples envolvendo uma amostra até abordagens mais complexas como seleção de modelos de regressões, modelos distintos de regressão para aplicações específicas, análises de similaridade e multivariada. Cada análise é baseada em exemplos que podem ser testados como um exercício nos bancos de dados testes fornecidos pelos autores do script, além de serem definidas quanto às suas definições, aplicações, instruções de uso, limitações ou restrições e cuidados requeridos, quando necessário.
Também são fornecidas dicas para a solução de alguns problemas comuns que ocorrem na plataforma do R, mas nem sempre são tão óbvios a todos, especialmente usuários recentes do referido software.  O texto está escrito em inglês devido a duas circunstâncias: a) a internacionalização da ciência brasileira nas áreas de Biologia vegetal e b) o acesso claro e compreensível por pessoas do exterior, visto especialmente a forte parceria consolidada por vários programas de pós-graduação nas áreas da Botânica e Ecologia no Brasil com pesquisadores estrangeiros instituições internacionais.

Para o download do material (script + bancos de dados testes) acesse o link abaixo:

sábado, 17 de março de 2018

Qual o melhor modelo misto para lidar com autocorrelação espacial?


Muitas vezes quando alguém está analisando dados distribuídos em subparcelas contíguas dentro de um bloco amostral ou transecção, um dos principais vieses a ser considerado é a pseudorepetição espacial. Neste caso, você precisa de um tipo de modelo chamado modelo misto que leva em consideração o viés de você possuir dados distribuídos em pseudoréplicas (ex: subparcelas). Muitos pesquisadores utilizam o GLMM (Generalized linear mixed models) na expectativa de conduzir uma análise estatística mais confiável. No entanto, um ponto importante que é discorrido por Dormann et al. (2007) é que o GLMM não necessariamente corrige a autocorrelação espacial completamente, resolvendo assim a pseudorepetição.

Um tipo de modelo de regressão mais eficiente que o GLMM neste aspecto é o LME (Linear mixed effects) do pacote “nlme”, o qual embasou primariamente o que veio a ser desenvolvido para o GLMM no pacote “lme4”. O LME possui uma eficiente estatística para corrigir autocorrelações espaço/temporais de forma geral que ainda é pouco implementada no pacote "lme4" e por conseguinte, no GLMM. A título de curiosidade, o link abaixo fornece uma comparação entre os pacotes "nlme" e "lme4", mostrando quais suas principais implementações e limitações em LME e GLMM, respectivamente.

http://glmm.wikidot.com/pkg-comparison

Exemplo de um modelo LME sem a estrutura de correlação (CorExp):

Exemplo de modelo nulo e "output" de LME conduzido com uma estrutura de correlação inclusa (CorExp):

Fonte: https://stats.idre.ucla.edu/r/faq/how-do-i-fit-a-variogram-model-to-my-spatial-data-in-r-using-regression-commands/

Uma forma interessante de aumentar a segurança e robustez estatística ainda mais utilizando o LME (selecionado como método base a "Maxmium Likelihood") é fazendo um análise prévia do modelo desejado através de LM (Linear Models) para verificar se há significativa autocorrelação espacial. Esta verificação se faz inserindo no modelo de LM no teste de Moran's I do pacot "lctools". Para isso, no seu arquivo de dados importado para o R, as parcelas devem ter discriminadas duas colunas X e Y relativa às coordenadas UTM obtidas a partir das suas coordenadas geográficas originais. Essas coordenadas é que permitirão que o LM inserido no teste de Moran's I aponte o nível de autocorrelação espacial no seu modelo.

Se o nível de autocorrelação for significativo (p<0.05) você pode inserir na sintaxe do seu LME a função "corExp", por exemplo. Isto irá aumentar e inserir um fator de correção no LME, garantindo que você obtenha relações com p-valores confiáveis e robustos. 


Links e exemplos relacionados:




Referências:

F DORMANN, Carsten et al. Methods to account for spatial autocorrelation in the analysis of species distributional data: a review. Ecography, v. 30, n. 5, p. 609-628, 2007.

sexta-feira, 16 de março de 2018

EQUIPE ESTATVEG

Écio Souza Diniz (ph.D in Botany)


Curriculum: http://lattes.cnpq.br/4486399846318757
Research Gate: https://www.researchgate.net/profile/Ecio_Souza_Diniz

email: eciodiniz@gmail.com




Jan Thiele (PhD in Natural Sciences)


Technical University of Munich (Alemanha)
Universidade de Münster (Alemanha)
Research Gate: https://www.researchgate.net/profile/Jan_Thiele

email: Jan.Thiele@uni-muenster.de