sábado, 7 de abril de 2018

Biodiversity Analysis in R: tutoriais para análises em biodiversidade.


Para iniciar nossa seção de recomendações destinada à sugestão de livros, artigos relacionados à estatística, outras páginas sobre este tópico, nós sugerimos o acesso à página do renomado pesquisador Steven Kembel da University of Quebec at Montreal (UQAM). Além de ser o desenvolvedor do pacote "picante", de amplo uso em análises filogenéticas de comunidades, ele fornece neste "workshop" do link abaixo uma ampla de gama de análises relativas a biodiversidade, indo desde análises em ecologia funcional propriamente ditas, passando por multivariadas até análises filogenéticas.
Este "workshop" é bem completo, oferecendo exemplos práticos com script disponível para ser testado e adaptado para outras realidades de estudo.



segunda-feira, 2 de abril de 2018

ANOSIM (Análise de Similaridade): como obter p-valores entre pares de comunidades?

Algumas pessoas têm questionado sobre os resultados de Análise de Similaridade (ANOSIM) fornecidos através do pacote "vegan" na plataforma do R. Os resultados providos apenas mostram o R global, relativo à estatística R da análise, e o p-valor, evidenciando unicamente se há diferença florística entre as comunidades, mas não mostram os p-valores entre todos os pares das comunidades em questão.
Exemplo de output da ANOSIM do "vegan":


Mas então, qual a outra a opção para verificar entre quais pares de comunidades as diferenças florísticas são significativas? 
A opção mais prática e de fácil acesso e uso é conduzir uma ANOSIM-One Way no software Past. O link abaixo mostra rapidamente e passo a passo como fazer isso no Past.

Você irá inserir no Past a mesma matriz de espécies utilizada para a análise no "vegan". Na barra lateral esquerda cinza do Past você deverá inserir os nomes das comunidades correspondentes as espécies nas colunas na quantidade correspondente para cada comunidade. Ou seja, se as 50 primeiras linhas correspondem à comunidade A, então marque com alguma cor (ex: vermelho, azul...) essas 50 linhas identificando tal comunidade (ex: Comun.A). O Past não roda a análise se as linhas pertencentes a cada comunidade não forem discriminadas em cores distintas.  Após inserir os dados da matriz de espécies e discriminar suas comunidades nas linhas como mencionado, basta selecionar tudo e ir em "Multivar" -> "Anosim-One Way".

Exemplo de output de ANOSIM-One Way no Past, mostrando os p-valores de comparações aos pares entre comunidades:


Outra coisa fundamental a se considerar antes de rodar sua ANOSIM é a distância de dissimilaridade que você escolhe. É comumente aceito que para matrizes de espécies baseadas em presença e ausência usa-se distância de Jaccard e para matrizes baseadas em abundância usa-se Bray-Curtis.


Links relacionados: 


Exemplo de execução do ANOSIM no "vegan": https://rdrr.io/rforge/vegan/man/anosim.html

Diferenças e afinidades entre Jaccard e Bray-Curtis:


Manual do Past em Português:

Manual original em Inglês:

sábado, 24 de março de 2018

BIOVEG1: script para análises estatísticas em Biologia Vegetal.



Está disponível para download gratuito o script “BIOVEG-1” para análises estatísticas no software R, aplicadas à Biologia Vegetal em geral com foco especial em Ecologia. O material foi elaborado pelo Dr. Écio Souza Diniz, titulado como doutor em Botânica pela Universidade Federal de Viçosa, O material foi desenvolvido em parceria com o Dr. Jan Thiele (Technical University of Munich e Universirty of Münster, Alemanha), que fez a revisão do conteúdo e ajustes finais.
O objetivo desse script e seu conteúdo é fornecer, por acesso livre, aos estudantes dos programas de Pós-Gradução em Botânica, Ecologia e Biodiversidade e conservação uma espécie de protocolo de vários tipos diferentes de análises estatísticas, que vão desde testes básicos e simples envolvendo uma amostra até abordagens mais complexas como seleção de modelos de regressões, modelos distintos de regressão para aplicações específicas, análises de similaridade e multivariada. Cada análise é baseada em exemplos que podem ser testados como um exercício nos bancos de dados testes fornecidos pelos autores do script, além de serem definidas quanto às suas definições, aplicações, instruções de uso, limitações ou restrições e cuidados requeridos, quando necessário.
Também são fornecidas dicas para a solução de alguns problemas comuns que ocorrem na plataforma do R, mas nem sempre são tão óbvios a todos, especialmente usuários recentes do referido software.  O texto está escrito em inglês devido a duas circunstâncias: a) a internacionalização da ciência brasileira nas áreas de Biologia vegetal e b) o acesso claro e compreensível por pessoas do exterior, visto especialmente a forte parceria consolidada por vários programas de pós-graduação nas áreas da Botânica e Ecologia no Brasil com pesquisadores estrangeiros instituições internacionais.

Para o download do material (script + bancos de dados testes) acesse o link abaixo:

sábado, 17 de março de 2018

Qual o melhor modelo misto para lidar com autocorrelação espacial?


Muitas vezes quando alguém está analisando dados distribuídos em subparcelas contíguas dentro de um bloco amostral ou transecção, um dos principais vieses a ser considerado é a pseudorepetição espacial. Neste caso, você precisa de um tipo de modelo chamado modelo misto que leva em consideração o viés de você possuir dados distribuídos em pseudoréplicas (ex: subparcelas). Muitos pesquisadores utilizam o GLMM (Generalized linear mixed models) na expectativa de conduzir uma análise estatística mais confiável. No entanto, um ponto importante que é discorrido por Dormann et al. (2007) é que o GLMM não necessariamente corrige a autocorrelação espacial completamente, resolvendo assim a pseudorepetição.

Um tipo de modelo de regressão mais eficiente que o GLMM neste aspecto é o LME (Linear mixed effects) do pacote “nlme”, o qual embasou primariamente o que veio a ser desenvolvido para o GLMM no pacote “lme4”. O LME possui uma eficiente estatística para corrigir autocorrelações espaço/temporais de forma geral que ainda é pouco implementada no pacote "lme4" e por conseguinte, no GLMM. A título de curiosidade, o link abaixo fornece uma comparação entre os pacotes "nlme" e "lme4", mostrando quais suas principais implementações e limitações em LME e GLMM, respectivamente.

http://glmm.wikidot.com/pkg-comparison

Exemplo de um modelo LME sem a estrutura de correlação (CorExp):

Exemplo de modelo nulo e "output" de LME conduzido com uma estrutura de correlação inclusa (CorExp):

Fonte: https://stats.idre.ucla.edu/r/faq/how-do-i-fit-a-variogram-model-to-my-spatial-data-in-r-using-regression-commands/

Uma forma interessante de aumentar a segurança e robustez estatística ainda mais utilizando o LME (selecionado como método base a "Maxmium Likelihood") é fazendo um análise prévia do modelo desejado através de LM (Linear Models) para verificar se há significativa autocorrelação espacial. Esta verificação se faz inserindo no modelo de LM no teste de Moran's I do pacot "lctools". Para isso, no seu arquivo de dados importado para o R, as parcelas devem ter discriminadas duas colunas X e Y relativa às coordenadas UTM obtidas a partir das suas coordenadas geográficas originais. Essas coordenadas é que permitirão que o LM inserido no teste de Moran's I aponte o nível de autocorrelação espacial no seu modelo.

Se o nível de autocorrelação for significativo (p<0.05) você pode inserir na sintaxe do seu LME a função "corExp", por exemplo. Isto irá aumentar e inserir um fator de correção no LME, garantindo que você obtenha relações com p-valores confiáveis e robustos. 


Links e exemplos relacionados:




Referências:

F DORMANN, Carsten et al. Methods to account for spatial autocorrelation in the analysis of species distributional data: a review. Ecography, v. 30, n. 5, p. 609-628, 2007.

sexta-feira, 16 de março de 2018

EQUIPE ESTATVEG

Écio Souza Diniz (ph.D in Botany)


Curriculum: http://lattes.cnpq.br/4486399846318757
Research Gate: https://www.researchgate.net/profile/Ecio_Souza_Diniz

email: eciodiniz@gmail.com




Jan Thiele (PhD in Natural Sciences)


Technical University of Munich (Alemanha)
Universidade de Münster (Alemanha)
Research Gate: https://www.researchgate.net/profile/Jan_Thiele

email: Jan.Thiele@uni-muenster.de