“A interpretação da evidência, usualmente sendo contexto-específica, é deixada para o investigador: ciência se trata de evidência, não de dicotomias ou decisões acentuadas.”1
Burnham & Anderson 2014
Na minha experiência aprendendo e ensinando estatística, o foco tem sido em grande parte em testes de significância de hipótese nula (null hypothesis significance testing — NHST). E não tenho nada contra — eu gosto de testes de hipóteses nulas, eu gosto de p-valores (sim, eu realmente gosto de p-valores) — contanto que sejam bem usados e evitando as falácias a eles associadas! – e acho que aprender tais testes é um bom início. Além disso, muitas perguntas científicas realmente podem ser respondidas por testes de hipótese nula. Existe um efeito de borda detectável ou não sobre a fauna de formigas em um manguezal? Existe uma diferença na estrutura da vegetação entre áreas de cerrado contaminadas e não contaminadas por metais pesados? Existe uma relação entre a pluviosidade em um mês e os casos de leptospirose em uma comunidade na Bahia? Testes de hipótese nula conseguem responder tais perguntas e, quando usados corretamente e combinados com estimativas de tamanhos de efeito e medidas de qualidade de ajuste, podem fornecer informações realmente úteis.
Mas em outras situações — em muitas outras situações — tais análises já não dão conta do recado. O efeito de borda sobre as formigas é linear ou não linear? Os metais pesados afetam a vegetação linearmente ou existe um limiar a partir do qual o efeito passa a ser muito mais intenso? A incidência de leptospirose é mais afetada por pluviosidade, temperatura, ou se naquele mês teve ou não visitação pelo Centro de Controle de Zoonoses? Bom, até daria pra pensar em testes de hipótese nula para fazer tais inferências, mas talvez seja melhor usar uma abordagem desenvolvida especificamente para lidar com hipóteses — ou modelos — contrastantes e concorrentes: a Seleção de Modelos.
E na minha experiência usando análises estatísticas e ajudando pessoas a usá-las, seleção de modelos é ao menos tão comum quanto testes de hipótese nula em diversas situações. Então sim, existe um descompasso entre o que utilizamos e o que é ensinado — inclusive o que é ensinado a nível de doutorado!2
Bora então ver um pouquinho sobre como podemos fazer uma seleção de modelos e interpretar seus resultados. Eu já escrevi um pouco sobre o que é um modelo linear, como interpretar os resultados de um modelo linear generalizado e como avaliar qualidade de ajuste e comparar entre diferentes modelos. O post de hoje pode ser visto como uma complementação deste último post, explorando alguns aspectos mais introdutórios.
Continuar lendo