Mais um texto sobre réplicas e pseudoréplicas

Uma versão deste post em áudio está disponível clicando aqui.

Digamos que você decidiu estudar como as características funcionais de unicórnios são afetadas por características do ambiente e como elas se relacionam entre si. Mas aí você percebeu que a sua área de estudo é muito pequena pra estudar unicórnios, e aí você decidiu estudar fadas. De modo que agora você está estudando como as características das fadas encontradas em uma área se relacionam com o ambiente e entre si.

E é claro que antes de planejar seu estudo você foi atrâs de ler sobre desenho amostral, réplicas e pseudoréplicas… Como assim você não leu sobre isso?! Ah, uffa. Levei um susto aqui. Bom, caso por algum motivo da vida você não tenha lido sobre isso, no final deste texto tem referências para artigos que você precisa ler. Precisa sim. Sim. Precisa. Mesmo. Precisa ler, mesmo. Começando pelo artigo do Hurlbert (aquele que fala de intrusões demoníacas), mas não parando por ele. Bom, se quiser ler esse post antes, tudo bem, mas leia os artigos ein!

Em linhas gerais, o conceito de réplicas e pseudoréplicas diz respeito à independência de suas unidades amostrais e ao uso da estatística para lidar com elas. Hurlbert (1984) define pseudoreplicação como “Uso de estatística inferencial para testar efeitos de tratamentos com dados de experimentos onde os tratamentos não são replicados (mesmo que as amostras sejam) ou as réplicas não são estatisticamente independentes.” É mais fácil visualizar isso em experimentos manipulativos. Por exemplo, antes de trabalhar com fadas decidimos avaliar como a adição de pó mágico (gentilmente fornecido pelo professor Slughorn, afinal, ninguém teve coragem de pedir ao Snape) afeta o crescimento de mandrágoras. Para isso, colocamos em um pote de tamanho apropriado cinco mandrágoras sem adição de pó mágico e em um outro pote, do mesmo tamanho, cinco mandrágoras com adição do pó. Temos réplicas de mandrágoras, sim; mas não temos réplicas dos tratamentos – as cinco mandrágoras que estão no mesmo pote não são independentes entre si. Pode ser que, sei lá, um pote esteja furado e perca água mais rapidamente. Qualquer variação que exista entre os potes pode ser um fator de confusão que vai atrapalhar a interpretação do nosso experimento. Também podemos dizer que neste caso, nossa unidade amostral não é cada mandrágora, mas sim cada pote, pois os tratamentos são aplicados nos potes, e não nas mandrágoras individuais. (Para ler mais sobre fatores de confusão, você pode consultar essa carta aberta ao diretor de Hogwarts).

De modo que para termos réplicas dos tratamentos, idealmente cada mandrágora seria plantadas em um pote diferente e os tratamentos (com e sem pó mágico) seriam aleatoriezados entre as mandrágoras. Ou talvez intercalados, para evitar que, aleatoriamente, todas as réplicas de um tratamento fiquem agrupados; vejam este post (em inglês) sobre o assunto.

Não basta replicar – é preciso que as réplicas sejam independentes e que possíveis fatores de confusão sejam evitados. Isso não quer dizer que temos que quantificar e modelar os efeitos de todas as variáveis que poderiam possivelmente afetar os resultados do nosso experimento; isso não seria possível nem se Snape nos oferecesse todas as poções e ingredientes. E isso também não significa que as nossas réplicas precisam ser todas idênticas – além de não ser possível, isso pode reduzir o grau ao qual poderemos generalizar nossos resultados. O que importa é que essas diferentes coisas que podem afetar o nosso estudo estejam distribuídas aleatoriamente entre os tratamentos.

Por exemplo… Digamos que o crescimento de mandrágoras é afetado pelo tamanho do pote onde elas estão crescendo (e talvez seja mesmo! São mandrágoras, afinal), mas não temos dez potes do mesmo tamanho. Digamos que temos cinco potes pequenos e cinco potes maiores. Se adicionarmos pó mágico aos potes pequenos mas não aos potes grandes, os efeitos do tamanho do pote e do pó vão se misturar. Sendo assim, precisamos aleatoriezar e/ou intercalar. Por exemplo, podemos colocar pó mágico em três potes pequenos e dois grandes. Isso vai nos permitir (ao menos parcialmente) separar os efeitos do tamanho do pote dos efeitos do pó.

Bom, agora que falamos um pouco sobre pseudoréplicas e mandrágoras em potes, vamos voltar ao nosso campo com fadas. Você sabe que as fadas que você vai estudar gostam de campos floridos; e, por sorte, perto do LESMA (Laboratório de Ecologia Supernatural e Magia Aplicada), existem cinco campos, de tamanhos diferentes, repletos de flores! Você também sabe que quando uma fada encontra uma flor nesse campo, ela fica por muito tempo perto dessa flor, então para fins de desenho amostral você pode tratar as fadas como organismos sésseis. Você chega então ao seguinte desenho amostral: em cada um dos cinco campos floridos, você vai colocar aleatoriamente seis parcelas de um tamanho apropriado. E dentro de cada uma dessas parcelas você vai amostrar todas as fadas, medindo algumas características funcionais delas (tamanho e transparência da asa, cor e comprimento do cabelo, comprimento e peso) (seguindo todas as diretrizes dos Comitês de Ética para Pesquisa com Seres Humanos, Pesquisa com Seres Não-Humanos e Pesquisa com Seres Mágicos, Mitológicos e Sobrenaturais, e mediante de assinatura prévia de um Termo de Consentimento Livre e Esclarecido pelas fadas sendo estudadas).

figsPseudoreplicas

Representação gráfico do desenho amostral. O grande quadrado cinza é a área de estudo, as figuras amebóides amarelas são os campos floridos, os quadrados brancos são suas parcelas e os coraçõezinhos roxos são as fadas amostradas em cada uma das suas parcelas. Em uma mancha só temos cinco parcelas porque as suas anotações de campo da última parcela foram comidas por um troll.

Neste estudo, qual é a unidade amostral básica? É cada fada, cada parcela, ou cada campo florido? O que você acha?

Se você respondeu “Depende” (e tendo em vista que grande parte das pessoas que lêem este blog fez biologia, é provável que você tenha respondido isso), você acertou! A grande questão é, depende do que?

No caso, depende da pergunta do seu estudo e das variáveis explanatórias usadas. Vejam bem, eu falei que serão medidos caracteres funcionais das fadas… Mas não falei o que será feito com esses caracteres depois e nem com que variáveis ambientais eles serão relacionados.

Por exemplo, você pode querer saber como o tamanho do campo florido afeta a diversidade funcional de fadas, por exemplo, porque campos floridos menores selecionariam fadas de asas menores, enquanto nos campos maiores haveria tanto fadas de asas pequenas (especializadas em aproveitar pequenas manchas de flores) quanto fadas de asas grandes (especializadas em voar por aí). Neste caso, a sua unidade amostral é o campo florido, pois o tamanho do campo florido vai afetar todas as fadas que vivem lá dentro. Você poderia calcular um único valor de diversidade funcional por campo e relacionar ele com o tamanho da área.

Mas talvez seu interesse esteja em uma escala menor – por exemplo, talvez em algumas parcelas haja mais flores amarelas e em outras mais flores azuis. Ou talvez algumas parcelas tenham sido pisoteadas por um troll e você quer saber como esse pisoteio afeta a diversidade funcional de fadas, na escala de parcela. Neste caso, não dá pra calcular um único valor pra cada campo florido, pois os valores da sua variável explanatória – se houve pisoteio ou não ou a cor das flores – variam entre as parcelas do mesmo campo. De modo que a sua unidade amostral agora é a parcela, e não o campo! Bom, podemos argumentar que as parcelas do mesmo campo não são independentes entre si; neste caso, usaríamos, por exemplo, ANOVA incluindo parcela como bloco, ou poderíamos usar modelos mistos. Mas isso já diz mais respeito à análise estatística e não tanto ao desenho amostral em si.

E talvez o seu interesse esteja em uma escala mais fina ainda – talvez você queira relacionar o tamanho das asas das fadas com o seu tamanho total. Neste caso, a sua unidade amostral vai ser cada fada. Os problemas de falta de independência podem ser maiores (vai que fadas com asas do mesmo tamanho formam panelinhas e forrageiam todas juntas), então talvez você precise escolher aleatoriamente uma fada por parcela ou senão incluir a parcela como fator aleatório, numa abordagem de modelos mistos. Mas a sua unidade amostral básica continua sendo a fada.

De modo que o que é réplica ou pseudoréplica depende basicamente da sua pergunta de estudo. O que devemos avaliar é se as suas variáveis explanatórias variam aleatoriamente entre as suas unidades amostrais, se não há variáveis de confusão que podem atrapalhar seu estudo e se suas unidades amostrais estão suficientemente bem distribuídas para serem consideradas independentes no que diz respeito à pergunta do seu estudo. Por exemplo, se todas as flores na mancha maior forem amarelas e todas as flores na mancha menor forem azuis, não teremos como separar o efeito da cor da flor do efeito do tamanho da mancha. Similarmente, se você sabe que fadas voam cinco metros em um dia, é bom que suas parcelas sejam mais distantes que isso entre si, para garantir certa independência entre elas. De qualquer modo, garantir independência total e absoluta entre as unidades amostrais talvez não seja possível – afinal, não importa quão distantes estejam suas unidades amostrais entre si, elas estarão no mesmo planeta. O que precisamos nos preocupar é se elas são indepentes entre si no que diz respeito à pergunta do estudo e se não há variáveis de confusão que possam se misturar com nossas variáveis explanatórias.

Artigos científicos sobre pseudoreplicação que você deveria ler (nessa ordem):

  • Hurlbert SH 1984 Pseudoreplication and the design of ecological field experiments. Ecological Monographs 54: 187-211.
  • Oksanen L 2001 Logic of experiments in ecology: is pseudoreplication a pseudoissue? Oikos 94: 27-38
  • Davies GM & Gray A 2015 Don’t let spurious accusations of pseudoreplication limit our ability to learn from natural experiments (and other messy kinds of ecological monitoring). Ecology and Evolution 5: 5295-5304
  • Colegrave N & Ruxton GD 2018 Using biological insight and pragmatism when thinking about pseudoreplication. Trends in Ecology and Evolution 33: 28-35.

2 pensamentos sobre “Mais um texto sobre réplicas e pseudoréplicas

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s