Digitando e conferindo dados

corrigindodados

Como podem ver acima, tais coisas acontecem. rs E às vezes um resultado que parece muito bonito e te deixa muito feliz por ter resultado de um erro de digitação.

Por mais que tomemos cuidado ao digitar dados, via de regra alguns errinhos acabam passando. Especialmente se temos alguns milhares de valores para digitar. Por exemplo, na minha iniciação científica eu medi o diâmetro e altura de 6446 caules de Miconia albicans* – e pra digitar tudo isso aí? Existem algumas formas de maximizar eficiência e minimizar erros ao digitar. Eu recomendaria, por exemplo, digitar aos poucos, preferencialmente assim que volta do campo. Deixar todos os dados para digitar no fim do trabalho envolve alguns riscos, como: – Não entendermos alguma anotação cujo significado teríamos lembrado digitando logo após a coleta; – Acontecer alguma coisa com os dados, que só estariam em uma cópia no seu caderno, e você perder todo ou parte do trabalho**; – Você cansar depois de duas horas digitando e começar a introduzir erros.

Além disso, eu recomendo fortemente fazer um curso online de digitação – o tempo gasto nisso vai reduzir o tempo gasto digitando depois! Usar bem o teclado numérico promove uma economia de tempo sensacional, e é mais difícil de errar. A sua tendinite também agradece, já que o pulso se movimenta bem menos quando usamos o teclado numérico. Eu recomendo os cursos do Good Typing.

E conheça sua ferramenta. No Microsoft Excel e no LibreOffice Calc, ao inserir valores em várias colunas é melhor usar a tecla Tab, e não a seta, para ir pra coluna seguinte. Fazendo assim, ao apertar a tecla Enter você vai automaticamente para a primeira coluna da linha seguinte (ou para a coluna na qual você começou a digitar). Do outro jeito, ao apertar Enter você vai para a última coluna na qual digitou e vai ter que voltar manualmente para a primeira – ou seja, algumas teclas a mais sendo apertadas, que, dependendo dos seus dados, podem sim significar uma redução na eficiência. Creio que quanto menos teclas precisamos apertar para navegar pela nossa planilha, mais nos focamos em digitar os dados corretamente e menos erros introduzimos.

E outra questão é que a planilha de campo é diferente da planilha onde os dados são inseridos (“planilha dos dados brutos”), que é diferente da planilha usada para as análises. A planilha de campo deve maximizar a eficiência de inserir os dados e transferir eles para o computador. A planilha onde os dados são inseridos deve maximizar a eficiência de inserção de dados e a facilidade de transformar eles em outros formatos para posterior análises, usando de preferência scripts automatizados. Leiam esse post do Brian McGill sobre como manejar seus dados. Finalmente, a planilha usada para análises é aquela que seu software de análise melhor entende e que melhor se adequa a cada pergunta específica. Eu costumo ter várias planilhas de análise – por exemplo, posso ter uma planilha com informações por indivíduo, informações resumidas por parcelas e informações resumidas por área de estudo, dependendo da escala na qual vou analisar os dados. O importante é saber passar de forma rápida, correta e indolor da planilha dos dados brutos para a planilha de análise.

Bom, tendo a planilha dos dados brutos pronta, podemos partir para os gráficos e as análise, certo? Errado! \o/ Por mais que tenhamos cuidado ao digitar os dados, alguns errinhos vão acabar passando, e é importante conferir estes errinhos. Afinal, nós queremos trabalhar com os nossos dados, e não com os nossos erros de digitação, né?

Pela minha experiência, existem alguns tipos de erros de digitação:

  • “Esqueci da vírgula” – Esse é o tipo via de regra mais fácil de ser detectado, pode ser encontrado fazendo um jitter plot ou ordenando os valores em ordem decrescente. Ao esquecer da vírgula, um 0.9 se transforma num 9 e um 3.2 se transforma em um 32. As minhas plantas não tinham 32 centímetros de diâmetro, então era bem fácil detectar isso.
  • “Gostei tanto desse indivíduo…” – São muitas as linhas que digitamos, e, dependendo do tamanho da planilha, pode ser difícil acompanhar. Tanto que eu prefiro usar cadernos pequenos onde o olhar se localiza mais facilmente. Acontece às vezes de digitarmos a mesma linha duas vezes. Tem o erro relacionado “Não gostei de você”, quando pulamos uma linha sem querer. Podemos encontrar o erro do primeiro tipo procurando por valores duplicados; o segundo tipo é mais difícil.
  • “Errei!” – Esse é o mais difícil de detectar, pois consiste em simplesmente apertar a tecla errada. Podemos digitar um 8 ao invés de um 9; ou um 0 ao invés de um 9; ou, no teclado numérico, 1 ao invés do 7, e assim por diante. Creio que aumenta à medida que passamos mais tempo digitando sem descanso. E não conheço nenhum jeito prático de detectar erros desse tipo.

O que fazer então? Creio que a única solução é conferir tudo depois de digitarmos! Pode ser por partes ou pode ser tudo de uma vez. Uma vez li um texto, que não consigo mais achar, que dizia que a única forma de fazer isso é imprimindo os dados digitados, colocando lado a lado com as planilha e conferindo valor por valor. E eu concordo! É muito difícil conferir tudo no computador. A tela é grande e é difícil prestar tanta atenção nos detalhes. Além disso, não conseguimos colocar as planilhas de campo do lado da tela. Então o que eu faço é imprimir a planilha de valores brutos (sim, são muitos valores, e gasta papel – mas o computador gasta energia!), sentar à mesa, colocar a planilha impressa lado a lado com as planilhas de campo, e conferir os valores digitados, um a um. Coloco uma marca em cada valor digitado corretamente e uma correção em cada erro. Tendo conferido tudo, volto ao computador e insiro as correções nos dados digitados, com muito cuidado para não inserir mais erros! O texto que li dizia que precisamos repetir o ciclo imprimir-conferir-corrigir até não encontrar mais erros, mas eu nunca fiz mais de uma correção… Acho que o gasto de papel e de tempo não compensa, mas talvez eu esteja sofrendo de excesso de confiança ao achar que uma única correção é suficiente.

Gasta tempo? Sim, gasta muito tempo. Mas, fazendo essa correção minuciosa, temos quase certeza de que estamos trabalhando com os dados reais, e não com os nossos erros de digitação.

E você, confere seus dados depois de digitados?

[Atualização] Com base em um comentário por email da Julia Oshima (valeu, Ju!), mais algumas sugestões:

  • Mantenha cópias digitais (fotos ou imagens escaneadas) das suas planilhas de campo. Seus cadernos podem se perder ou serem comidos pelo seu cachorro ou por cupins. E se você mantiver os arquivos digitais no Dropbox, por exemplo, poderá conferir algo estranho em qualquer lugar que você estiver.
  • Ao trabalhar com coordenadas de GPS, é uma prática boa anotar as coordenadas no caderno além de marcar o ponto no GPS, pois algo pode acontecer com o aparelho antes de você transferir os dados pro computador. Mas, caso nada aconteça com o aparelho, use as coordenadas armazenadas nele, e não as anotadas. Caso contrário, erros podem ser introduzidos ao anotar a coordenada errado ou ao digitar ela incorretamente. São números muito grantes e portanto muito propensos a erros!
  • E finalmente, pode ser interessante imprimir e guardar as planilhas finais, já corrigidas, de dados brutos, porque arquivos digitais se perdem… Recomendação de Gotelli e Ellison!

*Ai meu joelho.

**Daria um belo filme de terror isso aí.

Anúncios

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s