Hojas de datos en el campo

Por: Raymond L. Tremblay

Librerías de R requeridas para el siguiente módulo

Código
library(tidyverse)
library(flextable)

Presentamos un ejemplo de hoja de recolección de datos con algunas variables incluidas, que debería estar preparada antes de ir al campo, e impresa sobre papel impermeable que se pueda escribir con lápiz. Estos últimos puntos son muy importantes, ya que la gran mayoría de los bolígrafos son solubles en agua y, si el papel se moja, se pueden perder los datos. Considerando que estas hojas de datos pudiesen ser usadas como fuente para consultar los datos décadas en el futuro: recuerda que no se puede regresar con una máquina del tiempo para recoger los datos. Si tienes tu hoja de datos en el laboratorio y se te cae la taza de café, y los datos fueron escritos con bolígrafo, se pueden perder. ¡No se arriesgue! Usa lápiz.

Antes de ir al campo es importante tener la lista completa de todos los individuos en la hoja de datos, ya que esto ayuda a asegurarse durante el muestreo de que no se olvide ningún individuo. Datos olvidados no se pueden recuperar.

Puede usar papel Rite in the Rain o papel de impresora normal. Si usa papel normal, se puede poner en una bolsa de plástico con un pedazo de cartón para que no se doble. Si se moja, se puede secar y no se pierden los datos. Mi sugerencia: use papel Rite in the Rain y lápiz.

Ejemplo de Hojas de campo

Hoja en blanco para llevarse

Código
Hoja_de_campo %>% flextable()

anio

Número_de_Ind

Etapa

Cantidad_flores_abierta

Cantidad_capullo

Cantidad_Frutos

Numero_Hojas

Ancho_hoja_mm

etc

2,023

23,001

...

...

...

...

...

...

...

2,023

23,002

...

...

...

...

...

...

...

2,023

23,003

...

...

...

...

...

...

...

2,024

23,001

...

...

...

...

...

...

...

2,024

23,002

...

...

...

...

...

...

...

2,024

24,003

...

...

...

...

...

...

...

2,024

24,004

...

...

...

...

...

...

...

2,024

24,005

...

...

...

...

...

...

...


Ejemplos de tablas de Datos

Usando ejemplo de Tremblay y su codificación

  • p = plántula
  • j = juvenil
  • A0 = adulto no reproductivo
  • A1 = adulto reproductivo
  • m = muerto

Hoja llena al final del muestreo

Código
Hoja_llena %>% flextable()

Número_de_Ind

Etapa

Cantidad_flores_abierta

Cantidad_capullo

Cantidad_Frutos

Numero_Hojas

Ancho_hoja_mm

etc

23,001

p

23,002

j

2

10

23,003

A1

5

10

1

5

32

23,004

A0

0

0

0

2

14

23,005

m

24,006

p

24,007

j

1

7

24,008

p

Nota que solamente los individuos 23003 y 23004 son adultos: uno tiene flores, capullos y frutos, y el otro nada. Para todos los adultos hay que llenar la información, no dejarla en blanco. Para las otras etapas no es necesario llenar la mayoría de las columnas, ya que para las plántulas y muertos no se PUEDEN tener esas variables suplementarias; pero para los juveniles se puede llenar la cantidad de hojas y su tamaño. Nota que el individuo 23005 falleció.

Almacenamiento de datos de forma digital

Esta misma estructura para recoger los datos puede ser utilizada para ponerlos en una hoja de MS Excel, Google Sheets o macOS Numbers.

  • Es muy importante que haya dos hojas: una para los datos y otra para la metadata.
  • La metadata es la descripción de los datos: cómo se recogieron, dónde, cuándo, por quién, las unidades, objetivo de la investigación, etc.
  • En la hoja de datos, cada columna tiene información de solamente UNA variable y cada fila tiene información de solamente UN individuo. No se deberían tener las unidades indicadas en las celdas de la hoja de datos, sino en la metadata o en el nombre de la columna.
    • La primera fila tiene los nombres de las variables y la primera columna tiene los nombres de los individuos.
    • Los nombres de las columnas no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes (como en ñ).
    • Los nombres de los individuos no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes, como en ñ, é o %. Preferiblemente, la codificación debe seguir un patrón alfanumérico.
  • Las hojas de datos preferiblemente se guardan en archivos separados como .csv, .xls, .xlsx, .ods, etc. La ventaja de usar .csv es que es un archivo de texto y se puede abrir en cualquier programa de hoja de datos. Ese formato .csv (comma separated variable) es uno de los más viejos para almacenar datos, y es compatible con casi todos los programas de estadística. NUNCA guarde sus datos en un formato de programas especializados como SPSS, STATA, JMP o SAS, porque típicamente no se pueden abrir en otros programas; y si no tiene (o pierde) la licencia, puede que nunca los pueda abrir en el futuro (experiencia personal).

Revisión:

RLT: Enero 19, 2025

RLT: Junio 18, 2025