Hojas de datos en el campo

Por: Raymond L. Tremblay

Librerías de R requeridas para el siguiente módulo

Código
library(tidyverse)
library(flextable)

Presentamos un ejemplo de la hoja de recolección de datos y algunas variables incluido y que debería estar preparada antes de ir al campo y estar imprimido sobre papel que es impermeable y que se puede escribir con lápiz. Esos ultimos puntos son bien importante ya que la gran mayoría de los bolígrafos son soluble en agua y si el papel se moja se puede perder sus datos. Considerando que estas hojas de datos pudiese ser usado como fuente de averiguar los datos por décadas en el futuro. RECUERDA que no se puede regresar con una maquina de tiempo para recoger los datos. Si usted tiene su hoja de datos en el laboratorio y se le cae la taza café y fue escrito con bolígrafo se puede perder los datos. No se arriesga!! Usa lápiz.

Antes de ir al campo es importante tener la lista completa de todos los individuos en la hoja de datos, ya que esto le ayuda asegurarse durante el muestreo que no se le olvida ningún individuo. Datos olvidado no se puede recuperar.

Puede usar papel Rite-in-Rain o papel de impresora normal. Si usa papel normal, se puede poner en una bolsa de plástico con un pedazo de cartón para que no se doble. Si se moja, se puede secar y no se pierde los datos. Mi sugerencia use papel Rite in the Rain y lápiz.

Ejemplo de Hojas de campo

Hoja en blanco para llevarse

Código
Hoja_de_campo %>%
    flextable()

anio

Número_de_Ind

Etapa

Cantidad_flores_abierta

Cantidad_capullo

Cantidad_Frutos

Numero_Hojas

Ancho_hoja_mm

etc

2,023

23,001

...

...

...

...

...

...

...

2,023

23,002

...

...

...

...

...

...

...

2,023

23,003

...

...

...

...

...

...

...

2,024

23,001

...

...

...

...

...

...

...

2,024

23,002

...

...

...

...

...

...

...

2,024

24,003

...

...

...

...

...

...

...

2,024

24,004

...

...

...

...

...

...

...

2,024

24,005

...

...

...

...

...

...

...


Ejemplos de tablas de Datos

Usando ejemplo de Tremblay y su codificación

  • p == plantula.
  • j == juvenil
  • A0 == adulto non-reproductivo
  • A1 == adulto reproductivo
  • M = muerto

Hoja llena al final del muestreo

Código
Hoja_llena %>%
    flextable()

Número_de_Ind

Etapa

Cantidad_flores_abierta

Cantidad_capullo

Cantidad_Frutos

Numero_Hojas

Ancho_hoja_mm

etc

23,001

p

23,002

j

2

10

23,003

A1

5

10

1

5

32

23,004

Ao

0

0

0

2

14

23,005

m

24,006

p

24,007

j

1

7

24,008

p

Nota que solamente los individuos 23003 y 23004 son adultos, uno tiene flores, capullos y frutos y el otro nada. A todos los adultos hay que llenar la información, no dejarlo en blanco. Para las otras etapas, no es necesario llenar la mayoría de las columnas ya que para las plántulas y muertos no PUEDEN tener esas variables suplementaria, pero los juveniles, se puede llenar la cantidad de hojas y sus tamaño. Nota que el individuo 23005 falleció.

Almacenamiento de datos de forma digital

Esa misma estructura de recoger los dados puede ser utilizado para ponerlo en una hoja de MSExcel, Google Sheet o MacOS Numbers.

  • Es muy importante que haya dos hojas, una para los datos y otra para la metadata.
  • La metadata es la descripción de los datos, como se recogieron, donde, cuando, por quien, las unidades, objetivo de la investigación, etc.
  • En la hoja de datos, cada columna tiene información de solamente UNA variable y cada fila tiene información de solamente UN individuo. No debería tener las unidades indicado en las celdas de la hoja de datos, sino en la metadata o en nombre de la columna.
    • La primera fila tiene los nombres de las variables y la primera columna tiene los nombres de los individuos.
    • Los nombres de las columnas no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes, como en ñ.
    • Los nombres de los individuos no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes, como en ñ, é, y %. Preferiblemente que la codificación sea un patrón alfanumérico.
  • La hojas de datos preferiblemente se guarda en hoja de datos separados, como .csv, .xls, .xlsx, .ods, etc. La ventaja de usar .csv es que es un archivo de texto y se puede abrir en cualquier programa de hoja de datos. Ese formato .csv, comma separated variable, es uno de los más viejo para almacenar datos, y es compatible con casi todos los programa de estadística. NUNCA guarda sus datos en un formato de programas especializados como SPSS, STATA, JMP, SAS, porque típicamente no se puede abrir en otros programas, y si no tiene (o pierda) la licencias se puede que nunca los podrán abrir en el futuro (experiencia personal).

Revisión:

RLT: Enero 19, 2025

RLT: Junio 18, 2025