Apéndice B

Hojas de datos en el campo

Por: Raymond L. Tremblay

Librerías de R requeridas para el siguiente módulo

Código

library(tidyverse)
library(flextable)

Presentamos un ejemplo de hoja de recolección de datos con algunas variables incluidas, que debería estar preparada antes de ir al campo, e impresa sobre papel impermeable que se pueda escribir con lápiz. Estos últimos puntos son muy importantes, ya que la gran mayoría de los bolígrafos son solubles en agua y, si el papel se moja, se pueden perder los datos. Considerando que estas hojas de datos pudiesen ser usadas como fuente para consultar los datos décadas en el futuro: recuerda que no se puede regresar con una máquina del tiempo para recoger los datos. Si tienes tu hoja de datos en el laboratorio y se te cae la taza de café, y los datos fueron escritos con bolígrafo, se pueden perder. ¡No se arriesgue! Usa lápiz.

Antes de ir al campo es importante tener la lista completa de todos los individuos en la hoja de datos, ya que esto ayuda a asegurarse durante el muestreo de que no se olvide ningún individuo. Datos olvidados no se pueden recuperar.

Puede usar papel Rite in the Rain o papel de impresora normal. Si usa papel normal, se puede poner en una bolsa de plástico con un pedazo de cartón para que no se doble. Si se moja, se puede secar y no se pierden los datos. Mi sugerencia: use papel Rite in the Rain y lápiz.

Ejemplo de Hojas de campo

Hoja en blanco para llevarse

anio	Número_de_Ind	Etapa	Cantidad_flores_abierta	Cantidad_capullo	Cantidad_Frutos	Numero_Hojas	Ancho_hoja_mm	etc
2023	2.3e+04	...	...	...	...	...	...	...
2023	2.3e+04	...	...	...	...	...	...	...
2023	2.3e+04	...	...	...	...	...	...	...
2024	2.3e+04	...	...	...	...	...	...	...
2024	2.3e+04	...	...	...	...	...	...	...
2024	2.4e+04	...	...	...	...	...	...	...
2024	2.4e+04	...	...	...	...	...	...	...
2024	2.4e+04	...	...	...	...	...	...	...

Ejemplos de tablas de Datos

Usando ejemplo de Tremblay y su codificación

p = plántula
j = juvenil
A0 = adulto no reproductivo
A1 = adulto reproductivo
m = muerto

Hoja llena al final del muestreo

Número_de_Ind	Etapa	Cantidad_flores_abierta	Cantidad_capullo	Cantidad_Frutos	Numero_Hojas	Ancho_hoja_mm
2.3e+04	p	NA	NA	NA	NA	NA
2.3e+04	j	NA	NA	NA	2	10
2.3e+04	A1	5	10	1	5	32
2.3e+04	A0	0	0	0	2	14
2.3e+04	m	NA	NA	NA	NA	NA
2.401e+04	p	NA	NA	NA	NA	NA
2.401e+04	j	NA	NA	NA	1	7
2.401e+04	p	NA	NA	NA	NA	NA

Nota que solamente los individuos 23003 y 23004 son adultos: uno tiene flores, capullos y frutos, y el otro nada. Para todos los adultos hay que llenar la información, no dejarla en blanco. Para las otras etapas no es necesario llenar la mayoría de las columnas, ya que para las plántulas y muertos no se PUEDEN tener esas variables suplementarias; pero para los juveniles se puede llenar la cantidad de hojas y su tamaño. Nota que el individuo 23005 falleció.

Almacenamiento de datos de forma digital

Esta misma estructura para recoger los datos puede ser utilizada para ponerlos en una hoja de MS Excel, Google Sheets o macOS Numbers.

Es muy importante que haya dos hojas: una para los datos y otra para la metadata.
La metadata es la descripción de los datos: cómo se recogieron, dónde, cuándo, por quién, las unidades, objetivo de la investigación, etc.
En la hoja de datos, cada columna tiene información de solamente UNA variable y cada fila tiene información de solamente UN individuo. No se deberían tener las unidades indicadas en las celdas de la hoja de datos, sino en la metadata o en el nombre de la columna.
- La primera fila tiene los nombres de las variables y la primera columna tiene los nombres de los individuos.
- Los nombres de las columnas no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes (como en ñ).
- Los nombres de los individuos no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes, como en ñ, é o %. Preferiblemente, la codificación debe seguir un patrón alfanumérico.
Las hojas de datos preferiblemente se guardan en archivos separados como .csv, .xls, .xlsx, .ods, etc. La ventaja de usar .csv es que es un archivo de texto y se puede abrir en cualquier programa de hoja de datos. Ese formato .csv (comma separated variable) es uno de los más viejos para almacenar datos, y es compatible con casi todos los programas de estadística. NUNCA guarde sus datos en un formato de programas especializados como SPSS, STATA, JMP o SAS, porque típicamente no se pueden abrir en otros programas; y si no tiene (o pierde) la licencia, puede que nunca los pueda abrir en el futuro (experiencia personal).

--- description: "Apéndice B: ejemplo de hoja de campo para recolección de datos demográficos en orquídeas, con las variables esenciales para construir matrices de proyección." image: "images/Cirap_marcaje.png" open-graph: description: "Apéndice B: ejemplo de hoja de campo para recolección de datos demográficos en orquídeas, con las variables esenciales para construir matrices de proyección." twitter-card: description: "Apéndice B: ejemplo de hoja de campo para recolección de datos demográficos en orquídeas, con las variables esenciales para construir matrices de proyección." --- # Apéndice B {.unnumbered} ## Hojas de datos en el campo {.unnumbered} Por: Raymond L. Tremblay #### Librerías de R requeridas para el siguiente módulo ```{r ApenB1, warning=FALSE, message=FALSE} library(tidyverse) library(flextable) ``` Presentamos un ejemplo de hoja de recolección de datos con algunas variables incluidas, que debería estar preparada antes de ir al campo, e impresa sobre papel impermeable que se pueda escribir con lápiz. Estos últimos puntos son muy importantes, ya que la gran mayoría de los bolígrafos son solubles en agua y, si el papel se moja, se pueden perder los datos. Considerando que estas hojas de datos pudiesen ser usadas como fuente para consultar los datos décadas en el futuro: **recuerda que no se puede regresar con una máquina del tiempo para recoger los datos**. Si tienes tu hoja de datos en el laboratorio y se te cae la taza de café, y los datos fueron escritos con bolígrafo, se pueden perder. ¡No se arriesgue! **Usa lápiz**. Antes de ir al campo es importante tener la lista completa de todos los individuos en la hoja de datos, ya que esto ayuda a asegurarse durante el muestreo de que no se olvide ningún individuo. *Datos olvidados no se pueden recuperar*. Puede usar papel *Rite in the Rain* o papel de impresora normal. Si usa papel normal, se puede poner en una bolsa de plástico con un pedazo de cartón para que no se doble. Si se moja, se puede secar y no se pierden los datos. Mi sugerencia: use papel **Rite in the Rain** y lápiz. ## Ejemplo de Hojas de campo Hoja en blanco para llevarse ```{r ApenB2, message=FALSE, echo=FALSE} Hoja_de_campo <- tribble( ~anio, ~Número_de_Ind, ~Etapa, ~Cantidad_flores_abierta, ~Cantidad_capullo, ~Cantidad_Frutos, ~Numero_Hojas, ~Ancho_hoja_mm, ~etc, 2023, 23001, "...", "...", "...", "...", "...", "...", "...", 2023, 23002, "...", "...", "...", "...", "...", "...", "...", 2023, 23003, "...", "...", "...", "...", "...", "...", "...", 2024, 23001, "...", "...", "...", "...", "...", "...", "...", 2024, 23002, "...", "...", "...", "...", "...", "...", "...", 2024, 24003, "...", "...", "...", "...", "...", "...", "...", 2024, 24004, "...", "...", "...", "...", "...", "...", "...", 2024, 24005, "...", "...", "...", "...", "...", "...", "...", ) ``` ```{r ApenB3, message=FALSE, echo=FALSE} Hoja_de_campo %>% flextable() ``` ------------------------------------------------------------------------ ## Ejemplos de tablas de Datos {.unnumbered} ### Usando ejemplo de Tremblay y su codificación {.unnumbered} - p = **plántula** - j = **juvenil** - A0 = **adulto no reproductivo** - A1 = **adulto reproductivo** - m = **muerto** Hoja llena al final del muestreo ```{r ApenB4, message=FALSE, echo=FALSE} Hoja_llena <- tribble( ~Número_de_Ind, ~Etapa, ~Cantidad_flores_abierta, ~Cantidad_capullo, ~Cantidad_Frutos, ~Numero_Hojas, ~Ancho_hoja_mm, ~etc, 23001, "p", NA, NA, NA, NA, NA, NA, 23002, "j", NA, NA, NA, 2, 10, NA, 23003, "A1", 5, 10, 1, 5, 32, NA, 23004, "A0", 0, 0, 0, 2, 14, NA, 23005, "m", NA, NA, NA, NA, NA, NA, 24006, "p", NA, NA, NA, NA, NA, NA, 24007, "j", NA, NA, NA, 1, 7, NA, 24008, "p", NA, NA, NA, NA, NA, NA, ) ``` ```{r ApenB5, message=FALSE, echo=FALSE} Hoja_llena %>% flextable() ``` Nota que solamente los individuos 23003 y 23004 son adultos: uno tiene flores, capullos y frutos, y el otro nada. Para todos los adultos hay que llenar la información, no dejarla en blanco. Para las otras etapas no es necesario llenar la mayoría de las columnas, ya que para las plántulas y muertos no se PUEDEN tener esas variables suplementarias; pero para los juveniles se puede llenar la cantidad de hojas y su tamaño. Nota que el individuo 23005 falleció. ### Almacenamiento de datos de forma digital {.unnumbered} Esta misma estructura para recoger los datos puede ser utilizada para ponerlos en una hoja de MS Excel, Google Sheets o macOS Numbers. - Es muy importante que haya dos hojas: una para los datos y otra para la metadata. - La metadata es la descripción de los datos: cómo se recogieron, dónde, cuándo, por quién, las unidades, objetivo de la investigación, etc. - En la hoja de datos, cada columna tiene información de solamente UNA variable y cada fila tiene información de solamente UN individuo. No se deberían tener las unidades indicadas en las celdas de la hoja de datos, sino en la metadata o en el nombre de la columna. - La primera fila tiene los nombres de las variables y la primera columna tiene los nombres de los individuos. - Los nombres de las columnas no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes (como en **ñ**). - Los nombres de los individuos no pueden tener espacios, ni caracteres especiales, ni acentos, ni tildes, como en **ñ**, **é** o **%**. Preferiblemente, la codificación debe seguir un patrón alfanumérico. - Las hojas de datos preferiblemente se guardan en archivos separados como .csv, .xls, .xlsx, .ods, etc. La ventaja de usar .csv es que es un archivo de texto y se puede abrir en cualquier programa de hoja de datos. Ese formato .csv (*comma separated variable*) es uno de los más viejos para almacenar datos, y es compatible con casi todos los programas de estadística. **NUNCA** guarde sus datos en un formato de programas especializados como SPSS, STATA, JMP o SAS, porque típicamente no se pueden abrir en otros programas; y si no tiene (o pierde) la licencia, puede que nunca los pueda abrir en el futuro (experiencia personal). ------------------------------------------------------------------------