Capítulo15 Tibbles

Fecha de la ultima revisión

## [1] "2025-11-05"

El tema proviene de los siguientes sitios.

English: https://r4ds.had.co.nz/tibbles.html

Español: https://es.r4ds.hadley.nz/10-tibble.html

15.1 Temas: El paquete Tibble

as_tibble()

15.2 Crear un tibble

tibble()

Crear un tibble con la siguiente información. Una columna que tiene los valores del 1 al 8 que se llama “secuencia”, una segunda columna que tiene los siguientes valores 23,26, 24,26,27, 11,20,21 que se llama edad y una tercera columna con la siguiente información, Jose, Maria, Carol, Moncho, Liz, Maria, Jorge, Miguel, que ser llama Nombre

library(tidyverse)
#library(datos)

tibble(
  secuencia = c(1:6),
  edad = c(23,26, 24,26,27, NA),
  nombre = c("Jose", "Maria", "Carol", "Moncho", "Liz", "Maria")
)

## # A tibble: 6 × 3
##   secuencia  edad nombre
##       <int> <dbl> <chr> 
## 1         1    23 Jose  
## 2         2    26 Maria 
## 3         3    24 Carol 
## 4         4    26 Moncho
## 5         5    27 Liz   
## 6         6    NA Maria

15.3 Crear un tribble

tribble()

Haga un tribble con las primera 3 lineas del tibble anterior

tribble(
  ~secuencia, ~edad, ~nombre,
  1, 23, "Jose",
  2, 26, "Maria",
  3, 23, "Carol"
  
  
)

## # A tibble: 3 × 3
##   secuencia  edad nombre
##       <dbl> <dbl> <chr> 
## 1         1    23 Jose  
## 2         2    26 Maria 
## 3         3    23 Carol

15.4 tibble vs. data.frame

tb = tibble(
  a = lubridate::now() + runif(1e2) * 86400,
  b = lubridate::today() + runif(1e2) * 30,
  c = 1:100,
  d = runif(1e2),
  e = sample(letters, 1e2, replace = TRUE)
)
tb

## # A tibble: 100 × 5
##    a                   b              c      d e    
##    <dttm>              <date>     <int>  <dbl> <chr>
##  1 2025-11-05 16:52:20 2025-11-23     1 0.559  o    
##  2 2025-11-05 23:21:34 2025-11-05     2 0.250  o    
##  3 2025-11-05 18:15:11 2025-11-07     3 0.0653 d    
##  4 2025-11-06 16:01:25 2025-11-06     4 0.573  v    
##  5 2025-11-05 23:33:40 2025-11-27     5 0.651  k    
##  6 2025-11-06 07:45:30 2025-11-16     6 0.581  p    
##  7 2025-11-06 12:23:35 2025-11-29     7 0.0175 x    
##  8 2025-11-06 11:23:34 2025-11-16     8 0.0133 f    
##  9 2025-11-06 05:38:18 2025-11-19     9 0.661  c    
## 10 2025-11-06 11:46:31 2025-11-28    10 0.380  y    
## # ℹ 90 more rows

df_tb=as.data.frame(tb)
df_tb

##                       a          b   c          d e
## 1   2025-11-05 16:52:20 2025-11-23   1 0.55895788 o
## 2   2025-11-05 23:21:34 2025-11-05   2 0.24952694 o
## 3   2025-11-05 18:15:11 2025-11-07   3 0.06531608 d
## 4   2025-11-06 16:01:25 2025-11-06   4 0.57306761 v
## 5   2025-11-05 23:33:40 2025-11-27   5 0.65098699 k
## 6   2025-11-06 07:45:30 2025-11-16   6 0.58124937 p
## 7   2025-11-06 12:23:35 2025-11-29   7 0.01748210 x
## 8   2025-11-06 11:23:34 2025-11-16   8 0.01331984 f
## 9   2025-11-06 05:38:18 2025-11-19   9 0.66064715 c
## 10  2025-11-06 11:46:31 2025-11-28  10 0.38021846 y
## 11  2025-11-06 15:55:47 2025-11-27  11 0.55374044 o
## 12  2025-11-06 13:23:21 2025-11-16  12 0.57734132 r
## 13  2025-11-06 13:48:00 2025-11-07  13 0.89874595 s
## 14  2025-11-06 08:08:01 2025-11-18  14 0.02335350 s
## 15  2025-11-06 02:47:10 2025-11-28  15 0.36233644 a
## 16  2025-11-06 04:32:16 2025-11-12  16 0.79219053 c
## 17  2025-11-06 05:50:08 2025-11-12  17 0.79451792 q
## 18  2025-11-05 17:43:36 2025-11-15  18 0.03461087 h
## 19  2025-11-05 22:21:49 2025-11-06  19 0.83758986 y
## 20  2025-11-06 04:37:08 2025-11-16  20 0.08880666 h
## 21  2025-11-05 20:57:19 2025-11-18  21 0.81779321 m
## 22  2025-11-05 19:21:42 2025-12-02  22 0.88725936 k
## 23  2025-11-06 08:16:03 2025-11-06  23 0.26002925 a
## 24  2025-11-05 19:26:45 2025-11-16  24 0.31542900 t
## 25  2025-11-06 02:03:49 2025-11-10  25 0.91124396 m
## 26  2025-11-05 21:23:38 2025-11-19  26 0.69990520 u
## 27  2025-11-06 06:34:46 2025-12-04  27 0.83810166 o
## 28  2025-11-06 04:04:43 2025-11-08  28 0.39910988 q
## 29  2025-11-06 13:59:27 2025-11-28  29 0.99993174 t
## 30  2025-11-06 05:42:28 2025-11-14  30 0.66218230 y
## 31  2025-11-06 00:40:16 2025-11-09  31 0.98046836 c
## 32  2025-11-06 04:50:08 2025-11-17  32 0.13905381 o
## 33  2025-11-06 08:52:03 2025-12-01  33 0.34755612 m
## 34  2025-11-05 21:46:40 2025-11-24  34 0.99072892 t
## 35  2025-11-06 13:00:02 2025-11-27  35 0.01158322 g
## 36  2025-11-06 03:13:50 2025-11-25  36 0.59905566 w
## 37  2025-11-06 01:15:03 2025-11-25  37 0.66253655 m
## 38  2025-11-06 12:34:24 2025-11-13  38 0.81108752 p
## 39  2025-11-05 20:13:46 2025-12-02  39 0.86941914 m
## 40  2025-11-06 05:59:22 2025-11-29  40 0.18531162 v
## 41  2025-11-06 13:47:50 2025-11-09  41 0.93845374 p
## 42  2025-11-05 18:17:59 2025-11-15  42 0.98626153 o
## 43  2025-11-05 18:14:57 2025-11-28  43 0.36978729 g
## 44  2025-11-05 18:02:53 2025-11-16  44 0.40597546 h
## 45  2025-11-05 16:27:27 2025-11-07  45 0.45127090 p
## 46  2025-11-06 09:03:26 2025-11-09  46 0.83761479 d
## 47  2025-11-06 05:55:39 2025-12-04  47 0.20941751 c
## 48  2025-11-06 01:47:19 2025-11-30  48 0.99204004 y
## 49  2025-11-06 02:04:55 2025-11-06  49 0.50421065 r
## 50  2025-11-05 19:39:36 2025-11-16  50 0.33143023 g
## 51  2025-11-06 15:03:12 2025-11-15  51 0.73076078 w
## 52  2025-11-06 05:59:03 2025-11-11  52 0.46601006 v
## 53  2025-11-06 02:28:12 2025-11-25  53 0.93914242 z
## 54  2025-11-06 07:22:20 2025-12-01  54 0.88173091 s
## 55  2025-11-06 00:21:03 2025-11-29  55 0.34532379 i
## 56  2025-11-05 18:23:58 2025-11-23  56 0.58456342 l
## 57  2025-11-05 16:26:03 2025-12-01  57 0.88058255 v
## 58  2025-11-05 18:18:48 2025-11-06  58 0.22127013 v
## 59  2025-11-06 07:59:26 2025-11-23  59 0.89288290 o
## 60  2025-11-06 00:06:59 2025-11-11  60 0.02081485 y
## 61  2025-11-05 20:44:45 2025-11-21  61 0.27143203 n
## 62  2025-11-06 01:42:12 2025-11-12  62 0.95400736 c
## 63  2025-11-05 23:48:59 2025-11-13  63 0.86419811 j
## 64  2025-11-06 00:43:26 2025-11-14  64 0.25909042 i
## 65  2025-11-06 08:41:28 2025-11-15  65 0.71488890 t
## 66  2025-11-06 09:13:22 2025-11-14  66 0.14559841 m
## 67  2025-11-06 06:20:15 2025-11-19  67 0.33884110 a
## 68  2025-11-06 09:46:04 2025-11-18  68 0.85914380 c
## 69  2025-11-06 06:49:33 2025-11-26  69 0.78041364 o
## 70  2025-11-06 01:26:40 2025-11-25  70 0.83340269 v
## 71  2025-11-06 12:16:28 2025-11-26  71 0.46138001 k
## 72  2025-11-06 11:33:39 2025-11-27  72 0.95366063 x
## 73  2025-11-05 22:11:27 2025-12-02  73 0.58594067 i
## 74  2025-11-06 00:21:15 2025-11-21  74 0.07427914 i
## 75  2025-11-05 16:40:37 2025-12-03  75 0.41196391 p
## 76  2025-11-06 13:48:39 2025-11-15  76 0.64245513 l
## 77  2025-11-06 01:55:18 2025-11-18  77 0.88572561 a
## 78  2025-11-05 20:26:44 2025-12-04  78 0.27894255 z
## 79  2025-11-06 02:20:52 2025-11-25  79 0.11545121 p
## 80  2025-11-05 17:24:30 2025-12-01  80 0.27069348 w
## 81  2025-11-06 07:10:14 2025-11-06  81 0.09039557 m
## 82  2025-11-06 06:22:38 2025-12-04  82 0.84375956 u
## 83  2025-11-05 21:49:54 2025-11-17  83 0.44452948 t
## 84  2025-11-05 20:10:04 2025-11-13  84 0.17054338 a
## 85  2025-11-06 02:11:01 2025-12-04  85 0.94064577 n
## 86  2025-11-06 04:38:39 2025-11-10  86 0.55504992 s
## 87  2025-11-05 19:51:52 2025-12-03  87 0.74138904 o
## 88  2025-11-05 19:34:22 2025-11-16  88 0.69146950 m
## 89  2025-11-06 07:42:19 2025-11-27  89 0.95055655 v
## 90  2025-11-06 11:37:58 2025-12-01  90 0.50241356 h
## 91  2025-11-06 11:57:35 2025-11-30  91 0.94041471 l
## 92  2025-11-06 06:01:30 2025-11-16  92 0.66040567 e
## 93  2025-11-05 23:53:36 2025-11-21  93 0.74075930 s
## 94  2025-11-06 11:28:48 2025-11-21  94 0.49824345 q
## 95  2025-11-05 16:07:55 2025-12-03  95 0.10436335 j
## 96  2025-11-06 01:06:28 2025-11-05  96 0.06179632 g
## 97  2025-11-06 04:09:05 2025-11-14  97 0.21776393 s
## 98  2025-11-06 15:28:52 2025-11-05  98 0.15662152 x
## 99  2025-11-06 02:12:21 2025-11-23  99 0.62424786 s
## 100 2025-11-06 07:09:36 2025-11-07 100 0.39037936 c

tb %>%
  print(n = 4, width = Inf)

## # A tibble: 100 × 5
##   a                   b              c      d e    
##   <dttm>              <date>     <int>  <dbl> <chr>
## 1 2025-11-05 16:52:20 2025-11-23     1 0.559  o    
## 2 2025-11-05 23:21:34 2025-11-05     2 0.250  o    
## 3 2025-11-05 18:15:11 2025-11-07     3 0.0653 d    
## 4 2025-11-06 16:01:25 2025-11-06     4 0.573  v    
## # ℹ 96 more rows

lubridate::now()

## [1] "2025-11-05 16:04:38 AST"

lubridate::today()

## [1] "2025-11-05"

To convert a data frame to a tibble use as.tibble
To convert a tibble to a data frame use as.data.frame

15.5 Diferencias entre un tibble y un data frame.

Tibbles tiene un buen método de impresión que muestra solo las primeras 10 filas y todas las columnas que caben en la pantalla.
Tibbles no admite nombres de filas. Se eliminan al convertir a tibble o al crear subconjuntos:

Operaciones aritméticas en tibbles

A diferencia de los data frame, los tibbles NO admiten operaciones aritméticas en todas las columnas. El resultado fuerza silenciosamente a un data frame.

tbl <- tibble(a = 1:3, b = 4:6)
result=tbl * 2

is_tibble(result)

## [1] FALSE

is.data.frame(result)

## [1] TRUE

result2=tbl |> mutate(c=b*2)
result2

## # A tibble: 3 × 3
##       a     b     c
##   <int> <int> <dbl>
## 1     1     4     8
## 2     2     5    10
## 3     3     6    12

is_tibble(result2)

## [1] TRUE

Los tibbles también son más estrictos con $. Tibbles nunca realiza coincidencias parciales y generará una advertencia y devolverá NULL si la columna no existe:

df <- data.frame(abc = 1)
df$a

## [1] 1

#> [1] 1

df2 <- tibble(abc = 1)
df2$abc # nota el error

## [1] 1

Para extraer una columna de un tibble, use [[. Esto es más seguro que $ porque nunca realiza coincidencias parciales:

15.6 Selección de subconjuntos de datos

library(datos)

head(vuelos$salida_programada, n=20)

##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600

vuelos[["salida_programada"]] |> head(n=20)

##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600

#Alternativas usar esta función dentro de pipe

vuelos %>% .$salida_programada |> head(n=20)

##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600

vuelos %>% .[["salida_programada"]] |> head(n=20)

##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600

vuelos %>% .[["atraso_salida"]] |> 
  head(n=20)

##  [1]  2  4  2 -1 -6 -4 -5 -3 -3 -2 -2 -2 -2 -2 -1  0 -1  0  0  1

Ejercicios:

Hacer los ejercicios en la sección 10.5 del libro en español