Capítulo15 Tibbles

Fecha de la ultima revisión

## [1] "2025-10-29"

El tema proviene de los siguientes sitios.

English: https://r4ds.had.co.nz/tibbles.html

Español: https://es.r4ds.hadley.nz/10-tibble.html


15.1 Temas: El paquete Tibble

  • as_tibble()

15.2 Crear un tibble

  • tibble()

Crear un tibble con la siguiente información. Una columna que tiene los valores del 1 al 8 que se llama “secuencia”, una segunda columna que tiene los siguientes valores 23,26, 24,26,27, 11,20,21 que se llama edad y una tercera columna con la siguiente información, Jose, Maria, Carol, Moncho, Liz, Maria, Jorge, Miguel, que ser llama Nombre

library(tidyverse)
#library(datos)

tibble(
  secuencia = c(1:6),
  edad = c(23,26, 24,26,27, NA),
  nombre = c("Jose", "Maria", "Carol", "Moncho", "Liz", "Maria")
)
## # A tibble: 6 × 3
##   secuencia  edad nombre
##       <int> <dbl> <chr> 
## 1         1    23 Jose  
## 2         2    26 Maria 
## 3         3    24 Carol 
## 4         4    26 Moncho
## 5         5    27 Liz   
## 6         6    NA Maria

15.3 Crear un tribble

  • tribble()

Haga un tribble con las primera 3 lineas del tibble anterior

tribble(
  ~secuencia, ~edad, ~nombre,
  1, 23, "Jose",
  2, 26, "Maria",
  3, 23, "Carol"
  
  
)
## # A tibble: 3 × 3
##   secuencia  edad nombre
##       <dbl> <dbl> <chr> 
## 1         1    23 Jose  
## 2         2    26 Maria 
## 3         3    23 Carol

15.4 tibble vs. data.frame

tb = tibble(
  a = lubridate::now() + runif(1e2) * 86400,
  b = lubridate::today() + runif(1e2) * 30,
  c = 1:100,
  d = runif(1e2),
  e = sample(letters, 1e2, replace = TRUE)
)
tb
## # A tibble: 100 × 5
##    a                   b              c      d e    
##    <dttm>              <date>     <int>  <dbl> <chr>
##  1 2025-10-29 16:54:45 2025-11-16     1 0.559  o    
##  2 2025-10-29 23:23:59 2025-10-29     2 0.250  o    
##  3 2025-10-29 18:17:36 2025-10-31     3 0.0653 d    
##  4 2025-10-30 16:03:50 2025-10-30     4 0.573  v    
##  5 2025-10-29 23:36:05 2025-11-20     5 0.651  k    
##  6 2025-10-30 07:47:55 2025-11-09     6 0.581  p    
##  7 2025-10-30 12:26:00 2025-11-22     7 0.0175 x    
##  8 2025-10-30 11:25:59 2025-11-09     8 0.0133 f    
##  9 2025-10-30 05:40:43 2025-11-12     9 0.661  c    
## 10 2025-10-30 11:48:56 2025-11-21    10 0.380  y    
## # ℹ 90 more rows
df_tb=as.data.frame(tb)
df_tb
##                       a          b   c          d e
## 1   2025-10-29 16:54:45 2025-11-16   1 0.55895788 o
## 2   2025-10-29 23:23:59 2025-10-29   2 0.24952694 o
## 3   2025-10-29 18:17:36 2025-10-31   3 0.06531608 d
## 4   2025-10-30 16:03:50 2025-10-30   4 0.57306761 v
## 5   2025-10-29 23:36:05 2025-11-20   5 0.65098699 k
## 6   2025-10-30 07:47:55 2025-11-09   6 0.58124937 p
## 7   2025-10-30 12:26:00 2025-11-22   7 0.01748210 x
## 8   2025-10-30 11:25:59 2025-11-09   8 0.01331984 f
## 9   2025-10-30 05:40:43 2025-11-12   9 0.66064715 c
## 10  2025-10-30 11:48:56 2025-11-21  10 0.38021846 y
## 11  2025-10-30 15:58:12 2025-11-20  11 0.55374044 o
## 12  2025-10-30 13:25:46 2025-11-09  12 0.57734132 r
## 13  2025-10-30 13:50:26 2025-10-31  13 0.89874595 s
## 14  2025-10-30 08:10:26 2025-11-11  14 0.02335350 s
## 15  2025-10-30 02:49:35 2025-11-21  15 0.36233644 a
## 16  2025-10-30 04:34:41 2025-11-05  16 0.79219053 c
## 17  2025-10-30 05:52:33 2025-11-05  17 0.79451792 q
## 18  2025-10-29 17:46:01 2025-11-08  18 0.03461087 h
## 19  2025-10-29 22:24:14 2025-10-30  19 0.83758986 y
## 20  2025-10-30 04:39:33 2025-11-09  20 0.08880666 h
## 21  2025-10-29 20:59:44 2025-11-11  21 0.81779321 m
## 22  2025-10-29 19:24:07 2025-11-25  22 0.88725936 k
## 23  2025-10-30 08:18:28 2025-10-30  23 0.26002925 a
## 24  2025-10-29 19:29:10 2025-11-09  24 0.31542900 t
## 25  2025-10-30 02:06:14 2025-11-03  25 0.91124396 m
## 26  2025-10-29 21:26:04 2025-11-12  26 0.69990520 u
## 27  2025-10-30 06:37:12 2025-11-27  27 0.83810166 o
## 28  2025-10-30 04:07:08 2025-11-01  28 0.39910988 q
## 29  2025-10-30 14:01:52 2025-11-21  29 0.99993174 t
## 30  2025-10-30 05:44:53 2025-11-07  30 0.66218230 y
## 31  2025-10-30 00:42:41 2025-11-02  31 0.98046836 c
## 32  2025-10-30 04:52:33 2025-11-10  32 0.13905381 o
## 33  2025-10-30 08:54:28 2025-11-24  33 0.34755612 m
## 34  2025-10-29 21:49:05 2025-11-17  34 0.99072892 t
## 35  2025-10-30 13:02:27 2025-11-20  35 0.01158322 g
## 36  2025-10-30 03:16:15 2025-11-18  36 0.59905566 w
## 37  2025-10-30 01:17:28 2025-11-18  37 0.66253655 m
## 38  2025-10-30 12:36:49 2025-11-06  38 0.81108752 p
## 39  2025-10-29 20:16:11 2025-11-25  39 0.86941914 m
## 40  2025-10-30 06:01:47 2025-11-22  40 0.18531162 v
## 41  2025-10-30 13:50:15 2025-11-02  41 0.93845374 p
## 42  2025-10-29 18:20:24 2025-11-08  42 0.98626153 o
## 43  2025-10-29 18:17:22 2025-11-21  43 0.36978729 g
## 44  2025-10-29 18:05:18 2025-11-09  44 0.40597546 h
## 45  2025-10-29 16:29:52 2025-10-31  45 0.45127090 p
## 46  2025-10-30 09:05:51 2025-11-02  46 0.83761479 d
## 47  2025-10-30 05:58:04 2025-11-27  47 0.20941751 c
## 48  2025-10-30 01:49:44 2025-11-23  48 0.99204004 y
## 49  2025-10-30 02:07:20 2025-10-30  49 0.50421065 r
## 50  2025-10-29 19:42:01 2025-11-09  50 0.33143023 g
## 51  2025-10-30 15:05:37 2025-11-08  51 0.73076078 w
## 52  2025-10-30 06:01:28 2025-11-04  52 0.46601006 v
## 53  2025-10-30 02:30:38 2025-11-18  53 0.93914242 z
## 54  2025-10-30 07:24:45 2025-11-24  54 0.88173091 s
## 55  2025-10-30 00:23:28 2025-11-22  55 0.34532379 i
## 56  2025-10-29 18:26:23 2025-11-16  56 0.58456342 l
## 57  2025-10-29 16:28:28 2025-11-24  57 0.88058255 v
## 58  2025-10-29 18:21:13 2025-10-30  58 0.22127013 v
## 59  2025-10-30 08:01:51 2025-11-16  59 0.89288290 o
## 60  2025-10-30 00:09:24 2025-11-04  60 0.02081485 y
## 61  2025-10-29 20:47:10 2025-11-14  61 0.27143203 n
## 62  2025-10-30 01:44:37 2025-11-05  62 0.95400736 c
## 63  2025-10-29 23:51:24 2025-11-06  63 0.86419811 j
## 64  2025-10-30 00:45:51 2025-11-07  64 0.25909042 i
## 65  2025-10-30 08:43:53 2025-11-08  65 0.71488890 t
## 66  2025-10-30 09:15:47 2025-11-07  66 0.14559841 m
## 67  2025-10-30 06:22:41 2025-11-12  67 0.33884110 a
## 68  2025-10-30 09:48:29 2025-11-11  68 0.85914380 c
## 69  2025-10-30 06:51:58 2025-11-19  69 0.78041364 o
## 70  2025-10-30 01:29:05 2025-11-18  70 0.83340269 v
## 71  2025-10-30 12:18:53 2025-11-19  71 0.46138001 k
## 72  2025-10-30 11:36:04 2025-11-20  72 0.95366063 x
## 73  2025-10-29 22:13:52 2025-11-25  73 0.58594067 i
## 74  2025-10-30 00:23:40 2025-11-14  74 0.07427914 i
## 75  2025-10-29 16:43:02 2025-11-26  75 0.41196391 p
## 76  2025-10-30 13:51:04 2025-11-08  76 0.64245513 l
## 77  2025-10-30 01:57:43 2025-11-11  77 0.88572561 a
## 78  2025-10-29 20:29:09 2025-11-27  78 0.27894255 z
## 79  2025-10-30 02:23:17 2025-11-18  79 0.11545121 p
## 80  2025-10-29 17:26:55 2025-11-24  80 0.27069348 w
## 81  2025-10-30 07:12:39 2025-10-30  81 0.09039557 m
## 82  2025-10-30 06:25:03 2025-11-27  82 0.84375956 u
## 83  2025-10-29 21:52:19 2025-11-10  83 0.44452948 t
## 84  2025-10-29 20:12:29 2025-11-06  84 0.17054338 a
## 85  2025-10-30 02:13:26 2025-11-27  85 0.94064577 n
## 86  2025-10-30 04:41:04 2025-11-03  86 0.55504992 s
## 87  2025-10-29 19:54:17 2025-11-26  87 0.74138904 o
## 88  2025-10-29 19:36:47 2025-11-09  88 0.69146950 m
## 89  2025-10-30 07:44:44 2025-11-20  89 0.95055655 v
## 90  2025-10-30 11:40:23 2025-11-24  90 0.50241356 h
## 91  2025-10-30 12:00:01 2025-11-23  91 0.94041471 l
## 92  2025-10-30 06:03:55 2025-11-09  92 0.66040567 e
## 93  2025-10-29 23:56:01 2025-11-14  93 0.74075930 s
## 94  2025-10-30 11:31:13 2025-11-14  94 0.49824345 q
## 95  2025-10-29 16:10:20 2025-11-26  95 0.10436335 j
## 96  2025-10-30 01:08:53 2025-10-29  96 0.06179632 g
## 97  2025-10-30 04:11:30 2025-11-07  97 0.21776393 s
## 98  2025-10-30 15:31:17 2025-10-29  98 0.15662152 x
## 99  2025-10-30 02:14:46 2025-11-16  99 0.62424786 s
## 100 2025-10-30 07:12:01 2025-10-31 100 0.39037936 c
tb %>%
  print(n = 4, width = Inf)
## # A tibble: 100 × 5
##   a                   b              c      d e    
##   <dttm>              <date>     <int>  <dbl> <chr>
## 1 2025-10-29 16:54:45 2025-11-16     1 0.559  o    
## 2 2025-10-29 23:23:59 2025-10-29     2 0.250  o    
## 3 2025-10-29 18:17:36 2025-10-31     3 0.0653 d    
## 4 2025-10-30 16:03:50 2025-10-30     4 0.573  v    
## # ℹ 96 more rows
lubridate::now()
## [1] "2025-10-29 16:07:03 AST"
lubridate::today()
## [1] "2025-10-29"
  • To convert a data frame to a tibble use as.tibble

  • To convert a tibble to a data frame use as.data.frame


15.5 Diferencias entre un tibble y un data frame.

  • Tibbles tiene un buen método de impresión que muestra solo las primeras 10 filas y todas las columnas que caben en la pantalla.
  • Tibbles no admite nombres de filas. Se eliminan al convertir a tibble o al crear subconjuntos:

Operaciones aritméticas en tibbles

A diferencia de los data frame, los tibbles NO admiten operaciones aritméticas en todas las columnas. El resultado  fuerza silenciosamente a un data frame.

tbl <- tibble(a = 1:3, b = 4:6)
result=tbl * 2

is_tibble(result)
## [1] FALSE
is.data.frame(result)
## [1] TRUE
result2=tbl |> mutate(c=b*2)
result2
## # A tibble: 3 × 3
##       a     b     c
##   <int> <int> <dbl>
## 1     1     4     8
## 2     2     5    10
## 3     3     6    12
is_tibble(result2)
## [1] TRUE
  • Los tibbles también son más estrictos con $. Tibbles nunca realiza coincidencias parciales y generará una advertencia y devolverá NULL si la columna no existe:
df <- data.frame(abc = 1)
df$a
## [1] 1
#> [1] 1

df2 <- tibble(abc = 1)
df2$abc # nota el error
## [1] 1
  • Para extraer una columna de un tibble, use [[. Esto es más seguro que $ porque nunca realiza coincidencias parciales:

15.6 Selección de subconjuntos de datos

library(datos)

head(vuelos$salida_programada, n=20) 
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
vuelos[["salida_programada"]] |> head(n=20)
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
#Alternativas usar esta función dentro de pipe

vuelos %>% .$salida_programada |> head(n=20)
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
vuelos %>% .[["salida_programada"]] |> head(n=20)
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
vuelos %>% .[["atraso_salida"]] |> 
  head(n=20)
##  [1]  2  4  2 -1 -6 -4 -5 -3 -3 -2 -2 -2 -2 -2 -1  0 -1  0  0  1
  1. Ejercicios:

Hacer los ejercicios en la sección 10.5 del libro en español