Capítulo15 Tibbles

Fecha de la ultima revisión

## [1] "2025-10-15"

El tema proviene de los siguientes sitios.

English: https://r4ds.had.co.nz/tibbles.html

Español: https://es.r4ds.hadley.nz/10-tibble.html


15.1 Temas: El paquete Tibble

  • as_tibble()

15.2 Crear un tibble

  • tibble()

Crear un tibble con la siguiente información. Una columna que tiene los valores del 1 al 8 que se llama “secuencia”, una segunda columna que tiene los siguientes valores 23,26, 24,26,27, 11,20,21 que se llama edad y una tercera columna con la siguiente información, Jose, Maria, Carol, Moncho, Liz, Maria, Jorge, Miguel, que ser llama Nombre

library(tidyverse)
#library(datos)

tibble(
  secuencia = c(1:6),
  edad = c(23,26, 24,26,27, NA),
  nombre = c("Jose", "Maria", "Carol", "Moncho", "Liz", "Maria")
)
## # A tibble: 6 × 3
##   secuencia  edad nombre
##       <int> <dbl> <chr> 
## 1         1    23 Jose  
## 2         2    26 Maria 
## 3         3    24 Carol 
## 4         4    26 Moncho
## 5         5    27 Liz   
## 6         6    NA Maria

15.3 Crear un tribble

  • tribble()

Haga un tribble con las primera 3 lineas del tibble anterior

tribble(
  ~secuencia, ~edad, ~nombre,
  1, 23, "Jose",
  2, 26, "Maria",
  3, 23, "Carol"
  
  
)
## # A tibble: 3 × 3
##   secuencia  edad nombre
##       <dbl> <dbl> <chr> 
## 1         1    23 Jose  
## 2         2    26 Maria 
## 3         3    23 Carol

15.4 tibble vs. data.frame

tb = tibble(
  a = lubridate::now() + runif(1e2) * 86400,
  b = lubridate::today() + runif(1e2) * 30,
  c = 1:100,
  d = runif(1e2),
  e = sample(letters, 1e2, replace = TRUE)
)
tb
## # A tibble: 100 × 5
##    a                   b              c      d e    
##    <dttm>              <date>     <int>  <dbl> <chr>
##  1 2025-10-15 10:42:21 2025-11-02     1 0.559  o    
##  2 2025-10-15 17:11:36 2025-10-15     2 0.250  o    
##  3 2025-10-15 12:05:12 2025-10-17     3 0.0653 d    
##  4 2025-10-16 09:51:27 2025-10-16     4 0.573  v    
##  5 2025-10-15 17:23:42 2025-11-06     5 0.651  k    
##  6 2025-10-16 01:35:31 2025-10-26     6 0.581  p    
##  7 2025-10-16 06:13:36 2025-11-08     7 0.0175 x    
##  8 2025-10-16 05:13:35 2025-10-26     8 0.0133 f    
##  9 2025-10-15 23:28:20 2025-10-29     9 0.661  c    
## 10 2025-10-16 05:36:32 2025-11-07    10 0.380  y    
## # ℹ 90 more rows
df_tb=as.data.frame(tb)
df_tb
##                       a          b   c          d e
## 1   2025-10-15 10:42:21 2025-11-02   1 0.55895788 o
## 2   2025-10-15 17:11:36 2025-10-15   2 0.24952694 o
## 3   2025-10-15 12:05:12 2025-10-17   3 0.06531608 d
## 4   2025-10-16 09:51:27 2025-10-16   4 0.57306761 v
## 5   2025-10-15 17:23:42 2025-11-06   5 0.65098699 k
## 6   2025-10-16 01:35:31 2025-10-26   6 0.58124937 p
## 7   2025-10-16 06:13:36 2025-11-08   7 0.01748210 x
## 8   2025-10-16 05:13:35 2025-10-26   8 0.01331984 f
## 9   2025-10-15 23:28:20 2025-10-29   9 0.66064715 c
## 10  2025-10-16 05:36:32 2025-11-07  10 0.38021846 y
## 11  2025-10-16 09:45:49 2025-11-06  11 0.55374044 o
## 12  2025-10-16 07:13:22 2025-10-26  12 0.57734132 r
## 13  2025-10-16 07:38:02 2025-10-17  13 0.89874595 s
## 14  2025-10-16 01:58:03 2025-10-28  14 0.02335350 s
## 15  2025-10-15 20:37:11 2025-11-07  15 0.36233644 a
## 16  2025-10-15 22:22:17 2025-10-22  16 0.79219053 c
## 17  2025-10-15 23:40:09 2025-10-22  17 0.79451792 q
## 18  2025-10-15 11:33:38 2025-10-25  18 0.03461087 h
## 19  2025-10-15 16:11:50 2025-10-16  19 0.83758986 y
## 20  2025-10-15 22:27:09 2025-10-26  20 0.08880666 h
## 21  2025-10-15 14:47:21 2025-10-28  21 0.81779321 m
## 22  2025-10-15 13:11:43 2025-11-11  22 0.88725936 k
## 23  2025-10-16 02:06:04 2025-10-16  23 0.26002925 a
## 24  2025-10-15 13:16:47 2025-10-26  24 0.31542900 t
## 25  2025-10-15 19:53:51 2025-10-20  25 0.91124396 m
## 26  2025-10-15 15:13:40 2025-10-29  26 0.69990520 u
## 27  2025-10-16 00:24:48 2025-11-13  27 0.83810166 o
## 28  2025-10-15 21:54:45 2025-10-18  28 0.39910988 q
## 29  2025-10-16 07:49:29 2025-11-07  29 0.99993174 t
## 30  2025-10-15 23:32:29 2025-10-24  30 0.66218230 y
## 31  2025-10-15 18:30:18 2025-10-19  31 0.98046836 c
## 32  2025-10-15 22:40:09 2025-10-27  32 0.13905381 o
## 33  2025-10-16 02:42:04 2025-11-10  33 0.34755612 m
## 34  2025-10-15 15:36:41 2025-11-03  34 0.99072892 t
## 35  2025-10-16 06:50:03 2025-11-06  35 0.01158322 g
## 36  2025-10-15 21:03:52 2025-11-04  36 0.59905566 w
## 37  2025-10-15 19:05:05 2025-11-04  37 0.66253655 m
## 38  2025-10-16 06:24:25 2025-10-23  38 0.81108752 p
## 39  2025-10-15 14:03:47 2025-11-11  39 0.86941914 m
## 40  2025-10-15 23:49:24 2025-11-08  40 0.18531162 v
## 41  2025-10-16 07:37:52 2025-10-19  41 0.93845374 p
## 42  2025-10-15 12:08:01 2025-10-25  42 0.98626153 o
## 43  2025-10-15 12:04:58 2025-11-07  43 0.36978729 g
## 44  2025-10-15 11:52:54 2025-10-26  44 0.40597546 h
## 45  2025-10-15 10:17:29 2025-10-17  45 0.45127090 p
## 46  2025-10-16 02:53:28 2025-10-19  46 0.83761479 d
## 47  2025-10-15 23:45:40 2025-11-13  47 0.20941751 c
## 48  2025-10-15 19:37:21 2025-11-09  48 0.99204004 y
## 49  2025-10-15 19:54:56 2025-10-16  49 0.50421065 r
## 50  2025-10-15 13:29:37 2025-10-26  50 0.33143023 g
## 51  2025-10-16 08:53:13 2025-10-25  51 0.73076078 w
## 52  2025-10-15 23:49:04 2025-10-21  52 0.46601006 v
## 53  2025-10-15 20:18:14 2025-11-04  53 0.93914242 z
## 54  2025-10-16 01:12:21 2025-11-10  54 0.88173091 s
## 55  2025-10-15 18:11:05 2025-11-08  55 0.34532379 i
## 56  2025-10-15 12:14:00 2025-11-02  56 0.58456342 l
## 57  2025-10-15 10:16:05 2025-11-10  57 0.88058255 v
## 58  2025-10-15 12:08:50 2025-10-16  58 0.22127013 v
## 59  2025-10-16 01:49:27 2025-11-02  59 0.89288290 o
## 60  2025-10-15 17:57:00 2025-10-21  60 0.02081485 y
## 61  2025-10-15 14:34:46 2025-10-31  61 0.27143203 n
## 62  2025-10-15 19:32:13 2025-10-22  62 0.95400736 c
## 63  2025-10-15 17:39:00 2025-10-23  63 0.86419811 j
## 64  2025-10-15 18:33:28 2025-10-24  64 0.25909042 i
## 65  2025-10-16 02:31:30 2025-10-25  65 0.71488890 t
## 66  2025-10-16 03:03:23 2025-10-24  66 0.14559841 m
## 67  2025-10-16 00:10:17 2025-10-29  67 0.33884110 a
## 68  2025-10-16 03:36:05 2025-10-28  68 0.85914380 c
## 69  2025-10-16 00:39:35 2025-11-05  69 0.78041364 o
## 70  2025-10-15 19:16:41 2025-11-04  70 0.83340269 v
## 71  2025-10-16 06:06:30 2025-11-05  71 0.46138001 k
## 72  2025-10-16 05:23:40 2025-11-06  72 0.95366063 x
## 73  2025-10-15 16:01:28 2025-11-11  73 0.58594067 i
## 74  2025-10-15 18:11:17 2025-10-31  74 0.07427914 i
## 75  2025-10-15 10:30:38 2025-11-12  75 0.41196391 p
## 76  2025-10-16 07:38:40 2025-10-25  76 0.64245513 l
## 77  2025-10-15 19:45:19 2025-10-28  77 0.88572561 a
## 78  2025-10-15 14:16:45 2025-11-13  78 0.27894255 z
## 79  2025-10-15 20:10:53 2025-11-04  79 0.11545121 p
## 80  2025-10-15 11:14:32 2025-11-10  80 0.27069348 w
## 81  2025-10-16 01:00:16 2025-10-16  81 0.09039557 m
## 82  2025-10-16 00:12:40 2025-11-13  82 0.84375956 u
## 83  2025-10-15 15:39:55 2025-10-27  83 0.44452948 t
## 84  2025-10-15 14:00:05 2025-10-23  84 0.17054338 a
## 85  2025-10-15 20:01:02 2025-11-13  85 0.94064577 n
## 86  2025-10-15 22:28:41 2025-10-20  86 0.55504992 s
## 87  2025-10-15 13:41:53 2025-11-12  87 0.74138904 o
## 88  2025-10-15 13:24:23 2025-10-26  88 0.69146950 m
## 89  2025-10-16 01:32:20 2025-11-06  89 0.95055655 v
## 90  2025-10-16 05:27:59 2025-11-10  90 0.50241356 h
## 91  2025-10-16 05:47:37 2025-11-09  91 0.94041471 l
## 92  2025-10-15 23:51:32 2025-10-26  92 0.66040567 e
## 93  2025-10-15 17:43:38 2025-10-31  93 0.74075930 s
## 94  2025-10-16 05:18:49 2025-10-31  94 0.49824345 q
## 95  2025-10-15 09:57:57 2025-11-12  95 0.10436335 j
## 96  2025-10-15 18:56:30 2025-10-15  96 0.06179632 g
## 97  2025-10-15 21:59:06 2025-10-24  97 0.21776393 s
## 98  2025-10-16 09:18:53 2025-10-15  98 0.15662152 x
## 99  2025-10-15 20:02:22 2025-11-02  99 0.62424786 s
## 100 2025-10-16 00:59:38 2025-10-17 100 0.39037936 c
tb %>%
  print(n = 4, width = Inf)
## # A tibble: 100 × 5
##   a                   b              c      d e    
##   <dttm>              <date>     <int>  <dbl> <chr>
## 1 2025-10-15 10:42:21 2025-11-02     1 0.559  o    
## 2 2025-10-15 17:11:36 2025-10-15     2 0.250  o    
## 3 2025-10-15 12:05:12 2025-10-17     3 0.0653 d    
## 4 2025-10-16 09:51:27 2025-10-16     4 0.573  v    
## # ℹ 96 more rows
lubridate::now()
## [1] "2025-10-15 09:54:39 AST"
lubridate::today()
## [1] "2025-10-15"
  • To convert a data frame to a tibble use as.tibble

  • To convert a tibble to a data frame use as.data.frame


15.5 Diferencias entre un tibble y un data frame.

  • Tibbles tiene un buen método de impresión que muestra solo las primeras 10 filas y todas las columnas que caben en la pantalla.
  • Tibbles no admite nombres de filas. Se eliminan al convertir a tibble o al crear subconjuntos:

Operaciones aritméticas en tibbles

A diferencia de los data frame, los tibbles NO admiten operaciones aritméticas en todas las columnas. El resultado  fuerza silenciosamente a un data frame.

tbl <- tibble(a = 1:3, b = 4:6)
result=tbl * 2

is_tibble(result)
## [1] FALSE
is.data.frame(result)
## [1] TRUE
result2=tbl |> mutate(c=b*2)
result2
## # A tibble: 3 × 3
##       a     b     c
##   <int> <int> <dbl>
## 1     1     4     8
## 2     2     5    10
## 3     3     6    12
is_tibble(result2)
## [1] TRUE
  • Los tibbles también son más estrictos con $. Tibbles nunca realiza coincidencias parciales y generará una advertencia y devolverá NULL si la columna no existe:
df <- data.frame(abc = 1)
df$a
## [1] 1
#> [1] 1

df2 <- tibble(abc = 1)
df2$abc # nota el error
## [1] 1
  • Para extraer una columna de un tibble, use [[. Esto es más seguro que $ porque nunca realiza coincidencias parciales:

15.6 Selección de subconjuntos de datos

library(datos)

head(vuelos$salida_programada, n=20) 
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
vuelos[["salida_programada"]] |> head(n=20)
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
#Alternativas usar esta función dentro de pipe

vuelos %>% .$salida_programada |> head(n=20)
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
vuelos %>% .[["salida_programada"]] |> head(n=20)
##  [1] 515 529 540 545 600 558 600 600 600 600 600 600 600 600 600 559 600 600 600
## [20] 600
vuelos %>% .[["atraso_salida"]] |> 
  head(n=20)
##  [1]  2  4  2 -1 -6 -4 -5 -3 -3 -2 -2 -2 -2 -2 -1  0 -1  0  0  1
  1. Ejercicios:

Hacer los ejercicios en la sección 10.5 del libro en español