[R] 2. tibble 데이터

반응형

티블(tibble)

  • tidy data에서 사용하는 R 데이터 객체를 티블(tibble)이라고 부릅니다.
  • tibble은 R 베이스 객체인 data.frame 객체 형태와 근본적으로 큰 차이가 없습니다.
  • 하지만 tidyverse 라이브러리의 함수들을 사용하다보면 기존 data.frame 객체보다 tibble 객체가 더 효율적이라는 것을 느끼게 될 것 입니다.
  • 앞으로 tidyverse에서 다루게될 데이터 객체는 tibble입니다.



  • 길이가 같은 벡터형 객체를 tibble 데이터 객체로 만들 수 있습니다.
name <- c("Ray", "Dylan", "Samuel", "Rin", "Jade")
score <- 5:1

temp <- tibble(
  name, score
)

temp
## # A tibble: 5 x 2
##   name   score
##   <chr>  <int>
## 1 Ray        5
## 2 Dylan      4
## 3 Samuel     3
## 4 Rin        2
## 5 Jade       1
  • 테이블 출력 결과를 해석하자면, “# A tibble: 5 x 2”는 데이터 구조를 설명합니다. 즉 행렬형태의 데이터로 5개의 가로줄과 2개의 세로줄을 갖는 것을 의미합니다.
  • 그 다음 각 변수의 이름 아래에 <dbl>, <chr>, <int> 라는 라벨이 붙어 있는 것을 보실 수 있는데 이 라벨은 티블 형태의 데이터의 변수가 어떤 형태인지를 보여주는 것이며 그 의미는 아래와 같습니다.
    라벨 의미
    <chr> 문자형(character)
    <int> 정수(integer)
    <dbl> 더블(double)
    <date> 날짜(date)
    <time> 시간(time)
    <dttm> 날짜와 시간(date-time)
    <lgl> 논리값. 조건에 맞으면 TURE, 그렇지 않으면 FALSE 반환
    +lbl 변수의 값에 부여된 라벨 값이 추가되어 있음을 표시



  • tibble 데이터 역시 data.frame과 마찬가지로 가로줄과 세로줄의 위치와 구역을 지정(인덱싱)하여 데이터의 일부를 필터링할 수 있습니다.
temp[5, ]
## # A tibble: 1 x 2
##   name  score
##   <chr> <int>
## 1 Jade      1
temp[, 1]
## # A tibble: 5 x 1
##   name  
##   <chr> 
## 1 Ray   
## 2 Dylan 
## 3 Samuel
## 4 Rin   
## 5 Jade



  • 변수명을 정의하는데 tibble이 조금 더 자유도가 높습니다.
  • 아래와 같이 변수명에 띄어쓰기나 한글 등이 가능합니다.
tibble(
  `이름` =  c("Ray", "Dylan", "Samuel", "Rin", "Jade"),
  `스코오오 어` = 5:1
)
## # A tibble: 5 x 2
##   이름   `스코오오 어`
##   <chr>          <int>
## 1 Ray                5
## 2 Dylan              4
## 3 Samuel             3
## 4 Rin                2
## 5 Jade               1
반응형
TAGS.

Comments