[R] 2. tibble 데이터
반응형
티블(tibble)
- tidy data에서 사용하는 R 데이터 객체를 티블(
tibble
)이라고 부릅니다. tibble
은 R 베이스 객체인data.frame
객체 형태와 근본적으로 큰 차이가 없습니다.- 하지만
tidyverse
라이브러리의 함수들을 사용하다보면 기존data.frame
객체보다tibble
객체가 더 효율적이라는 것을 느끼게 될 것 입니다. - 앞으로
tidyverse
에서 다루게될 데이터 객체는tibble
입니다.
- 길이가 같은 벡터형 객체를 tibble 데이터 객체로 만들 수 있습니다.
name <- c("Ray", "Dylan", "Samuel", "Rin", "Jade")
score <- 5:1
temp <- tibble(
name, score
)
temp
## # A tibble: 5 x 2
## name score
## <chr> <int>
## 1 Ray 5
## 2 Dylan 4
## 3 Samuel 3
## 4 Rin 2
## 5 Jade 1
- 테이블 출력 결과를 해석하자면, “# A tibble: 5 x 2”는 데이터 구조를 설명합니다. 즉 행렬형태의 데이터로 5개의 가로줄과 2개의 세로줄을 갖는 것을 의미합니다.
- 그 다음 각 변수의 이름 아래에
<dbl>
,<chr>
,<int>
라는 라벨이 붙어 있는 것을 보실 수 있는데 이 라벨은 티블 형태의 데이터의 변수가 어떤 형태인지를 보여주는 것이며 그 의미는 아래와 같습니다.라벨 의미 <chr>
문자형(character) <int>
정수(integer) <dbl>
더블(double) <date>
날짜(date) <time>
시간(time) <dttm>
날짜와 시간(date-time) <lgl>
논리값. 조건에 맞으면 TURE, 그렇지 않으면 FALSE 반환 +lbl
변수의 값에 부여된 라벨 값이 추가되어 있음을 표시
- tibble 데이터 역시 data.frame과 마찬가지로 가로줄과 세로줄의 위치와 구역을 지정(인덱싱)하여 데이터의 일부를 필터링할 수 있습니다.
temp[5, ]
## # A tibble: 1 x 2
## name score
## <chr> <int>
## 1 Jade 1
temp[, 1]
## # A tibble: 5 x 1
## name
## <chr>
## 1 Ray
## 2 Dylan
## 3 Samuel
## 4 Rin
## 5 Jade
- 변수명을 정의하는데 tibble이 조금 더 자유도가 높습니다.
- 아래와 같이 변수명에 띄어쓰기나 한글 등이 가능합니다.
tibble(
`이름` = c("Ray", "Dylan", "Samuel", "Rin", "Jade"),
`스코오오 어` = 5:1
)
## # A tibble: 5 x 2
## 이름 `스코오오 어`
## <chr> <int>
## 1 Ray 5
## 2 Dylan 4
## 3 Samuel 3
## 4 Rin 2
## 5 Jade 1
반응형
'tidyverse' 카테고리의 다른 글
[R] 6. 날짜 및 시간 변수 (lubridate) (3) | 2021.07.05 |
---|---|
[R] 5. mutate() (0) | 2021.07.05 |
[R] 4. select(), filter(), group_by(), summarise(), arrange(), rename() (0) | 2021.07.05 |
[R] 3. 파이프 오퍼레이터 (%>%) (0) | 2021.07.05 |
[R] 1. tidyverse 라이브러리와 tidy data (0) | 2021.07.05 |
TAGS.