Loading...

[R] 1. fpp3 간단한 소개

소개 https://tidyverts.org/ tidyverts는 시계열 데이터 분석을 tidy approach로 진행하게 하는 ecosystem 입니다. R에서는 fpp3 라는 이름으로 tidyverts를 구성하고 있는 라이브러리들을 불러올 수 있습니다. 또는 install_packages("..."), install_github("tidyverts/...")와 같이 필요한 라이브러리들만 별도로 불러올 수 있습니다. fpp3는 Forecasting: principles and practice 3rd의 약자라고 합니다. library(fpp3) ## ─ Attaching packages ────────────────────── fpp3 0.4.0 ─ ## ✓ tibble 3.1.2 ✓ tsibble 1...

[R] 14. 피벗팅(pivotting)

피벗팅 과거 포스팅에서 spread()와 gather() 함수에 대해서 설명드린적이 있습니다. 데이터를 long format 또는 wide format으로 변환시키는 방법에 대한 설명입니다. 이번에는 같은 내용이지만 tidyverse 라이브러리에 있는 다른 함수를 사용하는 방법에 대해서 말씀드리겠습니다. 물론 spread(), gather() 함수 역시 같이 구동되는 tidyr 라이브러리의 내장 함수입니다만, 사용성을 더 개선한 함수가 있습니다. 예시로 쓰일 데이터 예제 set.seed(2021) # 임의로 데이터를 생성한다. (100명의 유저가 특정 곡을 스트리밍한 이력) temp % mutate( song_class_flag = case_when( song_id %in% c("d", "e", "f")..

[R] purrr 라이브러리 내 map() 함수 이해하기

## [1] "ko_KR.UTF-8" purrr 이번 포스팅에서는 purrr 라이브러리에서 주로 다루는 함수에 대해서 정리해보겠습니다. purrr 라이브러리는 tidyverse 라이브러리를 구동할 때 같이 불러오는 라이브러리 중 하나 입니다. tidyverse에서 purrr를 소개하기로는.. 함수형 프로그래밍 도구(functional programming toolkit)라는 표현을 하고 있습니다. 여기서는 purrr 라이브러리 내 map() 함수에서만 짧게 소개하겠습니다. map_*() 여러 함수(커스텀 함수 등을 포함)들을 적용하여 반복 계산을 조금 더 용이하게 해주는 함수입니다. 일단 기본함수인 map()은 객체 .x에 대해 특정 함수 .f를 적용하여 해당 결과를 리스트로 출력해줍니다. map(.x,..

[R] 1. Tidy text format

1. The tidy text format tidy text format을 행(row)당 하나의 토큰(token)이 있는 테이블로 정의합니다. 토큰은 분석에서 사용하고자 하는 “단어”와 같이 의미가 있는 텍스트 단위를 의미합니다. 물론 토큰은 단일 단어 뿐만 아니라 n-gram, 문장 또는 단락 등이 될 수도 있습니다. 행당 하나의 토큰 구조를 만들기 위해서는 토큰화(tokenization)를 거쳐야 합니다. 1. 1. Contrasting tidy text with other data structures 문자열(String): 문자열, 즉 문자 벡터 말뭉치(Corpus): 이러한 유형은 일반적으로 메타데이터 및 세부정보로 주석이 달린 원시 문자열 등이 포함 문서-단어 행렬(Document-term ma..