Loading...

[R] 9. 기술통계분석

0. 예시로 쓰일 데이터 예제 set.seed(2021) # 임의로 데이터를 생성한다. (100명의 유저가 특정 곡을 스트리밍한 이력) temp % mutate( song_class_flag = case_when( song_id %in% c("d", "e", "f") ~ "인기곡", TRUE ~ "비인기곡" ) ) temp ## # A tibble: 150 x 7 ## user_id user_age user_gender song_id streaming_count download_count ## ## 1 10000 44 여성 e 20 6 ## 2 10001 47 남성 f 21 6 ## 3 10002 49 남성 k 14 3 ## 4 10003 44 남성 j 8 4 ## 5 10004 26 여성 f 20 5 ..

[R] 4. select(), filter(), group_by(), summarise(), arrange(), rename()

0. 예시로 쓰일 데이터 예제 set.seed(2021) # 임의로 데이터를 생성한다. (100명의 유저가 특정 곡을 스트리밍한 이력) temp % select(-song_id, -streaming_count) ## # A tibble: 100 x 2 ## user_id user_age ## ## 1 10000 32 ## 2 10001 43 ## 3 10002 41 ## 4 10003 30 ## 5 10004 38 ## 6 10005 40 ## 7 10006 38 ## 8 10007 27 ## 9 10008 44 ## 10 10009 49 ## # … with 90 more rows 데이터 분석을 위해 전처리를 하는 작업을 거치다보면서 변수명에 _id 와 같이 특정 변수명 규칙을 발견할 수 있습니다. 이..