Loading...

[R] 한글 형태소 분석

형태소 추출 관련 라이브러리 R의 대표적인 한국어 형태소 분석기로는 RcppMeCab와 KoNLP가 있습니다. 라이브러리 설치 가이드로 아주 잘 정리된 페이지가 있어서 아래에 첨부드립니다. https://mrchypark.github.io/textR/installation#1 https://github.com/mrchypark/textR/blob/master/docs/installation.pdf RcppMeCab library(RcppMeCab) pos() 함수는 문장의 형태소를 분리해주는 역할을 하는 함수 입니다. # 한글이 깨지는 경우 `enc2utf8()` 함수를 이용해 인코딩을 UTF-8로 변경해줍니다. test % pos() ## $`한글 테스트 입니다.` ## [1] "한글/NNG" "테스트..

[R] 텍스트 데이터 분석을 위한 라이브러리 준비

tidyverse, tidytext library(tidyverse) ## ─ Attaching packages ──────────────────── tidyverse 1.3.1 ─ ## ✓ ggplot2 3.3.5 ✓ purrr 0.3.4 ## ✓ tibble 3.1.2 ✓ dplyr 1.0.7 ## ✓ tidyr 1.1.3 ✓ stringr 1.4.0 ## ✓ readr 1.4.0 ✓ forcats 0.5.1 ## ─ Conflicts ───────────────────── tidyverse_conflicts() ─ ## x dplyr::filter() masks stats::filter() ## x dplyr::lag() masks stats::lag() library(tidytext) 텍스트 데이..