Loading...

Document Classification - Basic

Document Classification - Basic 1. tm package 2. 변환 3. 문서의 행렬 표현 4. 단어 빈도 5. 단어 간 상관관계 1. tm package 공부했다면 흔히 볼 수 있는 예시 이메일의 스팸메일 여부를 구분하는 것이 대표적인 문서 분류의 예시입니다. 또 다른 예시로는 제품 리뷰 글을 보고 해당 리뷰가 긍정인지 부정인지 구분하는 감성 분석(Sentiment Analysis)도 있습니다. tm 패키지는 텍스트마이닝 패키지 중 하나로 문서의 집합은 Corpus로, 각 문서는 TextDocument로 표현됩니다. 한글로 텍스트마이닝은 한글형태소가 잘되어 있는 패키지 KoNLP 등을 병행하여 같이 이용하시면 됩니다. 이번 예제에서는 기본이기때문에 내장되어진 영어로된 문서를 이..

[R] DescTools

1. DescTools 패키지 2. Desc() function 1. DescTools 패키지 탐색적 데이터 분석에 유용한 패키지 중 하나로 변수와 관련된 기술통계량 및 간단한 그래프를 보기 위한 유용한 패키지 입니다. library(DescTools) 2. Desc() function Desc() 함수 하나면 각 변수들의 기초통계량을 구할 수 있습니다. Desc(mtcars, plotit = TRUE) ## ------------------------------------------------------------------------- ## Describe mtcars (data.frame): ## ## data.frame: 32 obs. of 11 variables ## ## Nr ColName C..

협업 필터링 추천 시스템 구축하기

협업 필터링 추천 시스템 구축하기 1. recommenderlab 패키지 설치 2. 데이터 탐색 3. 사용자 기반 협업 필터링 (UBCF) 3. 1. 모델링 3. 2. 데이터 탐색 3. 3. 모형 평가 4. 아이템 기반 협업 필터링 (IBCF) 4. 1. 모델링 4. 2. 모형 평가 4. 3. 매개변수 튜닝 1. recommenderlab 패키지 설치 recommenderlab 패키지는 추천 엔진 구축에 사용되는 사용자 기반의 협업 필터와 아이템 기반의 협업 필터, SVD, 연관성 규칙 기반 알고리즘과 같은 추천 알고리즘을 개발하고 테스트하기 위한 R 패키지입니다. library(recommenderlab) recommenderlab 패키지에는 기본 데이터 세트가 제공됩니다. data_packages

[R] 기계학습 과제...

1. Introduction 1. 1. Orange Juice(OJ) data 1. 2. Methods and functions 1. 3. Evaluate performance 2. Modeling 2. 1. Logistic regression 2. 2. Linear discriminant analysis 2. 3. Quadratic discriminant analysis 2. 4. k-Nearest neighbor 2. 5. Generalized additive models 2. 6. Classification trees 2. 7. Random forest 2. 8. Support vector machine 3. Conclusion 3. 1. Comparison Test MSE 3. 2. Summary..