Loading...

Symbolic Data Analysis : Interval-valued data

1. 심볼릭 데이터 분석 (Symbolic Data Analysis) 1. 1. 구간형 자료 (Interval-valued Data) 2. 구간형 자료의 선형 회귀 모형 2. 1. Center Method (CM) 2. 2. Center and Range Method (CRM) 2. 3. Constrained Center and Range Method (CCRM) 2. 4. Symbolic Covariance Method (SCM) 2. 5. Monte Carlo Method (MCM) 3. 구간형 자료의 비선형 회귀 모형 3. 1. Nonlinear Regression Method (NLM) 1. 심볼릭 데이터 분석 (Symbolic Data Analysis) AI의 성능이 빠르게 발전되는 주요 원인 ..

Document Classification - Basic

Document Classification - Basic 1. tm package 2. 변환 3. 문서의 행렬 표현 4. 단어 빈도 5. 단어 간 상관관계 1. tm package 공부했다면 흔히 볼 수 있는 예시 이메일의 스팸메일 여부를 구분하는 것이 대표적인 문서 분류의 예시입니다. 또 다른 예시로는 제품 리뷰 글을 보고 해당 리뷰가 긍정인지 부정인지 구분하는 감성 분석(Sentiment Analysis)도 있습니다. tm 패키지는 텍스트마이닝 패키지 중 하나로 문서의 집합은 Corpus로, 각 문서는 TextDocument로 표현됩니다. 한글로 텍스트마이닝은 한글형태소가 잘되어 있는 패키지 KoNLP 등을 병행하여 같이 이용하시면 됩니다. 이번 예제에서는 기본이기때문에 내장되어진 영어로된 문서를 이..

협업 필터링 추천 시스템 구축하기

협업 필터링 추천 시스템 구축하기 1. recommenderlab 패키지 설치 2. 데이터 탐색 3. 사용자 기반 협업 필터링 (UBCF) 3. 1. 모델링 3. 2. 데이터 탐색 3. 3. 모형 평가 4. 아이템 기반 협업 필터링 (IBCF) 4. 1. 모델링 4. 2. 모형 평가 4. 3. 매개변수 튜닝 1. recommenderlab 패키지 설치 recommenderlab 패키지는 추천 엔진 구축에 사용되는 사용자 기반의 협업 필터와 아이템 기반의 협업 필터, SVD, 연관성 규칙 기반 알고리즘과 같은 추천 알고리즘을 개발하고 테스트하기 위한 R 패키지입니다. library(recommenderlab) recommenderlab 패키지에는 기본 데이터 세트가 제공됩니다. data_packages

추천 엔진에 이용되는 데이터 마이닝 기법

1. 이웃 기반 기법 1. 1. 유클리드 거리 1. 2. 코사인 유사도 1. 3. 자카드 유사도 1. 4. 피어슨 상관계수 2. 수학적 모델링 기법 2. 1. 행렬 인수 분해 2. 2. 교대 최소 제곱 3. 3. 특이값 분해 3. 머신 러닝 기법 : 분류 모델 3. 1. 로지스틱 회귀 3. 2. kNN 분류 3. 3. 서포트 벡터 머신 4. 클러스터링 기법 5. 차원축소 : 주성분 분석 6. 벡터 공간 모델 6. 1. 단어 빈도 6. 2. 단어 빈도-역문서 빈도 7. 평가 기법 1. 이웃 기반 기법 추천 시스템은 아이템이나 사용자 사이의 유사성에 대한 개념을 기반으로 동작합니다. 이러한 이웃 메소드는 두 사용자나 아이템 사이의 유효한 정보를 두 개의 벡터로 간주하며, 이 두 벡터에 간단한 수학적 계산을 ..