Loading...

Tree Models

Tree Models 1. 의사결정나무(Decision tree) 1. 1. 노드를 나누는 기준 2. 적용 2. 1. rpart() 2. 2. ctree() 3. 랜덤 포레스트(Random Forest) 3. 1. randomForest() 1. 의사결정나무(Decision tree) 의사결정나무는 지니 불순도(Gini Impurity) 등의 기준을 사용하여 노드(node)를 재귀적으로 분할하면서 tree 모형을 만드는 방법입니다. if ~ then, else 의 조건문과 같은 형식으로 구성되어 있어서 이해하기 쉽고 처리속도가 비교적 빠르며, 여러 가지 feature들간의 상호 작용을 잘 표현해주고 다양한 데이터에 적용시킬 수 있다는 장점이 있습니다. 1. 1. 노드를 나누는 기준 노드에는 분류의 시작점..

Logistic Regression Model

Logistic Regression Model 1. glm() 2. glm() object fitting 3. predict() 4. Multinomial Logistic Regression : multinom() 1. glm() 로지스틱 회귀(Logistic Regression) 모형은 특정 데이터에서 설명변수 \(X\)에 의하여 반응변수의 분류의 형태가 \(Y\)일 확률을 \(p\), 반대로 \(N\)일 확률을 \(1-p\)로 가정할 때 다음과 같은 선형 모형을 가정합니다. \[\log\bigg(\frac{p}{1-p}\bigg)=\beta_0 + \beta_1X\] 우리가 흔히 알고 있는 선형 회귀(Linear Regression) 모형과 차이를 살펴본다면 일반 선형 회귀모형은 반응변수의 값이 확률..