Loading...

Tree Models

Tree Models 1. 의사결정나무(Decision tree) 1. 1. 노드를 나누는 기준 2. 적용 2. 1. rpart() 2. 2. ctree() 3. 랜덤 포레스트(Random Forest) 3. 1. randomForest() 1. 의사결정나무(Decision tree) 의사결정나무는 지니 불순도(Gini Impurity) 등의 기준을 사용하여 노드(node)를 재귀적으로 분할하면서 tree 모형을 만드는 방법입니다. if ~ then, else 의 조건문과 같은 형식으로 구성되어 있어서 이해하기 쉽고 처리속도가 비교적 빠르며, 여러 가지 feature들간의 상호 작용을 잘 표현해주고 다양한 데이터에 적용시킬 수 있다는 장점이 있습니다. 1. 1. 노드를 나누는 기준 노드에는 분류의 시작점..

Logistic Regression Model

Logistic Regression Model 1. glm() 2. glm() object fitting 3. predict() 4. Multinomial Logistic Regression : multinom() 1. glm() 로지스틱 회귀(Logistic Regression) 모형은 특정 데이터에서 설명변수 \(X\)에 의하여 반응변수의 분류의 형태가 \(Y\)일 확률을 \(p\), 반대로 \(N\)일 확률을 \(1-p\)로 가정할 때 다음과 같은 선형 모형을 가정합니다. \[\log\bigg(\frac{p}{1-p}\bigg)=\beta_0 + \beta_1X\] 우리가 흔히 알고 있는 선형 회귀(Linear Regression) 모형과 차이를 살펴본다면 일반 선형 회귀모형은 반응변수의 값이 확률..

[R] apply 계열 함수

1. apply() 2. lapply() 3. sapply() 4. tapply() R에서는 벡터, 행렬 또는 데이터 프레임에 어떠한 임의의 함수를 적용하고 그 결과를 받기 위한 apply 계열 함수가 존재합니다. 이를 간단하게 정리해보았습니다. 함수 설명 apply() array 또는 matrix에 주어진 함수를 적용한 뒤 그 결과를 vector, array, list로 반환 lapply() vector, list 또는 표현식에 함수를 적용하여 그 결과를 list로 반환 sapply() lapply()와 유사하지만 결과를 vector, matrix 또는 array로 반환 tapply() 벡터에 있는 데이터를 특정 기준에 따라 그룹으로 묶은 뒤 그룹마다 주어진 함수를 적용하고 그 결과를 반환 mapply..

[R] ggplot2 활용 데이터 시각화 예시

1. Introduction 1. 1. The mpg data frame 2. Creating a ggplot 2. 1. A graphing template 2. 2. Aesthetic mappings 2. 3. Facets 2. 4. Geometric objects 2. 5. Statistical transformations 2. 6. Position adjustments 2. 7. Coordinate systems 1. Introduction 이번 포스팅에서는 ggplot2 패키지를 사용하여 데이터를 시각화 하는 방법을 설명하겠습니다. ggplot2 패키지는 그래픽을 출력하는 R 패키지로 가장 우아하고 가장 다재다능하며일정 문법을 따르는 깊이 있는 그래픽 패키지 중 하나입니다. ggplot2의 이론적..