Loading...

단순 선형회귀분석

단순 선형회귀분석 1. 기초 설명 2. 모델링 3. 선형 회귀 결과 추출 3. 1. 회귀계수 3. 2. 적합된 값(fitted value) 3. 3. 잔차(residuals) 3. 4. 회귀 계수의 신뢰구간 3. 5. 잔차제곱합 4. 예측과 신뢰구간 5. 모형 평가 6. 모형 진단 그래프 7. 회귀직선의 시각화 1. 기초 설명 단순 선형 회귀(Simple Linear Regression)는 반응변수 \(Y_i\)를 하나의 설명변수 \(X_i\)로 설명합니다. 모형식은 다음과 같습니다. \[Y_i = \beta_0 + \beta_1 X_i + \epsilon_i\] 이 식에서 \(\beta_0\)는 절편, \(\beta_1\)은 설명변수 \(X_i\)의 계수이며, 이 들을 회귀 계수(regression c..

[R] 문자열 처리

1. 특정 부분 문자열 찾기 2. 문자열의 길이 파악 3. 여러 문자열을 하나로 합치기 4. 주어진 형식에 맞춰 문자열을 조합하기 5. 부분 문자열 추출 6. 특정 기준으로 부분 문자열 리스트 만들기 이번 포스팅에서는 R에서 자공하는 많은 문자열 함수 중 일부만 아주 간단히 체크하겠습니다. 드물지는 않지만 필요하실 때가 있으실수도 있을 것 같아서 올려봅니다. 많은 선택적인 인수는 생략할 것이기 때문에 이 점을 염두해주세요! 1. 특정 부분 문자열 찾기 grep() 함수는 문자열 벡터에서 특정 부분 문자열 패턴을 찾기 위한 함수입니다. grep() 함수에 대한 출력물로는 특정 패턴을 지니고 있는 벡터의 위치(index)가 출력됩니다. pattern : 찾고자 하는 문자열의 패턴 x : 문자열 벡터 x

[R] 추정 및 검정

1. 하나의 모평균(일표본 평균) 2. 두 개의 모평균(독립 이표본 평균) 3. 짝지은 이표본 평균 4. 이표본 분산 이번 포스팅에서는 평균, 분산, 비율에 대한 추정(inference) 및 검정(test)하는 방법에 대해서 말씀드리겠습니다. 주로 설명할 추정은 구간 추정에 대한 부분입니다. 예를 들면, 평균의 구간 추정은 데이터로부터 표본을 추출하여 표본평균을 구한 뒤 전체 데이터의 평균이 어떤 구간 \([a, b]\)안에 있다고 말하는 것 입니다. 1. 하나의 모평균(일표본 평균) 하나의 모집단으로부터 표본을 추출하고 표본으로부터 모집단 평균의 신뢰구간을 구하는 방법에 대해서 살펴보겠습니다. 이론적 배경 확률변수 \(X_{1}, X_{2}, ..., X_{n}\)이 서로 독립이고 정규분포 \(N(\m..

[R] 상관 분석

1. Correlation Analysis 2. Pearson Correlation Coefficient 2. 1. Visualization of correlation coefficient 3. Spearman’s Rank Correlation Coefficient 4. Kendal’s Rank Correlation Coefficient 5. Correlation Test 1. Correlation Analysis 상관분석(Correlation Analysis)은 두 확률 변수 사이의 관련성을 파악하는 방법입니다. 상관 계수(Correlation coefficient)는 두 변수 간 관련성의 정도를 의미하며 이를 계산하는 방법에는 피어슨 상관계수, 스피어만 상관계수, 켄달의 순위 상관계수 등이 있습니다...