Loading...

[R] 추정 및 검정

1. 하나의 모평균(일표본 평균) 2. 두 개의 모평균(독립 이표본 평균) 3. 짝지은 이표본 평균 4. 이표본 분산 이번 포스팅에서는 평균, 분산, 비율에 대한 추정(inference) 및 검정(test)하는 방법에 대해서 말씀드리겠습니다. 주로 설명할 추정은 구간 추정에 대한 부분입니다. 예를 들면, 평균의 구간 추정은 데이터로부터 표본을 추출하여 표본평균을 구한 뒤 전체 데이터의 평균이 어떤 구간 \([a, b]\)안에 있다고 말하는 것 입니다. 1. 하나의 모평균(일표본 평균) 하나의 모집단으로부터 표본을 추출하고 표본으로부터 모집단 평균의 신뢰구간을 구하는 방법에 대해서 살펴보겠습니다. 이론적 배경 확률변수 \(X_{1}, X_{2}, ..., X_{n}\)이 서로 독립이고 정규분포 \(N(\m..

[R] 상관 분석

1. Correlation Analysis 2. Pearson Correlation Coefficient 2. 1. Visualization of correlation coefficient 3. Spearman’s Rank Correlation Coefficient 4. Kendal’s Rank Correlation Coefficient 5. Correlation Test 1. Correlation Analysis 상관분석(Correlation Analysis)은 두 확률 변수 사이의 관련성을 파악하는 방법입니다. 상관 계수(Correlation coefficient)는 두 변수 간 관련성의 정도를 의미하며 이를 계산하는 방법에는 피어슨 상관계수, 스피어만 상관계수, 켄달의 순위 상관계수 등이 있습니다...

[R] 적합도 검정

## [1] "ko_KR.UTF-8" 1. Chi-square test 대부분의 통계적 모형에서는 종종 데이터가 특정 분포를 따름을 가정으로 합니다. 특히 데이터의 크기가 충분히 많다면 데이터가 정규 분포를 따름을 별 의심 없이 가정하기도 합니다. 하지만 실제로 그 분포를 따르는지 확인해볼 필요도 있습니다. 이와 관련하여 여러 방법이 존재하지만 이 때도 독립성 검정과 마찬가지로 분할표를 작성한 후 카이제곱검정을 사용할 수 있습니다. 이전 포스팅에서 했던 방식과 동일하게 예제를 통해 설명드리겠습니다. 데이터는 MASS 라이브러리에 내장되어 있는 survey 데이터를 사용합니다. library(MASS) data(survey) survey는 학생 설문 조사 데이터입니다. str() 함수를 이요해서 데이터의 ..

[R] 범주형 자료에서 독립성 검정

Brief description : Test of independence 분할표에 행에 나열된 변수와 열에 나열된 변수가 독립이라고 가정한다면, 각 \(i\)번째 행, \(j\)번째 열의 셀 확률 값을 \(P(i,j)\)라고 할 때 다음이 성립됩니다. \[P(i, j) = P(i) \times P(j)\] 여기서 말하는 독립성 검정은 실제로 이와 같은 가정이 성립하는 지 알아보는 것을 목표로 합니다. 변수 간의 독립성 검정에는 카이제곱 검정(Chi-Squared Test)을 사용하며 이 때 사용하는 통계량은 아래와 같습니다. \[\sum^{r}_{i=1} \sum^{c}_{j=1} \frac{O_{ij}- E_{ij}}{E_{ij}} \sim \chi^{2}_{(r-1)(c-1)}\] - 위 식에서 \(..