[R] 데이터 불러오기
반응형
1. 기본 워크 스페이스 디렉토리 확인
getwd()
함수를 이용하여 Default Working Directory를 확인할 수 있습니다.
getwd()
## [1] "/Users/kakao1/Desktop/Jade_logging/basic"
- 만일 새로운 경로로 Working Directory를 설정하고 싶다면
setwd()
함수를 이요하여 설정할 수 있습니다.
setwd("/Users/kakao1/Desktop/Jade_logging")
2. CSV 파일 불러오기
- CSV 파일을 데이터 프레임(data.frame)으로 읽어들이려면
read.csv()
기본 내장 함수를 이용합니다. - 코드와 파라미터에 대한 설명은 아래와 같습니다.
- file : 파일 경로 및 파일명
- header = FALSE : 파일의 첫 행을 변수명으로 처리할 것인지 여부
- sep = "" : 각 관측치를 구분하는 구분자 지정, 구분이 tab일 경우 sep = "
- na.strings = “NA” : 데이터에 결측치가 포함되어 있을 경우 R에서 NA로 대응시킬 값을 지정
- stringsAsFactors : 문자열을 팩터로 저장할 지 또는 문자열로 저장할 지 여부를 지정하는데 사용
read.csv(
file,
header = FALSE,
sep = "",
na.strings = "NA",
stringAsFactors = default.stringAsFactors()
)
- 작업중인 데이터 프레임을 CSV로 저장하려면
write.csv()
함수를 사용합니다. - 코드와 파라미터에 대한 설명은 아래와 같습니다.
- x : 파일에 저장할 데이터 프레임
- file = "" : 데이터를 저장할 파일 경로 및 파일명
- row.names = TRUE : TRUE일 경우 행 이름을 CSV 파일에 포함하여 저장
write.csv(
x,
file = "",
row.names = TRUE
)
- 이 밖에
.txt
파일을 로드할 때read.table()
함수를 사용하며 포맷이나 파라미터는 거의 동일합니다.
3. Excel 파일 불러오기
xlsx
라이브러리 안에 내장되어 있는 read.xlsx() 함수를 이용할 수 있습니다.- 먼저
xlsx
라이브러리를 설치한 후 불러옵니다.
install.packages("xlsx")
library(xlsx)
read.xlsx()
함수의 arguments는 아래와 같습니다.- file : 파일 경로 및 파일명
- sheetIndex : 엑셀 파일 안에서 몇 번째 시트를 불러들일 것인지 지정
- read.xlsx() 함수의 특징은 Excel 파일이 A1셀부터 시작하지 않더라도 자동으로 데이터가 시작되는 부분과 끝 부분을 찾아서 로딩
read.xlsx(
file,
sheetIndex,
header = TRUE,
stringsAsFactors = TRUE
)
- 이 밖에 불러오는데 수동으로 설정해야할 부분이 있다면 startRow, colIndex, rowIndex 등의 arguments를 별도로 지정하면 됩니다.
4. SAS 데이터 파일 불러오기
sas7bdat
라이브러리 안에 내장되어 있는read.sas7bdat()
함수를 이용할 수 있습니다.- 마찬가지로
sas7bdat
라이브러리를 설치한 후 불러옵니다.
install.packages("sas7bdat")
library(sas7bdat)
read.sas7bdat()
함수의 arguments는 다음과 같습니다.
read.sas7bdat(
file,
debug = FALSE
)
5. SPSS 데이터 파일 불러오기
foreign
라이브러리 안에 내장되어 있는read.spss()
함수를 이용할 수 있습니다.- 동일하게
foreign
라이브러리를 설치한 후 불러옵니다.
install.packages("foreign")
library(foreign)
read.spss()
함수의 arguments는 다음과 같습니다.
read.spss(
file,
use.value.labels = TRUE,
to.data.frame = FALSE
)
반응형
'Basic' 카테고리의 다른 글
[R] 적합도 검정 (0) | 2017.07.04 |
---|---|
[R] 범주형 자료에서 독립성 검정 (0) | 2017.07.04 |
[R] 표본 추출 (0) | 2017.07.03 |
[R] 난수생성과 기초통계량 (0) | 2017.07.03 |
[R] 기본 plot 함수 (1) | 2017.07.03 |
TAGS.