[R] 데이터 불러오기

반응형

1. 기본 워크 스페이스 디렉토리 확인

  • getwd() 함수를 이용하여 Default Working Directory를 확인할 수 있습니다.
getwd()
## [1] "/Users/kakao1/Desktop/Jade_logging/basic"

 

  • 만일 새로운 경로로 Working Directory를 설정하고 싶다면 setwd() 함수를 이요하여 설정할 수 있습니다.
setwd("/Users/kakao1/Desktop/Jade_logging")





2. CSV 파일 불러오기

  • CSV 파일을 데이터 프레임(data.frame)으로 읽어들이려면 read.csv() 기본 내장 함수를 이용합니다.
  • 코드와 파라미터에 대한 설명은 아래와 같습니다.
    • file : 파일 경로 및 파일명
    • header = FALSE : 파일의 첫 행을 변수명으로 처리할 것인지 여부
    • sep = "" : 각 관측치를 구분하는 구분자 지정, 구분이 tab일 경우 sep = "
    • na.strings = “NA” : 데이터에 결측치가 포함되어 있을 경우 R에서 NA로 대응시킬 값을 지정
    • stringsAsFactors : 문자열을 팩터로 저장할 지 또는 문자열로 저장할 지 여부를 지정하는데 사용
read.csv(
  file,
  header = FALSE,
  sep = "",
  na.strings = "NA",
  stringAsFactors = default.stringAsFactors()
)

 

  • 작업중인 데이터 프레임을 CSV로 저장하려면 write.csv() 함수를 사용합니다.
  • 코드와 파라미터에 대한 설명은 아래와 같습니다.
    • x : 파일에 저장할 데이터 프레임
    • file = "" : 데이터를 저장할 파일 경로 및 파일명
    • row.names = TRUE : TRUE일 경우 행 이름을 CSV 파일에 포함하여 저장
write.csv(
  x,
  file = "",
  row.names = TRUE
)

 

  • 이 밖에 .txt 파일을 로드할 때 read.table() 함수를 사용하며 포맷이나 파라미터는 거의 동일합니다.





3. Excel 파일 불러오기

  • xlsx 라이브러리 안에 내장되어 있는 read.xlsx() 함수를 이용할 수 있습니다.
  • 먼저 xlsx 라이브러리를 설치한 후 불러옵니다.
install.packages("xlsx")
library(xlsx)
  • read.xlsx() 함수의 arguments는 아래와 같습니다.
    • file : 파일 경로 및 파일명
    • sheetIndex : 엑셀 파일 안에서 몇 번째 시트를 불러들일 것인지 지정
    • read.xlsx() 함수의 특징은 Excel 파일이 A1셀부터 시작하지 않더라도 자동으로 데이터가 시작되는 부분과 끝 부분을 찾아서 로딩
read.xlsx(
  file, 
  sheetIndex,
  header = TRUE,
  stringsAsFactors = TRUE
)
  • 이 밖에 불러오는데 수동으로 설정해야할 부분이 있다면 startRow, colIndex, rowIndex 등의 arguments를 별도로 지정하면 됩니다.





4. SAS 데이터 파일 불러오기

  • sas7bdat 라이브러리 안에 내장되어 있는 read.sas7bdat() 함수를 이용할 수 있습니다.
  • 마찬가지로 sas7bdat 라이브러리를 설치한 후 불러옵니다.
install.packages("sas7bdat")
library(sas7bdat)
  • read.sas7bdat() 함수의 arguments는 다음과 같습니다.
read.sas7bdat(
  file, 
  debug = FALSE
)





5. SPSS 데이터 파일 불러오기

  • foreign 라이브러리 안에 내장되어 있는 read.spss() 함수를 이용할 수 있습니다.
  • 동일하게 foreign 라이브러리를 설치한 후 불러옵니다.
install.packages("foreign")
library(foreign)
  • read.spss() 함수의 arguments는 다음과 같습니다.
read.spss(
  file, 
  use.value.labels = TRUE,
  to.data.frame = FALSE
)
반응형

'Basic' 카테고리의 다른 글

[R] 적합도 검정  (0) 2017.07.04
[R] 범주형 자료에서 독립성 검정  (0) 2017.07.04
[R] 표본 추출  (0) 2017.07.03
[R] 난수생성과 기초통계량  (0) 2017.07.03
[R] 기본 plot 함수  (1) 2017.07.03
TAGS.

Comments