R 데이터 처리 실습해보기 - 1

오늘은 예제 샘플 데이터를 가지고 R로 데이터를 가져와서 확인하는 방법에 대하여 실습해보려 합니다.

주석

주석을 쓸 때, 주석 바로 밑에 명령줄이 있다면 명령이 실행되면서 출력되고

#이론#####

또는

#####이론#####

위와 같이 만들면 책갈피 기능이 생깁니다.

데이터 입력

  • csv 데이터 가져오기
read.csv()
read.delim(file = "",sep = ",")
read.table(file = "",sep = ",")

위와 같이 다양한 방식으로 데이터를 가져올 수 있습니다.

또한 구분자를 지정하면 칸이 나누어지면서 구분됩니다.

  • tsv 데이터 가져오기
read.table(file = "",sep = ",")

이 또한 위와 같이 데이터를 가져올 수 있습니다.

  • 일반적인 데이터 가져오기
read.delim(file = "",sep = ":")

보통 read.delim으로 하는 게 보편적으로 쓰인다고 합니다.

실습 코드

# 본 예제는 인프런 R을 R려줘 강의의 예제로 진행되었습니다.
aws = read.delim(file = "AWS_sample.txt",sep = "#",stringsAsFactors = FALSE)
print(aws)

우선 파일을 확장자를 포함한 이름으로 써준 뒤, 구분자는 #으로 하고, stringsAsFactors를 FALSE로 해줍니다.

이 옵션은 벡터로 자동 변환되는 것인데, 기본이 켜짐이므로 꺼줘야 합니다.

만약 파일이 없다고 뜨면, R의 작업 폴더에 있는지 확인하기 위해

getwd()
list.files()

위 명령어를 입력하고 살펴봅니다.

각각 작업 경로를 보여주고, 작업 경로의 파일을 보여줍니다.

그리고 너무 긴 파일이라 출력이 일부분밖에 안되면

options(max.print=999999)

최대 출력을 증가시켜줍니다.

상단/하단 확인

# 상단 행 확인
head(aws)
head(aws,10)

최상단 일부분만 확인할 때는 head 명령을 씁니다.

인자를 추가로 줘서 보여주는 양을 늘릴 수 있습니다.

# 하단 행 확인
tail(aws)
tail(aws,10)

최하단 일부분만 확인할 때는 tail 명령을 씁니다.

인자를 추가로 줘서 보여주는 양를 늘릴 수 있습니다.

객체 구조 확인

# 객체 구조 확인
str(aws)

객체와 변수의 갯수와 타입을 조회할 수 있습니다.

통계 확인

# 변수의 기술 통계
summary(aws)

각 변수의 통계를 집계할 수 있습니다.

행과 열 갯수

# 행 갯수 확인
nrow(aws)

# 열 갯수 확인 
ncol(aws)
length(aws)

# 행/열 갯수 확인 
dim(aws)

행과 열의 갯수를 정수로 반환해줍니다.

다같이 보려면 dim이라는 명령을 쓰면 됩니다.

변수명과 데이터 형태 확인

# 변수명 확인
colnames(aws)
names(aws)

변수명을 확인 할 때는 두 가지 방식이 존재합니다.

# 데이터 형태 확인
class(aws)

데이터의 타입을 알아보고 싶을때 class 명령을 사용하면 됩니다.

내용이 많아서 부득이하게 다음 내용은 다음날 다음 포스팅에서 작성됩니다 :)

Written on March 2, 2018