R 데이터 처리 실습해보기 - 1
오늘은 예제 샘플 데이터를 가지고 R로 데이터를 가져와서 확인하는 방법에 대하여 실습해보려 합니다.
주석
주석을 쓸 때, 주석 바로 밑에 명령줄이 있다면 명령이 실행되면서 출력되고
#이론#####
또는
#####이론#####
위와 같이 만들면 책갈피 기능이 생깁니다.
데이터 입력
- csv 데이터 가져오기
read.csv()
read.delim(file = "",sep = ",")
read.table(file = "",sep = ",")
위와 같이 다양한 방식으로 데이터를 가져올 수 있습니다.
또한 구분자를 지정하면 칸이 나누어지면서 구분됩니다.
- tsv 데이터 가져오기
read.table(file = "",sep = ",")
이 또한 위와 같이 데이터를 가져올 수 있습니다.
- 일반적인 데이터 가져오기
read.delim(file = "",sep = ":")
보통 read.delim으로 하는 게 보편적으로 쓰인다고 합니다.
실습 코드
# 본 예제는 인프런 R을 R려줘 강의의 예제로 진행되었습니다.
aws = read.delim(file = "AWS_sample.txt",sep = "#",stringsAsFactors = FALSE)
print(aws)
우선 파일을 확장자를 포함한 이름으로 써준 뒤, 구분자는 #으로 하고, stringsAsFactors를 FALSE로 해줍니다.
이 옵션은 벡터로 자동 변환되는 것인데, 기본이 켜짐이므로 꺼줘야 합니다.
만약 파일이 없다고 뜨면, R의 작업 폴더에 있는지 확인하기 위해
getwd()
list.files()
위 명령어를 입력하고 살펴봅니다.
각각 작업 경로를 보여주고, 작업 경로의 파일을 보여줍니다.
그리고 너무 긴 파일이라 출력이 일부분밖에 안되면
options(max.print=999999)
최대 출력을 증가시켜줍니다.
상단/하단 확인
# 상단 행 확인
head(aws)
head(aws,10)
최상단 일부분만 확인할 때는 head 명령을 씁니다.
인자를 추가로 줘서 보여주는 양을 늘릴 수 있습니다.
# 하단 행 확인
tail(aws)
tail(aws,10)
최하단 일부분만 확인할 때는 tail 명령을 씁니다.
인자를 추가로 줘서 보여주는 양를 늘릴 수 있습니다.
객체 구조 확인
# 객체 구조 확인
str(aws)
객체와 변수의 갯수와 타입을 조회할 수 있습니다.
통계 확인
# 변수의 기술 통계
summary(aws)
각 변수의 통계를 집계할 수 있습니다.
행과 열 갯수
# 행 갯수 확인
nrow(aws)
# 열 갯수 확인
ncol(aws)
length(aws)
# 행/열 갯수 확인
dim(aws)
행과 열의 갯수를 정수로 반환해줍니다.
다같이 보려면 dim이라는 명령을 쓰면 됩니다.
변수명과 데이터 형태 확인
# 변수명 확인
colnames(aws)
names(aws)
변수명을 확인 할 때는 두 가지 방식이 존재합니다.
# 데이터 형태 확인
class(aws)
데이터의 타입을 알아보고 싶을때 class 명령을 사용하면 됩니다.
내용이 많아서 부득이하게 다음 내용은 다음날 다음 포스팅에서 작성됩니다 :)