2020. 2. 2. 00:42 IT/R (데이터전처리대전 따라하기)
R null 값 찾기, 제거, 치환(nvl)
# 데이터 읽기
null_test <- read.csv('data/null_test.csv',fileEncoding='UTF-8',header=TRUE, stringsAsFactors=FALSE)
# 전체 데이터 확인
null_test
a b c
1 EE NA NA
2 DD 312 45
3 EE NA 456
4 BB 567 5678
5 CC 345 456
6 AA 678 NA
7 KK 7465 23
8 AA NA 456
9 EE 4523 435
# b,c열 null 데이터 확인 (1,3,6,8행)
null_test %>%
filter(is.na(b) | is.na(c))
a b c
1 EE NA NA
2 EE NA 456
3 AA 678 NA
4 AA NA 456
#drop_na 함수로 b 가 null인 레코드를 제거한다 (1,3,8행)
null_test %>%
drop_na(b)
a b c
2 DD 312 45
4 BB 567 5678
5 CC 345 456
6 AA 678 NA
7 KK 7465 23
9 EE 4523 435
#drop_na 함수로 null_test 데이터 프레임에 있는 모든 열 중 null 값 있는 행을 모두 제거한다
null_test %>%
drop_na()
a b c
2 DD 312 45
4 BB 567 5678
5 CC 345 456
7 KK 7465 23
9 EE 4523 435
#na.omit 함수로 null_test 데이터 프레임에 있는 모든 열 중 null 값 있는 행을 모두 제거한다
na.omit(null_test)
a b c
2 DD 312 45
4 BB 567 5678
5 CC 345 456
7 KK 7465 23
9 EE 4523 435
#replace_na 함수로 null 값을 지정한 값으로 치환하는 함수
null_test %>%
replace_na(list(b='AAAAAAAAA',c='LLLLLLL'))
a b c
1 EE AAAAAAAAA LLLLLLL
2 DD 312 45
3 EE AAAAAAAAA 456
4 BB 567 5678
5 CC 345 456
6 AA 678 LLLLLLL
7 KK 7465 23
8 AA AAAAAAAAA 456
9 EE 4523 435
'IT > R (데이터전처리대전 따라하기)' 카테고리의 다른 글
R 날짜, 시간 계산 (0) | 2020.03.26 |
---|---|
R null 값을 평균값으로 보완 (0) | 2020.02.03 |
R 조건에 따라 조인할 마스터 테이블 변경하기 (0) | 2020.01.18 |
R 조인 (0) | 2020.01.12 |
R 순위 구하기 (0) | 2020.01.09 |