# 데이터 읽기
null_test <- read.csv('data/null_test.csv',fileEncoding='UTF-8',header=TRUE, stringsAsFactors=FALSE)

# 전체 데이터 확인
null_test

   a    b    c
1 EE   NA   NA
2 DD  312   45
3 EE   NA  456
4 BB  567 5678
5 CC  345  456
6 AA  678   NA
7 KK 7465   23
8 AA   NA  456
9 EE 4523  435

# b,c열 null 데이터 확인 (1,3,6,8행)
null_test %>%
  filter(is.na(b) | is.na(c))

   a   b   c
1 EE  NA   NA 
2 EE  NA  456
3 AA 678  NA  
4 AA  NA  456


#drop_na 함수로 b 가 null인 레코드를 제거한다 (1,3,8행)
null_test %>%
  drop_na(b)

   a    b    c
2 DD  312   45
4 BB  567 5678
5 CC  345  456
6 AA  678   NA
7 KK 7465   23
9 EE 4523  435



#drop_na 함수로 null_test 데이터 프레임에 있는 모든 열 중 null 값 있는 행을 모두 제거한다
null_test %>%
  drop_na()

  a    b    c
2 DD  312   45
4 BB  567 5678
5 CC  345  456
7 KK 7465   23
9 EE 4523  435

#na.omit 함수로 null_test 데이터 프레임에 있는 모든 열 중 null 값 있는 행을 모두 제거한다
na.omit(null_test)

  a    b    c
2 DD  312   45
4 BB  567 5678
5 CC  345  456
7 KK 7465   23
9 EE 4523  435

 

#replace_na 함수로 null 값을 지정한 값으로 치환하는 함수
null_test %>%
  replace_na(list(b='AAAAAAAAA',c='LLLLLLL'))

a         b       c
1 EE AAAAAAAAA LLLLLLL
2 DD       312      45
3 EE AAAAAAAAA     456
4 BB       567    5678
5 CC       345     456
6 AA       678 LLLLLLL
7 KK      7465      23
8 AA AAAAAAAAA     456
9 EE      4523     435

 

'IT > R (데이터전처리대전 따라하기)' 카테고리의 다른 글

R 날짜, 시간 계산  (0) 2020.03.26
R null 값을 평균값으로 보완  (0) 2020.02.03
R 조건에 따라 조인할 마스터 테이블 변경하기  (0) 2020.01.18
R 조인  (0) 2020.01.12
R 순위 구하기  (0) 2020.01.09
Posted by 소율소희아빠

블로그 이미지
소율소희아빠

공지사항

Yesterday
Today
Total

달력

 « |  » 2025.5
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

최근에 올라온 글

최근에 달린 댓글

글 보관함