상세 보기
미세먼지 자료에서의 결측치 대체 방법 비교
Comparision of Missing Imputaion Methods In fine dust data
- 김연진;
- 박헌진
초록
자료 분석에 있어서 결측치 대체는 큰 이슈중 하나이다. 결측치의 발생을 무시하고 분석을 진행하게 되면, bias가 발생하여 그에 따른 추정치에 대해 잘못된 결과를 줄 수 있다. 이 논문에서는 미세먼지자료에서 발생한 결측치를 적절한 대체 방법을 찾아 적용하자 한다. 이를 통해 시계열 자료에서 발생한 결측치를 R을 기반으로 한MICE, MissForest 등의 기존 방법과 시계열 기반 모델을 사용하여 여러 가지 상황에 대한 시뮬레이션을 설정해 비교해 밝히고자 하였다. 이 결과에 대해 각각을 변수 별로 비교하였을때 ImputeTS 패키지를 이용한 auto arima 모델의 kalman filter를 적용한 모형과 MissForest 모형이 미세먼지자료 결측치 대체에서는 좋은 결과를 주는 것으로 판단되었다.
키워드
Missing Imputataion; Climate Data; MICE; MissForest; ImputeTS; 결측치 대체; 미세먼지 자료; MICE; MissForest; ImputeTS
- 제목
- 미세먼지 자료에서의 결측치 대체 방법 비교
- 제목 (타언어)
- Comparision of Missing Imputaion Methods In fine dust data
- 저자
- 김연진; 박헌진
- 발행일
- 2019-12
- 유형
- Y
- 저널명
- 한국빅데이터학회 학회지
- 권
- 4
- 호
- 2
- 페이지
- 105 ~ 110