실외공기측정기 자료를 이용한 도심 기상 예측 기계학습 모형 비교

Comparison of Machine Learning Techniques in Urban Weather Prediction using Air Quality Sensor Data

초록

최근 국가 관측망, 기업 공기 측정기 등을 통해 많고 다양한 기상 데이터가 수집되고 있다. 기계학습 기법을 통해 기상 예측하려는 노력이 곳곳에서 이루어지고 있으며, 국내 미세먼지는 농도가 증가해오고 사람들의 관심이 높아 가장 관심있는 예측 대상 중 하나이다. 본 연구에서는 서울시 전역에 설치된 840여 개실외공기측정기 데이터를 사용하여 PM10ㆍPM2.5 예측 모형을 비교하고자 한다. 5분 뒤 미세먼지 농도예측을 통해 실시간으로 정보를 제공할 수 있으며, 이는 10분ㆍ30분ㆍ1시간 뒤 예측 모형 개발에 기반이될 수 있다. 잡음 제거, 결측치 대체 등의 데이터 전처리를 진행하였고, 시ㆍ공간 변수를 고려할 수 있는 파생 변수를 생성하였다. 모형의 매개변수는 반응 표면 방법을 통해 선택하였다. XGBoost, 랜덤포레스트, 딥러닝(Multilayer Perceptron)을 예측 모형으로 사용하여, 미세먼지 농도와 예측값의 차이를 확인하고, 모형 간 성능을 비교하고자 한다.

키워드

PM10PM2.5machine learningspatio-temporal modelweather data미세먼지 농도기계학습시공간 모형기상 자료
제목
실외공기측정기 자료를 이용한 도심 기상 예측 기계학습 모형 비교
제목 (타언어)
Comparison of Machine Learning Techniques in Urban Weather Prediction using Air Quality Sensor Data
저자
박종찬박헌진
DOI
10.36498/kbigdt.2021.6.2.39
발행일
2021-12
유형
Y
저널명
한국빅데이터학회 학회지
6
2
페이지
39 ~ 49