상세 보기
금융 시계열 데이터에 대한 표현학습 성능 개선을 위한 확장된 사전학습 데이터셋 구축 방안
초록
시계열 데이터에 대한 표현학습이 최근 다수 제시되고 있으나 시계열 데이터의 특성 상 도메인과 시간 단위가 모두 일치하는 다량의 데이터를 모으기는 어려울 수 있다. 이에 본 논문에서는 금융 시계열 데이 터에 대한 표현학습의 성능을 높이기 위해 사전학습 데이터셋을 확장할 때 같은 도메인을 유지하는 것이 더 중요한지 같은 시간 단위를 유지하는 것이 더 중요한지에 대해 연구하였다. 그 결과 도메인이 다르더 라도 같은 시간 단위의 데이터들을 활용하는 것이 미세조정 후의 모델 성능에 더 긍정적으로 작용한다는 것을 확인할 수 있었
- 제목
- 금융 시계열 데이터에 대한 표현학습 성능 개선을 위한 확장된 사전학습 데이터셋 구축 방안
- 저자
- Do-Guk Kim
- 학회명
- 한국정보과학회 한국컴퓨터종합학술대회