다중 표현을 활용한 다중 태스크 기반 암호화 트래픽 분류

Encrypted Traffic Classification based on Multi-Task Learning with Multi-modal representations

초록

최근 네트워크 트래픽의 암호화로 인해 페이로드를 깊이 디코딩하여 네트워크 트래픽을 분류하는 기법이 한계를 보이고 있다. 이의 대안으로 원시 바이트(raw byte)를 입력으로 받는 딥러닝 기반 분류 모델이 관심을 받고 있지만, VPN 등으로 이중으로 암호화된 트래픽 분류 응용에서 적절하게 동작하는지에 대해 의문을 제기하는 사례들이 늘고 있다. 이러한 배경 아래, 본 연구에서는 두 가지 입력 표현(원시 바이트와 패킷 메타데이터)을 함께 활용하는 다중 태스크 학습(Multi-Task Learning) 모델을 제안한다. 제안 모델은 여러 분류 과제를 동시에 학습함으로써 모델의 일반화 성능을 향상시키고, 원시 바이트와 패킷 메타데이터 간 상호보완적인 정보를 통합적으로 학습한다. 제안 모델의 성능을 MIT 링컨 연구소에서 공개한 VNAT 데이터셋으로 평가한 결과, 기존 연구보다 좋은 분류 성능을 확인하였다.

제목
다중 표현을 활용한 다중 태스크 기반 암호화 트래픽 분류
제목 (타언어)
Encrypted Traffic Classification based on Multi-Task Learning with Multi-modal representations
저자
Heejun Roh
학회명
2025 한국정보과학회 한국소프트웨어종합학술대회 (KSC 2025)
개최지
전라남도 여수시
학회 개최일
2025-12-16 ~ 2025-12-19