Impact of DNN Model Partitioning for Mobile AI Services

모바일 AI 서비스를 위한 DNN 모델 파티셔닝 효율성 분석

초록

최근, 모바일 단말 및 AI 임베디드 단말의 물체 인식 및 비디오 분석과 같은 실시간 모바일 AI 서비스는 높은 정확도의 심층신경망 (DNN)을 사용하여 모바일 단말의 에너지 소모 감소와 추론 속도 향상 등 사용자 경험 향상에 집중하고 있다. 본 논문에서는 모바일 AI 서비스를 위한 DNN 모델 파티셔닝의 효율성에 대해 분석한다. 특히, DNN 모델 파티셔닝이 DNN모델 추론의 단대단 지연 시간, 모바일 단말의 에너지 소모, 그리고 추론 속도에 끼치는 영향을 분석하며, DNN모델 파티셔닝을 통해 모바일 AI 서비스 사용자 경험 향상을 꾀할 수 있음을 확인한다.

제목
Impact of DNN Model Partitioning for Mobile AI Services
제목 (타언어)
모바일 AI 서비스를 위한 DNN 모델 파티셔닝 효율성 분석
저자
Yeongjin Kim
학회명
HE 32nd JOINT CONFERENCE ON COMMUNICATIONS AND INFORMATION
개최지
속초 소노캄 델피노
학회 개최일
2022-04-27 ~ 2022-04-29