Impact of DNN Model Partitioning for Mobile AI Services

Yeongjin Kim

상세 보기

Impact of DNN Model Partitioning for Mobile AI Services

모바일 AI 서비스를 위한 DNN 모델 파티셔닝 효율성 분석

Yeongjin Kim

초록

최근, 모바일 단말 및 AI 임베디드 단말의 물체 인식 및 비디오 분석과 같은 실시간 모바일 AI 서비스는 높은 정확도의 심층신경망 (DNN)을 사용하여 모바일 단말의 에너지 소모 감소와 추론 속도 향상 등 사용자 경험 향상에 집중하고 있다. 본 논문에서는 모바일 AI 서비스를 위한 DNN 모델 파티셔닝의 효율성에 대해 분석한다. 특히, DNN 모델 파티셔닝이 DNN모델 추론의 단대단 지연 시간, 모바일 단말의 에너지 소모, 그리고 추론 속도에 끼치는 영향을 분석하며, DNN모델 파티셔닝을 통해 모바일 AI 서비스 사용자 경험 향상을 꾀할 수 있음을 확인한다.

제목: Impact of DNN Model Partitioning for Mobile AI Services

제목 (타언어): 모바일 AI 서비스를 위한 DNN 모델 파티셔닝 효율성 분석

저자: Yeongjin Kim

학회명: HE 32nd JOINT CONFERENCE ON COMMUNICATIONS AND INFORMATION

개최지: 속초 소노캄 델피노

학회 개최일: 2022-04-27 ~ 2022-04-29