상세 보기
생성 모델을 이용한 데이터 프리 양자화를 위한 Bit-width Aware Generator와 채널 어텐션 기반 중간 레이어 지식 증류
Bit-width Aware Generator and Intermediate Layer Knowledge Distillation using Channel-wise Attention for Generative Data-Free Quantization
- 백재용;
- 허두환;
- 김덕웅;
- 유용상;
- 신혁진;
- ... 배승환;
- 외 1명
초록
본 논문에서는 생성 모델을 이용한 데이터 프리 양자화에서 발생할 수 있는 지식 격차를 줄이기위하여 BAG (Bit-width Aware Generator)와 채널 어텐션 기반 중간 레이어 지식 증류를 제안한다. 생성 모델을 이용한 데이터 프리 양자화의 생성자는 오직 원본 네트워크의 피드백에만 의존하여 학습하기 때문에, 양자화된 네트워크의 낮은 bit-width로 인한 감소된 수용 능력 차이를 학습에 반영하지못한다. 제안한 BAG는 양자화된 네트워크와 동일한 bit-width로 양자화하여, 양자화된 네트워크에 맞는 합성 이미지를 생성하여 이러한 문제를 완화한다. 또한, 양자화된 네트워크와 원본 모델 간의 지식 격차를 줄이는 것 역시 양자화에서 매우 중요한 문제이다. 이를 완화하기 위해 제안한 채널 어텐션 기반 중간 레이어 지식 증류는 학생 모델이 교사 모델로부터 어떤 채널에 더 집중해서 학습해야하는지를 가르친다. 제안한 기법의 효율성을 보이기 위해, CIFAR-100에서 학습한 원본 네트워크를가중치와 활성값을 각각 3-bit로 양자화하여 학습을 수행하였다. 그 결과 56.14%의 Top-1 Accuracy를달성하였으며, 베이스라인 모델인 AdaDFQ 대비 3.4% 정확도를 향상했다.
키워드
뉴럴 네트워크 양자화; 데이터 프리 양자화; 생성 모델; 지식 증류; 어텐션 매커니즘; Neural Network Quantization; Data-free Quantization; Generative model; Knowledge Distillation; Attention Mechanism
- 제목
- 생성 모델을 이용한 데이터 프리 양자화를 위한 Bit-width Aware Generator와 채널 어텐션 기반 중간 레이어 지식 증류
- 제목 (타언어)
- Bit-width Aware Generator and Intermediate Layer Knowledge Distillation using Channel-wise Attention for Generative Data-Free Quantization
- 저자
- 백재용; 허두환; 김덕웅; 유용상; 신혁진; 박대현; 배승환
- 발행일
- 2024-07
- 유형
- Y
- 저널명
- 한국컴퓨터정보학회논문지
- 권
- 29
- 호
- 7
- 페이지
- 11 ~ 20