quantization 태그가 달린 모든 블로그 글.
AI의 양자화는 가중치와 활성화의 수치 정밀도를 낮춰 신경망이 더 빠르게 실행되고 메모리를 덜 사용하도록 하는 모델 압축 기법으로, 정확도 손실은 미미한 경우가 많습니다.