Todas as publicações do blog etiquetadas com quantization.
A quantização em IA é uma técnica de compressão de modelos que reduz a precisão numérica dos pesos e das ativações, para que as redes neurais sejam mais rápidas e utilizem menos memória, frequentemente com perdas mínimas de precisão.