Todas las entradas del blog etiquetadas con quantization.
La cuantización en IA es una técnica de compresión de modelos que reduce la precisión numérica de los pesos y las activaciones para que las redes neuronales funcionen más rápido y consuman menos memoria, a menudo con una pérdida mínima de precisión.