Todas las entradas del blog etiquetadas con self-attention.
El Transformer es una arquitectura de red neuronal basada en autoatención que impulsa los grandes modelos de lenguaje actuales. Descubre cómo funciona y por qué es importante.