
Los modelos de lenguaje a gran escala (LLM, por sus siglas en inglés) como ChatGPT, Gemini o Claude, entre otros, se han convertido en herramientas habituales para programadores, escritores, científicos y empresas. Sin embargo, detrás de su aparente «magia» hay una compleja maquinaria matemática y computacional que merece ser entendida. En este artículo vamos…

En nuestro post anterior sobre los Modelos de Lenguaje de Gran Escala (LLMs), mencionamos la influencia de la arquitectura Transformer en su éxito. Para comprender completamente el impresionante poder de los LLMs como GPT-3 y GPT-4 de OpenAI o BART de Google, es esencial profundizar en la mecánica de esta arquitectura. El Corazón de…