Transformers

  • Transformers vs modelos Flow

    Transformers vs modelos Flow

    Los transformers han sido los reyes indiscutibles durante los últimos años. Modelos como GPT, Llama, Gemini o Claude han demostrado su potencia generando texto, código, audio e incluso imágenes. Pero en paralelo está emergiendo una nueva familia de modelos: los modelos flow, también conocidos como flow matching models o, en su variante más reciente,…

  • Cómo funciona un LLM paso a paso

    Cómo funciona un LLM paso a paso

    Los modelos de lenguaje a gran escala (LLM, por sus siglas en inglés) como ChatGPT, Gemini o Claude, entre otros, se han convertido en herramientas habituales para programadores, escritores, científicos y empresas. Sin embargo, detrás de su aparente «magia» hay una compleja maquinaria matemática y computacional que merece ser entendida. En este artículo vamos…

  • Modelos de lenguaje… ¿con tamaño de contexto infinito?

    Modelos de lenguaje… ¿con tamaño de contexto infinito?

    En el ámbito de la inteligencia artificial, donde la memoria y la comprensión profunda del lenguaje son la frontera final, un reciente artículo de Tsendsuren Munkhdalai, Manaal Faruqui y Siddharth Gopal, ingenieros en Google, promete ser el cohete que nos lleve hacia nuevas dimensiones. Titulado «Leave No Context Behind: Efficient Infinite Context Transformers with…

  • Modelos de Lenguaje de Gran Escala (LLMs): Un profundo vistazo a la Arquitectura Transformer y el Futuro de la IA

    Modelos de Lenguaje de Gran Escala (LLMs): Un profundo vistazo a la Arquitectura Transformer y el Futuro de la IA

    El Amanecer de los LLMs En el frenético mundo de la inteligencia artificial (IA), los Modelos de Lenguaje de Gran Escala (LLMs) se han posicionado en el centro del escenario, empujando los límites de lo que las máquinas pueden comprender y generar en términos de lenguaje humano. Estos modelos, como GPT-3 y GPT-4 de…