LLMs archivos - The Black Box Lab

Modelos de razonamiento: ¿Cómo funcionan?

marzo 6, 2025

•

The Black Box Lab

Uno de los cambios más significativos en IA ha sido la llegada de los modelos de razonamiento. A diferencia de los tradicionales LLMs (Large Language Models), cuya fortaleza radica en la generación de texto a partir de patrones aprendidos, los nuevos modelos como OpenAI o1 y o3, DeepSeek R1, Grok 3 de xAI y…
Arquitectura Mamba, ¿competencia para la arquitectura Transformer?

abril 12, 2024

•

The Black Box Lab

En la constante búsqueda por mejorar la eficiencia y efectividad de los modelos de lenguaje a gran escala (en inglés, LLMs), la arquitectura Mamba emerge como una técnica innovadora. Desarrollada por investigadores de la Universidad Carnegie Mellon y Princeton, Mamba promete abordar uno de los retos más significativos de los modelos basados en Transformers:…
Desvelando el misterio de la Arquitectura Transformer: La tecnología que está detrás de los LLMs

junio 7, 2023

•

The Black Box Lab

En nuestro post anterior sobre los Modelos de Lenguaje de Gran Escala (LLMs), mencionamos la influencia de la arquitectura Transformer en su éxito. Para comprender completamente el impresionante poder de los LLMs como GPT-3 y GPT-4 de OpenAI o BART de Google, es esencial profundizar en la mecánica de esta arquitectura. El Corazón de…
Modelos de Lenguaje de Gran Escala (LLMs): Un profundo vistazo a la Arquitectura Transformer y el Futuro de la IA

mayo 19, 2023

•

The Black Box Lab

El Amanecer de los LLMs En el frenético mundo de la inteligencia artificial (IA), los Modelos de Lenguaje de Gran Escala (LLMs) se han posicionado en el centro del escenario, empujando los límites de lo que las máquinas pueden comprender y generar en términos de lenguaje humano. Estos modelos, como GPT-3 y GPT-4 de…