La IA en la creación de imágenes realistas a partir de textos

Una de las novedades más aclamadas en la Inteligencia artificial ha sido la creación de imágenes realistas a partir de textos. Esto ha generado aún más rivalidades entre las compañías OpenAI, con DALLE-2, y Google, con IMAGEN.

La Inteligencia Artificial continúa avanzando a ritmos agigantados y cada vez se encuentra más presente en nuestras vidas. Su aplicación en tantos y tan variados sectores (salud, educación, transporte, etc.) demuestra que esta combinación de algoritmos es una toda una revolución que nos encamina hacia la evolución.

En este sentido, en los últimos meses, entre los avances más llamativos de la Inteligencia Artificial nos hemos encontrado con la creación de imágenes realistas o ilustraciones a partir de textos o descripciones escritas.

Esto ha provocado que la rivalidad entre los de las compañías más avanzadas en Inteligencia Artificial aumente: OpenAI y Google o, lo que es lo mismo: DALLE-2 e IMAGEN.

OpenAI y DALLE-2

OpenAI es, a día de hoy, una de las compañías más avanzadas en cuanto a investigación e implementación de la Inteligencia Artificial.

DALLE-2 nace como heredero de DALLE-1 y es capaz de generar imágenes realistas, e incluso ilustraciones, a partir de descripciones que realicen los usuarios de forma escrita.

Además, también tiene la capacidad de editar y versionar imágenes, agregando nuevos objetos, eliminando otros y sustituyéndolos por nuevos, incluso tiene la capacidad de cambiar la perspectiva de una ilustración, dándole una nueva reinterpretación.

¿Cómo funciona DALLE-2?

La IA DALLE-2 tiene el mismo funcionamiento que el de un sistema neuronal. Por tanto, en él, se entrelazan textos descriptivos y diversas imágenes.

Tienen la capacidad de relacionar el sujeto, la acción y el estilo artístico, siendo capaces de crear desde imágenes que existen hasta algunas inventadas.

Google e IMAGEN

Google, por su parte, ha lanzado IMAGEN, una IA con la capacidad de dibujar todo lo que se le pida por escrito y, según la compañía, tiene la capacidad de superar a OpenAI y su DALLE-2.

¿Cómo funciona IMAGEN?

IMAGEN se basa en ciertos modelos lingüísticos que tienen la capacidad de comprender los textos de forma correcta y, con ellos, utiliza distintos modelos para dar forma a las imágenes ultrarrealistas que crea.

DALLE-2 e IMAGEN: ¿mismos resultados?

Cuando parecía que OpenAI era la mayor novedad en el ámbito de la creación de imágenes con DALLE-2, Google ha demostrado que su IA, IMAGEN, tiene la capacidad de generar imágenes ultrarrealistas.

Ambas producen imágenes de 64 x 64 píxeles, pero luego son escaladas a 1.024 x 1.024 píxeles.

La realidad es que ambas creaciones tienen un uso y un funcionamiento similar, pero Google asegura que IMAGEN es capaz de generar las imágenes con más precisión que la IA de OpenAI.

Por otro lado, mientras que OpenAI tiene previsto liberar la herramienta para que cada vez sean más usuarios los que puedan utilizarla, Google ha asegurado que IMAGEN se encuentra aún en proceso de investigación y que la utilizarán, únicamente, expertos y académicos.

En The Black Box Lab podemos desarrollar tu aplicación a medida.

¿Necesitas que te echemos una mano con tu App? Consúltanos.

The Black Box Lab

Agencia de desarrollo de negocio, especializada en nuevas tecnologías. Sus pilares son la cercanía, sencillez y transparencia. Dispone de los mejores profesionales para hacer realidad tus ideas. Apasionados de las nuevas tecnologías.

All author posts