redaccion@diariodigitalis.com

DALL-E, la I.A. que crea trabajos de diseño gráfico

Se llama DALL-E por el pintor catalán Salvador Dalí y por Wall-E, el robot creado por Pixar para la película homónima. Y es una inteligencia artificial hija de la compañía OpenAI capaz de entender una frase y crear una imagen que la represente. El resultado, en algunas ocasiones, nos impresiona a nosotros, los humanos.

OpenAI son conocidos en el campo de la Inteligencia Artificial por haber creado la red neuronal capaz de generar texto GPT-3 y a su «hermana», que completa imágenes, Image GPT. Ahora, ha progresado en sus desarrollos para crear a DALL-E, una herramienta que genera imágenes a partir de frases de una manera que, para nosotros los humanos, tiene sentido.

DALL-E está creada con un conjunto de datos que enlazan millones de imágenes con sus correspondientes palabras y, además, es capaz de distinguir valores sintácticos (qué palabra es un nombre y cuál un adjetivo, por ejemplo). El resultado es que combina conceptos no relacionados en diseños que nosotros entendemos.

La imagen creada surge desde cero, solo interpretando la frase, o como regeneración una imagen que ya existe: DALL-E puede regenerar una región rectangular de la imagen que se extienda hasta la esquina inferior derecha, y hacerlo según las instrucciones del mensaje de texto.

Algunos ejemplos asombrosos

Para que pueda entender las frases, sus creadores han tenido que enseñar a DALL-E a comprender el lenguaje, con sus diferentes categorías sintácticas, y asociarlo a las imágenes adecuadas. Con frases sencillas con un sujeto y varios adjetivos el resultado es impresionante.

reloj pentágono verde DALL-E

Y sigue siendo realmente bueno cuando se habla de grupos de objetos, si bien en este aspecto no es tan precisa. Si hablamos de nombres con más de un significado, suele presentar versiones con varios de ellos (por ejemplo, con el término inglés glasses presenta imágenes con vasos e imágenes con gafas).

DALL-E también puede ofrecer la perspectiva que le pidamos, o cambiar la textura del objeto para que parezca que está hecho de otro material, e incluso puede generar una animación sencilla que muestre un cambio de perspectiva.

Donde el resultado es realmente impresionante es cuando se pide a DALL-E que genere imágenes de objetos no relacionados. Las imágenes de un caracol hecho de un arpa impresionan por lo que los humanos consideraríamos su «valor artístico». La capacidad para antropomorfizar objetos y animales también es destacable.

Caracol Arpa DALL-E

Y algo que termina por dejarnos con la boca abierta: los creadores de DALL-E descubrieron que tiene una capacidad que ellos mismos no anticiparon: entender que le estamos pidiendo una modificación de una imagen y generarla. Esta habilidad surgió de la capacidad de su predecesor GTP-3 de entender cuando se le pedía que tradujera un texto.

Id bootcamps Banner

Gato DALL-E

Las cosas que DALL-E no entiende

OpenAI muestra en su página web algunas aplicaciones que DALL-E puede tener para el diseño y la moda, pero también destaca aspectos en los que DALL-E no anda tan fina. Le cuesta entender las asociaciones entre objetos y colores cuando se trata de grupos de objetos (y se confunde más cuanto más objetos se introducen), y también le resulta difícil interpretar correctamente frases con palabras que pueden tener distintas interpretaciones semánticas.

El otro problema de DALL-E es qué implicación tienen herramientas como estas de cara a ciertas profesiones, como los diseñadores gráficos. En OpenAI aseguran que van a analizar el impacto que modelos como DALL-E van a tener en la sociedad y en la economía al alterar procesos de trabajo más tradicionales. Y  también considerarán posibles sesgos del modelo al ofrecer resultados y las implicaciones éticas de su creación a largo plazo.

El siglo de la Inteligencia Artificial

De todas las tecnologías emergentes, la I.A. es la que la mayoría señalan como el hito transformador más importante de las próximas décadas. Son muchas las voces que dicen que las empresas que adopten la I.A. en sus procesos de trabajo serán las que prosperen, y la apuesta de las instituciones por la Inteligencia Artificial es muy fuerte en todos los países desarrollados, incluida España.

DALL-E es una herramienta de I.A. impresionante, pero al ver su trabajo aún está lejos de poder suplantar a un diseñador humano. El futuro seguro que nos sorprenderá, pero de momento debemos ver a este tipo de aplicaciones como una potente herramienta más para los creadores.

Artículos Relacionados

Suscríbete a nuestra newsletter


(Obligatorio)

También te puede gustar

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Suscríbete a nuestra newsletter