Lección 17 - Generador de imágenes GPT-4o
En esta lección haremos un repaso de las posibilidades que ofrece el nuevo generador de imágenes integrado en ChatGPT.
Parece que la gente de OpenAI ha leído la lección anterior (donde decía que el modelo de imagen de ChatGPT era regulero) y han querido dejarme por mentiroso, porque acaban de lanzar el modelo más potente hasta el momento. Al menos, en cuanto a interacción, ya que está perfectamente integrado con GPT-4o y tiene mucha flexibilidad.
Vamos a dividir la lección en cada uso que le podemos dar, pero tiene muchos más que todavía no hemos probado. Atención, porque esto empieza a servir realmente para trabajar.
Crear imágenes coherentes entre sí
Empezamos por uno de los más llamativos. A partir de ahora ya podemos “hablar” directamente con ChatGPT para indicarle qué queremos generar o editar. Antes, con Dall-E 3, GPT se encargaba de “traducir” nuestras indicaciones al modelo de imagen, que no hablaba como nosotros. Y ya sabemos que muchas guerras han empezado por culpa de un mal traductor.
Esto significa que ya no hay intermediarios y que GPT 4o es el encargado directo de fabricar y editar las imágenes. Venga, menos palabrería y más mostrar ejemplos.



En primer lugar, le hemos pedido que genere una imagen de Terminator estilo videojuego retro. Luego que lo convierta a una figura en miniatura tipo Warhammer, y, por último, que me lo ponga en la mano (en una foto previamente realizada). No es perfecto, porque realiza algunos cambios en la imagen, pero es buenísimo y parece real.
PD: No, no pienso generar más imágenes con el estilo de Studio Ghibli, ya está bien de inundar Internet.
Diseñador de interiores
Siguiendo el punto anterior, también podemos utilizarlo para cambiar o probar cualquier diseño en nuestra casa.
Os dejo unos ejemplos que ha hecho mi amigo Javier “srlobo13” (compañero del grupo de Telegram) que es muy creativo y siempre está a la última en estos temas.






Diseñador gráfico
Otra novedad muy importante ha sido la mejora en el procesamiento del texto. Ahora es capaz de generar imágenes con pocos errores. Esto permite crear, por ejemplo, la carta de un restaurante:
O un logo:
Una forma rápida de diseñar es pedirle primero a GPT que nos genere las “indicaciones para un diseñador gráfico”, que luego utilizaremos para que él mismo genere la imagen, ya sea con indicaciones precisas o dejándolo a su gusto.
Generador de mockups
Un mockup es un “prototipo” que muestra cómo quedaría un producto en la vida real, sin la necesidad de lanzarlo. Se suele usar mucho en diseño para enseñarle a los clientes los carteles, camisetas, webs…
Con este nuevo generador podemos crear los que nos dé la gana y emplazarlos donde queramos (incluso en el fin del mundo…).



Infografías
Si hace unos meses era casi imposible generar un logo sin que tuviera errores en el texto, ya no digo una infografía entera. Ahora es bastante viable. Tiene algunos errores en las tildes y ha cortado un trozo, pero leñe, que lo ha hecho entero.
Nos puede ahorrar un buen puñado de horas al diseñar presentaciones.
Diseñador de moda
Esto es un poco experimental, pero me ha gustado bastante el resultado y creo que puede ser revolucionario.
Partimos de que no tengo ni pajolera idea de moda. Lo máximo que controlo es elegir talla de camisetas en el Primark, ese es el nivel. Así que, en primer lugar, le pedimos que diseñe él mismo el vestido.
Y luego le decimos que genere la imagen. Sinceramente, no sé si ha respetado las indicaciones o se las ha pasado por el forro, pero el resultado es una pasada. Me voy a poner en contacto con Victorio & Lucchino…
Ocio
Como siempre digo, no te olvides de jugar y experimentar con la IA. Además de ser divertido, es la mejor forma de aprender a usarla.





Notas finales
Con este nuevo modelo de OpenAI, la forma de promptear imágenes que hemos usado hasta ahora ya no tiene tanto sentido. De hecho, puede ser contraproducente utilizar el generador de prompts que compartimos en anteriores lecciones.
Al comunicarnos directamente con el modelo, podemos explicarle con lenguaje natural lo que necesitamos. Esto es un paso muy importante.
Aun así, en próximas lecciones desarrollaremos otro custom GPT para facilitar la tarea de escribir este tipo de prompts más naturales.
PD: Aprovecho este correo para recordar que hemos abierto un grupo de Telegram para compartir herramientas, prompts y charlar un rato, exclusivo para suscriptores de la newsletter.