How to work with Image Generation AIs
Esta clase explica cómo generar imágenes desde cero, cómo editar imágenes existentes, cómo usar imágenes como referencia visual, cómo crear diseños promocionales y cómo evaluar y perfeccionar resultados de forma profesional.
1. Creación de Imágenes desde Cero (Generación por Texto)
Cuando trabajamos con generación por texto, la IA crea una imagen completamente nueva sin ninguna referencia visual previa. Todo depende de la calidad del prompt: claridad, detalle, estilo y coherencia. Esta fase es fundamental para aprender cómo “piensa” la IA y cómo interpretar las descripciones.
¿Qué se aprende en esta fase?
Redacción de Prompts Efectivos
El alumno aprenderá a formular prompts claros, detallados y estructurados. Se explican técnicas para controlar el estilo visual, iluminación, composición, atmósfera y nivel de detalle.
Estilos y Composición
Aquí se introducen estilos artísticos (realista, ilustración, 3D, pintura, cómic, acuarela…), así como planos fotográficos, ángulos, lentes y reglas de composición.
Control de Variabilidad
Se enseña cómo generar múltiples versiones de un mismo prompt, mantener consistencia o provocar variaciones creativas.
Ventajas
- Libertad total para crear conceptos y mundos nuevos.
- No depende de una imagen previa.
- Perfecto para creatividad pura y escenarios imaginados.
Desventajas
- Menor precisión si el prompt está incompleto.
- Identidad visual difícil de controlar sin experiencia.
Diferencias clave
La IA no tiene referencias, así que cada palabra cuenta: si no se menciona, no existe.

Creado con Nano banana

Creado con Midjourney
2. Creación de Imágenes desde Cero (Generación por Texto + Imagen)
Este método combina la fuerza de un prompt textual con la precisión de una imagen de referencia. La imagen aporta estructura visual, identidad y composición; el texto indica cómo quieres transformarla. Es la técnica más poderosa y más utilizada en proyectos reales.
¿Qué se aprende en esta fase?
Uso de una Imagen como Base Visual
La IA toma la imagen de referencia y extrae estilo, colores, rasgos, proporciones y composición. Esto garantiza coherencia y precisión en el resultado.
Texto como Instrucción de Cambio
El alumno aprende a indicar qué se debe modificar: iluminación, fondo, estilo, época, expresión, ambiente, ropa, textura…
El texto dirige la transformación.
Transformación Creativa
La IA puede convertir una foto normal en un retrato artístico, una pintura, una versión futurista o un estilo cinematográfico, manteniendo al sujeto reconocible.
Ventajas
- Máxima precisión visual.
- Mantiene identidad y rasgos.
- Ideal para retratos, branding, e-commerce, diseño y proyectos corporativos.
Desventajas
- Requiere instrucciones claras para evitar estilos contradictorios.
- Si la imagen original es mala, la IA arrastra los problemas.
Diferencias clave
No es edición directa:
La IA genera una nueva imagen basada en la imagen original + instrucciones de texto.


Creado con Nano banana


Creado con Midjourney


Creado con Nano banana


Creado con Midjourney
Creador de imágenes de ChatGPT (DALL·E) como motor Texto + Imagen
El creador de imágenes de ChatGPT, basado en el modelo DALL·E de OpenAI, es una de las herramientas más cómodas para trabajar con generación Texto + Imagen. Permite subir una imagen de referencia (foto, boceto, diseño…) y, a partir de un prompt bien escrito, pedirle a la IA que mantenga la estructura principal mientras cambia el estilo, el ambiente o los detalles visuales.
En la práctica, el alumno puede indicarle a ChatGPT algo tan sencillo como: «Toma esta foto y conviértela en una ilustración de estilo cómic con colores vivos» o «Mantén la pose y la ropa, pero cambia el fondo por un paisaje urbano nocturno con luces de neón». DALL·E interpreta tanto la imagen como el texto y genera una nueva versión coherente con ambas instrucciones.
Para proyectos reales —retrato profesional, branding, portadas, miniaturas, publicidad— el creador de imágenes de ChatGPT resulta especialmente útil porque:
- Mantiene la identidad visual del sujeto o del producto gracias a la imagen de referencia.
- Ahorra tiempo en pruebas, ya que se puede iterar rápidamente cambiando solo el prompt.
- Facilita la experimentación con estilos (realista, ilustración, pintura digital, cinematográfico, etc.) sin perder la base original.


ChatGPT (DALL·E)


ChatGPT (DALL·E)
3. Edición de Imágenes Existentes
Aquí la IA trabaja directamente sobre la imagen original. No genera una nueva desde cero: modifica, corrige o mejora partes concretas de la fotografía. Esta técnica es clave para retoque fotográfico, publicidad, retratos profesionales y restauración.
¿Qué se aprende en esta fase?
Inpainting (Editar Partes Específicas)
El alumno aprende a seleccionar y modificar zonas concretas como ojos, fondo, piel, ropa o iluminación.
La IA rellena el área editada con coherencia visual.
Reemplazo de Elementos
Se enseña a cambiar partes completas de la imagen: cielo, fondo, ropa, expresiones, objetos o detalles del entorno.


Ventajas
- Control sobre elementos específicos.
- Mantiene la identidad de la imagen original.
- Ideal para fotografía y contenido profesional.
Desventajas
- Es fundamental mantener coherencia visual.
- Si se edita mal, se nota rápido.
Diferencias clave
Aquí sí se modifica la imagen original en sí misma, sin crear una nueva escena completa.
4. Refinamiento y Ajustes Detallados
Cuando ya existe una imagen (generada o editada), comienza la fase de perfeccionamiento. Es donde se pasa de un resultado “bueno” a uno realmente profesional.
Mejorar detalles
Microtexturas, ojos, reflejos, suavizado de piel, telas, metales…
Son ajustes mínimos pero esenciales para calidad visual.
Ajustar iluminación y sombras
Corregir sombras duras, mejorar contraste, equilibrar temperatura de color y añadir luz direccional si es necesario.
Mantener estilo
Esta fase también corrige incoherencias estilísticas:
Si la imagen pide un estilo cinematográfico, todo debe respetarlo (colores, luz, contraste).
Diferencias clave
No se cambia la escena ni su estructura.
Solo se pulen los detalles hasta lograr un acabado impecable.
5. Evaluación de Resultados y Ajuste de Parámetros
Tras generar una imagen, el alumno debe aprender a evaluarla, detectar fallos y realizar ajustes iterativos. Esta etapa desarrolla criterio visual y profesional.
¿Qué se aprende?
Evaluación de la Coherencia
Se analiza si:
- Proporciones son correctas
- Sombras son naturales
- Fondos y sujetos encajan
- Estilo es consistente
- No hay artefactos (manos deformes, ojos mal formados, perspectivas incorrectas)
Ajustes Iterativos
El alumno aprende a corregir detalles puntuales:
- Reducir saturación
- Ajustar brillo
- Cambiar ángulo de cámara
- Añadir foco de luz
- Modificar expresiones
- Afinar textura
Diferencias clave
Esta fase no cambia la escena; optimiza el resultado final.
6. Recursos para Inspiración, Prompts y Resultados Reales
Estos recursos permiten a los alumnos estudiar cómo se construyen buenos prompts y cómo se relaciona cada prompt con su resultado final. Perfecto para analizar sintaxis, estética y estructura.
Lexica.art
(Stable Diffusion – Biblioteca más completa)
Miles de prompts reales organizados por estilo, técnica, autor y concepto.
Biblioteca de Nano Banana
(Prompts + Resultados)
Colección altamente especializada con ejemplos reales del modelo Nano Banana.
Guía de personajes para Midjourney
(Estilos + Técnicas)
11 Prompts para personajes con Midjourney: Guía esencial para diseñadores y artistas digitales
Guías esenciales para dominar Nano Banana y Midjourney
Si quieres aprender a generar, editar y perfeccionar imágenes con inteligencia artificial, estos dos vídeos son el punto de partida perfecto. El primero te muestra cómo trabajar con Nano Banana, la herramienta gratuita para crear y transformar imágenes con resultados sorprendentes. El segundo te introduce en Midjourney, la plataforma líder en generación visual avanzada. Dos enfoques distintos, dos potencias creativas, un mismo objetivo: ayudarte a crear imágenes espectaculares sin complicarte la vida.



