Necesitas un generador de imágenes. No el mejor teóricamente, sino el adecuado para lo que realmente estás construyendo. La semana pasada probé los cuatro con las mismas 50 indicaciones. Los resultados no fueron lo que sugería la publicidad.
La configuración: Lo que realmente se prueba
Antes de comparar estas herramientas, establezcamos qué importa en la producción. La mayoría de las comparaciones se centran en la belleza estética, que es subjetiva e inútil. En su lugar, evalué según lo que los equipos necesitan en flujos de trabajo reales:
- Consistencia: ¿Obtienes el mismo resultado al repetir una indicación? (Medido en 5 ejecuciones por herramienta con valores de semilla idénticos cuando estaban disponibles).
- Eficiencia de indicación: ¿Cuántas palabras necesitas para conseguir lo que quieres? ¿Puede usarla un compañero de equipo junior o es una herramienta especializada?
- Costo real por 100 imágenes: No el precio de lista, sino el costo real al tener en cuenta reintentos e iteraciones.
- Control sobre los detalles: ¿Puedes imponer un estilo, composición o parámetro técnico, o el modelo interpreta libremente?
- Casos extremos: Manos, texto en imágenes, perspectiva, objetos específicos. ¿Dónde falla cada uno?
- Disponibilidad de API y documentación: ¿Puedes construir un flujo de trabajo o es solo una interfaz web?
Analicemos cada herramienta teniendo esto en cuenta.
Midjourney: La Herramienta de Diseño, No la API
Midjourney se ejecuta a través de Discord. Esto no es una limitación, es el diseño completo del producto. Escribes en un canal, esperas 45–90 segundos, obtienes cuatro variaciones y eliges una para mejorar o iterar.
Fortalezas
El resultado de Midjourney es consistentemente pulido. Las proporciones suelen ser correctas. Las manos tienen cinco dedos (esto importa más de lo que debería). La estética es reconocible: si has visto una imagen de Midjourney, la conoces. Eso se debe en parte a que el modelo tiene fuertes opiniones sobre lo que se ve «bien».
El ciclo de iteración es rápido si sabes lo que haces. Escribes una indicación, Midjourney genera cuatro opciones, mejoras o remezclas una y refinas a partir de ahí. Para los equipos de diseño acostumbrados a la iteración creativa, este flujo de trabajo es nativo.
La consistencia es alta cuando usas parámetros. --ar 16:9 fija la relación de aspecto. --style raw reduce el filtrado estético. --seed [número] fija la semilla aleatoria, dándote resultados reproducibles. Esto importa cuando estás construyendo un sistema visual.
# Estructura de indicación de Midjourney (ejemplo realista)
# Objetivo: Crear un conjunto coherente de imágenes de productos para una lista de comercio electrónico
# Primer intento (malo):