¿Cómo funciona MIDJOURNEY?

¿Cómo funciona MIDJOURNEY?

8 min

26.4.23

A lo largo de la historia de la humanidad, el progreso tecnológico ha potenciado a algunos empleados, mientras que a otros los ha dejado obsoletos. Los avances en automatización e inteligencia artificial ya han tenido un impacto significativo en los trabajadores de sectores como la fabricación y el transporte.

midjourney sitio web

Hoy es la industria creativa la que está en juego. Con una mezcla de asombro y temor, artistas visuales, diseñadores, ilustradores y muchos otros creativos han estado observando el desarrollo de los generadores de texto a imagen de IA. El líder del mercado (Midjourney) ya cuenta con más de 8 millones de usuarios activos en apenas unos meses.

Esta nueva tecnología ha suscitado debates sobre temas como la apropiación de estilos y el uso de la IA en la creación visual. A algunos artistas les ha preocupado el uso de la IA por su rapidez y eficacia, pero otros la han acogido como una herramienta nueva e innovadora.

¿Qué es un generador de texto a imagen de IA?

El software de IA texto-imagen transforma el texto introducido por el usuario (el prompt) en una imagen. Se utilizan grandes conjuntos de datos de pares texto-imagen para entrenar estas tecnologías de IA mediante aprendizaje automático.

Midjourney aún no ha hecho públicos sus conjuntos de datos. Pero Stable Diffusion, un conocido programa de código abierto, ha sido más abierto sobre los datos que utiliza para entrenar su IA. Es de suponer que Midjourney utiliza el mismo principio operativo.

texto a imagen
Esta imagen se obtuvo con el prompt "Generador de texto a imagen"

"No buscamos las imágenes en Internet nosotros mismos. Otros lo han hecho antes", afirma el profesor Björn Ommer, del grupo de Visión y Aprendizaje por Ordenador.

"Grandes conjuntos de datos que se han puesto a disposición del público tras ser recuperados de la web. Y eso es lo que hemos utilizado, principalmente los conjuntos de datos LAION, que son públicos y contienen miles de millones de imágenes con las que podemos entrenarnos".

La organización sin ánimo de lucro LAION recopila pares imagen-texto en Internet. Luego los agrupa en conjuntos de datos en función de criterios como el idioma, la resolución y la valoración estética esperada (y muchos otros).

Estos pares imagen-texto son proporcionados a LAION por Common Crawl, otra organización sin ánimo de lucro. Con el fin de democratizar el acceso a la información web, Common Crawl ofrece acceso gratuito a su tienda de datos de rastreo web. Para ello, extrae cada mes miles de millones de páginas web y pone a disposición del público los conjuntos de datos resultantes.

¿Cómo se entrena la IA de Midjourney?

El modelo de IA se entrena utilizando estos conjuntos de datos de pares imagen-texto una vez recopilados y organizados. Mediante el entrenamiento, la IA aprende a relacionar la composición gráfica de una imagen, su estructura visual y cualquier información visual identificable con el texto que aparece junto a ella.

Tras dedicar mucho tiempo a entrenar estos patrones, explica Ommer, "se dispone entonces de un potente modelo que realiza transiciones entre el texto y los elementos visuales".

La difusión es el siguiente paso en la creación de un generador de texto a imagen.

La IA se entrena con cada repetición de la imagen cada vez más "ruidosa", añadiendo progresivamente ruido visual gaussiano o "aleatorio" a una imagen.

A continuación, se invierte el procedimiento y se ordena a la IA que cree una imagen que se parezca visualmente a la primera imagen de entrenamiento utilizando píxeles aleatorios.

Ommer explica: "El resultado final de añadir mil veces un poco de ruido será como si tiras del cable de la antena de tu televisor y sólo hay estática, ruido, no hay señal.

Mediante este método de convertir una imagen en ruido y viceversa, el modelo de IA se entrena con miles de millones de fotos.

Al final de este ciclo de entrenamiento, la IA puede empezar a construir imágenes antes inimaginables a partir del ruido.

En la práctica, esto significa que un usuario puede acceder a un generador de texto a imagen, introducir un comando de texto en un breve cuadro de texto y la IA crea una imagen totalmente nueva a partir del texto introducido.

Cada IA de texto a imagen contiene un conjunto de palabras clave que los usuarios han ido recopilando a través de la experimentación. Los usuarios han compartido en línea consejos y tácticas para crear arte de una determinada manera, y palabras clave como "digital art", "4k" o "cinematics" pueden tener un impacto significativo en los resultados. Las indicaciones típicas dirían algo como: "A digital artwork of an apple wearing a cowboy hat, artstation trend, 4k, detailed."

Midjourney: ¿Se trata de un plagio artístico?

La ética de los generadores de IA texto-imagen ha sido objeto de numerosos debates. La capacidad de estas IA para aprender sobre el trabajo de artistas reales, activos y en activo ha sido una de las principales preocupaciones. Esto podría permitir a cualquiera que utilice estas herramientas producir nuevas obras de arte con el estilo distintivo de estos artistas.

La comunidad de arte en línea Deviant Art anunció en noviembre que integraría DreamUp, un motor de generación de imágenes basado en IA, en su sitio web.

Las obras de arte creadas por los usuarios de Deviant Arts en Internet estarían así disponibles para ser enseñadas a la IA.

Sin embargo, tras recibir muchas críticas de su comunidad, Deviant Art cambió su política a las 24 horas del anuncio. Los usuarios tendrán que elegir proactivamente utilizar sus datos para entrenar a la IA.

El generador de texto a imagen desarrollado por DALL-E se incluirá ahora en el mercado de fotos de archivo Shutterstock, que también pagará a los creadores cuyas obras se hayan utilizado para entrenar a la IA.

Midjourney: ¿nueva y poderosa herramienta o competencia desleal?

En la categoría de "Nuevos artistas digitales" de la Feria Estatal de Colorado de 2022, ganó la obra generada por IA "Space Opera Theatre", de Jason Allen, realizada con Midjourney.

Este premio ha generado muchas críticas y debates sobre la dirección del arte. En medio de la publicidad, Allen ha creado una nueva empresa llamada AI Infinitum que ofrece "impresiones de lujo de IA".

A algunos artistas les preocupa la velocidad y precisión con la que un conversor de texto a imagen de inteligencia artificial puede producir obras de arte. Un programa como Midjourney puede producir en segundos muchas obras de arte que normalmente tardarían horas o días.

Esto ha alarmado a algunos creativos, que temen que la tecnología deje obsoletas sus habilidades.

pintura midjourney
Una "pintura" realizada con Midjourney

Según Ommer, "consideré que el objetivo de mi investigación nunca sustituiría a los seres humanos, la inteligencia humana ni nada por el estilo".

"Veo la Stable Diffusion y muchas otras herramientas, simplemente como una tecnología facilitadora que ayuda al artista, al ser humano y al usuario que utiliza estas herramientas a conseguir más o a realizar mejor las cosas que solían hacer, sin sustituirlos de la mejor manera posible".

El avance del arte generado por IA

Investigadores y empresas tecnológicas trabajan en la siguiente fase del arte visual generativo, a medida que los generadores de texto a imagen de IA siguen mejorando.

Winkowski es uno de los varios artistas visuales que ya han empezado a integrar herramientas de IA generativa en su flujo de trabajo y a impulsar la tecnología para producir arte.

Hace poco creó un cortometraje titulado "Leaving home" en el que dibujó algunas de las imágenes y dejó que Stable Diffusion creara el resto.

"Como artista, es casi como tener un superpoder", afirma.

"Es muy emocionante. Y creo que podremos embarcarnos en tareas más grandiosas de lo que nunca imaginamos".

No cabe duda de que herramientas como Midjourney son una auténtica revolución para el mundo del arte. En nuestra opinión, nunca sustituirán a los artistas con talento, pero éstos tendrán que aprender a trabajar con este software.

Representan (para quienes saben utilizarlas) una fuente de inspiración ilimitada. Por otro lado, los artistas "medios" (es decir, sin mucho talento) tienen mucho de qué preocuparse, pero podrían acabar siendo sustituidos por los generadores de texto a imagen.

¿Quieres ver de lo que es capaz la inteligencia artificial de Midjourney? Echa un vistazo a nuestra página dedicada a Midjourney.

No te pierdas nuestro artículo completo sobre ChatGPT.

Al hacer clic en "Aceptar", acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Consulte nuestra Política de privacidad para obtener más información.