El cielo infinito de la Inteligencia Artificial
La Inteligencia Artificial aplicada a procesos creativos despierta debates sobre su uso en todo el mundo. ¿Cómo es la historia detrás del primer editorial de moda y portada de una publicación colombiana realizada con IA? ¿Cómo fue manejar desde la dirección creativa la enorme aleatoriedad con la que las IA producen sus imágenes? Aquí el detrás de cámaras.
En mayo de 2023, el consejo editorial de la Revista Fucsia, dirigido por Mónica Jaramillo, decidió que la portada de la edición 219 sería hecha con inteligencia artificial. El equipo, conformado por Pacho Escobar como editor general, Natalia Pinilla en la dirección de arte, Mónica Garzón como coordinadora editorial, un nutrido equipo de colaboradores y yo en la coordinación general, aceptó el reto.
Encendimos el televisor, fuimos a YouTube y reprodujimos un video de quienes, sabíamos, debían ser los protagonistas de la portada: Dawer X Damper. ¿Vos creés que soy un alien o qué? La propuesta estética, musical y artística del dúo caleño nos conquistó de inmediato. Papi, tú tranqui, que yo quilo. El concepto de afrofuturismo latinoamericano retratado en su álbum debut Donde Machi los catapultó como uno de los mejores artistas de 2022 según la revista Rolling Stone y los ubicó en el sexto puesto entre los 50 mejores discos en español por detrás del Motomami de Rosalía, Marchita de Silvina Estrada o Un verano sin ti de Bad Bunny.
Gracias a una aproximación que hicimos en el número 218 de la revista, les comunicamos la noticia y, luego de que aceptaran, comenzamos a trabajar. Para la tarea llegó al equipo Gabriel Henao, artista visual, diseñador y director creativo. La dirección narrativa estuvo a mi cargo y juntos empezamos a esbozar una idea de lo que queríamos hacer. Necesitábamos crear un mundo que no respondiera a limitaciones geográficas, naturales o de presupuesto.
Teníamos que interpretar las ideas de DxD para crear metáforas visuales. O, como reza en el texto de portada: “Una suerte de ejercicio poético visual, de la palabra a la imagen, de la voz al papel”.
El primer momento
Antes de hacer cualquier propuesta creativa, consumimos horas de “referentes sonoros, artísticos, literarios y audiovisuales, así como de músicos, grupos, colectivos y creadores como Little Simz, Tyler The Creator, Basquiat, Dennis Rodman, Mapa Teatro, Combo Chimbita, Jambeau, Ballet Black, Brockhampton, Francisca Jiménez Ortegate, Kerry James Marshall, Javier Morales y Lorena Torres. Además de las colecciones de Acne Studios Menswear SS24, Botter Menswear SS24, Saint Laurent Menswear SS24, la fotografía de Rafael Pavarotti, Cheyenne Boya o Bade Fuwa”, como contamos en aquel momento.
Compartimos moodboards entre nosotros por semanas. Enviamos hipervínculos, investigamos de la mano de artistas visuales, estilistas, fotógrafas, diseñadores de moda, escritores y recopilamos horas de conversación. Empezamos a encontrar patrones dentro de los referentes que se apilaban en carpetas y depuramos lo suficiente como para tener una primera idea.
Redactamos las primeras descripciones –prompts– de lo que habíamos interpretado y dejamos que MidJourney imaginara un poco. Aunque había algo de lo que queríamos, tuvimos que ajustar el prompt varias veces. Entre tanto, entendimos que el concepto de afrofuturismo era demasiado amplio y relacionado con el sci-fi, que muchas de las ubicaciones geográficas eran creadas a partir de clichés, prejuicios y, sobre todo, de una lectura occidental de la imagen. Sin embargo, después de los ajustes suficientes, creamos un carrete de opciones.
Preparamos una entrevista enfocada en los patrones que habíamos identificado. Al entender que las IA no tienen techo, debíamos dejar la menor cantidad de cabos sueltos a la hora de crear; ponerle un límite al cielo infinito de opciones que se presentaron ante nosotros. Para eso, recurrimos a los juegos matemáticos en la literatura de la OuLiPo, puntualmente a ejercicios de escritura limitada.
Sabíamos que había que decantar dos relatos de vida en verbos, adjetivos, materiales, colores, olores, texturas, emociones, entre otras categorías, para condensar el afrofuturismo en términos universales que alcanzaran la especificidad de la mente del dúo musical. Un par de días después teníamos un cuestionario estructurado, pero lo suficientemente orgánico como para responder en medio de una conversación. No queríamos llenar casillas, sino escarbar entre los sentidos y recuerdos de los protagonistas para que las respuestas estuvieran implícitas para nosotros, brindando contexto, historia y una línea narrativa clara, pero que fueran explícitas para que la IA no alucinara tanto. Los límites de la herramienta se establecen desde la dirección narrativa y creativa incluso antes de escribir el prompt.
Afrofuturismo vol. 1 / Categorizar
Nos reunimos con Dawer X Damper en Bogotá y les mostramos la propuesta. Como en todo proceso, hubo puntos ciegos. Nuestra lectura estuvo sesgada por los referentes que teníamos y, a pesar de que la cercanía generacional nos dio complicidad, era obvio que el punto de partida distaba del resultado que queríamos.
Aprovechamos la presencialidad e hicimos una sesión de fotos a cargo de Esteban Vega para registrar los rostros del dúo en todos los ángulos y expresiones posibles. Durante los retratos conocimos más de los artistas. Conversamos sobre canciones, videoclips, referentes de moda, preferencias en cuanto a patrones, materiales, sueños y gustos. Fueron más de siete horas de conversación.
Hablamos de sus infancias, anécdotas y, sobre todo, de las sensaciones que despertaba repasar el pasado. Las texturas de la niñez, la sensación de la tela al rozar la piel, los sabores de las tardes después del colegio, los sonidos de las noches de adolescencia y la exploración estética en la juventud.
La generosidad de Dawer y Damper fue la columna vertebral del relato. Con la promesa de una cita cercana, nos despedimos y volvimos al proyecto.
La IA estuvo presente no solo en la traducción de texto a imagen, sino en cada etapa de creación de este prompt. Primero, aprovechamos herramientas recién lanzadas de transcripción con IA (que para ese momento eran ‘innovadoras’ y que ahora vienen incrustadas en Premier) para transcribir la entrevista, lo que nos debería ahorrar un par de días de trabajo, pero no fue así. El texto resultante fue un desastre. La herramienta no reconoció ni una sola palabra de la jugosa jerga caleña que debimos rellenar como en un exámen de inglés tipo fill in the blank.
Una vez reconstruida la entrevista, utilizamos LLMs (modelos de lenguaje de gran tamaño) para apoyar ejercicios de divergencia y convergencia. Primero, para encontrar y listar la mayor cantidad de descriptores –verbos, adjetivos, materiales, colores, olores, texturas, emociones– con los cuales DxD asociaban su historia y conceptualizaban el afrofuturismo. Segundo, para llevar a cabo un mapeo del valor o importancia relativa de esos términos en su discurso. Es decir, identificar la relevancia que tenían ciertas características sobre otras teniendo en cuenta factores como recurrencia en el discurso, coherencia con el resto de aspectos, emocionalidad al mencionarlos durante la conversación, entre otros.
Esa información apoyó un ejercicio de ‘clusterización’, o segmentación, y reagrupación de términos en categorías más amplias y manejables con las cuales construir prompts estructurados –objeto, sujeto, espacio, características emocionales, descripción visual, referencias adicionales–.
Partimos del supuesto de que para construir un prompt que refleje un imaginario específico no solo se deben combinar términos, sino canjearlos. En otras palabras, explorar entre palabras puntuales para llegar al resultado deseado. Creemos que el orden de los grupos de términos importa e influye en el resultado final. No hay modo de comprobar esto más que de manera empírica, viendo el resultado de esas permutaciones y guiando hacia el camino deseado.
Afrofuturismo vol. 2 / Curaduría
Con la nueva información, regresamos al ejercicio descriptivo. Fueron días de crear un prompt que contemplara escenas en las que los personajes interactuaban. La especificidad era todavía más necesaria. ¿Qué verbo va acá? Flotar, no. Intentemos con volar, tampoco. Bueno, sigamos con… saltar. No, tampoco. Está bien, pon levitar. ¡Ese es!
Probamos decenas de cámaras, ópticas, texturas, verbos, emociones hasta que [nos] agotamos [entre] todas las combinaciones posibles. Después, seguir. Creamos, revisamos y descartamos miles de imágenes. Cuando sentíamos que estábamos cerca lo compartíamos con el equipo, además de con DxD, y empezamos a pulir la estética de lo que queríamos hacer.
Como lo explicamos en ese entonces: “Construimos ese lugar desde el que se rescatan los retazos de las telas, las cabuyas y desde el que se resignifican esos espacios de los que muchos se avergüenzan. En donde la colectividad es la columna vertebral, el sancocho comunitario, la gente del barrio, las canchas de fútbol y el pantone chontaduro”.
Ahora, la curaduría. Teníamos tres propuestas que exploraban diferentes aproximaciones al tema. La pregunta era ¿Por cuál inclinarse? Cada una tenía una colorimetría diferente, la interacción de los personajes era más o menos surrealista y la narrativa variaba entre instantes y aspectos diferentes de las vidas de los personajes. Universos y combinaciones infinitas que no podíamos abarcar por completo.
Luego de discutirlo con el equipo, colegas y con los protagonistas de la historia, nos inclinamos por una paleta de color de separación complementaria, combinando los amarillos o naranjas propios de un chontaduro, con azules que contrasten tanto en tono como en saturación. La luminosidad del azul se usó para dar indicios de las diferentes temporalidades y espacialidades entre escenas. Equilibramos planos abiertos, medios y close-ups con el enfoque propio de la fotografía editorial. Usamos algo de la distorsión propia de un lente estándar (35-50mm) sin exagerar en la profundidad de campo y recurrimos al contrapicado para amplificar la sensación de levedad.
Con eso claro, enfocamos la narrativa hacia el universo elegido. Elaboramos escenas complementarias que contaran una historia, como en cualquier editorial de moda. Revisamos una y otra vez la narrativa. Creamos cientos de imágenes al día y al final de cada jornada y aproximación a una sola escena, reducíamos a veinte, luego quince, diez y finalmente cinco.
Repasamos los problemas que había: el modelo de difusión utilizado se alimenta de una base de datos genérica y con imaginarios ajenos a nuestra visualidad; esa falta de referencias concretas en MidJourney sobre lo caleño, colombiano o latino nos obligó a buscar soluciones prácticas. Comenzamos una nueva investigación para aterrizar la estética occidental al Valle del Cauca.
Machete & Flow
Luego de tener una selección oficial, regresamos con DxD.
Durante varios días, revisamos todos y cada uno de los ajustes que teníamos que hacer. La camisa del tío en la década de los 80, leñadora azul, que heredaron Dawer y Damper e integraron a la estética que vimos en videoclips como Quilo o Suave; la balsa que les recordaba a sus abuelos, la madera de la que construyeron una casa del árbol; las mallas destempladas de la cancha de fútbol atravesadas por cables de luz, entre otros.
Finalmente, haciendo uso de otras herramientas de IA (Stable Diffusion, Photoshop, Topaz), Gabriel aterrizó los escenarios creados para hacerlos un poco más cercanos al contexto nacional, agregando algunos elementos específicos y, finalmente, metiendo mano como en los viejos tiempos: capas y capas de ajustes, color grading, aplicando técnicas de photocomposite, incluso añadiendo ropa de su clóset. Por ahora, la IA no reemplazará la capacidad de los humanos para contextualizar y dar sentido a la imagen, por lo que la dirección de arte es el bastión de la humanidad frente a lo artificial.
Quedaba el mayor de los problemas: las caras, su identidad específica. Esto porque estamos hablando de tiempos antiguos cuando insightface, ReActor u otros ‘face swappers’ no existían o apenas si producían resultados decentes en muy baja resolución, y tanto entrenar un modelo personalizado para un rostro, como hacer un upscale, requerían de un gasto de cómputo enorme. Gabriel estaba sin GPU, de viaje en Buga y pidiéndole al milagroso que no se quemara la CPU del portátil. Hicimos las maromas propias del mundo editorial. Ni la AI salva al diseñador gráfico de trasnochar la noche previa al día de la entrega.
Afrofuturismo vol. 3
Una vez elegidas las imágenes, elaboré la historia que acompaña el editorial explicando el proceso creativo y el porqué de cada cosa. Queríamos dejar claro que nada es gratuito, ningún elemento es meramente ornamental. Por el contrario, todo dialoga entre sí y compone esta interpretación del afrofuturismo de Dawer x Damper que construimos utilizando muchas herramientas, con el conocimiento, trabajo y acompañamiento de muchos artistas. Al final fue un ejercicio creativo de jugar a ponerle límites al cielo infinito de la IA.
Suscríbase a nuestro boletín
Sin spam, notificaciones solo sobre nuevos productos, actualizaciones.
Dejar un comentario