Por Cristián Parodi
La creación de contenidos con IA – textos, audios, videos, música, imágenes – requiere que se defina con precisión qué se busca generar. Esa descripción se conoce como «prompt». En todos los casos, se redacta utilizando el lenguaje natural, es decir, describiendo en palabras el “objeto” a generar: una foto, un clip, etc.
Si bien todas las herramientas de IA generativas logran comprender ese prompt y generar el contenido, también es cierto que no todas tienen el mismo nivel de comprensión. Por esa razón, el proceso generativo es de prueba y error hasta obtener el resultado buscado. Esta forma de trabajo es muy común en la generación de imágenes, videos y música.
La idea de generar contenidos a partir de una descripción nos obliga a ser muy específicos con lo que buscamos, y a redactar el prompt de manera que logremos un resultado que cumpla con nuestro objetivo. Es decir, hay que escribir bien y mucho. En el campo de las imágenes y videos, la especificación de la composición es un aspecto fundamental del proceso. Por ejemplo: «Primer plano de una mujer de 50 años, con pelo negro largo, rasgos latinos, vestida con un vestido claro, parada en medio de un campo deshabitado, mirando a la distancia. En el fondo, detrás de ella, fuera de foco, un grupo de niños juega en el campo”.
La acción de fotografiar, que es un acto instintivo que nos lleva a hacer un encuadre determinado y apretar el botón, pasa a ser una acción muy bien definida en el mundo de la IA. Esto nos lleva a tener que expresar en palabras la composición: traducir una idea visual en un texto. De lo contrario, el prompt no funcionará.
La precisión y claridad en la redacción son claves para obtener los mejores resultados con las herramientas de IA generativas.
Foto: el prompt del ejemplo generado a través de Midjourney
