1. PINTÁNDOME UNA DIANA
Soy muy consciente, vista la forma irracional en la que se está tratando este asunto, de que al escribir este artículo me estoy pintando una diana en la frente.
Y es algo que no deseo, de verdad. Me encantan la tranquilidad y el buen rollo.
Pero…
Pero hay ciertas cosas que creo que deben decirse y, aunque preferiría que las dijera otra persona y fuese ella la que se metiese en problemas, parece que no va a ser el caso y que no me va a quedar otra que hacerlo yo.
2. CAMBIA LA LETRA, PERO…
Hace unos treinta años coincidí con el ilustrador Luis Royo en la HispaCon de Gijón celebrada en 1993, aunque dudo que él se acuerde de ello. Participábamos en la misma mesa redonda de la que ya no recuerdo el tema, pero teniendo en cuenta que estaba él presente, supongo que tendría que ver con la ilustración de cifi. Lo que no recuerdo muy bien es qué pintaba yo allí, un joven fan que había empezado a publicar relatos y pequeños artículos unos cuatro años atrás y que de ilustración poco o nada sabía. En todo caso, mientras esperábamos a que diera inicio la mesa redonda, me presenté a Luis Royo y charlamos un rato. En cierto momento él me comentó:
—Hay mucha gente, mucho «experto», que considera que la ilustración que yo realizo no es arte, porque uso aerógrafo.
Me quedé de piedra, porque la idea me parecía una majadería: la obra de Royo será arte o no en función de cómo resuene en el espectador, no de qué técnicas o herramientas concretas esté usando. Eso, que a mí me parecía entonces de cajón (y me lo sigue pareciendo), no era compartido al parecer por ciertos «expertos».
No es tan raro. Cuando surge una nueva tecnología, especialmente una que amenaza con cambiar el paradigma de una profesión o un modo de vida y, por tanto, tener una repercusión social y económica que, para ciertos sectores, podría resultar catastrófica, se produce una inmediata reacción contra el cambio.
Pensad en todos los empleos relacionados con el transporte de tracción animal que se perdieron con la llegada del motor de combustión interna, por ejemplo.
O las protestas en el mundo pictórico cuando se intentó calificar a la fotografía como un arte. Reacciones furibundas de pintores, críticos y especialistas clamando contra la idea, afirmando que no podía ser arte algo que se limitaba simplemente a enfocar con una lente y apretar algún tipo de botón o interruptor. Apenas había intervención humana en el asunto, todo lo hacía la máquina mediante un proceso puramente químico o mecánico. ¿Dónde estaba la creatividad?
Al parecer, sí que había creatividad en la fotografía, por mucho que el trabajo «lo estuviera haciendo una máquina» y hoy es aceptada como una disciplina artística más[1], sin que a nadie se le ocurra poner eso en duda y sin que haya matado la pintura. La ha desplazado en ciertos sectores, quizá, en aquellos más industriales y comerciales, donde la fotografía (o, en las últimas décadas, el fotomontaje asistido por programas informáticos) es más competitiva que una ilustración o un cuadro hechos por humano.
3. ADAPTARSE
Hace unos años vi la película Hidden Figures, que habla de las mujeres (especialmente las afroamericanas) que trabajaron para la NASA en tiempos del programa Apolo realizando cálculos diversos (y sumamente complejos). Mujeres que, por cierto, eran conocidas como «computers». Una de ellas es Dorothy Vaughan, considerada como una de las pioneras en la programación y la principal experta en el mundo en el lenguaje FORTRAN, creado precisamente para realizar cálculos matemáticos. En la película, es la supervisora de las matemáticas afroamericanas.
El caso es que Vaughan descubre que su departamento peligra porque la NASA ha comprado una gigantesca máquina calculadora que puede realizar el trabajo de los humanos con mucha más rapidez. Ni gracia que le hace, evidentemente, pero en lugar de ponerse a despotricar, reacciona, investiga, aprende FORTRAN y luego se lo enseña a sus subordinadas.
Cuando el nuevo ordenador está listo para usarse y la NASA necesita alguien que lo programe ya tiene ahí un equipo cualificado.
Desconozco lo real o ficticio de esa historia. Sin duda Hollywood habrá adornado y exagerado ciertas cosas con propósitos narrativos y dramáticos. Lo que sí es cierto es que, como he dicho, Vaughan se convirtió en una de las principales expertas mundiales en FORTRAN.
Real o no, la anécdota pone el dedo en la llaga de la que, para mí, es la reacción correcta cuando un cambio tecnológico amenaza con llevarse por delante una profesión. No todo el mundo puede dar el salto que dio Vaughan, es cierto, pero a mi entender es mejor intentarlo que quedarse cruzado de brazos, henchido de dignidad y furia.
4. UN POCO DE HISTORIA
El desarrollo de la inteligencia artificial aplicado a actividades creativas no es algo nuevo. En música lleva haciéndose desde los años cincuenta del pasado siglo. En 1958 se presenta la primera música enteramente generada por un ordenador (el ILLIAC), que crea un cuarteto de cuerda mediante una metodología de «generación y prueba». El programa genera notas de manera pseudoaleatoria usando cadenas de Markov y estas notas se chequean con reglas compositivas heurísticas de armonía clásica y contrapunto. Solo se conservan las que superan ese chequeo. Si a partir de cierto momento ninguna de las notas generadas satisface las reglas, se emplea un sistema de retroceso para borrar la composición hasta ese punto y se empieza un nuevo ciclo.
Desde esos primeros intentos, la música generada por inteligencias artificiales ha evolucionado de forma considerable. Si alguien tiene interés en conocer su historia, le aconsejo que investigue en la red, donde encontrará artículos bastante extensos y detallados al respecto.
También son de los años 50 los primeros intentos de conseguir arte pictórico generado por inteligencias artificiales, con la aparición de AARON, provisto de un brazo robótico capaz de coger un pincel y pintar un lienzo. No se limitaba a copiar un dibujo preexistente, sino que era capaz de generar tantos dibujos únicos sobre el mismo tema como se le pidieran. Al igual que los humanos, AARON adquiría sus conocimientos de forma acumulativa; definía las plantas en términos de tamaño, grosor de las ramas en relación a la altura, ritmo al que adelgazan al crecer, grado de ramificación, ángulo en el que brotan y otros muchos factores, que también se aplican a la creación de hojas y de racimos. Manipulando estos factores, era capaz de generar un amplio espectro de tipos de plantas y nunca dibujaba la misma dos veces, ni siquiera cuando estaba dibujando plantas de la misma especie.
En cualquier caso, ha sido en los últimos años donde el desarrollo de esas inteligencias artificiales se ha acelerado de forma considerable gracias al incremento brutal en la velocidad y la capacidad de cálculo de las máquinas y, especialmente, gracias a internet, que les da acceso a una cantidad casi infinita de datos (musicales, pictóricos, fotográficos, textuales) en un tiempo muy corto. Estamos ahora mismo en la frontera de un cambio de paradigma que, en los próximos diez años, va a afectar de un modo que ni podemos prever a las actividades creativas humanas. La ilustración, la escritura (y la traducción, tema que, desde una óptica puramente egoísta, me toca mucho más de cerca y me importa mucho más) van a verse afectadas de un modo intenso (y, en muchos sentidos, traumático) y el panorama va a cambiar de una manera salvaje en lo social y en lo económico. Dado que vivimos en un sistema capitalista, ese cambio va a ser perjudicial para la mayor parte de las personas que ahora mismo se ganan la vida (o aspiran a ello) con esas actividades.
Hablando en plata, la hostia para los ilustradores profesionales y los escritores profesionales (y posiblemente otros sectores) va a ser gigantesca, inmensa y de proporciones épicas.
Eso no implica que vayan a desaparecer la ilustración o la escritura como actividades creativas humanas. La gente seguirá dibujando y pintando y escribiendo, no creo que eso vaya a cambiar. Pero ganarse la vida dibujando, pintando o escribiendo va a estar al alcance de una minoría aún más pequeña que la que hoy puede permitirse vivir de ello. Habrá personas que definirán los datos y parámetros con que se alimenta a las inteligencias artificiales para obtener el resultado requerido. Durante un tiempo (que sospecho que no será mucho), esas mismas personas (u otras) pulirán los resultados de las IA para eliminar pequeñas inconsistencias, fallos o incoherencias.
Si esas personas van a ser consideradas artistas (como lo fueron los fotógrafos con el tiempo, pese a la idea inicial de que se limitaba enfocar, apuntar un botón y, como mucho, retocar un poco el resultado de lo que hacía la máquina) o van a tener otro tratamiento es algo de lo que no tengo la menor idea.
El tiempo lo dirá.
5. ¿CÓMO FUNCIONA?
Hoy en día las GAN (Generative Adversarial Networks) están entre los modelos más populares para la generación de imágenes mediante IA; han demostrado ser muy efectivas para crear imágenes realistas y de alta calidad, y se han usado en una amplia variedad de aplicaciones, desde el desarrollo de arte digital y el diseño de personajes de videojuegos hasta la síntesis de imágenes médicas y la creación de datos de entrenamiento para otras aplicaciones de IA.
Las GAN tienen una estructura única que las hace especialmente adecuadas para la creación de imágenes. Se componen de dos redes neuronales: una generadora, que compone nuevas imágenes, y una discriminadora, que intenta distinguir entre las imágenes creadas y las reales. En el proceso de entrenamiento, ambas compiten entre sí en un juego de suma cero, lo que permite que la red generadora aprenda a componer imágenes más realistas y detalladas.
¿Y cómo es el proceso?
- La primera fase es la de recopilación, donde se reúne un conjunto de datos de entrenamiento adecuado, lo que incluirá imágenes que se usarán como referencia para el modelo y texto que se utilizará como prompts para generar nuevas imágenes. Estos datos deben ser representativos de la tarea específica que se desea realizar.
- La segunda fase consiste en el preproceso de los datos recopilados. Es necesario tratarlos para que puedan ser usados por el modelo de IA. Esto incluye tareas como la normalización de las distintas imágenes, su etiquetado, la tokenización de texto, y la creación de vectores de características.
- Tercera fase, el entrenamiento. Es aquí (y solo aquí) donde el modelo de IA utiliza los datos recopilados preparados en los pasos anteriores. Aprende a asociar los prompts de texto con las imágenes de referencia, y a generar nuevas imágenes a partir de los prompts de texto introducidos.
- Terminado el entrenamiento viene una cuarta fase de ajuste que ayuda a mejorar la precisión del modelo IA y su capacidad de generalización.
- Solo superadas estas cuatro fases, se podrá usar el modelo para generar nuevas imágenes a partir de prompts de texto.
6. ¿PERJUDICIAL ES SINÓMINO DE ILÍCITO?
Todo cambio tecnológico encuentra resistencia y con mayor razón si lleva aparejado un cambio de paradigma social y laboral… que, como es inevitable en un sistema capitalista, acabará afectando de forma negativa a las clases trabajadoras[2].
Eso se debe, básicamente, a que el capitalismo es una mierda de sistema trucado para que la banca gane siempre y los jugadores nos acabemos jodiendo.
Así de simple.
Asumo que estamos de acuerdo en que un determinado desarrollo tecnológico puede ser perjudicial para un colectivo sin que el desarrollo en sí resulte éticamente cuestionable (no sé, la imprenta o el motor de combustión interna, que hicieron desaparecer unas cuantas profesiones). O que puede ser ambas cosas… o ninguna.
Yendo al caso de las IA, se nos intenta convencer de que estamos ante ambas cosas: no solo va a causar un claro perjuicio a determinados colectivos (ilustradores, escritores, redactores, traductores, por mencionar algunos) sino que la forma en que funciona la herramienta para obtener resultados no es ética.
Estoy de acuerdo con la primera afirmación. Creo que es evidente que va a perjudicar a muchas personas.
Y aunque no encuentro del todo falsa la segunda, como explicaré en el siguiente epígrafe, la forma en la que esto se está presentando públicamente, sobre todo en las redes sociales, es hipócrita, interesada y trata de mostrar como sinónimo de EL MALTM un elemento que no tiene nada de ilícito mientras, al mismo tiempo, obvia la cuestión ética realmente peliaguda.
El argumento más habitual para defender la falta de ética del sistema es el punto 1 del proceso que detallaba en el epígrafe anterior y que repito aquí para no perderlo de vista:
Se reúne un conjunto de datos de entrenamiento adecuado, lo que incluirá imágenes que se usarán como referencia para el modelo y texto que se utilizará como prompts para generar nuevas imágenes. Estos datos deben ser representativos de la tarea específica que se desea realizar.
Lo que se suele afirmar es que en la fase de recopilación de datos de entrenamiento se accede a un montón de bases de datos y bancos de imágenes y se utiliza el trabajo de un montón de artistas humanos (vivos y muertos) sin pedir permiso ni pagar nada por ello. Se ha llegado a decir más de una vez que las IA son entrenadas con «datos robados».
Expresado de ese modo la mayor parte de las personas que oyen o leen eso piensan que las IA se han colado de forma ilegal en el área de miembros de los bancos de imágenes o en bases de datos privadas y se han apropiado del contenido de estas.
Si eso fuera cierto, ni siquiera debería discutirse si es ético. Sería directamente ilegal. Y habría que aplicar a esas empresas las sanciones correspondientes. Fin de la discusión.
Pero en realidad los datos e imágenes que usan los modelos IA para su entrenamiento no están en ningún área privada ni en una base de datos de acceso solo para miembros, sino en las redes abiertas, y son de acceso libre y gratuito, al menos para humanos. Es decir, esas imágenes que recogen las IA están al alcance de cualquier humano de forma legal, libre y gratuita y puede descargárselas siempre y cuando el uso que les dé sea privado y no pretenda hacerlas pasar por suyas o comercializarlas.
Eso es precisamente lo que hacen las IA, tomar esas imágenes y, sin más, mezclarlas con otras y hacer pasar el resultado de eso como algo propio.
¿Verdad?
O quizá no.
Vayamos por partes.
En primer lugar supongo que todos tenemos claro que los seres humanos aprendemos por imitación, un sistema sumamente sencillo pero eficaz, de copia y repetición. El niño aprende a hablar imitando lo que oye y a leer y escribir copiando lo que ve. El neófito en artes marciales aprende copiando los movimientos del senséi y repitiéndolos una y otra vez. No hablemos ya de aprender a jugar al ajedrez, donde se copian, reproducen y repiten una y otra vez movimientos famosos e incluso partidas enteras.
Y los artistas aprenden copiando lo que otros han hecho antes y repitiendo ese proceso una y otra vez.
En ninguna parte he visto que fuera necesario el permiso de los copiados para ello. Cualquier ilustrador puede ir a un museo y pasarse la tarde copiando la obra de grandes artistas del pasado y del presente. O puede tomar una ilustración recogida de la red (repito, en un sitio abierto, libre y gratuito que permite la descarga de esas imágenes) y usarla de modelo, copiar la iluminación, cierta pose o determinadas texturas en su obra. Puede, incluso, usar de punto de partida media docena de imágenes distintas (tomando esto de aquí, esto otro de allá, aquello de un tercero…) y combinarlas en su obra siempre y cuando lo haga de forma creativa y el resultado sea algo lo suficientemente distinto del original.
Es más, en el mundo digital no es nada raro tomar una obra de otro o parte de ella e integrarla en la propia, siempre que se realicen las suficientes modificaciones para que se pueda considerar algo nuevo y distinto y no un mero copia-y-pega.
Lo que se afirma es que las IA no hacen eso, no utilizan los datos de aprendizaje como modelo, sino que se limitan a copiarlos sin más y combinarlos; como mucho, se les aplica un par de filtros o efectos y listo.
Solo que si volvemos a examinar la descripción del proceso que he dado más arriba (y que creo que es, salvo prueba en contra, una descripción, aunque simplificada, razonablemente ajustada a la realidad) no parece ser el caso.
En realidad el proceso allí descrito no se diferencia demasiado del que seguiría un humano que quiere aprender a pintar: este también se pasará una buena parte del aprendizaje recopilando datos (viendo, analizando y examinando de forma crítica la obra de otros autores) y tratando de generar algo nuevo a partir de los datos examinados (creando obras propias a partir de los modelos analizados) y su técnica se irá ajustando con el tiempo (mediante correcciones de un profesor, por ejemplo).
Es cierto que el modelo IA no puede crear algo nuevo en el sentido de que lo haya creado de la nada, por supuesto.
Pero el artista humano tampoco.
Todo arte es derivativo y necesita la existencia de una tradición previa, ya sea como modelo desde el que desarrollarse o estado contra el que reaccionar.
En ese momento seguramente alguien dirá:
—Pero los seres humanos utilizan el material ajeno de forma creativa y no servil y consiguen resultados muy distintos a los originales de los que parten. Eso distingue al humano de la máquina: es creativo; la máquina, no. Como mucho, simula que lo es, pero su proceso es imitativo, servil, incapaz de salirse de los parámetros trazados y sin una pizca de originalidad.
Como lo es, por mucho que algunos se pongan muy dignos y arruguen el gesto, el 99% del arte humano: igualmente imitativo, servil, creado al compás de una moda, carente de imaginación y sin una pizca de originalidad.[3]
El 99% de cualquier forma de expresión artística es basura, por citar de forma un poco libre la Ley de Sturgeon. La IA no es capaz de ofrecer los resultados técnicos y creativos de un genio de la pintura, claro que no, pero puede obtener los de un humano que está aprendiendo a pintar y resulta prometedor o incluso, parametrizadas sus opciones del modo adecuado, es capaz de conseguir resultados similares o incluso superiores a los de un buen montón de humanos que se dedican profesionalmente a la ilustración, le pese a la quien le pese.
(Por cierto, el argumento de «la ilustración hecha por IA nos roba nuestro trabajo y, además, tiene una calidad de mierda» es tan válido como ese de «los inmigrantes nos roban el trabajo y además vienen a vivir del cuento sin dar palo al agua». Vamos, que es una falacia de manual.)
En esencia, el proceso por el que la IA crea una ilustración no es idéntico, pero sí análogo al usado por un humano.
Las mayores diferencias son, por un lado, que el humano «es creativo» y la IA solo «simula serlo»[4] y, por el otro, que lo que a un humano le puede costar horas o días, la IA lo hace en un picosegundo.
Las IA no están robando el trabajo de artistas humanos. Lo están usando para aprender como lo harían los artistas humanos, pero más rápido, muchas más veces y más a fondo.
¿Es eso perjudicial para la ilustración hecha por humanos?
Seguro. Especialmente si nos movemos por los campos de la ilustración comercial o publicitaria. Se avecinan cambios potencialmente desastrosos para los artistas comerciales o para los creadores de contenidos de texto profesionales, por ejemplo. Y para unas cuantas profesiones más.
Eso creo que es innegable. Y es también lamentable.
Pero…
¿Ese perjuicio viene de un uso ilícito?
No, al menos no en los términos de «se está robando el trabajo de otros», que son los que se suelen usar.
De paso, tengo que confesar que una de las cosas que más me molestan es encontrar entre los defensores de la idea de «las IA están robando a los artistas» a personas que tienen los suficientes conocimientos técnicos para saber que eso no es cierto. Qué los lleva a tergiversar la verdad, cuando no a mentir directamente, es algo sobre lo que prefiero no indagar.
7. SIN EMBARGO…
Sí que hay un componente en el proceso de entrenamiento de las IA (las que generan imágenes, las que escriben, las que traducen, las que reconocen voz y pueden responder a preguntas…) que no tiene nada de ético. Que es, definitivamente, inmoral, atroz y apesta. Y que es un problema ético real, no la reacción (comprensible pero interesada y tergiversadora) de un colectivo que ve amenazado su modo de vida.
Sin embargo, sobre eso apenas se llama la atención. He visto comentarlo a muy pocas de las personas que están en contra del uso de las IA y la inmensa mayoría de ellas se centran en el supuesto robo del trabajo ajeno. En todos esos comentarios indignados que hay en las RRSS sobre el uso de las IA en la ilustración o el texto, casi nunca he visto que se mencionase ese problema.
Es como poco curioso que sobre el asunto ético espinoso se pase casi de puntillas (¿será tal vez porque de momento apenas afecta al primer mundo? No, inconcebible. Eso sería pura hipocresía) mientras se incide una y otra vez con grandilocuencia en lo terrible que es que las IA usen sin permiso arte creado por otras personas… mientras al parecer no hay nada de terrible que los humanos hagan otro tanto.
Veamos de nuevo el punto 2 de la descripción del proceso que di más arriba:
Es necesario tratar los datos para que puedan ser usados por el modelo de IA. Esto incluye tareas como la normalización de las distintas imágenes, su etiquetado, la tokenización de texto, y la creación de vectores de características.
Ese «tratar los datos» que tan aséptico suena implica el trabajo de un montón de personas que se dedican, entre otras cosas, al etiquetado imágenes hasta el mínimo detalle para que la IA pueda reconocer, no solo lo que hay en una imagen concreta, sino interrelacionarla con la misma etiqueta en otras imágenes.
Hablamos de una cantidad ingente de personas (cientos de miles a lo largo de un montón de años) que han estado realizando microtrabajos repetitivos y alienantes[5] identificando y etiquetando a un nivel de detalle obsesivo elementos de imágenes a cambio de un pago, no ya de miseria, sino directamente de hambre. Sin toda esa labor de microetiquetado y categorización, las IA no obtendrían los resultados que obtienen, aunque tuviesen acceso al arte de todo un imperio galáctico.
Y ese sí que es un componente perverso en el desarrollo de las IA…
Un componente que, en general, al primer mundo le importa entre poco y nada.
Tanto es así que en mayor o menor medida ese componente inmoral de explotación del Tercer Mundo está presente en cualquier negocio globalizado y ninguna gran empresa escapa de él, no hablemos ya de las multinacionales. Todas trabajan así, sean las relacionadas con temas de reconocimiento de voz, traducción o reconocimiento del entorno para proceso informáticos, las que necesitan coltán para la fabricación de componentes electrónicos o las que manufacturan ropa y complementos deportivos varios a cambio de sueldos de miseria y jornadas interminables.
Es explotación pura y dura de la mano de obra buscando minimizar los costes y maximizar los beneficios aunque sea en fracciones de céntimo.
¿Debería ese componente hacer que dejemos de usar las imágenes o textos generados por IA?
Posiblemente. No seré yo quien lo niegue.
Pero entonces también deberíamos dejar de comprar en Amazon; y dejar de usar teléfonos móviles; y pasar de Alexa, Google Nest, Apple HomePod o cualquier otro asistente con reconocimiento de voz; y no comprar ropa fabricada en el tercer mundo o electrodomésticos ensamblados allí a cambio de sueldos de miseria.
Estoy seguro de que hay muchas personas que lo han hecho.
También estoy seguro de que el 99% de la gente que despotrica sobre lo podridas que están las IA siguen dando dinero a multinacionales sin escrúpulos que usan exactamente las mismas técnicas de explotación; por ejemplo, disfrutando, sin darle mayor importancia, lo bien que le reconoce su smartphone los comandos de voz y el dictado de mensajes o de la ropa que se han comprado en ZARA.[6]
Nadie está obligado a ser coherente.
Yo mismo no lo soy ni por asomo.
Pero si alguien no lo es y el gazapo en su coherencia está justo y solo cuando tocan algo cercano que lo perjudica, quizá ha llegado el momento de tomar distancia de uno mismo, repensarse un poco las cosas y analizar el asunto de forma racional.
Antes de criticar la paja en el ojo ajeno quizá habría que echarle un vistazo a la orgía en el propio.
8. ¿AUTORÍA?
De vez en cuando surge la siguiente queja:
—Y tiene el morro de considerarse el autor de la imagen cuando se ha limitado a escribir cuatro palabras y la IA ha hecho todo el trabajo.
Aplicando esa misma lógica, quien hace todo el trabajo en una fotografía es la cámara, ya que el humano se limita a apuntarla al lugar que quiere fotografiar y apretar un botón.
—Eso no es cierto —se me responderá—. La intervención humana es fundamental. Tiene que elegir el objetivo adecuado, buscar el encuadre que mejor capte lo que quiere captar, comprobar que la luz es la correcta y que el enfoque es el apropiado, entre otras muchas cosas. Y, si bien es cierto que a veces se logra lo que se quiere a la primera por puro azar, por lo general hay que tirar un montón de fotos antes de conseguir lo que se está buscando. El humano establece los parámetros iniciales y toma las decisiones finales; es el autor de la foto. La cámara es solo la herramienta.
A lo que respondo a mí vez que generar una imagen mediante IA está muy lejos de ser «escribir cuatro palabras».
Se debe tener una idea clara de lo que se quiere ver y se debe saber describir eso de un modo lo más preciso posible y de forma que la IA no se equivoque. Y, si bien es cierto que a veces se consigue la imagen que se estaba buscando al primer intento por pura casualidad, lo más probable es que haya que refinar esa descripción y hacer variaciones sobre los resultados ofrecidos y usar esos resultados como inicio de un nuevo intento con una nueva descripción modificada y refinada y, de nuevo, realizar variaciones sobre el resultado que devuelve la IA… y a veces darse por vencido y comprender que no hay manera de conseguir lo que se desea por el camino que se está siguiendo y hay que volver al inicio y replantearse la descripción que se le va a dar la IA. Todo eso puede suponer minutos o puede suponer horas. Y en casos extremos puede suponer varios intentos totalmente distintos a lo largo de varios días que llevarán a su vez minutos u horas.
En todo ese proceso la intervención humana es fundamental y decisiva. Tanto como lo es a la hora de sacar una fotografía. Por supuesto que hay prompts de texto que no son más que cuatro palabras puestas de cualquier manera a ver lo que sale, del mismo modo que hay fotografías hechas de forma descuidada a ver qué pasa, pero si se busca un resultado concreto y se quiere conseguir un mínimo de calidad hay que echar un tiempo considerable de trabajo humano; hay que establecer con extremo cuidado los parámetros iniciales y hay que tomar decisiones en cada paso del proceso, porque la IA solo muestra posibles resultados, es cosa del humano elegir el que cree más adecuado y refinarlo en busca de lo que quiere conseguir.
Así que, en efecto, el humano es el autor de la imagen generada mediante IA y esta no es más que la herramienta usada para generarla, del mismo modo que el humano es el autor de la fotografía y la cámara no es más que la herramienta usada para crearla.
Volviendo al tema de la creatividad, por otra parte, podemos decir que aunque sea cierto que la IA no es creativa y se limita a seguir un proceso puramente mecánico establecido por un algoritmo (es algo más complejo que eso, pero, venga, aceptemos pulpo como animal de compañía), sí que hay creatividad en la generación de imágenes usando IA. Y esa creatividad está del lado del humano que la parametriza… exactamente igual que en la fotografía la creatividad está en el fotógrafo y no en la cámara… aunque sin duda la calidad de la cámara influirá en el resultado final.
9. COLOFÓN
Me encantaría mantener una discusión tranquila, sana y razonable, lejos de exaltamientos, sobre este asunto. Quién sabe, a lo mejor se me convencía de que mi postura es errónea y hasta cambiaba de idea sobre el tema.
Sé muy bien que no será posible en las redes sociales, especialmente en Twitter, donde la inmediatez facilita las arengas y frases lapidarias y penaliza los razonamientos coherentes y en profundidad. Su dinámica no lo permite, especialmente en temas en los que hay mucha gente emocionalmente muy implicada. Antes o después (y suele ser más bien antes) aparecerá alguien pidiendo adhesiones inquebrantables y realizando afirmaciones como «este es un tema que no admite debate»[7]. Esa persona no tardará en encontrar seguidores entusiastas y adeptos hasta el infinito y más allá. De ahí al comportamiento de turba en busca de sangre hay un paso… que se suele dar con cierta frecuencia.
Si en algún momento se va a debatir sobre esto en las redes, voy a intentar con todas mis fuerzas no entrar en la discusión. Quizá no lo consiga, porque a veces el carácter se sobrepone a la razón y todos cometemos tonterías. Pero desde luego mi idea es no entrar ahí. Es uno de los motivos por los que he escrito y publicado esto; aquí estoy dando mi opinión sobre el tema y es cuanto tengo que decir acerca de él.
Como decía al principio, este artículo va a ponerme una diana en la frente. El primer disparo vendrá sin duda disfrazado de inocente pregunta cuando alguien, a raíz de la publicación de algún título de Spórtula, pregunte a la editorial cómo se ha realizado la ilustración de portada.
Es una pregunta lícita, sin duda. Como también será lícita la respuesta que se dará desde la editorial: No es asunto vuestro.
No, no lo es. Podéis sentir curiosidad, por supuesto, pero no es ni ha sido nunca asunto vuestro qué herramienta o herramientas ha utilizado la persona que crea una ilustración o un texto. No veo ningún motivo por el que eso tenga que cambiar.
NOTAS
[1] Se la suele llamar El Octavo Arte, igual que al cómic se lo considera el Noveno. Lo gracioso, lo irónico, es que tanto fotografía como cómic son expresiones artísticas anteriores al cine, normalmente considerado El Séptimo Arte. Supongo que el cine tenía mejores publicistas.
[2] Identifico como tales a aquellas personas que viven exclusivamente de su trabajo, no del control de los medios de producción, independientemente de lo mucho o poco que cobren.
[3] Por si alguien se lo pregunta, sí, también mi obra es imitativa (puedo identificar con bastante precisión los modelos de los que parte y los elementos que la han influenciado), no especialmente original y posiblemente sea servil.
[4] Sí, es un sarcasmo, por si alguien lo no pilla. Las pocas definiciones funcionales que existen de la creatividad son estrictamente operacionales pero se desconoce el proceso interno: vemos que algo es creativo porque es distinto al modelo del que parte, pero no tenemos ni idea de lo que ocurre en la cabeza del artista. No hay modo de saber si un humano es creativo de verdad o solo está simulando serlo de un modo exitoso… y lo mismo pasa con las IA.
[5] Bajo ciertas circunstancias, es verdad, las microacciones repetitivas pueden resultar incluso relajantes. Al mismo tiempo, ganarte la vida realizándolas durante 12 horas al día (quizá más) por cuatro monedas no es lo que entendemos normalmente como un trabajo gratificante en el que te realizas como persona.
[6] Al respecto, recomiendo el artículo de Santiago L. Moreno publicado en C y titulado «En torno a Omelas», donde describe casi a la perfección el modo en que nuestra sociedad no tiene problema en disfrutar de algo fabricado a costa del sufrimiento, la miseria y la explotación de otros, siempre y cuando esos otros, por definición, no seamos nosotros ni los de nuestro entorno.
[7] Y yo que pensaba que los únicos lugares donde existen temas que no están sujetos a debate son las dictaduras.