Millones de personas vuelven a estar interesadas en ChatGPT. El problema es que lo ha conseguido vulnerando derechos de autor

Hacía tiempo que las redes no se volvían tan locas con una herramienta de inteligencia artificial. Normalmente hay cierto ajetreo cuando algo llama la atención más de la cuenta, pero lo que ha sucedido con la generación de imágenes de ChatGPT basada en GPT-4o no tiene ningún tipo de sentido. La IA generativa ha conseguido algo que hacía tiempo que no conseguía: sorprender al usuario de a pie. Y lo ha hecho haciendo gala de una de las mayores críticas hacia esta tecnología: la vulneración de los derechos de autor.

Contenido©. En las últimas horas las redes sociales se han llenado de memes, imágenes y avatares editados por ChatGPT para parecerse a los dibujos de Studio Ghibli. Las imágenes son realmente espectaculares, al César lo que es del César, pero no conviene olvidarnos de que una IA sabe generar una imagen de un caballo porque, entre otras cosas, ha sido entrenada con millones y millones de imágenes de caballos.

Click en la imagen para ir al tweet.

Dicho de otra manera. Si una IA como ChatGPT-4o es capaz de convertir o generar una imagen con el estilo de un autor concreto es porque sabe cómo es el estilo de ese autor concreto. Es decir, que ChatGPT-4o ha debido ser entrenado con contenido relacionado, basado o generado por el estudio fundado por Hayao Miyazaki. ¿Y qué pasa con ese contenido? Que es precioso, emotivo y cercano, pero no gratuito ni de dominio público. Es contenido protegido por derechos de autor, un tema que ha traído a ChatGPT y OpenAI de cabeza desde sus inicios.

No es ningún secreto. Desde luego que no. ChatGPT fue entrenado con una enorme cantidad de datos obtenidos de internet, sitios webs, libros, publicaciones en redes sociales, artículos académicos, etc. Contenido que puede ser de libre acceso, pero no por ello gratuito. Una imagen que está "en internet" no está "en internet", está alojada en un servidor que puede pertenecer a una empresa y puede tener (y seguramente tenga) derechos de autor. Que puedas verla y descargarla gratis en tu móvil para usarla de fondo de pantalla no significa que puedas imprimirla y venderla o ilustrar la portada de tu próxima novela con ella.

Click en la imagen para ir al tweet.

"Artistas vivos". OpenAI asegura haber optado por un "enfoque conservador" para las imágenes que usan el trabajo de otros artistas y haber "añadido una denegación que se activa cuando un usuario intenta generar una imagen con el estilo de un artista vivo". Como Miyazaki, por poner un ejemplo. Ante el aluvión de imágenes generadas con el estilo del dibujante japonés, un portavoz de la empresa ha dicho a Business Insider que OpenAI impedirá "generaciones con el estilo de artistas vivos individuales", pero sí permitirá "estilos de estudios más amplios".

Dicho de otra manera, estilo Hayao Miyazaki no, estilo Studio Ghibli sí. Lo cual tiene su punto irónico, porque en el año 2016, tras ver una demo de una animación generada por IA, el maestro Miyazaki dijo "yo nunca desearía incorporar esta tecnología a mi trabajo. Creo firmemente que es un insulto a la vida misma".

Mi vecino Totoro | Imagen: Studio Ghibli

El estilo. Cabe destacar que nadie puede evitar que alguien haga obras con el estilo de Miyazaki o de Studio Ghibli. El estilo no está protegido per se. Otra historia, y es donde está el quid de la cuestión, es usar obras protegidas para entrenar a una IA capaz de replicar ese estilo. Ese es el verdadero problema. Podríamos entenderlo como el fan art: tú puedes hacer una ilustración de Pikachu, imprimirla y ponerla en tu habitación, no hay problema. Lo que no puedes hacer es vender esa ilustración.

En Xataka

El Gobierno de España quiere que todo el contenido IA lleve una "etiqueta". Suena muy bien, pero es un reto tremendo

El dolor de cabeza de OpenAI. Este acceso y uso de contenido protegido por derechos de autor con fines comerciales le ha valido a OpenAI alguna que otra denuncia, siendo la más importante la de New York Times. Getty también denunció a Stable Diffusion por haber usado sus imágenes para entrenar modelos, Anthropic fue denunciada por un grupo de autores por haber usado sus libros para entrenar a Claude y Meta, aparentemente, descargó 81,7 TB de libros con copyright para entrenar a sus modelos.

La conclusión es clara y la hemos abordado en alguna ocasión: el precio a pagar por tener inteligencia artificial es el saqueo de todo el contenido en Internet, más allá de que las empresas de IA se apoyen y escuden en el fair use. Con la inteligencia artificial generativa parece haberse asumido que si está en Internet es gratis, y la realidad es que no siempre es así. Todas las grandes empresas de IA han ignorado las leyes de copyright y, de momento, no está habiendo consecuencias. El debate, sin embargo, está lejos de terminar y probablemente esta no sea la última vez que se ponga sobre la mesa.

Imagen de portada | @Mdurbar

En Xataka | La IA generativa tiene un enorme problema con el contenido sin licencia para entrenarse. Adobe está intentando solucionarlo

Millones de personas vuelven a estar interesadas en ChatGPT. El problema es que lo ha conseguido vulnerando derechos de autor

Detrás de un inocente meme hecho con el estilo de Hayao Miyazaki hay algo mucho más importante: una vulneración de los derechos de autor por la que las empresas de IA no parecen estar sufriendo consecuencias

Explora en nuestros medios

nproxy.org

Recibe "Xatakaletter", nuestra newsletter semanal

Explora en nuestros medios

nproxy.org