OpenAI ha utilizado contenido con copyright para entrenar sus modelos: ahora se enfrenta a una oleada de demandas

La compañía suma un nuevo conflicto legal relacionado al entrenamiento sus modelos de IA
Microsoft, socio clave de OpenAI, también está incluido en la demanda recientemente presentada

12 comentarios Facebook Twitter E-mail

30 Abril 2024

Javier Marquez

OpenAI sigue acumulando demandas por entrenar sus modelos de inteligencia artificial con contenido protegido por derechos de autor. En los últimos meses, medios estadounidenses como The Intercept y The New York Times acusaron a la compañía dirigida por Sam Altman de utilizar artículos de su propiedad sin autorización. Ahora, la segunda empresa de periódicos más grande del país también ha decidido tomar acciones legales contra la tecnológica.

Ocho publicaciones que se encuentran bajo el paraguas del gigante Alden Global han presentado este martes una demanda en un tribunal federal de Nueva York contra OpenAI y su principal socio estratégico, Microsoft. El texto legal acusa a las mencionadas firmas de alimentar sus productos de IA generativa con “millones” de artículos protegidos por copyright y exige una compensación económica, pero no antes de que el caso sea tratado en un juicio con jurado.

ChatGPT y el modelo de negocio de los periódicos demandantes

La demanda de los periódicos de Alden señala que ChatGPT y Copilot mostraban el texto de artículo que se encontraban detrás de un muro de pago. Esto, según los demandantes, se tradujo en al menos dos problemas: por un lado, no siempre se citaba la fuente de la información; por otro lado, muchos lectores dejaron de pagar sus suscripciones. Las publicaciones aseguran que los mencionados chatbots causaron un impacto negativo en su modelo de negocio.

De acuerdo a Axios, la demanda también hace referencia a las “alucinaciones” que tienen los chatbots. Como sabemos, uno de los grandes problemas del estado actual de la IA generativa es que inventa cosas. En este sentido, el documento legal señala que ChatGPT inventó que The Denver Post había publicado acerca de investigaciones médicas relacionadas a que fumar puede ser una cura para el asma, tema que, según afirman, nunca existió en el periódico.

La demanda, impulsada por dos de los bufetes de abogados elegidos también por The Times, por ahora incluye los periódicos New York Daily News, Chicago Tribune, Orlando Sentinel, South Florida Sun Sentinel, San Jose Mercury News, The Denver Post, Orange County Register y St. Paul Pioneer Press. Se trata de ocho de las sesenta marcas que controla Alden Global Capital, por lo que también cabe la posibilidad de que en el futuro se sumen alguna de sus otras publicaciones.

Entrenar modelos de IA, un desafío cada vez más complicado

Estamos siendo testigos del descomunal crecimiento de la industria de la IA, pero también de los retos que aparecen en el horizonte. Los chatbots que casi todos conocemos tienen información sobre un amplio abanico de temas. Para conseguirlo, las compañías que los desarrollaron han tenido que recurrir a una ingente cantidad de datos. Todo parece indicar que algunas piezas son de dominio público, mientras que otras todavía están protegidas por derechos de autor.

Cabe señalar que desde que OpenAI adoptó un enfoque más comercial, alejándose de la filosofía abierta con la que fue fundada, muchos detalles de sus tecnologías se mantienen en secreto. Lo cierto es que no sabemos con qué datos exactamente ha sido entrenado, por ejemplo, el prodigioso GPT-4. Sin embargo, la compañía reconocía ante el parlamento británico que “sería imposible entrenar los principales modelos de IA de hoy en día sin usar materiales con copyright”.

En Xataka

Es oficial: Estados Unidos activa la prohibición de TikTok en nueve meses salvo que la plataforma pase a sus manos

Tendremos que esperar para saber el desenlace de los procesos judiciales que ahora están en marcha. Mientras tanto, eso sí, OpenAI ha comenzado a construir alianzas con diversos grupos editoriales para poder acceder a sus contenidos. El objetivo aquí es claro: garantizar cierto caudal de datos para poder entrenar sus modelos. Entre los acuerdos más recientes encontramos a Associated Press (AP), Axel Springer, Prisa y Le Monde.

Imágenes | Wirestock | Solen Feyissa | Emiliano Vittoriosi

En Xataka | ChatGPT se inventa datos y eso es ilegal en Europa. Así que una organización se ha propuesto arreglarlo con una demanda

Temas

Comentarios cerrados

Ver 10 comentarios

10 comentarios

Usuario desactivado

30 Abr., 23:07

2

Mira, primero se prueba la existencia y brecha de masa de Yang-Mills, antes esto que le quieren tirar encima a OpenAI.
Tienen que ser demasiado anormales, para no decir otra cosa, para que pierdan esa demanda.
Lo otro, que es ortogonal al tema, es la capacidad de generar presas de estos hijos de putas abogados, que nada más están al tanto de las compañías que hacen dinero, para ver qué les quitan. Qué profesión más mundana. Creo que ni los políticos son gente tan baja y mala entraña.
Menú
mszerox

* *

1 May., 4:16

3

Al final luego China y los militares mandan a callar a los abogados con el primero cagandoles a pirateria y el segundo con amenazas de rajarse a sus familias.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Usuario desactivado

2 May., 2:25

7

Cada cosa que MS toca, la arruina :-)
Que se jh..oda OpenAI por elegir esos socios :-)... y por robar propiedad intelectual, los paladines del copyright recibiendo un trago de su misma medicina.
Menú
1

Comentario moderado
buceopistilos

*

1 May., 10:17

4

Creo que nos aporta más el progreso que supone la IA que andar con litigios de copyrights.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo
Exos

* *

1 May., 16:51

6

Los derechos de autor no limitan el aprendizaje. Todos hemos aprendido de las obras de otros y hasta ahora no ha sido ningún problema, al revés, era motivo de honra y prestigio. Parece que si eso lo hace un software es delictivo, un robo… Cuando lo que se hace no es copiar un contenido, sino en extraer conclusiones sobre éste y en base a estas, generar o analizar otros datos.
Un ejemplo fácil es: no puedes crear una película copiando algún personaje de de Disney, pero puedes hacer una cuyos personajes sigan esa estética, eso lo hemos visto muchísimas veces.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo
Respondiendo a Exos

reiizumi

* * *

2 May., 7:31

8

Es más fácil de ver con un ejemplo:
- Compras un diseño 3D y lo imprimes en tu impresora. Ya que estás haces 2 o 3 copias para amigos.
- Una empresa compra el mismo diseño 3D y lo pone en su tienda, vendiendo cientos de copias.
Ambos han pagado lo mismo, pero no han obtenido el mismo beneficio. Incluso el 2o ha causado pérdidas al vendedor del diseño, ya que otros decidirán comprar la versión final en vez del diseño (incluso teniendo impresora).
Por esta razón, la mayoría de productos tienen versión "individual" y "para empresa", con costes claramente diferentes.
Aun así, las empresas confirman utilizar las versiones individuales para entrenar su IA.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 6.25 Vota positivo Vota negativo
Respondiendo a reiizumi

Exos

* *

3 May., 5:57

9

Ese ejemplo no tiene nada que ver, no se copia, se aprende ¿A que no te cobran menos por entrar en una galería de arte si no eres artista? Pues es lo mismo
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo
Respondiendo a Exos

reiizumi

* * *

3 May., 6:42

10

¿Me estás comparando una persona vs una AI?
Como persona vas a una galería de arte y aprendes algo de las técnicas, y puedes, o no, utilizarlas en los encargos que tengas.
Una AI almacena la información de todo lo que hay en la galería y genera "algo nuevo" que está basado en lo que allí existe, generando millones de resultados en un solo día.
Por tanto, una AI funciona bajo el modelo de creación masiva y cumple exactamente con el ejemplo que he indicado.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 6.25 Vota positivo Vota negativo
Respondiendo a reiizumi

Exos

* *

4 May., 7:46

11

Claro que las comparo, una trata de replicar a la otra haciendo tareas cada vez más complejas. Es más, están utilizando IAs para investigar como funciona nuestra mente, cómo aprendemos, cómo desarrollamos un lenguaje, etc.
Una inteligencia artificial, al igual que una natural no almacena todo, se queda con lo que le resulta útil para su cometido, no tiene una galería. Por otro lado, cuando una persona crea algo, siempre parte de cosas que ya existen, igual que una IA.
Tú, y muchos otros como los que denuncian, tenéis un problema de concepto de lo qué es y como funciona una IA.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo