Cinco editoriales demandan a Meta por entrenar Llama con 267 terabytes de libros piratas
Elsevier, Macmillan, McGraw Hill, Cengage y Hachette acusan a Meta y a Mark Zuckerberg de usar más de 267 terabytes de material protegido, descargado de sitios pirata, para entrenar sus modelos Llama.
Cinco de las editoriales más grandes del mundo —Elsevier, Cengage Learning, Hachette Book Group, Macmillan Publishing Group y McGraw Hill— junto al autor Scott Turow, presentaron una demanda colectiva contra Meta y su fundador Mark Zuckerberg. La acusación: haber usado más de 267 terabytes de material protegido por derechos de autor, descargado de sitios pirata, para entrenar los modelos de lenguaje Llama.
Qué dice la demanda
Según el escrito presentado ante un tribunal federal de Nueva York, Meta habría descargado el material mediante torrents desde plataformas de piratería conocidas, y habría enmascarado direcciones IP para evitar ser detectada mientras lo hacía. Los demandantes también acusan a la compañía de eliminar la información de gestión de derechos de autor para ocultar el origen del contenido.
Entre las obras citadas específicamente se encuentran varios libros del propio Turow, incluyendo su clásico thriller legal de 1987 "Presunto inocente". Las editoriales sostienen que esto no es un caso límite de "uso justo" (fair use), sino una copia masiva y deliberada de contenido con derechos reservados.
La defensa de Meta
Meta ha sostenido en casos similares que entrenar modelos de IA con material protegido puede calificar como uso justo, un argumento que ya ha sido puesto a prueba en otras demandas presentadas por autores como Sarah Silverman contra la propia Meta y OpenAI. La compañía no ha confirmado ni negado públicamente los detalles específicos de los 267 terabytes mencionados en esta nueva demanda.
Qué piden los demandantes
Las editoriales buscan daños estatutarios, una orden judicial que impida a Meta seguir usando el material, y la destrucción de las copias infractoras, lo que en teoría podría obligar a la empresa a revisar o incluso retirar versiones de Llama entrenadas con ese contenido.
Por qué importa
Este caso se suma a una ola creciente de demandas de editoriales, autores y medios de comunicación contra las principales empresas de IA generativa. La pregunta de fondo —si entrenar un modelo con libros y artículos protegidos califica como "uso justo"— sigue sin una respuesta definitiva en los tribunales de Estados Unidos, y el resultado de casos como este podría determinar cómo se entrenan los modelos de IA en el futuro.
Junior De Leon
Editor principal de TechPulse.
Comentarios
Sé el primero en comentar.