
El controvertido uso de material pirateado por parte de Meta para el entrenamiento de Llama 3
Un reciente informe de investigación de The Atlantic revela una verdad inquietante sobre las prácticas de entrenamiento de Meta para su modelo de IA generativa, Llama 3. Los hallazgos resaltan el enorme volumen de libros y artículos académicos de fuentes ilícitas utilizados sin la debida autorización.
Falta de consideraciones éticas en el desarrollo de la IA
Durante su exploración inicial de la IA generativa, Meta contempló brevemente la posibilidad de obtener conjuntos de datos por medios legítimos. Dado que ninguna IA generativa puede funcionar sin las contribuciones de innumerables artistas y académicos, cabría esperar un enfoque más ético. Sin embargo, como demuestra esta situación, figuras influyentes del sector tecnológico como Mark Zuckerberg y Sam Altman parecen indiferentes al impacto de sus acciones, tomando decisiones que priorizan el lucro sobre la integridad artística.
Detalles de las acusaciones de piratería
El análisis de The Atlantic, respaldado por documentos judiciales recientemente descubiertos, sugiere que los empleados de Meta consideraron licenciar oficialmente varias obras literarias, pero finalmente consideraron el proceso «excesivamente caro» o «increíblemente lento».Dado que el ecosistema de IA generativa depende completamente del material existente, supuestamente optaron, con la aprobación tácita de Zuckerberg, por recuperar conjuntos de datos masivos de LibGen, un conocido sitio web de piratería que cuenta con más de 7, 5 millones de libros y 81 millones de artículos académicos.
Una respuesta comunitaria a la crisis
La magnitud de la presunta infracción de Meta ha provocado indignación entre los autores. Alex Reisner, de The Atlantic, ha creado un recurso para que los escritores comprueben si sus obras están incluidas en la base de datos de LibGen. Esta iniciativa popular reconoce las dificultades para determinar la totalidad de las descargas de Meta, dadas las posibles inexactitudes en los metadatos de LibGen. A medida que la noticia se difunde en plataformas como Threads, muchos autores expresan su consternación y preocupación.
Voces de la comunidad literaria
Como señaló Alexandra Bracken, autora de éxitos de ventas, la justificación de la piratería suele basarse en la accesibilidad. Sin embargo, el impacto va más allá de la pérdida de ventas; implica una pérdida de control sobre la propiedad intelectual con consecuencias de gran alcance. El perspicaz comentario de Bracken capta el quid de la cuestión:
Durante años se ha dicho a los autores que la piratería de nuestra obra estaba justificada por problemas de accesibilidad y que los lectores que piratean nuestra obra nunca habrían comprado copias legales. Pero el problema no es solo la pérdida de ventas, sino la pérdida total del control sobre nuestra propiedad intelectual, lo que ha provocado esto directamente.
Karina Halle también expresó su angustia, revelando que casi noventa de sus libros están afectados por las acciones de Meta y cuestionando la integridad del proceso de desarrollo de la IA:
89 de mis libros (y 19 ediciones extranjeras) en ese sitio de piratería que Meta ha utilizado para alimentar su IA. Sin palabras.
De manera similar, el autor AK Caggiano criticó el enfoque de Meta, señalando con humor la ironía de que su IA promueva la asistencia a la escritura mientras que los creadores originales son marginados:
¡Meta promocionando sus chorradas de IA de «ayúdame a escribir» en las publicaciones que creo es aún más gracioso ahora porque, ¿QUÉ QUIERES DECIR? ¡YA LO ESCRIBÍ! ¿AHORA QUIERES QUE ME PLAGIE?
Francesca Zappia planteó preguntas respecto de la compensación, cuestionando la actitud desdeñosa de Meta hacia los esfuerzos sustanciales que los autores ponen en sus obras creativas:
¿Dónde está mi compensación, @meta? Te llevaría demasiado tiempo y sería demasiado caro obtener los datos legalmente, pero ¿qué hay del tiempo, el trabajo y el dinero que gasté en crear y promocionar esos libros?
Llamados a un cambio legislativo
A medida que la tecnología de IA generativa evoluciona rápidamente, los legisladores parecen retrasarse a la hora de abordar los dilemas éticos que plantea. Con el incumplimiento de las leyes de derechos de autor vigentes, los creadores se encuentran en una situación precaria, mientras los magnates tecnológicos se benefician económicamente de su labor artística. El debate sobre posibles demandas colectivas está cobrando fuerza, y muchos abogan por un cambio en la forma en que la industria aborda estos problemas. La pregunta sigue siendo: ¿Queremos un futuro donde la literatura y la creatividad sean reemplazadas por contenido derivado, desconectado y carente de auténtica expresión humana?
Para obtener más información y más información sobre este tema, visita Source&Images.
Deja una respuesta ▼