
MrBeast responde a polémica por grabar video en zonas arqueológicas de México
mayo 20, 2025
Descubren una colosal burbuja absolutamente esférica en la Vía Láctea y la nombran Teleios, ‘perfección’
mayo 20, 2025Meta está usando LibGen, un archivo en línea de materiales pirateados, entre ellos, académicos, para entrenar sus modelos de lenguaje de IA generativa. La noticia es una paradoja, especialmente si se lee desde la perspectiva de la investigación académica. El escritor es lo opuesto a un defensor del derecho de autor. Es un sistema que ofrece muy poca autonomía y escaso apoyo a los pequeños editores, y que, en cambio, otorga un enorme poder a los grandes grupos editoriales, además de ser un obstáculo para la libre circulación del conocimiento y la cultura.
Gran parte de mi trabajo académico se publica en acceso abierto, pero es gracias a los privilegios asociados al país en el que trabajo como investigador. Fui uno de los primeros en entrevistar a Alexandra Elbakyan, de Sci-Hub, el proyecto en línea que mantiene todos los artículos científicos disponibles de forma gratuita. En resumen, no soy precisamente un defensor de los derechos de autor. Sin embargo, no veo nada positivo en que mi trabajo pirateado haya terminado en los datos de entrenamiento de la IA de Meta. Para el escritor, el problema principal, es Meta en sí misma y la economía política de la inteligencia artificial generativa, junto con la del capitalismo digital. En otras palabra, la piratería no es el verdadero problema.
Cuando The Atlantic publicó su investigación sobre esta base de datos en línea, que permite el acceso ilegal a contenidos protegidos por derechos de autor, me dio curiosidad buscar mi nombre. Hallé que LibGen albergaba cuatro de mis publicaciones académicas, incluido un libro publicado en 2020 por una editorial internacional y sujeto a derechos de autor. Como todas las personas que conozco que trabajan en el mundo académico y de la investigación, sé exactamente lo que es LibGen. En resumen, hace con los libros lo que Sci-Hub hace con los artículos.
Funcionarios de Trump se presentaron en la dependencia días antes de que la administración despidiera a su responsable, la cual acababa de publicar un informe sobre el uso de materiales protegidos por derechos de autor para el entrenamiento de la IA.
Cómo se publica la investigación académica
Cualquiera que realice investigación académica, incluso aquellos que, como yo, tienen el privilegio de hacerlo en un país donde los recursos institucionales permiten condiciones óptimas de trabajo, investigación y acceso a fuentes, tarde o temprano debe utilizar una de estas bases de datos.
No existe universidad ni sistema de bibliotecas que tenga acceso a todos los trabajos o libros publicados. Además, nadie está dispuesto a gastar cientos de dólares de su propio bolsillo para comprar un libro académico, ni puede costear archivos PDF de artículos que, a menudo, solo sirven para una cita marginal en una revisión bibliográfica. Un solo artículo cuesta decenas de dólares. Para quienes investigan, la verdadera moneda de cambio es la citación del trabajo ajeno. Por un lado, sin acceso a la bibliografía, uno no es citado; y por otro, no puede demostrar conocimiento de lo que se publica en sus campos de interés.
Los autores están siempre a un correo electrónico de distancia, y enviar sus trabajos a colegas o estudiantes que solicitan acceso forma parte de la costumbre. Sin embargo, LibGen o Sci-Hub son, a menudo, la única solución posible, o al menos la más rápida, para acceder a contenidos de otro modo inaccesibles. Existen datos y estadísticas que demuestran que el uso de estas plataformas es realmente global: incluso en países donde la investigación está mejor financiada, las descargas desde estas plataformas son numerosas. No hay ningún sector al que el sistema actual de derechos de autor perjudique tanto como a la investigación académica. En nuestro caso, se trata de un sistema explotador: no aporta ningún beneficio a la circulación del conocimiento, el desarrollo disciplinar ni la mejora del trabajo académico. Por el contrario, es quizás el peor obstáculo para cualquiera de estos objetivos: los materiales, cada vez más caros, dificultan la investigación y excluyen a quienes no tienen acceso a través de sus instituciones a sistemas bibliotecarios bien surtidos. Además, los derechos de autor sobre trabajos académicos no aportan beneficio económico a quienes investigan. Los derechos de autor son un obstáculo para la circulación de la verdadera moneda académica: las citas.
Para quienes no estén familiarizados con esta dinámica, en la inmensa mayoría de los casos, quienes investigan no reciben ninguna compensación de las editoriales académicas al publicar su trabajo, ni control sobre los derechos vinculados a su difusión. No se recibe remuneración por artículos, capítulos de libros y, casi nunca, por los propios libros. Sin embargo, todos estos materiales son comercializados por las editoriales, que ganan sumas millonarias con el trabajo que obtienen gratuitamente, y ejercen control sobre esos contenidos. En el mejor de los casos, un investigador puede recibir un anticipo simbólico por un libro, pero esto está lejos de ser la norma. El mercado se dirige casi exclusivamente a la propia academia, y las bibliotecas son los principales clientes de estas carísimas publicaciones. Las regalías para los autores, cuando existen, son mínimas.
Condé Nast y los editores de varios periódicos acusan a la empresa canadiense Cohere de utilizar sus contenidos sin permiso para el entrenamiento y los resultados de sus sistemas.
Acceso abierto, derechos de autor y edición académica
Una solución a este problema son los modelos que ofrecen recursos científicos en acceso abierto. El acceso abierto implica la posibilidad de publicar contenidos, artículos o libros, sin las restricciones de suscripción impuestas por los editores. También puede ser facilitado por las propias grandes editoriales, que cobran a los autores tarifas de varios miles de euros para «liberar» su trabajo de los derechos de autor y ponerlo a disposición del público. Asimismo, existen revistas académicas completamente de libre acceso, cuyos editores no cobran por ofrecer contenidos gratuitos. Muchas de estas revistas son de excelente calidad y gran prestigio, pero operan en un mundo diferente: son la excepción y, al mismo tiempo, la respuesta a una distorsión.
El impulso hacia el acceso abierto ha ido intensificándose progresivamente a lo largo de los años, impulsado por investigadores, instituciones académicas y organismos de financiación que ahora exigen cada vez más que las publicaciones estén disponibles en algún formato abierto. Si se tiene la suerte y, de nuevo, el privilegio de trabajar para una institución o recibir financiación de un organismo que apoya el acceso abierto, se está en buena posición. Algunas universidades tienen acuerdos con editoriales para cubrir las tarifas de acceso abierto de los artículos publicados por sus investigadores. Algunos organismos financiadores, como el que apoyó parte de mi trabajo, también ofrecen subsidios para cubrir estos costos, incluso en libros. Sin embargo, este es terreno de privilegios, desigualdades y geografía: factores que conceden ventajas y amplifican brechas.
En general, la edición académica es un universo de dinámicas de poder y explotación en el que todos estamos implicados en diferente grado. Para que su IA fuera más eficiente, Meta necesitó entrenarla también con textos académicos. En esto, incluso Meta encontró un obstáculo en los derechos de autor y, para eludirlos, recurrió a una base de datos formalmente ilegal como LibGen, y lo hizo en secreto. Se trata de una paradoja gigantesca. Meta podría haber infringido leyes y quizá enfrente demandas de editoriales por infracción de derechos. Sería fácil ver en este movimiento algún tipo de reacción contra un sistema injusto, una respuesta necesaria para el bienestar de la humanidad, que, con una IA mejor, solo tendría que ganar. Incluso podría parecer una victoria contra los derechos de autor. Pero hablamos de una gigante tecnológica que no tiene como objetivo la libre difusión del conocimiento. Las plataformas sociales, incluidas las de Meta, son extremadamente laxas al responder a solicitudes de retirada por supuestas infracciones de derechos, y esta herramienta suele usarse incluso para censurar contenidos. ¿Cómo debe salir Meta del discurso sobre la lucha contra los derechos de autor? Después de 20 años de canibalización de la red por parte de estas empresas, ¿realmente creemos que hay un indicio de espíritu pirata en sus acciones?
Hoy comienza el caso antimonopolio de la FTC contra Meta. Su resultado podría influir en el crecimiento de las grandes tecnológicas, pero el gobierno de EE UU tiene un largo camino por recorrer para demostrar sus argumentos.
El extractivismo de la IA generativa
Las razones por las que existe la piratería académica no tienen nada que ver con la posibilidad de que esta pueda ser explotada por una corporación. Esto debe quedar especialmente claro cuando se habla de inteligencia artificial. No es posible hablar de IA omitiendo sus rasgos políticos y económicos, o haciéndolo en abstracto, olvidando que la IA que ofrecen las big tech es un producto depredador desde múltiples perspectivas, además de una herramienta surgida de las mismas dinámicas de poder que llevan más de veinte años contaminando la red.
No se trata de demonizar las herramientas que tienen aplicaciones prácticas extremadamente útiles, incluso para la propia investigación, sino de no perder de vista la naturaleza de esas herramientas, la actuación de las empresas y sus objetivos. El problema no es la IA, sino las condiciones en las que se crea, los actores implicados y sus fines. Y en este caso no estamos hablando de una IA desarrollada por la Organización Europea para la Investigación Nuclear (CERN, por sus siglas en inglés), ni por instituciones públicas o de investigación, sino de la inteligencia artificial de Mark Zuckerberg.
El robo sin escrúpulos de este contenido es depredador porque omite por completo la existencia de quienes lo crearon. Y no porque no respete los derechos de autor, sino porque se apropia de una propiedad cultural. Es depredador porque recurre, sin ningún razonamiento cultural, a la piratería, que fue concebida para socavar un sistema injusto. Al hacerlo, Meta crea una capa adicional de explotación sobre ese contenido, burlándose de una estrategia de resistencia y vaciándola de sentido.
Que Meta recurriera a una base de datos ilegal para esta operación demuestra dos cosas: que los derechos de autor están agotados y no sirven absolutamente para nada, y, al mismo tiempo, que no hay límite alguno para las acciones de las empresas tecnológicas y su lógica extractiva. No había límites para la extracción de datos con fines de publicidad dirigida, ¿por qué debería haberlos para la IA generativa?
Esto ayudará a debilitar los derechos de autor o a enviarlos al desván, es un cuento de hadas que solo puede sostenerse en alguna narrativa determinista, donde la IA es un agente neutral, inevitable e imparable, al que no es posible ni justo poner límites. Es una narrativa tóxica, conveniente y muy peligrosa, como lo ha sido durante décadas. La respuesta no pueden ser los derechos de autor, pero tampoco la rendición incondicional ante este pensamiento que mezcla el lenguaje corporativo con una filosofía mezquina. No hemos librado y sostenido batallas por una red libre, por el uso justo, por las licencias Creative Commons, para que ahora sean explotadas por Meta y, una vez más, nos alegremos por ello.
Artículo originalmente publicado en WIRED Italia. Adaptado por Alondra Flores.