En noviembre del año pasado, las asociaciones representantes de los titulares de derechos de autor enviaron una carta al Gobierno noruego solicitando una compensación económica por el uso de materiales protegidos. El Gobierno decidió entonces encargar un estudio a la Biblioteca Nacional de Noruega que pudiera dilucidar si el uso de tales materiales influía el en rendimiento de los modelos de IA generativos. Tras varios meses de análisis y un consorcio con universidades y centros de supercomputación del país nórdico, se llegó a la conclusión de que, en general, los materiales protegidos por derechos de autor aportaban mejoras a los grandes modelos de lenguaje.
Además, los resultados indicaron que las obras de ficción y las traducciones no solo no aportaban a mejorar los LLMs, sino que en todas las métricas que se usan para medir el comportamiento de estos modelos, los resultados bajaban. No obstante, mientras que el uso de contenidos más fácticos parece ser positivo, su impacto se reduce en etapas posteriores del entrenamiento de modelos, muy habituales hoy en día, en las que se dota a los modelos de la capacidad de mantener conversaciones o resolver tareas.
En este contexto, mientras que los investigadores demostraron que, efectivamente, el uso de material protegido por derechos de autor parecía mejorar el rendimiento de los LLMs, se trató de no intentar traducir las mejoras porcentuales a un esquema de pago para los autores.
Una vez establecido el valor del material protegido, se decidió iniciar una serie de negociaciones entre Gobierno y representantes de los titulares de derechos para alcanzar un acuerdo que permitiera el uso de obras protegidas en el entrenamiento de grandes modelos de lenguaje. Había, pues, voluntad por parte del Gobierno al considerar los materiales protegidos como una parte fundamental para el desarrollo de modelos de lenguaje competitivos y para el beneficio de la sociedad noruega.
Al finalizar el proyecto, la Biblioteca Nacional de Noruega representó al Gobierno en las negociaciones. Se celebraron varias rondas con todos los representantes, pero había principalmente dos bloques diferenciados: la prensa escrita y los autores y editores de libros. Tras las primeras tomas de contacto, y con la supervisión del Gobierno, se hicieron varias propuestas. Una vez acordadas las medidas generales, se pasó a delimitar el alcance del acuerdo, su funcionamiento, las cuantías y otros aspectos relevantes, como mecanismos para darse de baja.
Por desgracia, mientras que el acuerdo fue aprobado por ambos bloques, solo se consiguió alcanzar con los representantes de prensa escrita. Aunque ya se ha iniciado una nueva conversación con los editores para ver exactamente qué material es relevante para el desarrollo de IA generativa y bajo qué términos se podría acceder a él.
Para la prensa escrita, se acordó un pago anual de 45 millones de coronas noruegas (unos 4 millones de euros), gestionado por la sociedad representante de los titulares de derechos. Cada periódico tiene la opción de darse de baja una vez al año, lo que implica que cualquier publicación de la misma casa será excluida de los conjuntos de datos de entrenamiento.
El material podrá ser usado para cualquier etapa del ciclo de desarrollo de los LLMs mientras que no sea distribuido a terceras partes. Modelos liberados que hayan usado material protegido por derechos de autor procedentes del acuerdo no podrán ser retirados, salvo error demostrable en su entrenamiento por parte de la Biblioteca Nacional, que será quien construya y ponga a disposición de la sociedad tales LLMs. Por último, los modelos que hayan usado material procedente del acuerdo deberán ser liberados con una licencia que sea tan abierta como sea posible, que permita el uso comercial, pero que restrinja el uso de los modelos para extraer de manera voluntaria datos de su entrenamiento.
Sí, las negociaciones con las editoriales ya están en marcha y, aunque ningún detalle puede ser revelado de momento, esperamos que lleguen a buen término durante la primera mitad de 2026.
La protección de los derechos de autores y editores es un pilar fundamental de esta iniciativa. ¿Qué papel desempeña Kopinor en su supervisión y gestión?
Kopinor es la sociedad gestora que representa a las distintas asociaciones de los titulares de derechos. Además de esta entidad de gestión, varios representantes de las distintas asociaciones formaron parte de las negociaciones, pero, en última instancia, Kopinor es la encargada de gestionar el acuerdo y distribuir la compensación económica de la manera que internamente elijan.
Sí, creo que el modelo noruego puede servir claramente de referencia, y de hecho no es un caso aislado: encaja en una tendencia europea en la que el ejemplo más cercano es el proyecto neerlandés GPT-NL.
En los Países Bajos, GPT-NL es un gran modelo de lenguaje impulsado por entidades públicas y sin ánimo de lucro, financiado por el Ministerio de Asuntos Económicos, con el objetivo explícito de reforzar la soberanía digital y garantizar un uso de la IA transparente, verificable y alineado con los valores y normativas europeas, incluido el respeto a la propiedad de los datos y a la legislación de propiedad intelectual.
Tanto Noruega como los Países Bajos comparten varios principios que sí pueden trasladarse a otros países: los modelos se desarrollan desde el sector público o consorcios sin ánimo de lucro; se insiste en entrenar los sistemas con datos obtenidos de forma legal y bajo acuerdos específicos (en ambos casos, incluso con grandes grupos de medios de comunicación), y se conciben como infraestructuras abiertas para universidades, administraciones y empresas, no como cajas negras puramente comerciales.
En ese sentido, el acuerdo noruego sobre prensa y el modelo holandés apuntan en la misma dirección: demostrar que es posible construir modelos competitivos partiendo de marcos de licencia claros, compensación a titulares de derechos y una fuerte exigencia de legalidad y transparencia. Ese conjunto de ideas, más que los detalles técnicos concretos, es lo que, en mi opinión, puede y debería servir de plantilla para el resto de Europa.
2025 © Centro Español de Derechos Reprográficos

