17/06/2025

IAG y derechos de autor: del mito de la máquina que piensa a la realidad de la reproducción literal y del puro cálculo matemático

Jorge Corrales, Director general de CEDRO

La experiencia y los análisis efectuados en los últimos años vienen a confirmar que los contenidos editoriales protegidos por el Derecho de Autor son utilizados para el desarrollo de los sistemas de inteligencia artificial generativa (IAG) y cómo, en distintos formatos y de diferentes maneras, son reproducidos en todas las fases de desarrollo de dicho sistema.

Esta explotación de las obras, de acuerdo con la normativa y jurisprudencia europea, exige la autorización de sus autores y editores y una remuneración justa por estos usos, algo que parecen olvidar los desarrolladores, privados y públicos, de este software de IA.

Como no podía ser de otra manera, el planteamiento arriba expuesto, en cuanto a la utilización de obras protegidas, ha venido a ser refrendado por un representante del Barcelona Supercomputing Center (BSC) en un taller sobre IA y derechos de autor, organizado por la Comisión JURI del Parlamento Europeo, el pasado 4 de junio.

El representante del BSC puso de manifiesto que en el desarrollo de la IAG «cada fase —ingestión, procesamiento, aprendizaje— necesariamente implica acceder y copiar contenido protegido, no meramente ideas».

Y esto es así porque en el entorno digital, tradicionalmente las obras, por ejemplo, los libros, periódicos, revistas y partituras, se han representado mediante un código binario -secuencias de ceros y unos-, que permite almacenar y procesar la información. Esta codificación almacenaba implícitamente también la información relativa al orden de las palabras y su posición en el texto. Se trata, pues, de estándares que permitían y permiten la reproducción digital de obras, generando una especie de ciclo de traducción entre el lenguaje humano y el lenguaje de las máquinas, permitiendo que estas lo entiendan.

Algunos de los primeros desarrollos modernos de la IAG seguían la idea secuencial de la era binaria. Pero no hay que dejarse engañar, esta tecnología nació con el objetivo de reducir el coste de almacenamiento de la información y aumentar la eficiencia en la gestión de esta. Sin embargo, ahora, con el desarrollo de los modelos basados en Transformers, los procedimientos de traducción del lenguaje humano al lenguaje máquinas han cambiado.

La tecnología Transformers permite reproducir de forma literal la información y la expresión original de la obra. De acuerdo con la RAE, literal significa: «… conforme a la letra del texto, o al sentido exacto y propio...». A diferencia de otros sistemas que codifican las palabras en formato binario —ceros y unos—, los Transformers utilizan representaciones vectoriales multidimensionales, mediante una técnica conocida como embedding.

Esta técnica de embedding codifica la siguiente información:

Vector de tokens de la palabra: reproduce la palabra.
Vector de posición: reproduce la posición de la palabra en la frase, texto, etc. Sin la inclusión de esta información de posición no se podría desarrollar la parte de valor semántico (significado) y de contexto del modelo.
Vector de significado (semántica): reproduce el significado que el autor/a ha dado a la palabra en el texto.
Vector de contexto: reproduce la relación de la palabra con el contexto.

Por tanto, y sin necesidad siquiera de ser preguntado sobre el acceso legítimo a las obras que son utilizadas para el desarrollo de las aplicaciones de IAG, el representante del BSC afirmó que, en la fase de “ingestión” —preparación del repositorio inicial de obras, conocido técnicamente como “dataset”— es necesario acceder y reproducir obras protegidas. Esto implica que en la primera etapa en el desarrollo de la IAG se requiere la reproducción digital de todas las obras incluidas en el repositorio, para lo cual es necesaria la autorización de sus titulares de derechos. Y este punto es clave antes de analizar si cabría la aplicación del límite de minería de textos y datos previsto en el artículo 4 de la Directiva 2019/790, que permitiría el uso de las obras sin autorización para algunos fines, ya que antes sería necesario contar con ese acceso legítimo a dichas publicaciones para que fuera legal.

Asimismo, cuando el representante del BSC reconoce que en la fase de procesamiento resulta imprescindible reproducir las obras para transformar cada palabra en tokens, unidades mínimas que el modelo utiliza para operar (por el referido coste de almacenamiento y de cálculo), y demás vectores comentados.

En ellos se incluye las características semánticas y contextuales del contenido, esto es, la expresión original de las obras protegidas por los derechos de autor. Por lo que también aquí sería necesario el permiso de los titulares. Múltiple es la jurisprudencia del TJUE que lo confirma: «…la protección del derecho de autor abarca las expresiones pero no las ideas, procedimientos, métodos de operación o conceptos matemáticos en sí…». Véase, en este sentido, la sentencia de 2 de mayo de 2012, SAS Institute, C‑406/10. Cuestión también es señalada por el propio BSC en su presentación

De igual forma, el representante del BSC explicó que durante la fase de entrenamiento de un modelo de IAG también es necesario acceder y reproducir contenidos protegidos como parte del proceso técnico, pero en este caso en forma de los referidos vectores obtenidos en el paso anterior. Estos vectores, una vez introducidos en forma de matrices en la red neuronal, permiten realizar cálculos matemáticos —como la obtención de derivadas— para reducir el error entre el valor real y el que devuelve el modelo.  Por tanto, esta fase implica necesariamente otra reproducción más, efectuada en un formato diferente de la obra nacida directamente del autor.

El representante del BSC expuso, además, que en la fase de generación del modelo —es decir, cuando este es utilizado por los usuarios— no se produce acceso ni reproducción directa de las obras o de reproducciones de las obras originales del autor por parte del modelo de inteligencia artificial generativa.

Ahora bien, aunque el modelo no accede directamente a las obras o a las expresiones en dicho proceso de generación, los resultados que genera (comúnmente denominados outputs) pueden reproducir parcial o totalmente contenidos protegidos y, también, transformarlos y comunicarlos públicamente. A pesar de ello, los desarrolladores, a mi juicio, conscientemente no implementan medidas tecnológicas que bloqueen estos resultados que afectan directa y gravemente a los derechos de autor, a la normal explotación de las obras y al trabajo realizado por autores/as y editores/as. Además, hay que tener en cuenta que los modelos desarrollados por el BSC, como MarIA y ALIA, han sido puestos a disposición de usuarios empresariales con fines comerciales.

Por cierto, el representante del BSC también advierte en su intervención sobre la dificultad de garantizar la trazabilidad del uso de los contenidos protegidos en las respuestas o resultados (output) de las aplicaciones de IAG. Esta cuestión ya ha sido contemplada por el legislador: tanto el artículo 17 de la Directiva 2014/26/UE como el artículo 167 de la Ley de Propiedad Intelectual establecen que la responsabilidad de reportar los usos de las obras es una obligación que recae en el usuario del material protegido, una calificación que el propio BSC no cuestiona.

Por tanto, la existencia de dificultades técnicas para garantizar la trazabilidad, la información sobre el origen de las obras utilizadas para obtener esos los resultados, no encajan con la obligación legal de respeto a los derechos de los titulares ni justifica la falta de remuneración a los mismos. Esta obligación es claramente del desarrollador y, en ningún caso, puede trasladarse a los titulares, quienes deben dar la autorización y recibir la remuneración que legítimamente les corresponde.

Es importante señalar la necesidad de establecer medidas de seguridad eficientes sobre las bases de datos vectoriales que muchos de los desarrolladores utilizan para almacenar los embeddings —es decir, las representaciones vectoriales de obras protegidas—ya que no está claro que sean irreversibles y que permita reconstruir las obras, en todo o en parte, lo que incrementa el riesgo de infracciones contra los derechos de autor.

Como resumen, un nuevo cambio de tecnología para reproducir obras o su expresión original, es decir de codificación binaria a embedding, ha propiciado un debate que no es real y que ha sido motivado por intereses que amenazan con desarticular todavía más los principios fundamentales de nuestra sociedad.

Hemos de recordar que, durante los últimos treinta años se han desarrollado políticas de rent seeking — según las denomina la teoría económica— sobre los derechos de los autores y editores. Estas políticas, basadas en conceptos legales como fair use o límites o excepciones al derecho de autor, han potenciado a medio y largo plazo los siguientes resultados:

El desarrollo de barreras de entrada que limitan la competencia en el mercado de servicios digitales, empoderando a aquellas empresas que han podido desarrollar acciones de venta cruzada de producto a precio 0.

El desarrollo de inestabilidad en los entornos sociales, al primar en dichas empresas únicamente objetivos económicos, obviando su responsabilidad sobre cuestiones sociales y medioambientales.

El debilitamiento del impacto social de los valores del sector de la cultura escrita y por tanto al propio sector y a la sociedad.

Por todo ello, y con el objetivo de conseguir el pleno respeto a los derechos de autores y editores en el escenario que plantea la IAG, es fundamental analizar convenientemente los intereses que no se explicitan y que están detrás de estos nuevos desarrollos tecnológicos. Sin olvidar claro está, ir más allá de un simple análisis de conflicto de intereses, que en muchos casos es disfrazado de escasa capacidad presupuestaria a corto plazo.

Y termino con una pregunta: así como en su momento, con el desarrollo de la tecnología digital basada en código binario, fue necesario un tiempo para acordar un estándar de reproducción de la obra —como lo fue el código ASCII—, ¿no estaremos, quizás, ante una situación similar? ¿Acaso no veremos, con el tiempo, la creación de un nuevo estándar para la reproducción de la obra o de la expresión de la obra en el espacio multidimensional de los embeddings?

Imagen: © Shutterstock

Deja un comentario

Más reciente arriba Más antiguo arriba

Ver más comentarios

Gracias por el comentario, su comentario debe ser aprobado primero

Nuevo código

Por favor escriba el código de arriba

Os invitamos a comentar las entradas de nuestro blog.

Los comentarios están moderados, no aparecen en el blog de forma inmediata.

Se publicarán todos los comentarios salvo los que no tengan que ver con los temas tratados o contengan insultos o descalificaciones.

De acuerdo con lo establecido en la legislación vigente, le informamosque los datos que facilite serán tratados por CEDRO para poder tramitar su comunicación. Sus datos no serán cedidos a terceros, salvo obligación legal.

Usted cuenta con los derechos de acceso, rectificación, supresión, oposición, limitación al tratamiento y portabilidad, respecto de sus datos de carácter personal, así como con la posibilidad de revocar su consentimiento, pudiéndolos ejercitar por escrito a la dirección cedro@cedro.org, donde haga mención a su nombre, apellidos y dirección de correo electrónico. Para más información pinche en la Política de Privacidad.

Acepto los términos y condiciones de uso y la Política de Privacidad

Del Blog y sus servicios

Reglas generales de uso

Los usuarios habrán de acceder y utilizar el Blog para la finalidad para la que el mismo ha sido concebido y, en particular, con pleno respeto a las leyes, la moral, el orden público y los presentes Términos de uso. En concreto, los usuarios, se comprometen a acceder y utilizar el Blog conforme a las siguientes premisas:

El usuario no interferirá en el adecuado funcionamiento del Blog ni en el uso que otros usuarios estén realizando del mismo; ni interferirá o perturbará la aplicación o el funcionamiento de las medidas de seguridad implantadas en el Blog o la conexión a éste de otros usuarios o redes;
El usuario cumplirá con cualesquiera normas que resulten de aplicación al acceso y uso del Blog, incluyendo aquéllas que afecten al acceso, tratamiento y transmisión de datos;
El usuario no utilizará el Blog para enviar correos electrónicos o información no solicitada o para promover o comercializar, directamente o mediante enlaces, productos o servicios propios o de terceros, ya lo haga gratuita u onerosamente.
El usuario no utilizará el Blog para suplantar la identidad de un tercero o hacerse pasar por otro así como tampoco para acosar, injuriar o calumniar a otras personas o realizar actos de competencia desleal o publicidad engañosa o no autorizada por la legislación española o los presentes Términos de uso.
El usuario no utilizará el Blog para recabar información de terceros, en particular datos de carácter personal.
El usuario podrá acceder, ver, descargarse, copiar e imprimir los comentarios, opiniones, materiales, datos, informaciones y, en general, cualquier contenido que figure en el Blog, así como reenviar y compartir los mismos con otras personas, exclusivamente para su uso personal, esto es, nunca con una finalidad comercial. Todas las copias que haga de los comentarios, opiniones, materiales, datos e informaciones contenidas en el Blog deben identificar, claramente, su origen y autoría; y mantener los avisos de copyright o que hagan referencia a derechos de propiedad intelectual, industrial o de cualquier otra naturaleza que originalmente incluyeran. El usuario no utilizará, reproducirá, modificará, distribuirá o pondrá a disposición de terceros los comentarios, opiniones, materiales, datos o informaciones contenidas en el Blog con fines comerciales ni se atribuirá su autoría o atribuirá ésta a quien no corresponda. CEDRO, o el legítimo titular de los comentarios, opiniones, materiales, datos o informaciones descargadas, seguirá ostentando la plena titularidad respecto de los mismos así como respecto de las marcas y logos que pudieran aparecer en ellos y en el propio Blog.

Contenidos incorporados por los usuarios.

El Blog incluye una diversidad de contenidos que han podido ser elaborados bien por CEDRO bien por sus colaboradores, partners o terceros.

Asimismo, el hecho de que un contenido esté publicado o mencionado en el Blog, no implica que CEDRO esté conforme con lo manifestado en el mismo, no respondiendo, en ningún caso y bajo ninguna circunstancia, de aquéllos contenidos que no le fueran propios; ello afecta, igualmente, a las opiniones y manifestaciones que pudieran intercambiar los usuarios del Blog al participar en los distintos foros que se lleven a cabo a través del Blog.

El usuario será el único responsable de las opiniones, comentarios, materiales, información y/o datos que incorpore, publique, envíe, transmita, intercambie y utilice a través del Blog y garantiza que dicha incorporación, publicación, envío, transmisión, intercambio o utilización no vulnera ningún compromiso de confidencialidad y que posee las licencias, derechos, consentimientos y permisos de uso necesarios para realizar tales usos de dichos contenidos a través del Blog.

Si usted, en su condición de usuario, estuviera accediendo al Blog en nombre y representación de su empleador, manifiesta y garantiza que está autorizado a aceptar estos Términos de uso en nombre y por cuenta de su empleador y que su empleador está de acuerdo en mantenerle indemne tanto a usted como a CEDRO, y a sus filiales, colaboradores, partners y otros usuarios, en caso de que se violen los Términos de uso. Asimismo, y en caso de que incluya, publique, transmita, intercambie, traslade o comparta algún contenido a través del Blog, usted también manifiesta y garantiza que ha revisado que dicho contenido y su inclusión en el Blog es conforme con todas las políticas corporativas de su empleador y/o de la entidad o persona a la que pertenece o controla dicho contenido. Es su responsabilidad asegurarse de que los contenidos que incluye, publica, transmite, intercambia, traslada o comparte a través del Blog no implican divulgar información confidencial o propiedad de terceros, incluyendo información amparada por un acuerdo de confidencialidad, que usted no esté autorizado a divulgar.

Con carácter general, el usuario del Blog se compromete a no introducir comentarios, opiniones, datos, informaciones, materiales y, en definitiva, cualesquiera contenidos que:

sean falsos, inadecuados, incorrectos, engañosos o se encuentren incompletos;
promuevan productos y/o servicios ajenos a CEDRO, o consistan en solicitudes de empleo;
contengan contenido pornográfico o violento, o que inciten a la pornografía, a la violencia, al consumo de drogas o vulneren derechos de terceros;
contengan contenidos que supongan una violación de derechos de propiedad intelectual o industrial;
atenten contra el honor, la intimidad y/o la imagen de CEDRO y/o terceros, contra la moral y el orden público, o utilicen expresiones incorrectas, denigrantes, difamatorias o insultantes tanto contra el Blog y/o CEDRO, como contra otros usuarios y/o terceros;
vulneren compromisos de no competencia o confidencialidad alcanzados con CEDRO o con un tercero;
contengan virus, troyanos o cualquier otro tipo de software malicioso que pueda perjudicar el funcionamiento del Blog o de los sistemas o infraestructuras de otros usuarios, proveedores o terceros; o afectar negativamente a los datos y contenidos del Blog o de otros usuarios, proveedores o terceros;
contengan aplicativos, códigos fuentes o información de carácter personal;
vulneren lo dispuesto en estos Términos de uso o en la Política de Privacidad que aplica al Blog.

Asimismo, el usuario habrá de indicar, con claridad y veracidad, el origen de los datos, comentarios, opiniones, materiales, datos y, en general, contenidos introducidos en el Blog, absteniéndose de apropiarse de contenidos que no le pertenecieran o de atribuir los mismos a una persona que no fuera su legítimo autor o titular. En particular, el usuario se abstendrá de presentar sus opiniones, datos, informaciones, materiales y contenidos como si los mismos pertenecieran a CEDRO o como si ésta estuviera conforme o hubiera aprobado lo indicado en cada uno de ellos.

En definitiva, CEDRO no se responsabiliza por el mal uso o atribución indebida de los comentarios, opiniones, datos, informaciones, materiales y, en general, contenidos publicados en el Blog, ni de las opiniones y comentarios vertidos por los usuarios en foros, blogs, salas de chat, secciones y/o apartados a los que se acceda o participe a través del Blog.

CEDRO se reserva el derecho a no publicar, y/o retirar, las opiniones, juicios, comentarios, informaciones, datos, materiales o contenidos expuestos por los usuarios que infrinjan los presentes Términos de uso, la normativa vigente y/o lesione derechos de terceros, así como, en su caso, a cancelar las cuentas de los usuarios que infrinjan los presentes Términos de uso o la Política de Privacidad aplicable al Blog, sin necesidad de preaviso, en cualquier momento y sin limitación de ningún tipo; todo ello sin perjuicio de cualesquiera otros derechos y acciones que pueda ejercitar.

Acceso y uso de los contenidos

El usuario se verá expuesto a opiniones, juicios, comentarios, informaciones, datos, materiales y, en general, contenidos de diversas características y orígenes, lo que puede exponerle a contenidos que pudieran resultar ofensivos, indecentes, difamatorios o, simplemente, inadecuados o erróneos; asumiendo el usuario el riesgo asociado a su acceso o a la utilización o decisiones que adopte con causa en el mismo.

El usuario entiende que el Blog y las opiniones, juicios, comentarios, informaciones, datos, materiales, contenidos y servicios incluidos en el mismo son puestos a disposición de los usuarios por CEDRO en las condiciones recogidas en los presentes Términos de uso, no garantizando CEDRO la precisión, exactitud, veracidad, integridad o calidad de los contenidos disponibles en o a través del Blog, ya sean propios o de terceros.

No obstante, lo anterior, si el usuario considera que determinada opinión, juicio, comentario, información, dato, material y, en general, contenido lesiona cualquiera de sus derechos, puede ponerlo en conocimiento de CEDRO por escrito en la dirección postal facilitada anteriormente, o si lo prefiere, a través del apartado de contacto, o a través de la dirección de correo electrónico cedro@cedro.org. CEDRO se reserva el derecho a solicitar al usuario la verificación de su identidad y cualquier otra información necesaria para esclarecer los fundamentos de la reclamación realizada, así como a abstenerse de retirar la opinión, juicio, comentario, información, dato, material y, en general, contenido, si considera que no infringe derecho alguno.

De igual modo, si a través del Blog el usuario entablara algún tipo de relación con otro usuario o participante en el mismo, o de cualquier modo participara o recibiera servicios o productos de terceras partes utilizando el Blog, dicha comunicación, interacción o participación le vinculará sólo y exclusivamente con dicho tercero no siendo CEDRO responsable frente al usuario, bajo ningún concepto, en relación con dichas actividades o transacciones. En particular, la inclusión o existencia de links a sitios web de terceros no constituyen ningún respaldo, aprobación o promoción de dicho tercero o de los productos, servicios o informaciones contenidos en el sitio web de destino.

Por lo que se refiere a los usuarios del Blog, y respecto de las opiniones, juicios, comentarios, informaciones, datos o materiales a los que accedan al utilizar el Blog, el usuario reconoce y acepta que sólo puede acceder y utilizar los mismos, así como compartirlos, para su único y exclusivo uso personal o para el uso personal de aquellas personas con las que comparta tales contenidos, no pudiendo reproducir, modificar, divulgar, transferir, distribuir, publicar, desarrollar o, de cualquier otro modo, comunicar tales contenidos con fines comerciales o promocionales ni modificarlos o crear trabajos derivados o aparentar que de algún modo le pertenecen o es el autor de los mismos; así como tampoco atribuir su autoría a quien no correspondiera. En definitiva, el usuario siempre habrá de mencionar el origen y autoría de cualquier elemento o contenido del Blog al que acceda y que de algún modo utilice. De igual modo el usuario no podrá alterar, modificar, suprimir u ocultar ningún aviso de copyright o referente a un derecho de propiedad intelectual, industrial o de cualquier otra naturaleza que aparezca en el Blog o en los materiales o elementos que lo integran o que se han incluido o transmitido a través del mismo, incluyendo los que aparezcan en las copias que el usuario estuviera autorizado a realizar de tales materiales. En ningún caso, el usuario podrá utilizar los contenidos a los que acceda en detrimento de CEDRO o sus filiales, partners o colaboradores ni de otros usuarios, o de sus respectivos derechos.

Los aspectos relativos al tratamiento de los datos personales de los Usuarios con motivo del uso del Sitio Web se regulan el texto de Política de Privacidad Web. Al igual que otros portales de Internet, el Sitio Web utiliza una tecnología denominada "cookies" para recabar información sobre la forma de utilización del Sitio Web. Para información detallada sobre cómo CEDRO utiliza las cookies, consulta el texto Política de Cookies.

IAG y derechos de autor: del mito de la máquina que piensa a la realidad de la reproducción literal y del puro cálculo matemático

Del Blog y sus servicios

Suscripción

Archivo

Actualidad

Guía para autores y editores

¿Necesitas una licencia?

Función social y servicios