Madrid, 15/01/2025. CEDRO ha solicitado a Common Crawl, organización sin ánimo de lucro dedicada a la creación y el mantenimiento de un repositorio abierto de contenido digital extraído de la web, la retirada de las publicaciones de prensa del repertorio de CEDRO incluidos en esa enorme base de datos.
Estos contenidos, que, en muchas ocasiones, son utilizados para el desarrollo de modelos de inteligencia artificial generativa (IAG) se extrajeron de la web, copiaron y almacenaron sin el consentimiento de sus titulares de derechos.
Además, CEDRO ha instado a esta fundación, que cuenta para distintos proyectos con la colaboración de grandes multinacionales tecnológicas , que se abstenga en un futuro de rastrear, obtener, almacenar y poner a disposición del público estos contenidos.
La solicitud de CEDRO se fundamenta en el marco jurídico de la Unión Europea y los Tratados Internacionales, que consideran la actividad que lleva a cabo Common Crawl, consistente en el rastreo de contenido de internet y su almacenamiento en una base de datos de público acceso, como un acto de reproducción y comunicación pública. Según la normativa actual, esta práctica requiere la autorización previa de los titulares de los derechos afectados, que pueden exigir ser remunerados por la explotación de sus publicaciones.
Los trabajos realizados por Common Crawl son utilizados por empresas tecnológicas que desarrollan, entre otros, modelos de lenguaje natural dirigido a sustituir la intervención humana en determinadas tareas. Esta actividad difiere y excede significativamente de la finalidad que persigue la minería de textos y datos, como ya han puesto de manifiesto diversos estudios.
Este caso pone de manifiesto una vez más los beneficios de la gestión colectiva que desarrolla CEDRO. Puesto que para cada titular afectado sería prácticamente imposible detectar y atajar este tipo infracciones.
El repositorio de Common Crawl, como se puede leer en su propia página web, alberga más de 250.000 millones de páginas recopiladas desde 2007, con un crecimiento mensual de entre 3.000 y 5.000 millones de páginas nuevas. Además, su relevancia se refleja en que ha sido citado en más de 10.000 artículos de investigación, lo que resalta su impacto.
Gracias al trabajo de CEDRO, que seguirá monitorizando este caso para asegurar el cumplimiento de las normativas vigentes y la protección de los derechos de sus socios, se sigue fomentando buenas prácticas en materia de propiedad intelectual y concienciando sobre la aportación positiva de la cultura escrita a nuestra sociedad y la viabilidad de proteger de forma eficiente los derechos de autor en el ámbito digital, incluso en el marco de la IAG desarrollada tanto en el ámbito público como privado.
2025 © Centro Español de Derechos Reprográficos

