Consulta Pública de la Estrategia Nacional de Inteligencia Artificial
AGESIC
Propuesta técnico-legal para la protección de los derechos de propiedad intelectual y los datos personales en el entrenamiento de IA
Proponemos una solución que respeta la necesidad de proteger los secretos comerciales y la información confidencial de las empresas, mientras garantiza que los titulares de derechos de autor y otras partes interesadas puedan hacer valer sus derechos bajo la ley uruguaya.
Nuestra propuesta permite el manejo de la información compartida con estricta confidencialidad, salvaguardando los derechos de propiedad intelectual, secretos comerciales y datos sensibles. Es importante destacar que un proveedor de IA no necesita divulgar el conjunto de datos completo. El cumplimiento se asegura permitiendo que las partes identifiquen los ítems de datos sobre los que tienen legitimidad.
Este enfoque técnico protege los derechos de todas las partes interesadas, los intereses de seguridad pública y nacional, y cumple con las leyes de la Unión y nacionales. Se basa en prácticas industriales comunes, rentables y robustas. Las grandes empresas tecnológicas documentan las huellas digitales de los ítems de datos para que las autoridades puedan identificar contenido ilegal. Las empresas añaden rutinariamente atribuciones a los autores cuando utilizan sus obras en público. Las organizaciones académicas sin fines de lucro van más allá al referenciar las fuentes de datos, como ocurre cuando se publican conjuntos de datos de código abierto.
Para que una especificación sea lo suficientemente exhaustiva como para permitir que las partes hagan valer sus derechos, cualquier contenido protegido por derechos de autor o personal debe necesariamente ser divulgado ítem por ítem.
Los reguladores pueden asegurarse de que los proveedores de IA cumplan con sus obligaciones de transparencia bajo un amplio conjunto de leyes internacionales y específicas de cada país.
Los titulares de derechos y los consumidores pueden hacer valer sus derechos sobre los datos.
Los inversores pueden confiar en que un proveedor de IA no ha ocultado violaciones legales masivas, es decir, que el proveedor de IA no será golpeado por costosas demandas o acciones regulatorias.
Los proveedores de IA pueden demostrar que cumplen con las normas de protección de datos
A continuación presentamos varios ejemplos de cómo los conjuntos de datos de mayor calidad de la comunidad tienen características similares a las de MILD en sus metadatos y documentación. También mostramos cómo las especificaciones de MILD ayudarían con conjuntos de datos problemáticos.
Descripción: Un conjunto de datos de caras de Flickr en alta calidad (1024x1024).
Característica: Metadatos a nivel de ítem para las imágenes con su URL y licencia.
Descripción: Conjunto de datos de archivos de música con licencia de proveedores de audio.
Característica: Claridad legal para la licencia y el uso del modelo.
Problema: Conjunto de datos extraído de la web que fue filtrado de manera negligente para contenido ilegal, con un enfoque técnico deficiente.
Resultado: La organización fue presionada para retirarlo debido a la divulgación en la prensa del contenido ilegal (CSAM).
Solución: Los hashes en MILD permitirían una fácil identificación de contenido ilegal, lo cual es un enfoque estándar.
Problema: Conjunto de datos de libros obtenidos de sitios web piratas sin licencia.
Resultado: Obligado a ser retirado por una solicitud de eliminación bajo derechos de autor.
Solución: Los hashes en MILD permiten a los titulares de derechos detectar contenido de libros y tomar medidas antes.
Reportar contenido inapropiado
Este contenido no es apropiado?
0 comentarios
Cargando los comentarios ...
Cargando los comentarios ...