Skip to content

Latest commit

 

History

History
31 lines (24 loc) · 1.85 KB

README.md

File metadata and controls

31 lines (24 loc) · 1.85 KB

LinkedOpenDataINE

Este repositorio existe para subir los recursos semánticos generados para el proyecto LinkedOpenData, colaboración entre el Ontology Engineering Group y el Instituto Nacional de Estadística. Estas instrucciones parten de que el usuario tiene acceso a la VPN, y la base de datos del INE. Para ejecutar el fichero "linkedstats_generation.py" se debe estar conectado a la VPN, y los parámetros "example_usr", y "example_psw" son el usuario y contraseña para acceder a la base de datos.

Los pasos a seguir para generar estos datos en local son los siguientes:

  1. Crear un entorno virtual (Recomendado).
  2. Instalar Python.
  3. Instalar la librería de Morph-KGC y sus dependencias para que funcione con bases de datos Oracle:
 pip install morph-kgc[oracle]
  1. Ejecutar el script linkedstats_generation con el usuario y contraseña de la base de datos, y la clasificacion como parámetros:
python3 linkedstats_generation.py "example_usr" "example_psw" "CNAE09"

Cubos de datos

Para la generación correcta del cubo el fichero "variables_correspondece.txt" debe contener las variables que emplea ese cubo y su correspondecia con la medida o dimensión en RDF. Estas pueden ser reutilizadas de los vocabularios definidos por SDMX, o los diseñados para este proyecto. Los pasos a seguir para la generación semiautomática de de los cubos de datos en RDF son los siguientes:

  1. Crear un entorno virtual (Recomendado).
  2. Instalar Python.
  3. Ejecutar el script cube_semiauto_generation.py con la ruta del cubo a generar en formato csv.
python .\cube_semiauto_generation.py ../datasets/capitulo_66615.csv

Autor

  • Diego Conde Herreros (OEG-UPM) - main contact diego.conde.herreros at upm.es