Más de 150 investigadores de 18 universidades han constituido la Red Temática Española de Linked Data, similar a las que ya funcionan en países como EEUU y Reino Unido. El objetivo es transferir a la ciudadanía fuentes de datos sobre materias como la información geoespacial de España, informes financieros de las empresas que cotizan el bolsa, publicaciones especializadas, referencias bibliográficas sobre alimentación y agricultura, tráfico de autobuses y estado de las carreteras.
Una veintena de grupos de investigación españoles, que aglutinan a más de 150 investigadores de 18 universidades, han creado la Red Temática Española de Linked Data, con la finalidad de facilitar el intercambio y transferencia de conocimientos, incluso con investigadores españoles que se encuentren trabajando en el extranjero en áreas relacionadas, así como de aumentar la visibilidad internacional de la investigación española en Linked Data. Así lo informa en un comunicado la Facultad de Informática de la Universidad Politécnica de Madrid (UPM), desde donde se lidera la red.
Las Redes Temáticas son asociaciones de grupos de investigación de entidades públicas o privadas, cuyas actividades científicas o tecnológicas están relacionadas dentro de un ámbito de interés compartido.
Linked Open Data (LOD - Datos Abiertos Enlazados) es una red mundial de datos que acumula en la actualidad más de cuatro millones y medio de referencias organizadas por burbujas temáticas relacionadas entre sí a través de Internet. Esta red mundial de datos constituye uno de los pilares de Web Semántica.
Los Datos Enlazados es la forma que tiene la Web Semántica de relacionar los distintos datos que están distribuidos en la Web, de forma que se referencian de la misma forma que lo hacen los enlaces de las páginas web.
Nueva tendencia social
La importancia de la Web de Datos (o Web de Linked Data) se puede demostrar por su gran crecimiento en los últimos meses. Otras iniciativas de carácter parecido a la de la red temática española se han creado, de manera más o menos formal que en este caso, en los países del entorno europeo y también en Estados Unidos.
Ejemplos de redes temáticas similares son las de las comunidades alrededor de iniciativas como la del Reino Unido y Estados Unidos, de fundaciones como la Open Knowledge Foundation,o de iniciativas populares, como ocurre en Italia en torno a la FAO. El Gobierno español está trabajando para facilitar a su vez el acceso de ciudadanos y empresas a datos públicos de la Administración General del Estado, y varias comunidades autónomas y ayuntamientos ya se han sumado a esta tendencia con iniciativas de datos abiertos (Open Data), como Euskadi, Asturias, Navarra, Cataluña, Zaragoza o Gijón, entre otras.
Para conseguir sus objetivos, la Red Temática Española en Linked Data ha previsto desarrollar una serie de reuniones periódicas de investigación y evangelización, con empresas y administraciones públicas, bajo el formato de voCamps, Linked Data meetups, así como desayunos de trabajo. Asimismo, contempla la creación de itinerarios formativos y material educativo (tutoriales on-line, transparencias, etc.) y el fomento de la movilidad de los investigadores por el territorio nacional.
Fuentes de datos disponibles
La Red Temática Española en Linked Data nace con unas fuentes de datos disponibles soportados por los miembros de la red. Una de estas fuentes es GeoLinked Data (.es), una iniciativa abierta del Grupo de Ingeniería Ontológica de la Facultad de Informática de la Universidad Politécnica de Madrid, destinada al enriquecimiento de la Web de los Datos con datos geoespaciales del territorio nacional español.
Esta iniciativa se ha puesto en marcha con la publicación en la Web de Datos de diversas fuentes de información procedentes del Instituto Geográfico Nacional (IGN). Las fuentes de datos utilizadas, hasta el momento, en GeoLinkedData.es pertenecen a este instituto y al Instituto Nacional de Estadística (INE).
Otra fuente disponible es SemanticXBRL, un conjunto de datos generado por el grupo GRIHO a partir de informes financieros, en formato XBRL, que múltiples empresas que cotizan en la bolsa de USA envían a la SEC.
Hay otras fuentes de datos que están en progreso por parte de los miembros de la red y que estarán disponibles para la Red Temática Española en Linked Data.
Una de estas fuentes de datos en progreso está siendo desarrollada por la Universidad de Deusto, que creará una fuente de datos Dublin Core con todas las publicaciones, al menos del 2010 y 2011, del grupo de investigación MoreLab. Se va a crear un procesador de enlaces a ficheros de publicaciones PDF, a partir de los cuales extraer los metadatos necesarios para generar instancias Dublin Core.
Otra fuente de datos en progreso es un punto de acceso SPARQL para la web del grupo MoreLab. Los datos en formato RDF que pueden ser consultados serán modelados acorde con los vocabularios Dublin Core, Geo, DOAP y Bio. También se creará un generador automático de páginas personales del personal del grupo, incluyendo secciones como Bio, publicaciones o proyectos en los que participa.
Además, el grupo GRIHO está colaborando con el proyecto AGRIS de UN-FAO para publicar como Linked Data las referencias bibliográficas que han ido recopilando sobre publicaciones relacionadas con alimentación y agricultura.
Por último, la Web de la red recopilará fuentes de datos y software generados por agentes externos a la Red Temática Española en Linked Data y que están disponibles asimismo para sus investigadores. Por ejemplo, una API para acceder a los datos públicos de BizkaiaBus, así como de un API para acceder a los datos públicos que ofrece el Departamento de Interior del Gobierno Vasco sobre el estado de carreteras.
Una veintena de grupos de investigación
La Red Temática Española de Linked Data está liderada por el profesor Oscar Corcho, del Grupo de Ingeniería Ontológica de la Facultad de Informática de la Universidad Politécnica de Madrid, e integra los siguientes grupos: Ontology Engineering Group (OEG), Grupo de Interoperabilidad de Bases de Datos de la Universidad del País Vasco, Centro para las Tecnologías Inteligentes de la Información y sus Aplicaciones (CETINIA) de la Universidad Rey Juan Carlos, Unidad de Internet de la Universidad de Deusto, Grupo de Inteligencia Artificial de la Universidad Complutense de Madrid, Grupo de investigación aDeNu de la Universidad Nacional de Educación a Distancia, Grupo de Investigación en Interacción Persona-Ordenador e Integración de Datos de la Universitat de Lleida, Grupo de Sistemas Inteligentes de la Universidad Europea de Madrid, Grupo de Ontologías de la Universidad San Pablo-CEU, Grupo de Sistemas de Información Avanzados de la Universidad de Zaragoza, Grupo de Sistemas Inteligentes de la Universidad de Santiago de Compostela, Grupo de Tecnologías de Modelado, Procesamiento y Gestión del Conocimiento de la Universidad de Murcia, Grupo KHAOS de la Universidad de Málaga, Laboratorio de Tecnologías Web (WebTLab) de la Universidad Carlos III, grupo OntoQuercus de la Universidad de Extremadura, grupo Sistemas de Información Distribuidos (SID) de la Universidad de Zaragoza, The Distributed Group de la Universidad de Sevilla, Unidad de Tecnologías Semánticas de la Fundación CTIC, y Grupo WESO - Web Semántica de la Universidad de Oviedo.
Fuente: SINC