Inicio Biblioteca Complutense Catálogo Cisne Colección Digital Complutense

Mientras los repositorios avanzan llegan los datasets!

Javier Pérez Iglesias 24 de Noviembre de 2008 a las 12:12 h

El pasado 17 de noviembre de 2008 el Consorcio Madroño organizó un Seminario sobre Datasets. La idea era tratar los principales retos que presenta la inclusión de los datos relacionados con las investigaciones en los repositorios digitales.

El Seminario iba dirigido a bibliotecarios, informáticos y, por supuesto, a los propios investigadores.

Se puede consultar el programa en la página de Madroño y también colgadas las presentaciones.

La jornada sirvió para conocer lo que se está haciendo en tres bibliotecas universitarias de Gran Bretaña que han decidio abordar este reto de archivar, y poner en acceso libre, los datasets.

Mientras están accesibles las presentaciones, os adelantamos algo sobre qué es eso de los datasets. No son sino los datos científicos sobre los que se realizan las investigaciones. Pueden ser datos observacionales, experimentales o computacionales. Además, los datos pueden ser derivados (se crean a partir de la combinación de otros datos) o canónicos (de referencia, como las secuencias genéticas o las estructuras cristalográficas).

La primera en intervenir fue Alicia López Medina, Directora de Innovación de la UNED, una de las responsables de RECOLECTA (el proveedor de servicios que han montado REBIUN y la FECYT) y participante en el proyecto e-ciencia que patrocina la Comunidad de Madrid. López Medina habló de la importancia que tiene, en el desarrollo del Acceso abierto, que avancemos en interoperabilidad y normas para que haya entendimiento entre las máquinas. El gran reto al que nos enfrentamos, en palabras de López Medina, es el desarrollo de la e-ciencia que implica la aparición y uso de objetos complejos, que se crean por agregación. Los artículos estarán asociados a los datos que se utilizaron para su creación y a los sucesivos comentarios y nuevos análisis a los que dé lugar. En todo caso, las bibliotecas universitarias españolas aún no hemos iniciado acciones para el tratamiento de datasets.

Por eso, fue interesante escuchar la exposición de Luis Martínez Uribe, del Oxford e-Research Center, que nos habló sobre la categorización de los datasets y de las distintas necesidades que han observado, entre sus usuarios investigadores, a la hora de conservar y gestionar ese tipo de información.

El siguiente en intervenir fue Stuart McDonald de EDINA que es el centro de datos académicos nacionales del  Joint Information Systems Comitee (JISC) del Reino Unido. EDINA tiene su sede en la Universidad de Edimburgo y su principal misión es trabajar para la mejora de la enseñanza, el aprendizaje y al investigación en el sistema académico británico.

McDonald comentó varios proyectos, herramientas e iniciativas que se están llevando a cabo desde EDINA. Un dato interesante es que los institutos de financiación del Reino Unido ya están pidiendo ciertas garantías para que se conserven los datos en los que se han basado las investigaciones que ellos han financiado. Otro aspecto que mereció su atención fue el de la necesidad de validar los datasets en el momento en que se van a colocar, en acceso libre, en los repositorios.

La última intervención, que no la menos jugosa, fue la de Celia Russell que trabaja en el Economic and Social Data Service International (ESDS) de la universidad de Manchester. La sra. Russell comenzó su charla recordando que los datasets son "la sangre que da vida a las investigaciones" y por eso es tan importante que seamos capaces de afrontar su gestión y conservación (y que se pueda disponer de ellos en acceso abierto).

A lo largo de las presentaciones, y en los turnos de preguntas, surgieron cuestiones y dudas de mucho interés: ¿Cual será el papel de los bibliotecarios en el tratamiento de los datasets? ¿Habrá que operar a nivel local, nacional o internacional para su gestión? ¿Cómo se seleccionarán los datos? ¿Quién asegurará su autenticidad?

En algunos aspectos habrá que seguir caminando para encontrar respuestas (la consulta de las presentaciones también ayudará) pero, en todo caso, habrá que estar atentos a la participación de la Biblioteca de la Universidad Carlos III de Madrid en el Proyecto Nereus, un proyecto europeo que implica a varias bibliotecas académicas europeas, y que conlleva un compromiso de gestión de datasets.

Para más información sobre datasets se puede consultar el informe de la National Science Foundation, de los EEUU, Long live data collections: enabling research and education in the 21th century

Por cierto, os recordamos que los días 10, 11 y 12 de diciembre se celebrarán en la UCM (en la Facultad de Informática) las Terceras Jornadas de OS-REPOSITORIOS. Entre otros participantes, contaremos con la presencia de Luis Martínez Uribe que nos presentará las acciones que están llevando a cabo en Oxford para afrontar la gestión de los datasets.

La matrícula para asistir a estas jornadas, que se celebran bajo el lema "la proyeccción de los repositorios institucionales", es gratuita. Ánimo y a apuntarse!

Bookmark and Share
Ver todos los posts de: Javier Pérez Iglesias


Universidad Complutense de Madrid - Ciudad Universitaria - 28040 Madrid - Tel. +34 914520400
[Información - Sugerencias]