Inicio Biblioteca Complutense Catálogo Cisne Colección Digital Complutense

II Jornadas sobre la Reutilización de la Información del Sector Público: acceso y uso de la información (1)

Andoni Calderón Rehecho 21 de Febrero de 2012 a las 13:12 h

El 15 y 16 de febrero han tenido lugar las II Jornadas sobre la Reutilización de la Información del Sector Público: acceso y uso de la información, organizadas por dos grupos de investigación: PUBLIDOC de la Universidad Complutense y ACRÓPOLIS de la Universidad Carlos III.

El tema de las jornadas se centra en la necesidad de que toda la información pública esté accesible, si es posible de manera gratuita; lo que implica cuestiones legislativas, tecnológicas, económicas, científicas... y alfabetizadoras. Se relaciona -como veremos en el resumen- con conceptos como Open Data, Big Data, el aprendizaje máquina a máquina o la propia computación en la nube. Se va a incluir en la nueva directiva a Bibliotecas, Archivos y Museos.

La jornada se repartió en sendos días entre la Universidad Complutense y la Universidad Carlos III.

El día 15, reunió a unas 140 personas en la Facultad de Documentación de la UCM, siendo inauguradas las jornadas por el Vicerrector de Investigación de la UCM, Joaquín Plumet, acompañado del Decano de la Facultad y los directores de los grupos de investigación organizadores.

 

Acompañado por Fernando Ramos, el Decano y Mercedes Caridad

1. Inauguración 

Fernando Ramos Simón, de PUBLIDOC, nos dio una panorámica de las jornadas: la sesión de la UCM se dedicaría a reutilización de la información y la de la Carlos III a las políticas de información y acceso.
Consideró que los verdaderos destinatarios de la reutilización son los ciudadanos y las empresas, que es preciso sumar una masa crítica que permita crear redes de investigación en este ámbito (como es el caso de estas jornadas) y destacó que se encontrarían argumentos y opiniones provenientes de distintos ámbitos, desde la Comisión Europea al ciudadano en la red.

Además de dar las gracias a todos los que han hecho posible las jornadas, hace referencia a la documentación entregada:

Mercedes Caridad, del Instituto Agustín Millares al que pertenece el Grupo Acrópolis, destacó que en momentos de crisis hay que unir esfuerzos, la confluencia en líneas de trabajo similares entre los dos grupos de investigación organizadores y cómo el que dirige está trabajando con indicadores sobre la brecha digital. A continuación hizo una referencia al programa del siguiente día.


El Vicerrector disculpa al Rector y subraya cómo los avances más relevantes de los últimos años tienen que ver con la información (y tal vez con el transporte). Menciona una afirmación de un amigo suyo que fuera secretario de Estado en la que consideraba que todo es imaginable desde el punto de vista técnico. El problema estriba en el tratamiento de la información, que no se resuelve con un aparato.

 

2. La revisión de la Directiva Europea 2003/98 sobre Reutilización de la Información en el Sector Público 

Juan Pelegrín (ver presentación), de la Comisión Europea, se refirió  a la Directiva PSI, que va a ampliarse a Bibliotecas, Archivos y Museos.Ponente, presentador y diapositiva sobre por qué se revisa la directiva
Su contexto es la Agenda Digital Europea, según la cual se pretende conseguir para 2015 un mercado único digital. Se ha propuesto para ello una revisión de la Directiva PSI para abrir las fuentes de datos públicas, con lo que pasaríamos del PSI al Open Data.

La reutilización puede dar pie a un negocio de 140.000 millones de euros, supone un acercamiento a la ciudadanía, implica una rendición de cuentas y la mejora de la eficiencia, afecta a todos los niveles políticos (incluso locales y particulares) y, por supuesto, al mundo científico, dando paso a la E-ciencia. 


¿Cuál es la estrategia de Open Data?
Hay 3 tipos de medidas: reglamentarias/no reglamentarias, la dotación de presupuesto y el intercambio de experiencias entre estados.

La propia Comisión Europea pretende poner su información (en 27 lenguas) a disposición de todos: libre, abierta, sin condiciones. Para ello es necesario utilizar los formatos adecuados, que permitan el machine to machine learning.
Se van a financiar las iniciativas para el manejo de datos dentro del 7º Programa Marco y el Plan Horizonte 2020.
Se pretende crear un portal único para toda la Comisión, creando un portal paneuropeo de datos, de una manera similar a Europeana.

Para coordinar a todos los países miembros hay un Grupo PSI que cuenta con la plataforma ePSI con noticias sobre evaluación europea y la red LAPSI para cuestiones jurídicas. Además se está intentando marcar directrices sobre materias de licencias y costes y se han realizado diferentes infomes intentando evaluar su impacto.


¿Por qué se revisa la Directiva?

  • Falta de claridad y transparencia
  • No mecanismos eficaces para aunar posiciones, procedimientos...
  • Se cobra mucho y se usa poco
  • Si los datos están disponibles se formatean y crean nuevas informaciones con valor añadido

Se piensa que si algo es gratis supone una descarga masiva. Antes sólo las grandes empresas podían acceder; ahora las pequeñas pueden crear su propio nicho.
Hay que considerar no obstante que, algunas instituciones están obligadas a cobrar, que la venta de los datos supone en la mayor parte de los casos menos del 1% del presupuesto, que el usuario genera calidad y que bajar los precios acababa generando más beneficio.

Los cambios principales son:

  • todos los datos accessibles deben ser reutilizables (en España lo establece el Reglamento)
  • el ámbito de aplicación se amplía a las bibliotecas (incluyendo las universitarias), archivos y museos
  • definir la misión de servicio público
  • supervisión independiente
  • formatos legibles (junto a los metadatos)
  • las reglas de precios: quien cobre debe justificarlo (recae en ellos la carga de la prueba)

Las instituciones culturales tienen rasgos concretos que influyen en los derechos de autor y los costes, lo que sugiere la necesidad de un periodo de adaptación.

Se cree que estará disponible en un período de entre 1,5 y 2 años. 

 

Esquema de implicaciones de la reutilización

3. Marco legal en España: Real Decreto 1495/2011 

Jorge Cancio (ver presentación), de la SETSI (Secretaría de Estado de Telecomunicaciones para la Sociedad de la Información) muestra una panorámica de la situación en España, con las actividades del Proyecto Aporta y lo que supone el Real Decreto 1495/2011.
Define el concepto de reutilización como "el uso de los documentos, por personas físicas o jurídicas, con fines comerciales o no comerciales, siempre que dicho uso no constituya una actividad administrativa pública" (art. 3.1 de la Ley 37/2007), considerando que forman parte de ese conjunto de documentos los datos desagregados, en bruto. Muestra la diferente normativa existente defendiendo que más que laguna legal, como algunos manifiestan, existe un horror vacui legislativo.

La Ley 37/2007 es transposición de la Directiva arriba mencionada, que se desarrolla -además de en el Decreto citado- con el Real Decreto 1495/2011 que se adentra en los datos abiertos (open data), determinando que las instituciones públicas pueden dejar abierta la información o no; pero si lo hacen deben hacerlo en las mismas condiciones para todos.

Se detiene también en el valor de la reutilización:

  • el económico: mencionando estudios que lo situaban en los 27.000 millones de euros en 2006 (MEPSIR)
  • el de innovación en los servicios y productos: OCDE (2010)
  • el social y democrático: el valor de la información es mayor cuanto más se utiliza.

Presenta un mapa de la reutilización en España y responde a la pregunta de quiénes son los reutilizadores con un estudio del Proyecto Aporta: la mayor parte son empresas pequeñas, fundamentalmente de los ámbitos de los negocios (37,6%), geográfico/cartográfico (30.5%) y jurídico/legal (17%).

Las barreras que se han detectado han sido las siguientes:

  • falta información sobre la reutilización
  • hay inseguridad sobre qué puede hacerse
  • responsabilidades y funciones
  • las condiciones no son claras y están fragmentadas
  • necesidad de mejoras en la interoperabilidad y en el uso de formatos reutilizables

Estas son -entre otras- las razones por la que se ha aprobado el Real Decreto 1495/2011:

  • se clarifican las responsabilidades estableciendo una autorización general de reutilización; en que las excepciones deben justificarse
  • se dan detalles sobre las condiciones de reutilización, homogeneizándolas sin condiciones (salvo la cita) con cesión no exclusiva de los derechos de propiedad intelectual (algo similar a Creative Commons)
  • para condiciones especiales se crea un procedimiento especial
  • las tasas quedan fuera del RD ya que precisan de una ley para su regulación
  • para hacerla más accesible y visible:
    • soporte legal al catálogo de información pública
    • mantenimiento actualizado obligatorio
    • mandato para desarrollar las Normas Técnicas de Interoperabilidad dentro del ENI
  • establecimiento de responsabilidades y funciones:
    • 2 Secretarías de Estado: SETSI y Secretaría de Administraciones Públicas
    • Consejo Superior de Administración Electrónica
    • Órganos competentes para autorizar la reutilización

Datos.Gob.es: reutiliza la información pública es el espacio web clave, que busca apoyar al RD y todo lo que conlleva.

Para finalizar marca los hitos de este camino (2009, Portal Aporta; 2010, Guía de reutilización; 2011, Datos.Gob.es; 2012, Norma Técnica de Interoperabilidad sea aprobada y aparezcan diferentes planes RISP) en el que el objetivo del Proyecto Aporta es desaparecer, por haber cumplido con su misión.

 

4. Usos potenciales (y reales) de la información públicaDiapositiva sobre el avance de la tecnología

Luis Collado, de Google, nos dice que hemos visto el telediario o las noticias y que ahora vamos a ver las cosas reales. Considera que falta mucho para que realmente sea efectiva la puesta en abierto de esta información, ya que una cosa es lo que se piensa y otra lo que se hace.
En el mundo de la información se ha pasado en relativamente poco tiempo de la plaza en la que el pregonero nos daba la información a viva voz a estar todos colgados de la nube, con un avance tecnológico que nos está sobrepasando. Desde 2008 las instituciones están reaccionando, aunque el desarrollo legislativo/normativo está siendo superado claramente por las personas conectadas a Internet (unos 2.200 millones), durante cada vez más tiempo.


Una de las claves es que se han multiplicado las posibilidades de acceso en una era de la abundancia de la información, mediante el acceso digital.

Otro elemento fundamental es el nuevo tipo de ciudadano, con un papel más protagonista y menos pasivo ante la información:

  • tienen el poder
  • más gente consumiendo más
  • más infieles a las fuentes originarios de la información
  • ¡Opinan! ¡Comparten!
  • nuevas formas de acceso a la información: explosión de redes sociales (se trata mañana)
  • Yo e Internet: antes la información fluía en una única dirección; ahora el camino de vuelta está también transitado

Según Luis Collado la información pública se conforma con estar presente en la web, cuando debería:

  • hacerse ver: máxima visibilidad
  • innovar: hacer algo diferente
  • convertirse en una experiencia agradable: visibilidad
  • tener una utilidad

Los que le dan valor son los que él llama facilitadores (infomediarios), terceros que acercan la información a los destinatarios finales (ciudadanos, empresas...) y que no tienen un papel en la normativa.

¿Qué hacen estos facilitadores? Aquí pone ejemplos de las herramientas de Google:

  • El acceso al conocimiento, que está en los libros: Google Books, frente a la idea [supuesta] del bibliotecario de que vengan a verlo a mi biblioteca.
  • La información geoespacial, con los mapas (de los que dispone el Instituto Geográfico Nacional, con cartografía aérea). Google Maps te permite crear tu propio mapa, corregir alguno ya creado... Es un ejemplo de reutilización de información inicialmente pública.
  • El arte al alcance de la mano: Art Project. La tecnología permite llegar a detalles que ni siquiera son posibles en vivo a la distancia del paso por los museos.
  • La situación del tráfico en tiempo real. Pone un ejemplo de San Francisco, con Google Maps. Recuerda que esta es una información que tiene el Ayuntamiento, que los ciudadanos necesitan y que la tecnología permite.
  • Información (si yo quiero) sobre tiendas, espectáculos... cercanos a donde me encuentro, que se muestren en los dispositivos móviles. Esto es fomentar la economía según el ponente.

Para el debate:

  • ¿Cuál es el concepto de propiedad frente al derecho de uso? ¿De quién es la propiedad del sector público?
  • Propiedad intelectual de los contenidos. Cuando alguien opina, critica... ¿dónde está la propiedad intelectual?
  • El papel de terceros, que aportan valor añadido con fuertes inversiones, ¿se considera explotación comercial? ¿Cómo se realiza el retorno de las inversiones adicionales?
  • Los tipos de licencia son absolutamente claves y sin embargo no hay nada normalizado
  • Re-re-re-...utilización: es algo más complicado que una fuente-una información-un usuario...
  • Los precios que deben pagarse por la información
  • ¿Sustitución de los servicios públicos? Esos intermediarios pueden sustituir a los servicios públicos; como Google con el Catastro.

 

5. Datos enlazados en la BNE: Datos.bne.es 

Daniel Vila Suero (ver presentación) nos introduce en el mundo de los datos enlazados con un ejemplo que responde con este tipo de datos a la pregunta de quién ha traducido El Quijote, de tal manera que se integra información de La explotación de los datos en la diapositivamúltiples fuentes, mejorando la información local y facilitando el acceso a información remota. En el caso concreto que muestra, la basse de datos de la Biblioteca Nacional, VIAF (fichero de autoridades internacional) y DNB (Catálogo Nacional Alemán).

    El objetivo es integrar datos de varias fuentes diferentes, mediante grafos independientes que se interseccionan, basándose en estándares web que llevan desarrollándose más de 10 años.
    Combinan datos:

    • de diferentes fuentes
    • en distintos formatos
    • con niveles de detalle diversos
    • en varios idiomas

    Los elementos para lograrlo:

    • Linked Open Data (2011) [Ver EPI, 2011, v.20, n.2]
    • Modelos en RDF(S): el eje de todo. Describe recursos y relaciones entre ellos creando tripletas que unen Sujeto, atributo y valor; por ejemplo: Cervantes(Persona)-es autor-El Quijote(Obra)
    • Identificadores únicos URI, también para las entidades.
    • Relaciones de equivalencia entre URIs: SameAs
    • Modelo de ontología de datos

    En noviembre de 2011 había, en registros MARC21, 4,2 millones de registros de autoridad y 3,9 bibliográficos.

    El proceso sigue los siguientes pasos: especificaciones -> modelado -> generación de RDF -> generación de enlaces -> publicación -> explotación

    El modelado parte de FRBR (de la IFLA) que es convertido en RDF; la generación de enlaces busca fuentes de datos interesantes y establece relaciones entre ellas; se publica en la web y se pueden explotar creando APIs propias.

    Los resultados del portal suponen enlazar VIAF / SUDOC / GND / LIBRIS / DBPedia y constan de 58 millones de tripletas RDF.

    Puede verse la jornada con los ojos de otro testigo: http://manuelpereiragonzalez.blogspot.com/2012/02/resumen-ii-jornadas-sobre-reutilizacion.html

     

    El resumen completo llena 4 noticias. Éstas son las otras tres:

    Bookmark and Share
    Ver todos los posts de: Andoni Calderón Rehecho


    Universidad Complutense de Madrid - Ciudad Universitaria - 28040 Madrid - Tel. +34 914520400
    [Información - Sugerencias]