La jornada del día 15 continuó con la explicación de cuál es el modelo francés, el proyecto ePSIplataform, el impacto de la reutilización y de los Open Data sobre la gestión en las Administraciones públicas y una mesa redonda sobre el tratamiento de esos mismos Open Data, todas ellas repartidas entre el final de la mañana y la tarde.
6. El modelo francés de reutilización de datos del sector público
Denis Berthault (Groupement Français de l'Industrie de l'Information, GFII) nos habló del modelo francés, haciendo un recorrido histórico desde la industria digital en ciernes en los 90, a pesar de que la venta de información a altos precios.
Considera que la reutilización de la información del sector público es importante para la propia Administración, para las empresas y para los ciudadanos y que todos los datos deben estar en acceso abierto y gratuito.
Francia cuenta con Data.Gouv.fr, desde finales de noviembre del año pasado con 300.000 datasets, apoyado por Etalab, ["iniciativa que se inscribe dentro de la política de simplificación de los servicios públicos online franceses, pretende coordinar la acción de las administraciones nacionales y apoyar la apertura pública de los datos que éstas gestionan" Proyecto Agrega].
¿Qué es lo siguiente? (2012)
- ¿Cobrar o no cobrar? El primer ministro dice una cosa y el ministro de finanzas otra
- ¿Cómo evaluar el impacto real?
- Calidad de los datos gratuitos: formatos no propietarios, no pdf...
- ¿Qué licencias usar?
- Las administraciones, regiones, ciudades... podrían no recibir beneficios de sus inversiones
- Preocupación por las responsabilidades legales, los derechos de autor, la privacidad y la confidencialidad.
- Perspectiva de los datos culturales.
- Cómo encontrará el gobierno un camino entre la estrategia a largo y a corto plazo para conseguir beneficios: nueva industria, nuevos "jugadores", más impuestos. En el Reino Unido todo cuesta dinero. ¿Cuánto cuesta mi dinero?
- Definir cómo recuperar el coste: un modelo de precios (pago o un % del beneficio de los usuarios)
- Contenido obligatoriamente gratuito.
- Licencias en cascada como el re-re-re...uso.
- Datos personales y anonimato.
- Derechos de autor de los agentes públicos: Ley 961-2006 de 1 de agosto
- Definición y limitaciones del papel estatal.
- Control de reutilizadores.
¿Cuáles son las principales necesidades de los reutilizadores?:
- Algunos licencia para todo
- Política de precios transparente y de 1 a 3 años
- Incentivar la relación entre productores y reutilizadotes
- No pdf, por favor
- Calidad y estabilidad de los datos: Mantener el mismo nivel de calidad
- Portal y metas. ¿Un único punto de venta?
- Algunos datos deben ser gratuitos ¿Es capaz de auditar el coste de reunir y gestionar el uso de los reutilizadores? El control puede costar más que tener los datos reutilizables de forma gratuita
7. 14 años de política PSI y su impacto (ver presentación).
Marc de Vries, coordinador de ePSIplatform, nos habla de la plataforma epSI y nos muestra la evolución de los últimos años, destacando algunos hechos relevantes.
En primer lugar la Directiva Europea, que considera un hito y menciona 3 estudios:
- 2006: MEPSIR que calcula el beneficio en 27.000 millones de euros. Varios análisis de 2008 refuerzan la cifra: 28.000 millones
- 2011: Vickery: los efectos directos serían de 32.000 millones. Si se tienen en cuenta los costes marginales se llega a los 40.000
- 2011: POPSIS: los usuarios y los usos se incrementan cuando el coste marginal es cero; la ratio de recuperación de costes baja del 80% a menos del 5%; los costes se reducen si la reutilización se profesionaliza; los ingresos extras por impuestos y aumento de la eficiencia supera las pérdidas por ingresos.
Para darnos una visión de cómo se está transformando el ámbito que nos ocupa, utiliza lo que llama cadena del valor de la información cuyos elementos son los siguientes: producción, recolección/compilación, distribución y reutilización. En esa cadena, tradicionalmente le ha correspondido al público únicamente el último paso; mientras que el resto de tareas eran del dominio de la administración.
Lo que hace a continuación es comparar cómo se comporta esa cadena en dos momentos (1998 y 2012), en relación a los que son protagonistas en cada uno de los eslabones; añadiendo qué ha sucedido para cambiar de un esquema a otro; por ejemplo, uno en el que los ciudadanos intervengan en todos los pasos de la cadena (ver en imagen, esquema inferior: verde, Administración; rojo, ciudadanos).
Y estos elementos los aplica a tres tipos diferentes de información:
- La legal
- La de tráfico y topográfica
- La meteorológica
El futuro pasa por un proyecto que soporte la nueva directiva, mantenido por un pequeño consorcio que acoja a todos los implicados (stakeholders): http://www.epsiplatform.eu
En varias ocasiones hace referencia a la Conferencia europea sobre EPSI que tendrá lugar en Rotterdam el 16 de marzo de 2012.
8. Impacto de la RISP (y del Open Data) sobre la gestión de la documentación y archivo de las administraciones públicas (ver presentación)
Enric Staromiejski, de la empresa Everis, con una presentación utilizada en diciembre en otro congreso (accesible desde este enlace), pretende hablarnos de cómo la RISP y la gestión de los Open Data están relacionadas con la gestión documental y la interoperabilidad.
Nos habla de SIGeDA (Sistema de Gestión electrónica de la Documentación de la Administración de Cataluña) y de eGRIMS (Electronic Government Records and Information Management System). Nos dice que en Cataluña la legislación sobre los datos de la administración es bastante rica, sintiéndose pioneros.
El proyecto consiste en desarrollar medidas y medios electrónicos para la gestión horizontal con herramientas legales, políticas, organizativas, conceptuales y funcionales para un total de 8 iniciativas, encontrándose actualmente en la primera (normalización).
Los tres pilares del sistema son: la política de SiGEDA, los procesos y herramientas del modelo y la plataforma.
Gran parte de su presentación aparece bajo el título de "De eGRIMS a Open Goverment Data" en la que se presenta: Modelo de referencia + principios + modelo de interoperabilidad + modelo funcional + modelo técnico + criterios de medida + configuración de dimensión y principios.
Nos habla de hasta 9 pasos, de entre los que destacamos el primero: ¿Cómo enfocar la gestión de la documentación interna?
Se simplifica el ciclo de vida en tres fases: Administración / Vigencia / Conservación; con tablas de valoración documental reguladas por la Consejería.
No obstante, también hay fases previas: diseño de procedimientos, valoración documental, herramientas de gestión.El impacto de la RISP se da en cada uno de los pasos, teniendo en cuenta que no se puede llevar a cabo con los datos que están en tramitación y que requiere que el expediente se cierre cuanto antes. Y si es complicado, que lo estudie un Comité. En cada fase se incluyen unas tareas.
El valor informativo cobra importancia en la fase de valoración. Los archiveros son los responsables de la gestión de la información.
En el resto de pasos se incluyen cuestiones como el catálogo de datos enlazados, cuadros de clasificación (METS, PREMIS), interoperabilidad, anonimato...
Hace una propuesta de participación público-privada y plantea algunas conclusiones:
- No hay suficiente estructura de la documentación pública
- Imperio del pdf.
Sabemos cómo abordar la solución; pero no se aplica. Nadie se esfuerza en establecer ontologías - Se autopregunta: ¿se pueden abrir de manera automática sin causar un perjuicio? La respuesta es No; pero se puede preparar para cuando se vaya abriendo e ir creando mecanismos para gestionar la información de acuerdo con ello.
- Riesgos: ineficiencia
- También hay que borrar (lo establece la ley) y certificar que se ha hecho de manera ex profeso
- Derecho a ser olvidado (las tablas de valoración documental entran en esto).
9. Mesa redonda Tratamiento de datos Open Data.
9.1 A las 17:00 Félix del Valle moderó una mesa redonda en la que intervino en primer lugar el último ponente (Enric Staromiejski), ya que tenía que salir de viaje. Su intervención la resumió en la máxima Más datos y menos metadatos. Estamos construyendo metavocabularios y pervirtiendo el modelo, dejando que la presentación modele la información: No al pdf y sí el XML. Hizo referencia a la factura electrónica, a CODICE y XBRL.
9.2 Clara Chu (ver presentación) (University of North Carolina) habló de las necesidades de los grupos multiculturales, que se caracterizan porque no son promotores de open access (porque no se les ha preguntado), se caracterizan por el aislamiento, el diferente idioma, la necesidad de cubrir sus necesidades básicas y la falta de contenidos que respondan a sus necesidades.
Enumera diez principios que deben darse (del 10 al 1):
- Participación democrática (e-democracy) poder usar las tecnologías para informar al gobierno de sus necesidades mediante peticiones. Destaca la labor de las bibliotecas escolares.
- Participación ciudadana y fomento de la creación de comunidades reales y virtuales: Data.gov, Serve.gov, Volunteer.gov.
- Documentación, localización y acceso a todo lo disponible, lo ya no disponible y lo no disponible: Usa.gov (más fácil de usar).
- Participación de grupos étnicos y minoritarios en determinadas prioridades en la digitalización.
- Inclusión de datos que respondan a las necesidades de los grupos.
- Documentar y poder diferenciar/aislar datos por características sociodemográficas.
- Información con valor añadido.
- Portabilidad: permitir el uso con más dispositivos.
- Interoperabilidad. Diasporaalliance.org, Action.Usaid.Gov, OneVietnam Network, Wiki.crisiscommons.org.
- Acceso en el primer idioma: multilingües, acceso para ciegos, con disparidades y analfabetos. CityofBoston.gov (traducción automática)
9.3 Javier Calzada (Instituto Agustín Millares) proporciona una visión de los Open Data desde la documentación educativa, contemplando ésta tanto desde la escuela y la biblioteca pública como desde la Educación Superior y los CRAI, directamente implicados en los repositorios científicos y en los OpenCourseWare.
Los retos y oportunidades que plantean a las bibliotecas son por un lado la preparación de los datos (Peset, Fernanda; Ferrer-Sapena, Antonia; Subirats-Coll, Imma. "Open data y Linked open data: su impacto en el área de bibliotecas y documentación". El profesional de la información, 2011, marzo-abril, v. 20, n. 2, pp. 165-173.DOI: 10.3145/epi.2011.mar.06).
Por otro, un esfuerzo alfabetizador: los open data proporcionan transparencia y oportunidades de negocio; sin embargo parece que se tiende más a lo segundo que a lo primero no destinándose a ayudar a los ciudadanos sino más bien desafiando su capacidad de análisis, incluso aunque esté habituado a la tecnología. Se añade una brecha de datos a la brecha digital. La interpretación y puesta en valor de los datos queda en manos de los intermediarios, que tienen sus propios intereses.
Un estudio canadiense (¿?) mostraba cómo los datos abiertos refuerzan el poder de una élite que saca provecho de los datos.
¿Danah Boyd?: las competencias informacionales son el medio idóneo para acceder a la tecnología? Si defendemos el acceso para conseguir ciudadanos más informados, debemos reconocer el impacto de las competencias informacionales y poner los medios para llevarlo a cabo, incorporándolo a las competencias ALFIN.
Las bibliotecas deben implicarse en la ALFIN, uniendo en ella las competencias relacionadas con los open data: ser consciente de sus derechos, usar los canales adecuados para exigir los datos, ser capaz de valorarlos, contextualizarlos temporalmente, localizar las fuentes adecuadas, sacar partido de los datos estructurados, sin necesidad de registrarse ni proporcionar datos personales, con accesos gratuitos y un régimen de protección de datos y limitaciones en su acceso; además de exigir el archivo continuado.
En definitiva, un conjunto de valores y conocimientos para acceder, valorar y dar sentido a los datos para poder resolver problemas.
También hay otra vertiente: su reutilización por parte de las bibliotecas para crear contenidos, tales como documentos educativos u objetos de aprendizaje.
La optimización de recursos y la mejora de competencias ALFIN se entiende en un entorno interdisciplinar e interoperativo.
Por tanto, como conclusión, hay que fomentar los datos abiertos y su proceso; pero sin olvidar que tenemos que usar eficazmente estos datos, mediante la formación de la capacidad crítica.
9.4 David Cabo (Pro Bono Público, Dondevanmisimpuestos) nos dice que Open Data no es la solución a todos los problemas pero es el primer paso. Considera que lo que plantea Javier es como diagnosticar colesterol alto a alguien que está muriendo de hambre: cada vez hay más empresas pero no ha cambiado mucho.
Critica algunas de las informaciones que se han dado a lo largo de la jornada. Por ejemplo: Los 16 portales de transparencia sugieren que somos los que más tenemos; pero pasa algo similar a lo de los aeropuertos españoles: están desactualizados, son parciales (Córdoba, por ejemplo ha empleado 450.000 euros para llenar el espacio de pdfs). Nadie se preocupa por la estandarización, creando una maraña de páginas web sin estructuración de la información.
Se está haciendo hincapié en los sistemas tecnológicos y dándose proliferación de leyes. Sí que parece que la ley de archivos está bien; pero no hay una ley de transparencia de acceso a la información. Si preguntas por ella, la Administración no contesta, mientras otras administraciones están obligadas a contestar. El PSOE planteó una ley pero no la aprobó. El PP se comprometió a hacerla en 100 días: hay un contador en Tuderechoasaber.es que nos dice cuanto tiempo falta para cumplir la promesa.
Se da un triunfalismo un poco absurdo porque en realidad no hay voluntad política.
9.5 Sergio Álvarez, de Vizzuality, plantea que si estuviéramos preguntando por el colesterol y no por morirnos de hambre ¿cómo pueden interesar los datos abiertos a los demás?
Cree que se puede hacer lo mismo con mucho menos, sin grandes inversiones. Como muestra, cuatro botones: Abredatos, misparadas.com, contrataciondelestado.es, dondeZaragoza.
Falta enfoque a la hora de mirar los datos públicos. Todo el mundo pide datos; pero nadie los utiliza (para algo útil). En buena medida porque no son todo lo fáciles de usar que sería deseable. Debería haber menos gente que venda humo y que haga más cosas (que se puedan "tocar").
Y habla de 3 ejemplos:
- Un servicio de telefonía para identificar los baches de tu calle. Creas un espacio web (Otrobache.com) con código abierto, se lo ofreces al Ayuntamiento, no lo acepta y crea un servicio posterior.
- Nueva York tiene tal vez las mejores prácticas de Open Data. Puedes ver escenas de todas las películas grabadas en Nueva York en el lugar que te encuentres. No hace la vida más fácil pero la hace más bonita.
- Isla Roosevelt en Nueva York: es muy alargada y estrecha y sólo tiene un autobús. Hay una aplicación móvil que avisa de dónde se encuentra el autobús en cada momento.
Finaliza pidiendo que nos proporcionen datos más útiles en formatos más usables y que nos den todos los datos sin usar.
Una de las presentes resalta que se ha olvidado algo muy importante como el uso de los datos para la investigación científica. Menciona a Tim-Berners-Lee y su intervención en un proyecto relacionado con la salud pública y los datos desagregados.
David comenta que en cuanto a la investigación científica se hace un doble pago: la inversión y la compra de revistas. Ironiza con la expresión: No tengo dinero; pero os voy a dar datos. Hace un inciso para recordar que cuando se habla de open data no se está hablando de información personal.
Félix del Valle recuerda que las agencias de evaluación son las que determinan que es lo que tiene valor o no. Al valorar a los investigadores con una serie de parámetros, obliga a éstos a seguir la conductas que les permiten conseguir "puntos" y de esa manera, reconocimiento y financiación: no me valoran -> no me acreditan-> no me dan proyectos.
Clara Chu dice que si no hay cambio de cultura en la investigación no se desarrollará este aspecto; pero hay iniciativas (como Opentheses). Las bibliotecas también están implicadas en los open data: no en documentos sino en datos abiertos.
Ante otra de las preguntas David Cabo argumenta que la Administración no tiene empeño en abrir la información. Hay casos aislados, como el País Vasco, Navarra (al día siguiente se mencionaría cómo acababa de sacar adelante la ley) y un poco Cataluña. También el Catastro (les ha liberado de trabajo y logarado que sean más eficientes) o el Instituto Geográfico Nacional.
Se dice también que el INE muestra los datos de determinada manera para que no se puedan sacar conclusiones. Un trabajador del INE dice que no hay nada de eso. Es cierto que no se van al ritmo que les exige el entorno pero están intentando hacerlo, contando incluso con la posibilidad de utilizar APIs.
En ocasiones no hay datos desagregados por diferentes razones: porque no son fiables (por ejemplo, están obtenidos de una muestra) o por mandato legal.
Se apunta además que quien más usa los datos de la Administración es la propia Administración.
Javier menciona una experiencia educativa en un instituto estadounidense en el que contrastaron datos policiales con un mapeado de lugares con graffitis para determinar si existía correlación entre delincuencia y graffitis. David recordó que los datos policiales son públicos en muchos lugares de Estados Unidos y que la reutilización de los datos abiertos da opción a un periodismo de datos.
Y a continuación, Fernando Ramos y Mercedes Caridad cierran la jornada.
El resumen completo llena 4 noticias. Éstas son las otras tres:
- (1) http://www.ucm.es/BUCM/blogs/boletinbibliotecario/5416.php
- (3) http://www.ucm.es/BUCM/blogs/boletinbibliotecario/5451.php
- (y 4) http://www.ucm.es/BUCM/blogs/boletinbibliotecario/5462.php