Inicio Biblioteca Complutense Catálogo Cisne Colección Digital Complutense

V Jornada Profesional de la RBIC. Panel 2, Conocimiento compartido

Andoni Calderón Rehecho 19 de Diciembre de 2012 a las 18:49 h

Por cuestiones de agenda sólo pude acudir a la parte final de la V Jornada Profesional de la Red de Bibliotecas del Instituto Cervantes.
El presentador Arturo Munguía asegura que el conocimiento será mejor cuantas más personas participemos en él; para ello debe estar abierto. ¿Cómo generar el conocimiento compartido? ¿Qué puede aportar? Para hablar sobre estas cuestiones han venido Martín Álvarez Espinar y José Felipe Ortega que hablarán respectivamente de Linked Open Data y de Colaboración Abierta.

 

Martín Álvarez considera los LOD (Linked Open Data) como un paso más hacia la interoperabilidad. Se traslada a 1994 a la creación del World Wide Web Consortium (W3C) como organismo neutral que persigue aunar esfuerzos para establecer estándares, aunque no pretenda crearlos todos. Dispone de 3 nodos principales: en Boston, en Keio (al norte de Tokyo) y en Francia. Entre sus 20 oficinas tenemos una en Gijón, cobijada por el CTIC.

El Open Data se relacionaba al principio con la transparencia, la participación y la colaboración: la apertura asegura la confianza pública. Con la llegada de Obama se inauguró el Open Goverment (Recovery.gov) y más adelante Data.gov. Después el objetivo se desplaza a promover la eficiencia y la efectividad: OpenGoverning.Data.
¿Se trata de una moda? De las 3 iniciativas existentes a principios de 2009 se ha pasado a unas 200: "los data son el nuevo petróleo de la era digital" (Neelie Kroes, responsable de la agenda digital europea). Open-data.eu.

Menciona la normativa española (Directiva 2003/98/CE, ley 37/2007 y R.D. 1495/2011) y los beneficios reales: transparencia, empleo, innovación, participación, rendición de cuentas, crecimiento económico, calidad del dato, interoperabilidad. La RISP en España agrupa a 150 empresas del sector infomediario con unas 4.000 personas y 500 millones de beneficio (40% de sus ingresos). En Europa 140.000 millones al año, con 40.000 de ellos fruto de la reutilización directa. (Ver reciente Conferencia)

Asegura que la mejor idea la tendrá otro [La aplicación más interesante de tus datos no la vas a pensar tú] y pone el ejemplo de unos datos sobre el crimen proporcionados por un departamento de policía estadounidense que da lugar a un mapa de Google con indicación de los puntos conflictivos y después a una aplicación para móvil que a medida que nos movemos mide el grado de peligro criminal en la zona (hasta que el móvil cambia de manos).
Muestra varios ejemplos de reutilización de datos abiertos públicos y privados, como el que mide la calidad del aire en Madrid, la situación en tiempo real de los autobuses de Gijón, el tranvía bilbaíno en el móvil o Mapumental.

Cada vez hay más datos en la web y existe mayor confianza en su disponibilidad. El problema es que los datos están aislados en silos y necesitamos conectar los silos, lo que se consigue mediante tecnologías semánticas para integrar los datos (infraestructuras para la web, accesibles, enlazadas, disponibles) al nivel de dato más minúsculo, no elaborado. Linked Open Data por ejemplo, permite semantizar la web y la interoperabilidad mientras que SPARQL es la herramienta para la consulta semántica estándar.

Hay que dar 3 pasos:

  • Identificar las cosas que están en la web: mediante URI
  • Describir los recursos: por ejemplo la Dbpedia es la semantización de la Wikipedia
  • Enlazar los recursos entre sí: todos los objetos reales enlazados por sus relaciones semánticas.

De esta manera modelamos la realidad y se da una integración a escala real. Cada uno se concentra en su parcela; los demás en la suya. Un ejemplo de integración de datos, con 2,8 millones de objetos es Europeana LOD. Nos alerta de que tampoco es trivial y de que nos falta formación (y nos muestra una escuela donde la dan desde pequeños: http://alicechristie.org/edtech/ss/).

 Igualitaria, meritocrática, auto-organizada + Creative Commons 

Felipe Ortega, miembro de Wikipedia española, nos habló de Open Collaboration, que implica una estrategia de interacción: Cooperar, penalizar, rechazo, volver a cooperar. Normalmente se la contrapone con la propiedad intelectual, competitividad, el valor monetario y comercial. En realidad, si analizamos la cuestión bajo la óptica del “dilema del prisionero”, la estrategia más efectiva a largo plazo siempre es la cooperación

Nos habla de activismo ciudadano, de redes, contenidos y colaboración, de parecidos razonables con altos grados de aperturismo como el crowdsourcing, Innocentive o Amazon Mechanical Turk… pero que no son colaboración abierta porque la externalización de la tarea no es colaboración abierta, ni cuando la valoración de los resultados sólo la hace una persona o no es distribuida, ni cuando los resultados pasan a ser de quien lo haya publicado. Hay también algún ejemplo de Coopetition (como Collaborative Drug Discovery) donde no se entiende como competidoras al resto de empresas del entorno, ya que se afrontan los problemas de manera conjunta y una vez resueltos cada empresa sigue su camino. 

La colaboración abierta es igualitaria, meritocrática, auto-organizada (el proceso se debe adaptar a las personas y no al contrario) y además debe ser libre, lo que se consigue con licencias similares a Creative Commons. Algunos ejemplos: Wikidata, Kinux, Wikimedia Commons (más de 15 millones de archivos digitales), Flickr, Youtube(CC-BY), Open Clip Art Library

Además de las licencias libres (CC-BY, CC-BY-SA), hay otras con algunas restricciones (CC-NC, CC-ND): hay quien piensa que la única manera de sacarlo adelante es la rentabilización económica. 

Considera importantes las publicaciones en accceso abierto (DOAJ, OpenAIRE, PlosONE, Nature Publishing Group Licenses) y los archivos digitales (Wikipedia, Open Clip Art Library, Internet Archive, 10 Petabytes de memoria colectiva; Open Library como procomún cultural). Los LOD de los que se ha hablado antes tienen iniciativas asociadas, como Open Knowledge Foundation

La ganancia individual y grupal viene del procomún, del remix que permite la instauración de comunidades de prácticas para crear, compartir, mezclar… creando un conjunto común de bienes culturales. La Wikipedia es un ejemplo, con contenido libre pero con una serie de derechos que debo respetar. 

Es necesario organizar los datos y filtrarlos, anotando y clasificando contenidos. La información sin organización no sirve de nada: sin personas detrás la información de los datos tiene poco valor (o ninguno). La imagen recorta la cabeza de Martín Álvarez contra la diapositivaSin gestión de la información poco recorrido tendrá la gestión de datos (la estadística es el futuro rey).

La clave es la participación. La mayor parte de los proyectos siguen el esquema en el que pocos contribuyen un poco, muy pocos que contribuyen mucho y un número escaso que son líderes. Cada uno contribuye en la medida de sus posibilidades. El coeficiente de Gini dice que el 87% de los cambios son realizados por el 13 % de editores (sin contar las ediciones anónimas, que abarcan el 25%). Pero lo importante es que sin los contribuyentes pequeños no sería cooperación abierta ni tendría el éxito que tiene. Menciona el caso de Wiki Loves Monuments que ha conseguido más de 365.000 imágenes, algunas de una enorme calidad.
Los artículos más destacados en Wikipedia cuentan con 10 veces más editores que los no destacados y además son editores con más experiencia. En cuanto a la sostenibilidad, medida por el tiempo de permanencia de los editores, se concreta en que el  50% tiene un periodo de actividad de 100 días en Wikipedia y de 200 en Wikipedia en alemán. En la comunidad Debian por ejemplo, el 50% se mantienen durante 7 años y medio.

En realidad no hay una talla para todo el mundo. Hay que adaptarse a las circunstancias y necesidades personales. 

 

En el turno de preguntas se pregunta por los datos sensibles políticamente, por la protección de datos personales, si los documentalistas deberían intervenir en qué documentación se deja en abierto. Una archivera plantea que la información delicada va a ser destruida: disponemos de los archivos de Simancas y de Indias sólo porque Felipe II sabía que no iban a ser mirados los documentos que en ellos se recogen.

 

Bookmark and Share
Ver todos los posts de: Andoni Calderón Rehecho


Universidad Complutense de Madrid - Ciudad Universitaria - 28040 Madrid - Tel. +34 914520400
[Información - Sugerencias]