Biblioteca Complutense Catálogo Cisne Colección Digital Complutense

La colaboración entre Google y la Complutense para escanear libros y hacerlos accesibles gratuitamente

29 de Noviembre de 2012 a las 16:37 h

Google ha escaneado más de 20 millones de libros que puedes recuperar por cada palabra de cada línea de cada una de sus páginas y descargarlos si son de dominio público.

La Complutense ha sido el primer socio no anglosajón en sumarse al proyecto en el que participan algunas de las principales bibliotecas del mundo: Bibliotecas nacionales como la British Library, las de Italia, Holanda o Baviera, universitarias como Harvard, Oxford, California, Cornell y la mayor biblioteca pública del mundo, la New York Public Library son algunas de las instituciones colaboradoras.

Google creó varios centros de digitalización. En algunos se digitalizan más de 4.000 libros al día.

La Complutense ha digitalizado 120.000 libros de su colección creando la mayor colección española de libros antiguos escaneados en el centro de digitalización de Madrid.

  La colaboración entre Google y la Complutense para escanear libros y hacerlos accesibles gratuitamente

La Biblioteca Complutense de Madrid y su biblioteca

29 de Noviembre de 2012 a las 16:37 h

La Universidad Complutense es la mayor universidad española con 85.000 estudiantes y 6.289 profesores y su biblioteca es la segunda de España tras la Biblioteca Nacional.

La Biblioteca de la UCM cuenta con 3 millones de libros, 34 bibliotecas de centro, 11.500 puestos de lectura,  1.500 ordenadores y 450 bibliotecarios a tu servicio.

Además ofrece la mayor colección digital española con más de 600.000 objetos y millones de páginas escaneadas.

  La Biblioteca Complutense de Madrid y su biblioteca

La Colección Digital Complutense: a) Trabajos académicos

29 de Noviembre de 2012 a las 16:36 h

La UCM ofrece un gran número de sus trabajos académicos en formato digital y en abierto por Internet.

  • 25.000 tesis (5.500 en open access) configurando la mayor colección de tesis doctorales españolas.
  • El Portal Complutense de Revistas Científicas con 30.000 artículos de las revistas publicadas por la Universidad.
  • El Archivo Institucional E-Prints Complutense con más de 11.000 e-prins en open access.
  La Colección Digital Complutense: a) Trabajos académicos

La Colección Digital Complutense: b) Materiales de apoyo a la investigación

29 de Noviembre de 2012 a las 16:36 h

La Universidad Complutense cuenta con numerosas colecciones digitales de soporte al estudio y la investigación.

Entre ellas destacamos:

  • 400.000 periódicos (con acceso restringido exclusivamente para fines de investigación) digitalizados por la Biblioteca de la Facultad de Ciencias de la Información.
  • Fotografías de la Guerra Civil procedentes del Archivo Histórico del Partido Comunista de España que está depostiado en la Biblioteca Histórica Marqués de Valdecilla.
  • Dibujos de Academia desde el siglo XVIII digitalizados por la Biblioteca de la Facultad de Bellas Artes.
  • Impresos japoneses del siglo XIX custodiados en la Facultad de Bellas Artes.
  • Más de 50.000 grabados antiguos de la Colección Digital Dioscórides pertenecientes a libros de nuestra Biblioteca Histórica Marqués de Valdecilla.
  • El Archivo de Rubén Darío custodiado por nuestra Universidad, etc.
  La Colección Digital Complutense: b) Materiales de apoyo a la investigación

La Colección Digital Complutense: c) Fondo antiguo

29 de Noviembre de 2012 a las 16:35 h

La Colección Digital de Fondo Antiguo de la Universidad Complutense es la mayor de España y une a la riqueza de sus fondos la posibilidad de ser descargada gratuitamente desde diversas plataformas digitales internacionales, como Europeana, Google Libros, Hathi Trust, Internet Text Archive y nacionales como la Biblioteca Virtual Cervantes.

La colección está integrada por:

  • 125.000 libros digitalizados
  • 47.000 Grabados

Está considerada como la mayor colección española de libros antiguos digitalizados de España.

Esta colección ha sido realizada gracias a la colaboración con instituciones tanto públicas (Ministerio de Cultura, Comunidad de Madrid) como privadas (Google, Santander Universidades, Fundación de Ciencias de la Salud, Editorial Extramuros...).

  La Colección Digital Complutense: c) Fondo antiguo

Nuestra colección de libros antiguos digitalizados en 2006: La Colección Digital Dioscórides

29 de Noviembre de 2012 a las 16:35 h

En 2006 la Universidad Complutense tenía la mayor colección digital española en open access con 2.800 libros digitalizados a lo largo de 10 años de trabajo. Sin embargo, a este ritmo hubiésemos tardado 435 años en escanear lo que con Google se ha hecho en 3 años.

La Colección Digital Disocórides fue un magnífico proyecto de digitalización iniciado por las Bibliotecas de las Facultades de Farmacia y Medicina de la Universidad Complutense en 1995 y posteriormente continuado por la Biblioteca Histórica de la UCM.

El proyecto se pudo realizar gracias a la colaboración económica de la Fundación Ciencias de la Salud y representó un magnífico proyecto para nuestra universidad siendo la mayor colección diigtal de fondo histórico en abierto española. No obstante el ritmo de digitalización (280 obras anuales) estaban lejos de las más de 4.000 obras que los centros de digitalización de Google realizaban al día.

Dado que para poder ofrecer acceso electrónico a nuestro patrimonio en un tiempo razonable suponía pasar a un modelo de digitalización masiva la Universidad vio como una oportunidad única la posibilidad de sumarse al proyecto de digitalización de libros de Google.

Ello, unido al hecho de que el portal de acceso a nuestras colecciones digitales presentaba diversas carencias (no estaba preparado para la preservación digital a largo plazo, no disponía de un interfaz multilingüe, ni de métodos efectivos para la gestión de los derechos de autor o posiblidad de adaptarse a los desarrollos de web social al ritmo que la sociedad demandaba) fueron elementos que tuvimos en cuenta para integrarnos en el proyecto de digitalización de libros de Google.

Gracias a ello en sólo tres años de digitalización hemos conseguido digitalizar una parte considerable de los libros anteriores a 1871 (fecha que garantiza no entrar en conflicto con los derechos de autor o de las editoriales).

  Nuestra colección de libros antiguos digitalizados en 2006: La Colección Digital Dioscórides

Un proyecto controvertido

29 de Noviembre de 2012 a las 16:34 h

Este ha sido un proyecto muy controvertido pues algunos lo han visto como un ataque a los derechos de autores y editores mientras que otros lo defienden como un proyecto fantástico que ha permitido digitalizar y consultar el contenido de millones de libros que no hubiesen podido ser digitalizados de otro modo.

Así pues, para unos el proyecto ha significado:

- Una violación de los derechos de los autores y editores

- Un riesgo de monopolio del acceso a los contenidos de los libros

- La transferencia del patrimonio cultural público a una empresa comercial

- Un proceso de digitalización sin calidad suficiente: las imágenes contienen errores y el OCR no tiene la suficiente calidad.

 

Sin embarg para otros ha representado:

- Una oportunidad única para democratizar el conocimiento mediante la digitalización de los conocimientos contenidos en millones de libros

- La creación de una herramienta gratuita que permite consultar los contenidos de los libros y descargarlos para leer

- Ha estimulado la aparición de otros proyectos públicos y privados de digitalización masiva

 

Los hechos, de todos modos, son claros:

- Las bibliotecas participantes han creado con sus copias digitales importantes colecciones públicas de libros escaneados.

- Ahora, al buscar en Google se encuentran no sólo páginas web sino libros que se pueden descargar

- Las bibliotecas participantes valoran muy positivamente la calidad de la digitalizaciones en relación a la realizada con otros proyectos.

  Un proyecto controvertido

¿Qué hace Google?

29 de Noviembre de 2012 a las 16:34 h

Google traslada y escanea los fondos de la Complutense en el centro de escaneado que instaló en Madrid.

Los libros escaneados libres de copyright se pueden buscar y descargar desde Google Books.

También ha creado una interfaz exclusiva para la Universidad y sus usuarios.

Le da a la Complutense una copia de los libros escaneados.

Google ha corrido con el coste del trasnporte, digitalización, proceso y puesta en Internet de los documentos escaneados en nuestra universidad. Los libros han sido escaneados dos veces para evitar errores pues la experiencia muestra que es muy difícil que el digitalizador cometa un error en la misma página de un libro si este es digitalizado dos veces.

La interfaz que Google ha creado para nuestra universidad permite consultar no sólo todos los libros escaneados por Google, sino limitar la búsqueda sólo a los libros de la Universidad Complutense.

Además, Google genera dos copias de cada libro: una para la Universidad y otra para Google. La copia de la Universidad tiene la limitación de no poder ser utilizada con propósitos comerciales. Nuestra copia se ha preservado en Hathi Trust un gran proyecto internacional bibliotecario para prerservar a largo plazo y difundir gratuitamente los materiales digitales y será accesible desde Europeana.

Además, el acuerdo con Google permite difundir nuestra copia con otras instituciones nacionales, como la Biblioteca Nacional, el Ministerio de Cultura, el Catálogo Colectivo del Patrimonio Histórico o el Consorcio Madroño de bibliotecas de las universidades públicas madrileñas y la UNED.

  ¿Qué hace Google?

¿Qué hace la Complutense?

29 de Noviembre de 2012 a las 16:34 h

La Universidad Complutense proporciona los libros y los expertos que supervisan la selección de las obras a escanear.

Un trabajo muy importante ha sido la actualización de los metadatos y la organización de los movimientos de los libros asegurando la integridad de las colecciones y su seguridad.

También hemos realizado acciones para preservar y difundir nuestra copia digital y hacerla accesible al público en general.

Aunque el trabajo parecía ser básicamente tecnológico, para nuestra Universidad ha sido una ocación única para mejorar las condiciones de preservación de nuestras obras de fondo antiguo, actualizar su catalogación y mejorar los mecanismos de acceso a ellas.

En la actualidad la Universidad no sólo ha podido finalizar la catalogación de su fondo antiguo, sino que cuenta con datos sobre las condiciones de preservación de cada ejemplar lo que ha permitido mejorar las condiciones de preservación de nuestro fondo.

Finalmente hemos permitido acceder a nuestras obras digitalizadas no sólo desde nuestro catálogo sino a través de las principales pasarelas públicas de acceso a libros electrónicos (Europeana, Hathi Trust, Internet Archive...)

  ¿Qué hace la Complutense?

Planificación del proyecto: 2007

29 de Noviembre de 2012 a las 16:34 h

En 2007 la Biblioteca realizó un Análisis de las obras y bibliotecas de centro participantes en el proyecto. 

También ser realizaron la mayor parte de los trabajos de planificación y preparación de las colecciones y formación del personal. 

Entre estos trabajos destacan:

  • Informes de estadosobre las instalaciones, el acceso a los depósitos de libros, etc
  • Elaboración de una "Guía de criterios de selección": Tanto los fijos (fecha de publicación) y sobre la condición de escaneado.
  • Guía de Recomendaciones sobre Libros del siglo 19
  • Plan de encuadernación de obras anteriores al siglo XX.
  • Progama de escaneado: operaciones, flujos de trabajo, horario y logística (incluso limpieza de los libros y depósitos).

Debemos tener en cuenta que muchos de nuestros libros no habían sido abiertos nunca y en otros su estado de preservación necesitaba de ciertos cuidados que permitiesen su digitalización y preservación futura.

  Planificación del proyecto: 2007

Planificación del proyecto: 2008-2011

29 de Noviembre de 2012 a las 16:33 h

En el periodo entre 2008 - 2011 se ejecutaron las acciones planificadas en 2007. 

Gracias a ello se digitalizaron 120.000 libros y más de 200.000 libros antiguos fueron catalogados.  Nuestros libros se pudieron empezar a consultar en Google Libros y nuestro catálogo desde 2008 mejorando de forma exponencial su visibilidad.

 

Entre las principales acciones realizadas destacamos:

- Plan de Catalogación: 200.000 libros catalogados.

- Análisis del estado de conservación y los criterios de selección para la digitalización de 145.000 libros. La Universidad cuenta ahora con datos sobre el estado de conservación de cada uno de estos 145.000 libros con las causas de deterioro si este es el caso.

- Escaneado en el Centro de escaneado de Google en Madrid de más de 200.000 libros (120.000 de la Biblioteca Complutense, el resto de las bibliotecas de Cataluña).

En junio de 2011 se terminaron las operaciones de escaneado en Madrid. Debemos destacar que los libros sólo permanecían una semana fuera de nuestros depósitos y que no hubo ningún incidente reseñable a lo largo del proceso.

  Planificación del proyecto: 2008-2011

Desarrollos tecnológicos: Aplicación Web para la gestión del proyecto

29 de Noviembre de 2012 a las 16:33 h

Ofrece información en línea y en tiempo real de todos los movimientos diarios de libros a Google, envíos, devoluciones, el estado de conservación de los libros, etc, con datos estadísticos sobre las operaciones del proyecto.

Almacena los metadatos de los libros incluidos en el proyecto de digitalización y permite la gestión integral de los procesos transferiendo los datos al catálogo de la biblioteca para su consulta pública.

Esta aplicación permitió no sólo conocer el estado de cada ejemplar y los movimientos de los libros, sino que ha permitido transferir al catálogo los datos y mejorar la información sobre cada libro incluido en el programa.

  Desarrollos tecnológicos: Aplicación Web para la gestión del proyecto

Desarrollos tecnológicos: Aplicación para PDA

29 de Noviembre de 2012 a las 16:33 h

Los servicios informáticos de la Biblioteca desarrollaron también una aplicación para PDA que utilizaron los equipos de bibliotecarios que seleccionaban los libros en los depósitos.

Con el fin de mejorar las tareas de selección la aplicación lee  el código de barras del libro y permite introducir de forma rápida información sobre el estado de conservación del libro, su tamaño, tipo de encuadernación, etc.

La PDA presenta formularios para introducir las características y condiciones del libro de acuerdo a la guía de criterios de selección:

  • Dimensiones: altura, anchura y espesor.
  • Tipo de encuadernación: Valiosa, débil, perdida, con problemas de apertura, deteriorada.
  • Hojas: hongos, deterioro físico, folletos, papel frágil, sin cortar.

Dicha información se exporta al sistema de administración web y luego al Catálogo de la Biblioteca para su consulta pública.

  Desarrollos tecnológicos: Aplicación para PDA

¿Cómo se accede a nuestros libros digitalizados por Google?

29 de Noviembre de 2012 a las 16:32 h

Primero buscando en Google. Es fácil y rápido.

Cuando realizas cualquier búsqueda en Google no sólo buscas en el contenido de las páginas web y de los documentos que están incluidos en los sitios web.

Ahora también buscas en el interior de los libros de nuestras bibliotecas.

Esto ha permitido que libros que no habían sido consultados durante siglos y que estaban almacenados en los depósitos de las bibliotecas sean ahora hojeados y consultados cada semana.

Los resultados son espectaculares: más del 90% de los libros escaneados son consultados cada seis meses.

  ¿Cómo se accede a nuestros libros digitalizados por Google?

¿Cómo se accede a nuestros libros digitalizados por Google? 2. Interfaz exclusiva de Google para la UCM.

29 de Noviembre de 2012 a las 16:32 h

Google ha desarrollado y mantiene una interfaz de búsqueda para la Universidad Complutense y sus usuarios.

Por medio de esta interfaz puedes realizar búsquedas sólo en los libros de la UCM o en todos los 20 millones de libros de Google.

Puedes consultarlo en nuestra página: http://www.ucm.es/BUCM/atencion/25403.php.

  ¿Cómo se accede a nuestros libros digitalizados por Google? 2. Interfaz exclusiva de Google para la UCM.

¿Cómo se accede a nuestros libros digitalizados por Google? 3. Catálogo de la BUC

29 de Noviembre de 2012 a las 16:31 h

Puedes también consultar nuestros libros digitalizados por Google en nuestro catálogo Cisne. http://cisne.sim.ucm.es/.

  ¿Cómo se accede a nuestros libros digitalizados por Google? 3. Catálogo de la BUC

¿Cómo se accede a nuestros libros digitalizados por Google? 4. HathiTrust Digital Library.

29 de Noviembre de 2012 a las 16:30 h

También puedes acceder a nuestros libros vía Hathi Trust, una biblioteca digital integrada por los libros y revistas escaneados en las instituciones participantes.

Pincha aquí: http://www.hathitrust.org/

[Seguir leyendo] ¿Cómo se accede a nuestros libros digitalizados por Google? 4. HathiTrust Digital Library.

¿Cómo se accede a nuestros libros digitalizados por Google? 5. Desde su propio catálogo vía herramientas de descubrimiento

29 de Noviembre de 2012 a las 16:30 h

Cuando realizas una búsqueda en el catálogo de tu biblioteca, si este dispone de herramientas de descubrimiento, como Summno, la búsqueda no sólo se hace en la colección de tu institución, sino también en el contenido de los libros electrónicos de Hathi Trust, por lo que los libros complutenses son también recuperados.

Esto incrementa de forma notable la visibilidad de nuestras colecciones y de nuestra institución.

  ¿Cómo se accede a nuestros libros digitalizados por Google? 5. Desde su propio catálogo vía herramientas de descubrimiento

¿Cómo se accede a nuestros libros digitalizados por Google? Más: Internet Archive, Europeana…

29 de Noviembre de 2012 a las 16:30 h

Finalmente, miles de nuestros libros digitalizados están incluidos en el Internet Text Archive y pronto la colección entera lo estarán en Europeana, la biblioteca digital europea.

Para más información sobre el Internet Text Archive pincha aquí: http://archive.org/details/texts

Para más información sobre Europeana pincha aquí: http://www.europeana.eu/portal/

[Seguir leyendo] ¿Cómo se accede a nuestros libros digitalizados por Google? Más: Internet Archive, Europeana…

Proyecto Europeana Libraries

29 de Noviembre de 2012 a las 16:29 h

La Universidad Complutense está participando el el Proyecto "Europeana Libraries" junto a otras 19 bibliotecas de investigación de 14 países: Bayern Staatsbibliothek, Oxford University, Universidad de Gante, Trinity College, etc.

El objetivo es incorporar a 5 millones de objetos digitales en Europeana: manuscritos, películas, documentos sonoros, fotografías y otros textos pertenecientes al patrimonio bibliográfico y científico de las bibliotecas participantes a Europeana.

El proyecto es coordinado por The European Library y patrocinado por la Biblioteca Nacional de los Países Bajos.

La UCM incorporará la totalidad de su biblioteca digital en abierto: miles de artículos de revistas científicas, grabados, libros antiguos, tesis doctorales, etc.

 

  Proyecto Europeana Libraries

Datos totales del proceso de digitalización

29 de Noviembre de 2012 a las 16:29 h

Este proceso ha proporcionado a la Biblioteca información exhaustiva sobre el estado de conservación de nuestro patrimonio bibliográfico.

Sólo el 17 % de los volúmenes publicados antes de 1871 no han podido ser digitalizados.

Las razones principales de exclusión han sido los hongos, la pérdida de páginas o deterioros físicos del volúmen o de su encuadernación.

  Datos totales del proceso de digitalización

Aceso a los libros Complutenses en Google(en una semana)

29 de Noviembre de 2012 a las 16:28 h

Afortunadamente, nuestros libros son muy utilizados. Cada semana el 60% de los libros son visitados y cada seis meses lo son más del 90%.

Además, el libro más visitado de Google de los digitalizados en bibliotecas europeas es el "Diccionario Geográfico-estadístico de España y sus posesiones de Ultramar" de Pascual Madoz.

Este dato es especialmente importante pues hasta ahora, muchos de estos libros no habían sido usados durante siglos. Además, sólo los investigadores podían acceder a ellos viniendo físicamente a nuestras bibliotecas.

Gracias a este proyecto cualquier persona con una conexión a Internet puede ver (¡y descargar!) nuestros libros.

Sin duda este proyecto ha beneficiado al público en general y a la función de la Universidad como difusora del conocimiento.

  Aceso a los libros Complutenses en Google(en una semana)

¿Cómo preservamos nuestros libros digitalizados? Hathi Trust

29 de Noviembre de 2012 a las 16:27 h

En la UCM creemos que él único modo para preservar nuestros libros digitales a largo plazo es por medio de la colaboración con otras instituciones de prestigio. Por ello nos unimos en 2010 a Hathi Trust, la mayor biblioteca digital pública mundial.

¿Qué es Hathi Trust? HT es un consorcio de bibliotecas unidas para garantizar el acceso y la preservación a largo plazo de su patrimonio digitalizado.

• Actualmente cuenta con 10,557,655 volúmenes digitalizados; 5,556,767 libros y 274,642 ejemplares de revistas

• El 31% es en dominio público

• La Complutense se sumó en 2010.

• Por el momento es el único socio no norteamericano.

Otros socios son: La Biblioteca del Congreso de los Estados Unidos, la Biblioteca Pública de Nueva York y un gran número de bibliotecas universitarias: Columbia, Cornell, Harvard, MIT, Princeton, Stanford, California, Chicago, Michigan, Yale...

  ¿Cómo preservamos nuestros libros digitalizados? Hathi Trust

Características de HathiTrust

29 de Noviembre de 2012 a las 16:27 h

Las principales características de Hathi Trust son en relación con los servicios de acceso:

- Permite la búsqueda bibliográfica y de texto completo.

- Uso del sistema de autenticación Shibboleth.

- Se pueden descargar los libros en el dominio público (en formatos pdf y epub).

- Además, se pueden crear colecciones, hacerlas públicas y compartirlas con otros.

- Los datos bibliográficos (y el acceso a los libros escaneados) se incluyen en herramientas de descubrimiento como Summon.

En relación con la preservación del contenido:

- Representación de imágenes y texto (si es posible)

- Uso de tecnologías de código abierto: Perl, Linux, MySQL

- Los metadatos bibliográficos son manejados en un sistema de Gestión de Bibliotecas (Aleph).

- Acceso para usuarios con discapacidad

- Ofrece acceso a los datos bibliográficos a través de un API para su catálogo.

- Empleo de las principales normas internacionales sobre presrvación y acceso a la información digital: Trustworthy Repositories Audit & Certification (TRAC), Open Archival Information System (OAIS) Reference Model, Preservation Metadata Implementation Strategies (PREMIS)

- Formatos de imagen: TIFF, JPEG 2000, URL Permanente...

  Características de HathiTrust

Objetivos alcanzados durante el proyecto

29 de Noviembre de 2012 a las 16:27 h

  • Se ha escaneado de un número importante de nuestros antiguos libros (85%)

• Aumento del uso de la colección por parte del público general.

• Aumento de la disponibilidad, la visibilidad y la preservación de nuestras colecciones.

• Se ha incluido en el catálogo de la biblioteca todos los libros anteriores al siglo XX (gran parte de ellos con el texto completo).

  • Conocer el estado de conservación exacto de cada libro
  • El establecimiento de un plan de conservación y restauración de libros dañados.
  • Apoyo a los investigadores al ofrecer materiales digitalizados para análisis de textos y al público en general pues puede acceder a textos y materiales anres limitados a los investigadores.
  Objetivos alcanzados durante el proyecto


Universidad Complutense de Madrid - Ciudad Universitaria - 28040 Madrid - Tel. +34 914520400
[Información - Sugerencias]