Google quiere crear un programa de investigación cooperativa sobre informática aplicada a las Humanidades utilizando el corpus de Google Libros. Por ello, la empresa se ha dirigido a las bibliotecas que colaboran en el proyecto Google Libros para aceptar propuestas de investigadores procedentes de estas instituciones.
Las disciplinas de interés incluyen (aunque están abiertos a otras materias):
- Lingüística
- Historia
- Mundo clásico
- Literatura
- Filosofía
- Sociología
- Arqueología
- Antropología
Ejemplos de proyectos:
- Construcción de aplicaciones para el marcado y la identificación de conceptos, estructura o entidades en el texto (hecho a la medida de un dominio y lengua específicos)
- Creación de utilidades para encontrar libros o pasajes de interés para una disciplina en particular, incluyendo utilidades para realizar anotaciones.
- Desarrollo de sistemas de correcciones de múltiples fuentes para los datos y metadatos de los libros.
- Generación de datasets etiquetados (por ejemplo, etiquetado de parte de un discurso para idiomas poco conocidos)
- Comprobación de una hipótesis literaria o histórica a través del análisis innovador de un corpus de libros.
- Análisis de procesos generativos o creativos revelados en los textos.
Google podrá ofrecer en algunos casos parte del corpus de Google Libros o alojar los datos para los investigadores. Por ejemplo, Google puede proporcionar listas de frecuencias de palabras, categorizadas por idioma, fecha de publicación, país y materias.
(Más información en documento adjunto)