El análisis 'culturonómico'* de 5 millones de libros escaneados por Google books ha permitido determinar el listado de los científicos más famosos de los últimos 200 años (The Science Hall of Fame). Adrian Veres y John Bohannon han medido la fama mediante el numero de veces que aparece el nombtre del científico en todoas los libros publicados entre los años 1800 y 2000. La unidad de medida es el miliDarwin (mD), la milésima parte de un Darwin, es decir , la frecuencia con que el nombre de Darwin aparece en los libros en inglés desde 1839 (cuando Darwin tenía 30 años) hasta el año 2000, osea 148.429 veces en 69.048 libros, (el 2% de todos los libros publicados en inglés). ¿Dificil de creer? Pues resulta que Darwin aparece en el 4% de todos los libros en inglés publicados en el año 2000. Más información en John Bohannon, "The Gonzo Scientist: The Science Hall of Fame", donde también se ofrecen algunas recomendaciones para lograr convertirse en científico famoso... Que ¿qué es la culturonomía? Para quien no lo sepa lo explicamos abajo.
Los científicos más famosos
Bertrand Russell (1872-1970) es el científico más famoso, con 1500 mD de fama, y Charles Darwin (1809-1882) el segundo (obviamente con 1000 mD). El tercero es Albert Einstein (1879-1955) con 878 mD. Le siguen Lewis Carroll (1832-1898), Claude Bernard (1813-1878), Oliver Lodge (1851-1940), Julian Huxley (1887-1975) y Karl Pearson (1857-1936)... Podéis pensar que, por ejemplo, Carroll, Asimov o Sagan son más famosos por logros no científicos, pero el estudio "culturonómico" no ha hecho distinción al respecto.
La versión beta de The Science Hall of Fame permite que busques a tu científico favorito, pero no permite búsquedas por países por lo que es difícil encontrar al científico español más famoso entre los 4169 listados. Ramón y Cajal no aparece en el listado y Severo Ochoa (1905-1993) solo tiene 8 mD de fama (puesto 600 y pico), el mismo valor que tiene el físico Edward Witten, uno de los científicos más citados de todos los tiempos. Paul Erdös, el matemático que más artículos ha publicado durante su vida (unos 1400) solo tiene 4 mD de fama.
*¿Qué es la 'culturonomía'?'
En un artículo publicado el 16 de diciembre de 2010 en la revista Science y titulado Quantitative Analysis of Culture Using Millions of Digitized Books ("Análisis cuantitativo de la cultura por medio de millones de libros digitalizados"), el equipo Erez Lieberman Aiden et al. explica que la 'culturonomía' es la primera forma cuantitativa de llevar a cabo estudios culturales en general (véase Cómo aprender de los libros sin leerlos en Imagen en la Ciencia (Sergio de Régules) . El proyecto de Aiden et al. es una manera de aprender mucho de los libros sin tener que leerlos (buenas noticias para los malos lectores). Con el programa se puede analizar la frecuencia con la que aparece cualquier palabra, o secuencia de hasta cinco palabras, en el idioma y el periodo elegidos. El programa cuenta cuántas veces aparece la palabra o frase y las divide entre el número total de palabras. El resultado es una gráfica de frecuencia que sube y baja con la popularidad de la palabra a la que corresponde... Hay quien ha dicho que Aiden y sus colaboradores exageran con lo que esperan de su "culturonomía". Puede ser. Lo que no es exagerado es decir que usar su base de datos y su programa es divertidísimo. Prueben (está aquí). Pongan su nombre, su palabra preferida, su palabra más odiada; comparen los nombres de distintas personas. Si la 'culturonomía' no despega como ciencia, por lo menos puede ser un divertido juego de salón.
En noviembre de 2007, el joven matemático Erez Lieberman Aiden se presentó en las oficinas de la compañía Google. Quería permiso para usar la base de datos Google Books en una investigación. Aiden tenía la intención de aplicar métodos de análisis estadístico a los libros de esa base de datos para extraer información acerca de muchas cosas: tendencias culturales, historia de las palabras, ires y venires de ideologías, modas y personas y todo lo que puedan reflejar los libros. Google Books, que es un proyecto de digitalizar todos los libros del mundo en todos los idiomas, no puede ofrecer gratis en internet libros que esten sujetos a derechos de autor. Pero Aiden quería acceso a los libros completos y Google no vio motivos para negárselo.
Usando métodos estadísticos tomados de la biología evolucionista, Aiden, junto a sus colegas Jean-Baptiste Michel y Yuan Kui desarrollaron un programa llamado Bookworm (que en español equivale a "rata de biblioteca"). Esta "rata de biblioteca" opera en una base de datos formada por más de cinco millones de libros en siete idiomas (cerca del 4 % de todos los libros que se han publicado). La base de datos contiene 361,000 millones de palabras en inglés, 45,000 millones de palabras en español, y números parecidos en francés, chino, alemán, ruso y hebreo (cada idioma forma un "corpus" separado de la base de datos).
Con esta base de datos y el programa Bookworm (ambos disponibles aquí), Aiden y sus colaboradores (entre los que se cuentan el equipo de Google Books y el célebre psicólogo y lingüista canadiense Steven Pinker) afirman haber creado una nueva disciplina: la culturonomía.
Fuentes:
- La ciencia de la mula Francis
- "Cómo aprender de los libros sin leerlos" en Imagen en la Ciencia (Sergio de Régules)
- Quantitative Analysis of Culture Using Millions of Digitized Books / Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman Aiden. Science 14 January 2011: 176-182.Published online 16 December 2010 (Abstract, Full Text, Full Text (PDF), Supporting Online Material)