Técnicas de uso de las bases de datos

Las bases de datos son fuentes muy valiosas para almacenar y recuperar la información. Nos proporcionan bien la referencia, bien la información en estado bruto.  


Más información sobre las bases de datos

 

            El problema de las bases de datos es cómo buscar en ellas; no porque sea especialmente dificultoso sino porque – a pesar de los intentos efectuados – no hay un único lenguaje o modelo de interrogación.

            Por eso, es importante tomarse un tiempo cada vez que nos enfrentemos a una base de datos, y consultar la ayuda que casi todas incorporan.

 

            No obstante, hay una serie de rasgos que suelen ser comunes (aunque su utilización pueda ser diferente):

 

     Toda consulta se traduce en una especie de ecuación, que es la que interroga al sistema. Muchas veces oiremos hablar de ella como ecuación de búsqueda.

 

     Puede buscarse por un único campo (sólo en un tipo de datos del registro: materias, títulos,...), por varios a la vez o por todos (o al menos, por los más significativos).

Normalmente, los términos están normalizados (se establece que un nombre de autor o una materia, por ej., aparezca siempre de la misma forma).

 

     Se utiliza la lógica booleana para buscar por varios términos a la vez. Cuando veamos el término búsqueda avanzada, generalmente hace referencia a la utilización de tal lógica.

Los elementos básicos de la misma (llamados operadores booleanos) son los siguientes:

 

Y :  representa una intersección (en Matemáticas “Ç”) y reduce los resultados

Significa que los términos buscados deben encontrase todos a la vez en los registros que recuperemos. Acota, por tanto, los resultados: sirve para reducir su número.

Algunas otras formas en que aparece son: AND, + , .AND., ...

Ej.: "economics and spain " recupera sólo los registros donde aparezcan a la vez los dos términos

 

O :  representa una unión (en Matemáticas “È”). Amplía los resultados.

Su uso provoca que en los resultados aparezca uno cualquiera de los términos buscados en solitario, cualquier combinación de ellos (si son más de dos) y todos ellos a la vez.

Generalmente, obtenemos demasiados resultados, produciéndose ruido documental (información que no responde a lo que nos interesa en una búsqueda).

Otras formas de representación: OR, / , .OR., ...

Ej.: "economics or social" recupera los registros que contengan alguno de los términos o los dos a la vez.

 

NOT :  representa la negación: excluye (en Matemáticas “Ë”)

Todo término que siga al operador será considerado como no pertinente y eliminará del resultado los registros que lo contengan

Se representa también como: NOT, , .NOT., ...

 

Existen otros operadores booleanos, que son combinación de los anteriores. Pondremos como ejemplo el “O exclusivo” (NOR): funciona exactamente como el O; pero invalida los registros en que aparezcan todos los términos implicados a la vez: sólo serán válidos los que contengan un único término (uno, u otro, u...)

Ej.: "Economics not spain" recupera sólo los registros que incluyan economics pero no spain.

 

     Truncamientos: Consiste en indicar una serie de caracteres que queremos que aparezcan en nuestra consulta; pero sin que escribamos la palabra completa.

Se utilizan una serie de símbolos, llamados comodín, que pueden suplir a cualquier número de caracteres o a uno sólo: los más utilizados son * y s

Los truncamientos pueden situarse a la izquierda, a la derecha o en ambos lados. Los más frecuentes son los de la derecha.

Sirven para recuperar palabras que pertenecen a la misma familia. En rigor, sería como buscar varios términos utilizando el O booleano.

 

Ej. Econom*

Si * equivale a cualquier nº de caracteres, obtendremos Economía, econometría, económico (si no se tienen en cuenta las tildes), economics, econometrics, economy ,...

Sería como haber utilizado en la búsqueda todos esos términos conectados con O.

 

            Todos estos son elementos que encontraremos en cualquier base de datos (en cierto modo, están también en la base de cualquier catálogo).

 

            Hay otras sistemas de búsqueda que pueden aparecer en algunos casos; pero sólo los mencionaremos por encima, porque se salen del ámbito de esta curso de iniciación:

 

utilización de índices preestablecidos: suele haber un índice por cada campo significativo. Se elige el término, se introduce en la ecuación de búsqueda y se combina, en caso de que nos interese, con otros términos.

 

operadores sintácticos de proximidad: establecen la distancia a la que deben encontrarse los términos buscados: con una separación máxima de “x” caracteres, en el mismo campo, en la misma frase, en un orden concreto,...

 

ponderadores: determinan un peso para cada término; de tal forma que el resultado queda sesgado por el mismo.

 

            Como visión general de las búsquedas creemos que es suficiente.

            Baste señalar, por último, que nos encontraremos con programas más “amigables” que otros, más entendibles a un primer vistazo; fundamentalmente serán aquellos con enfoque más visual, con entornos similares a Windows o el Web, y en los que no haya que utilizar comandos, órdenes, ...

 

            Una última apreciación, que puede parecer superficial; pero no lo es, como demuestra la experiencia: debemos tener claro en qué lengua/s están introducidos los datos en la base, y por tanto, en qué lengua hemos de buscar. No debemos extrañarnos si no obtenemos resultados válidos al realizar una búsqueda en castellano en una base de datos que tiene sus registros en francés.

 

            También debemos tener cuidado cuando interrogamos bases de datos multidisciplinares: en ocasiones, tienen opciones que limitan la búsqueda a una disciplina o un conjunto de ellas. Si no lo tenemos en cuenta, podemos no obtener resultados.

Ej. Usa la base de datos Compludoc: para buscar adecuadamente sobre materias relacionadas con la economía, debemos – tras introducir el término de búsqueda – apretar el botón que indica Ciencias Sociales

2002, Biblioteca de la Universidad Complutense de Madrid