Facultad de Ciencias de la Información

 Curso: 2003/2004.

Profesor: Félix del Valle Gastaminza fvalle@ccinf.ucm.es

 

PERSPECTIVAS SOBRE EL TRATAMIENTO DOCUMENTAL DE LA FOTOGRAFÍA

Félix del Valle Gastaminza

http://www.ucm.es/info/multidoc/prof/fvalle/principal.htm

fvalle@ccinf.ucm.es

 

El objeto de este artículo es el de presentar una tipología de modelos de análisis documental aplicables al tratamiento de las imágenes fotográficas de cualquier tipo.

Tras exponer la necesidad de tratar la fotografía desde la perspectiva de las ciencias de la documentación se proponen modelos de carácter diverso para el tratamiento del contenido de las obras visuales. Estas vehiculan información visual que es necesario procesar, tratar y representar por medio de elementos procesables en sistemas de recuperación de información.

Se analizarán las características del contenido del documento fotográfico con objeto de proponer estrategias de interrogación y representación basadas en aspectos gramaticales, sintácticos, semánticos, cromáticos o formales de las fotografías y se examinarán las principales herramientas lingüísticas susceptibles de ser utilizadas en los procesos de análisis documental de la imagen como tesauros y clasificaciones especializadas.

Para todo ello se verán ejemplos de una variada tipología de documentos fotográficos.

 

1. Análisis y representación de documentos visuales.

El objeto principal que, desde nuestro punto de vista, debe guiar el análisis documental, es la recuperación de los documentos. Es bien cierto que hay otros objetivos (información, control, ordenación, sustitución) pero el más importante es conseguir que los documentos aparezcan cuando sean necesarios. El Análisis documental ha de servir pues para obtener representaciones de los documentos orientadas a la recuperación.

Todos los documentos audiovisuales plantean un problema de representación: Su contenido, información o mensaje está expresado mediante un lenguaje no escrito. En unos casos se trata de imagen fija, en otros es imagen móvil y a esta se le puede añadir el sonido. Pero sus representaciones, resultado del análisis documental  se expresan en un lenguaje escrito. Por tanto hay un problema de traducción o de transcodificación al tratar de representar imagen fija o imagen y sonido por medio de texto. El proceso de análisis comenzará por un proceso de lectura e interpretación y selección de significados que una vez expresados en lenguaje textual podrán ser normalizados mediante un lenguaje documental. Pero leer implica comprender e interpretar y para ello es necesario poner en funcionamiento una serie de competencias aprendidas de forma natural durante el aprendizaje formativo del ser humano (competencias iconológica y narrativa) y otras que implican una formación específica.

            A partir de ellas se pueden especificar los principales atributos de la fotografía, que serán el objeto de análisis de todos los modelos estudiados (Shatford-Layne 1994) :

Atributos de origen

El autor o autores y, en general, aquellas personas que tienen alguna responsabilidad respecto al contenido, el tiempo y lugar de creación, el tiempo y lugar de emisión, el título, la serie o reportaje al que pertenece, los derechos de autor, etc...

Atributos temáticos

De que trata y cómo se trata: temas, personas, lugares, etc... Qué, quién aparece en la imagen. Cómo es lo que aparece, qué acciones se detectan, etc. Toda la riqueza audiovisual del documento habrá de ser representada en un nuevo lenguaje; éste es quizás el gran reto de la documentación visual. 

Atributos relacionales

Las fotografías pueden estar relacionadas o asociadas con otras imágenes o con textos y es importante descubrir y tener en cuenta el contenido y la naturaleza de esas relaciones, que pueden resultar muy útiles para el usuario. Esas relaciones pueden provenir de cualquiera de los restantes atributos y serán explotadas por los sistemas automáticos de recuperación para mejorar las búsquedas. Así se pueden establecer relaciones entre fotografías del mismo autor, de autores de la misma época o procedencia, de autores de la misma agencia; relaciones entre fotografías por los temas que recogen, permitiendo agrupaciones y clasificaciones temáticas o relaciones por sus características morfológicas, como el soporte o el punto de vista o por sus características cromáticas.

Atributos morfológicos

Tipo de material, tipo de imagen (formato, tamaño, color),  tipo de plano utilizados,  puntos de vista (picado, contrapicado), utilización del blanco y negro, etc...

 A partir de esto revisaremos tres tipos de modelos: Modelos iconológicos, modelos lingüístico-documentales y modelos visuales.

   

2. Modelo iconológico: Erwin Panofsky. 

En los Estudios sobre iconología (Panofsky 1976) aborda el problema de la interpretación de las obras de arte señalando con precisión tres niveles de análisis, que conducen a la descripción pre-iconográfica, análisis iconográfico e interpretación iconológica: 

  1. Contenido temático natural o primario: Se percibe mediante la identificación de las formas presentes en la imagen como representaciones de objetos naturales —animales, plantas, casas, instrumentos, etc.—, personas, acontecimientos y lugares y sus relaciones como hechos. Podemos ejemplificar, de forma sencilla, este nivel de análisis mediante la Agonía en Getsemaní de El Greco, en la que se observan a un hombre arrodillado rezando frente a un hombre alado mientras otros tres hombres duermen y en un segundo plano aparecen varios más armados. Para resolver este nivel de análisis basta experiencia cotidiana y cultura general.
  2. Contenido secundario o convencional: Es la identificación de temas y conceptos manifestados en imágenes, historias y alegorías. En el ejemplo anterior, supone ser capaz de identificar a Jesús y el Ángel en la Oración en el Huerto de los Olivos o Getsemaní, a los Apóstoles dormidos, a los soldados romanos con Judas. A este proceso se le denomina análisis iconográfico. Para realizarlo, el iconógrafo debe tener conocimiento de las fuentes literarias, costumbres y tradiciones de la cultura en la que la escena sucede y se representa.
  3. Significado intrínseco o contenido: Consiste en la identificación de los principios subyacentes que revelan la actitud básica de una nación, un periodo, una clase, una creencia religiosa o filosófica. Se introduce uno en este nivel de análisis cuando se toma la Oración en Getsemaní como síntoma de la Contrarreforma, de una visión religiosa concreta o de la personalidad de El Greco. Este nivel de análisis requiere un conocimiento muy profundo de la historia del arte y de su contexto social y cultural.

 

Imagen 1: El Greco: Agonía en Getsemaní (Hacia 1580). Óleo sobre lienzo 40 x 51.5 in. Londres, National Gallery.

 

3. Modelos lingüísticos.

3.1. El análisis documental de la fotografía

En un texto anterior (Valle Gastaminza 1999) hemos abordado este tema planteando que al analizar el contenido de una fotografía se encuentran tres aspectos diferentes: la denotación y la connotación, lo que aparece en la fotografía y lo que ésta sugiere y el contexto en el que se produce.

En la imagen que figura a continuación, realizamos el análisis de la siguiente manera:

Denotación: Planteando las preguntas citadas y atendiendo tambien a los aspectos secundarios lo que apreciamos es un retrato frontal de un hombre de mediana edad vestido con un levitón desastrado y pantalones claros y etrechos sentado en una butaca en un jardín o bosque. En segundo término posan un grupo de sirvientes, uno de los cuales porta un capazo en la espalda, ante una mesa con una botella de vino y un racimo de uvas y una niña sentada en el suelo con una cesta.

Connotación: Propiedad, Poder, diferencia de clases, orgullo, soberbia, desafío, relaciones sociales, relaciones laborales, explotación, roles sociales, roles sexuales. Una deducción lógica (aunque no obligatoriamente cierta) nos lleva a pensar de que se trata de un propietario de viñedos.

Contexto: Situación económica y social de la Francia rural de finales del XIX.

Imagen 2: Frederic Viret. Carte de Visite. Paris, Hacia 1870.

3.2. Análisis Categorial: La gramática de casos como modo de lectura de fotografías.

La gramática de casos permite analizar el contenido de una fotografía a partir de la acción principal que se desarrolla en ella. A partir del trabajo de Cunha sobre los casos de Fillmore y Pottier García Gutiérrez se puede considerar la fotografía como momento de una acción y a partir de ahí evaluar los casos. En torno a la acción aparecen siete casos y dos tipos de modificadores aplicables a los casos Agente y Objeto.

Acción.

  • ¿Qué ocurre? ¿Cuál es el acontecimiento fundamental? Su papel es servir de vértice organizador a todos los demás casos conceptuales.
  • Muchas fotografías giran en torno a una acción y, como regla general, todas las acciones explicitadas en un texto son subsumibles en otra más amplia. Si no lo fueran podrían tratarse como microimágenes independientes.
  • En los retratos no hay acción propiamente dicha o más bien la acción es el hecho de posar para la cámara.
  • En los paisajes la acción es la propia existencia, la vida.
  1. Agente. Categoría que abarca seres vivos, humanos, animales o vegetales, microorganismos, instituciones como representaciones o colectivos humanos y, eventualmente, personificaciones y entes espirituales que desarrollen o ejecuten o sufran una acción.
  2. Objeto. En realidad es el mismo caso Agente referido a cosas o entidades no vivas que directamente desencadenen o sufran acciones.
  3. Instrumento. Herramienta o medio a través del cual se ejecuta la acción. Son objetos visualizados  mientras de utilizan con una función instrumental.
  4. Modo. Procedimiento general o especializado y voluntario, no implícito en la acción utilizado en la realización de la acción.
  5. Causa. Pueden ser causativos: 1) Los motivos inmediatos, 2) los antecedentes y 3) los contextos generales en los que la acción se inserta, aunque no estén implícitos.  
  6. Lugar. Noción espacial o contexto geográfico en el que tiene lugar la acción
  7. Tiempo. Noción temporal o contexto cronológico si fuera necesario, en el que tiene lugar la acción.

Modificadores

  1. Situación. La situación es involuntaria, atributiva y afecta física o psíquicamente a los actantes. ¿En qué situación se encuentra el Agente/Objeto?
  2. Asociativo. Caso secundario referido a acompañantes o elementos subsidiarios, nunca protagonistas directos, de los agentes y los objetos. ¿Con quién / qué se encuentra el Agente / objeto?

El hecho de que todo el proceso de análisis se sitúe en torno a una acción principal dificulta parcialmente este modelo en cuanto lo enfrentamos a imágenes que no reflejen acciones como tales, ¿Cuál es la acción en un retrato? ¿Y en un paisaje? ¿Quizás el paso del tiempo? Salvo que consideremos, en ambos casos, que la acción principal, de la cual haríamos abstracción, es precisamente, estar ante la cámara, posar. Sin embargo, los casos, como tales, ofrecen una estrategia muy coherente de interrogación respecto a los que transcurre ante la cámara. La gramática de casos, sin embargo, no es suficiente para extraer todo el conjunto de significados analizables pues deja de lado aspectos muy importantes como lo relativo a los aspectos visuales, creativos o relacionales de las fotografías.

 

Diario El País, 20 de junio de 2002.

ACCION: Enfrentamientos, discusión

AGENTES:

            Ertzainas: MOD. DE SITUACIÓN: Uniforme antidisturbios

            Sindicalistas: MOD. DE SITUACION: Violencia verbal

            Piquetes

INSTRUMENTO: Porras

CAUSA: Huelga General 20-J

LUGAR: País Vasco

TIEMPO: 20/06/2002

   

Una reciente propuesta (Tam and Leung 2001) de un sistema de descripción estructurada en lenguaje natural parte de presupuestos similares.

 

3.3. Modelo conceptual sintáctico y semántico (Jörgensen y otros)

Esta propuesta (Jörgensen; Jaimes; Benitez, and Chang 2001) ofrece 10 niveles de análisis en dos grupos: relacionados con la percepción (niveles sintácticos) y relacionados con el contenido visual (niveles semánticos):

Niveles sintácticos: Relacionados con la percepción.

  1. Tipo y técnica:  Fotografía o video; B/N o color, etc.
  2. Distribución global:  Color y textura global, sin entrar en análisis sectoriales.
  3. Estructura local: Componentes individuales de la imagen en términos visuales; detección de formas de las que se señalan elementos como punto, línea, tono, color o contraste.
  4. Composición global: Organización espacial de los elementos de la imagen donde se pueden tratar conceptos como equilibrio, simetría, centro de interés, etc...

Niveles semánticos.: Relacionados con el contenido visual.

  1. Objeto genérico: Nivel general de descripción de objetos (automóviles, árboles, hombres, p.e.)
  2. Objeto específico: Objeto identificado con precisión (Jorge Luis Borges, Edificio Chrysler)
  3. Escena genérica: Nivel general de descripción de escenas (paisajes, retratos, escenas, etc.)
  4. Escena específica: Escena identificada con precisión (Puerta del Sol, Parque del Retiro)
  5. Objeto abstracto: Interpretación subjetiva del valor simbólico o connotativo del objeto.
  6. Escena abstracta: Interpretación subjetiva del valor simbólico o connotativo de la escena.

Imagen 4: Emilio Beauchy: Sevilla 1892. 

Se ha aplicado este modelo a una imagen antigua de la ciudad de Sevilla con los resultados siguientes:

TT: Fotografía B/N. Papel albuminado sobre cartón.

DG: Tonalidad sepia uniforme

EL: Tercio superior uniforme; Dos tercios inferiores contrastados.

CG: Diagonal marcada por el río desbordado relaciona dos elementos de contenido importantes: Los curiosos y la Torre del Oro. A la izquierda, remarcada por otra diagonal paralela una mujer mira al centro de interés.

OG: Río, Ciudad, Puerto, Paseo, Barcos, Edificios, Torres

OE: Guadalquivir, Sevilla, Triana, Torre del Oro , Iglesia de Santa Ana

EG: Paisaje urbano

 EE: Inundaciones de 1892

EA: Peligro, Curiosidad, Desastres naturales, Control de la naturaleza

 

 

3.4. Modelo semántico a partir de propuestas de recuperación

A partir del estudio de demandas de información visual propuestas por usuarios no expertos la propia Jorgensen ha propuesto un conjunto de diez clases y atributos de gran interés por su exhaustividad para el tratamiento de contenido de las imágenes (Jörgensen 1999) : Objetos concretos, Estados del ser, Seres vivos, Información histórico artística, Elementos perceptuales, Color, Situación, Descriptores, Conceptos abstractos e Historia

Objetos concretos.

Objeto (OB): Objeto específico o categoría de objetos.

            Vestuario (CL): Elementos específicos de vestuario o complementos.

            Texto (TX): Cualquier elemento textual en la imagen; incluye cualquier sistema simbólico, alfabético o numérico.

            Parte del cuerpo (BP): Cualquier parte de la anatomía humana o animal; incluye peinado.

Estados del ser.

            Estatus Social (SS): Aplicable a seres vivos; incluye ocupación, raza, nacionalidad, clase y antropomorfización.

            Emoción (EM): Estados afectivos o mentales afectados por los componentes de la imagen.

            Relación (RL): Relaciones entre seres vivos en la imagen (intimidad, maternidad, enemistad)

            Grupos (GR): Colectivos; organizaciones, instituciones, clubes, etc.

Seres vivos.

            Gente (PE): Seres humanos, singulares o plurales, de cualquier edad o sexo. Personas específicas que aparecen en la imagen.

            Seres míticos (MB): Seres humanos míticos.

            Animales (AN): Todos, a partir del nivel celular. Subcategoría Animales míticos (ANM)

            Plantas (PL):  Todas, a partir del nivel celular. Subcategoría Plantas míticas (PLM)

Información histórico-artística.

            Artista (AR): Nombre; incluye identificación de firma si está en la imagen.

            Tipo de producto (PT): Publicación donde aparece la imagen; cómic, libro de texto, libro de arte, página web.

            Medio (MD): Materiales para la ejecución de la imagen: óleo, acuarela, mármol, madera.

            Género (GN): Tipo de representación: Retrato, escena, paisaje, desnudo.

            Técnica (TC): Técnica artística: Bajorrelieve, cera perdida.

            Tipo de trabajo (WT): Fotografía, pintura, dibujo, ilustración.

            Estilo (SY): Estilo genérico o específico: Impresionismo, pictorialismo, abstracción.

Elementos perceptuales.

            Componentes visuales (VC): Cualidades como iluminación, contraste.

            Textura (TE): Características de textura generales o específicos.

            Forma (SH): Forma/s específica/s dentro de la imagen (triángulo, círculo)

            Perspectiva (PS): Perspectiva, punto de vista, escala.

            Orientación (OR): Aplicable a elementos específicos: vertical, horizontal.

            Movimiento (MT): Movimiento o percepción de movimiento de seres vivos o inanimados.

            Punto focal (FP): Área de atención específica por medio de algún procedimiento artístico.

            Composición (CM): Disposición de elementos específicos o generales.

Color.

            Color (CO): Colores específicos.

            Valor de color (CV): Valores cromáticos en distintas escalas.

Situacion.

            Situación específica (PS): Emplazamientos o situaciones sugeridas  por preposiciones: (en, sobre, bajo) o palabras que designen específicamente emplazamiento (izquierda, centro)

            Situación general PG): Localización general, como fondo, fuera de campo. Puede referirse a una sección específica de la imagen como "suelo" o "cielo".

Descriptores.

            Calificadores (QU). Son adjetivos aplicables a Objetos y a Seres vivos.

            Número (NU): Número, cantidad, escala, edad, etc.

Conceptos abstractos.

            Término abstracto (AB): Términos conceptuales difícilmente expresables o cuantificables: único, extraño, , exótico, interesante...

            Atmósfera (AT): Ambiente o atmósfera de la imagen (divertido, anecdótico, cálido, triste)

            Aspecto simbólico (SM): Elemento visuales de carácter simbólico: Rama de olivo, escalera, estrella; pueden estar determinados culturalmente.

            Estado (ST). Condición un componente de la imagen o función de un componente (lleno, soporte)

            Tema (TH). Tema de la imagen (transporte, vida urbana). Disciplina específica mencionada o relacionada (Psicología, política, religión), y concepto abstracto general (Libertad).

Historia.

            Actividad (AC): Cualquier acción física de seres vivos, individuales o en grupo. Incluye información posicional o conversacional y gestos.

            Acontecimiento (EV): Actividad de carácter social, presentación, etc.

            Referencia literaria (LR) Tipo o género de literatura referenciado por la imagen (novela, aventura, cuento de hadas, mito, ciencia ficción)

            Lugar (SE): Localización general de una escena o actividad.

            Tiempo (TA): Duración de una actividad o referencia temporal. Tiempo del día o estación.

            Referencia temporal (TR): Tiempo de lo representado en la imagen.

            No es evidentemente aplicable todo a cada imagen pero su ofrece información de enorme interés para abordar el estudio documental de cualquier imagen como veremos en varios ejemplos.

 

Imagen 5: Alfred Stieglitz. Nueva York, 1892. 

OB

Tranvía de caballos; Medios de transporte; Calles

CL

Uniforme de trabajo

SS

Trabajadores

GR

Compañía de Tranvías de Nueva York

ANM

Caballos

AR

Alfred Stieglitz

GN

Escena

WT

Fotografía

VC

Luz natural

MT

Reposo contenido

CO

B/N

TE

Neblina

AT

Frío

TH

Transportes; Vida urbana

SE

New York (USA); Harlem

TA

Invierno

TR

1892

 

 

 

 

 

 

 

 

 

 

Imagen 6. Anónimo. Col. Castellano. Biblioteca Nacional. España.

 

OB

Capazos; Cunas

CL

Indumentaria tradicional pasiega

BP

Tocados; Cofias; Trenzas

SS

Nodrizas; Amas de cría

RL

Maternidad

PE

Mujeres; Niños

GN

Retrato de estudio

WT

Fotografía

AT

Calidez

TH

Lactancia; Servicio doméstico

SE

Vega del Pas; Cantabria; Madrid; España

TR

Hacia 1860

   

4. Modelos visuales: Content-Based Image Retrieval

    Frente a los muy subjetivos métodos humanos de análisis de contenido se presenta un método automático que se denomina Recuperación de imágenes basada en el contenido (Content-based Image Retrieval) que utiliza características puramente visuales, objetivables, de la imagen (Venters and Cooper 2000) . El método actúa procesando un vector representativo de las características visuales de la imagen y la similitud entre imágenes es procesada comparando los vectores representativos de cada imagen. El resultado de este proceso es un nivel cuantificado de similitud que mide la "distancia visual" entre dos imágenes, representadas por sus vectores en un espacio de representación. Las tres características de coincidencia visual más utilizadas son el color, la forma y la textura.

Color

Analiza la distribución global y local del color. El análisis de la distribución global no tiene en cuenta la posición ni las zonas donde aparece el/los color/es sino sólo los colores dominantes y las variaciones. La posición del valor de color no es significativa, lo que produce como resultado la aparición de resultados falsos. La distribución local estudia la imagen compartimentándola en diversos bloques y tratando las características de color de cada bloque. La posición del valor de color sí es aquí significativa.

Forma

El análisis de la forma mide la orientación relativa, la curvatura y el contraste de líneas de una imagen. El color, posición u orientación absoluta de las líneas no es tenido en cuenta.

 

Textura

El análisis de la textura extrae las características de uniformidad, granularidad, direccionalidad y repetición de la imagen.

            Puede ser un muy buen complemento de los sistemas tradicionales de indización humana. Debe tenerse en cuenta que son descripciones no absolutas sino relativas, comparables. Si existe un marco previo de representación, los vectores de cada imagen diferirán en mayor o menor medida de los vectores definidores del marco previo.

 

 5. A modo de conclusión: De la necesidad de lenguajes documentales controlados para la indización de la imagen.

            Los modelos de análisis vistos hasta aquí de forma somera nos dan pistas para abordar el tratamiento documental de la fotografía. Pero el modelo en sí no es suficiente y falta transformarlo en una estrategia de representación normalizada, tanto desde un punto de vista formal como lingüístico. En efecto, los resultados del proceso de análisis tienen que plasmarse en una ficha de representación en un determinado formato; los resultados más relacionados con el contenido, con la materia, tienen que procesarse en un lenguaje documental: No hay un lenguaje documental único para la imagen, pero sí varios muy extendidos. 

En el ámbito anglófono son muy destacables las iniciativas de control de vocabulario documental del Getty Information Institute: El Art and Architecture Thesaurus (AAT); La Union List of Artist Names (ULAN) y el Getty Thesaurus of Geographic Names (TGN). El planteamiento facetado del AAT lo hace especialmente interesante para el tratamiento de imágenes. También hay que resaltar el Thesaurus for Graphic Materials (TGM) de la Biblioteca del Congreso de los Estados Unidos, cuya opción es separar en la indización de imágenes el componente puramente temático (TGM I: Subject Terms) y los referentes a su género y aspectos formales (TGM II: Genre and Physical Characteristics Terms). Por último, señalaremos ICONCLASS, sistema de clasificación decimal muy orientado a las representaciones artísticas desde una vertiente iconológica.

            En el ámbito francófono, la iniciativa más remarcable es la del Thesaurus Iconographique de Garnier, cuya estrategia de representación, introduciendo sintaxis en la frase de descriptores es sumamente interesante. También citaremos el Répertoire dAutorité Matière (RAMEAU) o el de ICONOS de la Documentation Française.

En España, por último, citaremos el Tesauro de Patrimonio Andaluz, cuya organización facetada es muy sugerente y, en su misma línea conceptual, el que recientemente hemos terminado para el Centro de Documentación de Telecinco.


 

 

Bibliografía

 

1.    Jörgensen, Corinne. Image indexing: An analysis of selected classification systems in relation to image attributes named by naïve users. Annual Review of OCLC Research . 1999.

2.    Jörgensen, Corinne; Jaimes, Alejandro; Benitez, Ana B., and Chang, Shi-Fu. A Conceptual Framework and Empirical Research for Classifying Visual Descriptors. Journal of The American Society for Information Science and Technology. 2001; 52(11):938-947.

3.    Panofsky, Erwin. Estudios sobre Iconología. 2ª ed. Madrid: Alianza; 1976.

4.    Shatford-Layne, S. Some issues in the indexing of images. Journal of The American Society for Information Science and Technology. 1994; 45(8):583-588.

5.    Tam, A. M. and Leung, C. H. C. Structured Natural-Language Descriptions for Semantic Content Retrieval of Visual Materials. Journal of The American Society for Information Science and Technology. 2001; 52(11):930-937.

6.    Valle Gastaminza, Félix del. Manual de documentación fotográfica. Madrid: Síntesis; 1999. 255 p.

7.    Venters, Colin DC and Cooper, Matthew. A review A Review of Content-Based Image Retrieval Systems   [Web Page]. 2000. Available at: http://www.jtap.ac.uk/reports/htm/jtap-054.html.

 

 

©Félix del Valle Gastaminza fvalle@ccinf.ucm.es Despacho 208. Tel. 913942206. Página Web de Félix del Valle Home Page