Análisis documental.
Indización. Resúmenes. Tipos y normas para su elaboración
. Introducción: tratamiento documental
Resúmenes. Tipos y normas para su elaboración
Normas para la elaboración de resúmenes
Introducción: tratamiento documental.
Llamamos tratamiento documental a la operación intelectual consistente en aplicar al colectivo documental técnicas normalizadas con el fin de hacerlo controlable y utilizable .Consta de dos partes relacionadas entre sí, análisis documental y recuperación: la primera existe en función de la segunda.
El análisis documental está constituido por el conjunto de operaciones necesarias para extraer la información contenida en los documentos primarios y acondicionarla para su almacenamiento y posterior recuperación, y su producto es un documento secundario.
El análisis documental se hace a dos niveles. El primer nivel, o nivel externo, consiste en la descripción física de un documento -referencia bibliográfica y clasificación-; el segundo nivel, o nivel interno, se encamina a la descripción de su contenido, que puede ser de dos clases:
descripción característica: indización.
descripción sustancial: resumen.
La redacción de la referencia bibliográfica de un documento es la elaboración del conjunto mínimo de datos que permitan la identificación de una publicación o de una parte de ella. Puede encaminarse a;
formar parte de una bibliografía o índice bibliográfico
preceder a un resumen o revisión crítica del documento
añadirse a un documento para hacer referencia a otro
documento.
Los elementos que la componen y su orden pueden variar ligeramente según el tipo de publicación e incluso de un país a otros. Para su normalización podemos acogernos a la norma ISO-690.
Designa, por una parte, la operación de distribuir los objetos de acuerdo con sus características distintivas, en clases o categorías relacionadas entre sí; por otra, designa el propio sistema de clases o categorías, generalmente establecidas a priori, en el cual aquellos elementos se clasifican. Como operación del análisis documental cumple una doble finalidad: determinar el contenido de los documentos, a fin de poderlos distribuir de acuerdo a un sistema de categorías previamente establecido y permitir la distribución física de los documentos de acuerdo con dichas categorías en los depósitos que los contienen. Los tipos de clasificación se dividen en los de estructura arborescente (jerarquizados) y las clasificaciones por facetas. Los sistema de clasificación jerarquizada son los más utilizados actualmente y entre ellos cabe citar la Clasificación Decimal de Dewey, la Clasificación Decimal Universal, la Clasificación Internacional de la UNESCO para Ciencia y Tecnología y la Library of Congress Classification. Entre los sistemas de clasificación por facetas, el más conocido es el Colon Classification de Ranganathan.
Es la operación que tiene por objeto definir el contenido de un documento mediante un conjunto de conceptos que especifican el tema o temas de que trata. Su objetivo puede ser asignar los encabezamientos que darán lugar a un índice de materias, preparar el documento para su archivo y posterior recuperación o ambos. La indización puede considerarse como un tipo especial de clasificación, o como una operación alternativa de la misma: de hecho son dos operaciones complementarias. Normalmente, se clasifica al documento a efectos de su ordenación en un repertorio determinado; después se le indiza para facilitar su almacenamiento y posterior recuperación en los servicios de búsqueda retrospectiva y difusión selectiva de la información. Su importancia, pues, se ha incrementado al generalizarse los sistemas de búsqueda automatizada. Su eficacia está en relación directa con los documentos pertinentes recuperados.
Lenguajes de indización.
La forma más sencilla de indización se hace en lenguaje natural o libre, utilizando las mismas palabras que figuran en el documento original, a los que llamamos palabras claves (key-words) o unitérminos si se trata de palabras individuales exclusivamente. Pero cuando la indización adquiere mayor trascendencia es cuando se utiliza un vocabulario controlado: es decir, cuando cada grupo de sinónimos se expresa con un término único, estableciéndose relaciones de equivalencia, lo cual, además, resuelve el problema de la polisemia. En el lenguaje controlado de indización los términos pertenecen a las siguientes categorías;
Términos preferentes o descriptores: representan conceptos
precisos y unívocos en el proceso de indización y búsqueda de los
documentos.
Términos no preferentes: no se asignan a los documentos, pero
pueden utilizarse como puntos de acceso en los índices o thesaurus y dirigir al
usuario a través de términos sinónimos.
Identificadores o términos no controlados: no forman parte del
lenguaje de indización, pero se asignan a los documentos como términos
suplementarios.
La utilización del lenguaje de indización tiene como objeto asegurar la coincidencia entre el lenguaje utilizado por los emisores de información y el utilizado por quienes la buscan: el lenguaje natural utilizado en los documentos debe traducirse a este otro lenguaje más estricto. Cuando la coordinación de términos se hace a priori, dando lugar a descriptores compuestos, el lenguaje se llama precoordinado; cuando se hace a posteriori, a la hora de preparar las estrategias de búsqueda, se llama lenguaje postcoordinado.
El diccionario que permite la traducción de un lenguaje a otro es el thesaurus. Es un repertorio de términos con expresión de las relaciones semánticas que los unen. Contiene dos clases de términos, los descriptores (palabras que pueden utilizarse en la indización) y no descriptores (términos prohibidos que remiten siempre a un descriptor del que son sinónimos o cuasisinónimos). Las relaciones entre ellos pueden ser de cuatro tipos:
De equivalencia. Une todos los términos que expresan un mismo
concepto o pueden considerarse equivalentes. Uno se escoge como descriptor y los
demás remiten a él mediante la relación recíproca de "úsese" (US -use- ) y
"usado en lugar de" (UF -used for- =).
Alternativa. resuelve el carácter polisémico de un no-descriptor
remitiendo a otro que ha de usarse alternativamente mediante "véase...o..."
(S -see- :) y la recíproca "viene de" (SF -see from- *).
Jerárquicas. Unen descriptores más genéricos o más específicos
con respecto a los otros. Se utiliza "término más genérico" (BT -broad term-
<) o "término más específico" (NT -narrow term- >).
De afinidad. Unen descriptores que tienen una cierta afinidad con
la expresión de una idea, pero excluyendo las relaciones de equivalencia y las
jerárquicas. Son las relaciones de antonimia, causalidad, material-producto,
etc.: "término relacionado" (RT -related term- -).
Existe gran cantidad de estudios y experiencias sobre los modos de indización, siendo uno de los más conocidos el experimento de Cranfield (U.K.), dirigido por Cleverdon, que analizó la indización por la C.D.U., por clasificación facetada, clasificación por materias y unitérminos. Van Dijk y Van Slype afirman que la indización por materias fue la primera en aparecer, con el fin de hacer más eficaz la búsqueda, aunque más tarde, la necesidad de profundizar en la misma hizo necesario el uso de uniterms, cuya consolidación se debe a Taube en su obra The Uniterms system of Indexing Operating Manual, 1955. De cualquier modo, los pasos a dar para proceder a la indización de un documento no varían sustancialmente y son los siguientes:
Determinación y revisión
de los objetivos a lograr.
Conocimiento del
documento: título, introducción, tabla de materias, resumen, conclusiones,
epígrafes y rápido repaso del texto.
Identificación de los
términos del contenido.
Extracción de los términos
que se consideren adecuados.
Verificación de la
pertinencia de los términos.
Traducción al lenguaje
documental.
Verificación de la
pertinencia de los términos traducidos.
Formalización de la
descripción.
Siempre que sea posible se utilizará el descriptor más específico para cada concepto, así como los descriptores precoordinados, cuando existan, antes de recurrir a la coordinación de términos a posteriori.
Los sistemas para la extracción de conceptos pueden ser humanos o mecánicos, los cuales se basan en métodos estadísticos o lingüísticos -previa introducción de un thesaurus- y los métodos de aplicación pueden establecerse mediante el índice KWIC -palabras contenidas en el título- o KWOC -palabras colocadas fuera del título.
Resúmenes. Tipos y normas para su elaboración.
El resumen es una operación de síntesis consistente en representar el contenido de un documento de la forma más breve posible sin alterar su significado esencial. Como operación documental, no es un extracto cualquiera, sino el que se prepara de acuerdo con unas normas determinadas.
La finalidad fundamental del resumen es la economía de tiempo. La proliferación de textos repetitivos y de literatura redundante hacen necesario reducir los documentos a unas dimensiones mínimas y la vez suficientes para llegar a lo esencial de su contenido sin necesidad de su lectura total. Sus objetivos son:
Ayudar a los interesados a
decidir si deben leer el texto completo.
Proporcionar la mayor
cantidad de datos en el menor tiempo.
Acelerar el trabajo de las
revistas de resúmenes mejorando los servicios de la información científica y
técnica.
El resumen debe ser claro, metódico, ordenado y expresar sólo lo esencial. Debe utilizar términos precisos y rechazar los superfluos, como sinónimos, epítetos, términos de transición, etc. procurando alcanzar la plenitud de significado con el mínimo de palabras.
A la vez, el resumen debe ser fiel, reflejando los elementos esenciales del original sin aportar ideas nuevas. Por último debe ser completo, sucinto y vivo, que permita al lector hacerse con una idea exacta de las condiciones en que nació y se desarrolló el documento.
La dificultad del resumen radica en que, al menos teóricamente, sólo el autor del documento será capaz de resumirlo adecuadamente. En la mayoría de los casos, el autor del resumen debe ser, también él, especialista del tema que trata o, al menos, conocerlo en profundidad para poder captar con precisión las ideas fundamentales recogidas en el texto.
Existen varias clasificaciones de resúmenes, atendiendo a diversos aspectos del mismo. Según su planteamiento se dividen en indicativos e informativos.
Los resúmenes indicativos proporcionan una idea del contenido del artículo enumerando los temas de que trata. Los resúmenes informativos añaden detalles concretos sobre objetivos, métodos, resultados y conclusiones y suelen estar divididos en cuatro partes bien diferenciadas, que exponen estos aspectos.
Van Dijk Van Slype, a su vez, clasifican los resúmenes valiéndose de un criterio de orientación cuantitativa, tipificándolos de la siguiente manera:
Título (title): no indica más que los temas
principales.
Notación del contenido (notation of content): es el título
mejorado y más homogéneo (entre 10 y 30 palabras).
Resumen telegráfico (telegraphic abstract): frase
compuesta por la unión de palabras-clave utilizadas para la indización del
documento, en orden coherente y con alguna palabra de enlace.
Resumen indicativo (indicative abstract): descripción más
completa del contenido del texto, sin exponer conclusiones (entre 50 y 200
palabras).
Resumen informativo (informative abstract): describe el
contenido del testo y enumera algunas conclusiones (entre 100 y 300
palabras).
Extracto (extract): resumen a base de frases extraídas del
propio texto.
Reseña (review): describe las principales ideas contenidas
en el documento y añade comentarios críticos y opiniones personales.
Compendio (digest): versión abreviada del texto, de forma
más cuidada y literaria (del 20 al 50% del texto).
El texto mismo (full text). No es un resumen en el sentido
estricto de la palabra, pero puede cumplir su misión cuando quede registrado en
un servicio que considere inútil emplear otro tipo de resumen.
La elección de uno u otro tipo de resumen dependerá del tipo de usuario al que vaya destinado, recursos humanos y económicos, servicio que lo realice, etc., aunque el más utilizado suele ser el resumen informativo.
Normas para la elaboración de resúmenes.
Existe una gran cantidad de normas para la realización del resumen, pero al tratarse de una operación eminentemente intelectual, es difícil su unificación. Entre las normas más utilizadas por los servicios de documentación se encuentran el informe UNISIST, la Guía para la preparación de resúmenes de la UNESCO y las normas ISO-214-1976. Unas y otras son aplicables al redactor del resumen, aunque se orientan más bien a un autor único para el resumen y el texto. Los aspectos más notables de estas normas son:
Los títulos de los artículos deben ser lo suficientemente
precisos como para tener un valor práctico en vistas a su almacenamiento y
recuperación.
Los artículos deben ir precedidos de un resumen, teniendo en
cuenta que esta puede ser la única parte del texto que se leerá.
El resumen debe recapitular sucintamente sobre los hechos
contenidos en el texto y sus conclusiones, y atraer la atención sobre los datos
nuevos indicando su importancia.
Se deben emplear frases coherentes y no dar una simple serie de
epígrafes y el lenguaje debe ser corriente e inteligible por sí mismo.
No deben contener referencias o citas ni abreviaturas.
Deben ser tan concisos y breves como sea posible, no debiendo
exceder, salvo casos excepcionales de 200 palabras.
Deben respetar la forma y equilibrio del original, y si este no
va estar presente, el análisis debe ser lo suficientemente claro y detallado
como para reemplazarlo.
Deben publicarse en cualquiera de las lenguas vehiculares más
extendidas, sea cual sea la lengua original del texto.
La Conferencia Internacional sobre análisis documental científico
recomienda que los resúmenes se inserten en una parte de la publicación que
pueda ser recortada sin dañar al resto.
El primer aspecto a tener en cuenta en la elaboración de un resumen es que todo lo que no es esencial es inútil y se debe eliminar. Las características más destacadas serán la fidelidad y la concisión y se redactará un texto nuevo, con lenguaje propio y de la mayor objetividad. Boret y Peuret en su obra Le résumé de texte (París, 1969) señalan las tres fases deseables en la elaboración de un resumen:
1º: Lectura. Se leerá el texto detenidamente, a ser posible en dos fases: una primera superficial que dará idea del contenido y la segunda, más profunda, párrafo a párrafo, que dará lugar al análisis.
2º: Resumen analítico párrafo por párrafo: El párrafo es la unidad de composición que desarrolla una única idea, el punto básico de una argumentación. Por ello en esta fase se debe:
detenerse en los párrafos más complicados y dilucidarlos
detenerse en las expresiones de mayor carga significativa
separar la idea principal de las secundarias.
3º: Resumen propiamente dicho: sintetizar los aspectos separados por el análisis.
El resumen puede elaborarse para sustituir la lectura del texto original o para fomentarla. El primer caso sólo es aceptable cuando el artículo tenga un interés marginal para el lector; en el segundo caso, el resumen debe servir para seleccionar los textos y leerlos en su integridad. En ambos casos, la calidad del resumen es esencial para evitar cualquier juicio erróneo sobre el contenido de un documento.
Volver a:
Libros, bibliotecas, bibliotecarios
Rosario López de Prado
Museo Arqueológico Nacional (BIBLIOTECA)
Última revisión: 6 de mayo de 2000