niveles de análisis documental de contenido

8
Niveles de análisis documental de contenido Blanca GIL URDR’iAiN Profesora de la EU BD Complutense RESUN Análisis de las características y funciones que desempeñan las opera- ciones de Análisis documental de contenido en el proceso de normaliza- ción y tratamiento de la información. En relación con la indización, se tie- nen en cuenta los sistemas tradicionales: en cuanto al segundo nivel de analísis, el resumen, se apunta la imprecisión terminologica existente en lo que a su categorización se refiere. Palabras clave: Análisis documental 1 Indización 1 Resumen. INTRODt.JCCION El análisis constituye una fase fundamental del proceso documental. Se trata de una «operación o conjunto de operaciones destinadas a presentar el contenido de un documento de una forma distinta de la original, a fin de facilitar su consulta o su referencia en fase posterior»’. Las operaciones de entrada y salida de información en un sistema do- cumental. estrechamente relacionadas, se articulan en base al Análisis de contenido de la documentación, que constituye una de las etapas claves de su proceso de normalización y tratamiento. Como medio de evitar solapa- míentos con otras disciplinas, me parece conveniente adoptar la denomi- nación de Análisis [)ocumental de Contenido (ADC) para describir las ope- raciones mediante las que, tras la lectura del documento o tras la inspección CHALMIER. 1. Les ‘leeniques documentaires. París: PUF. 1979, p. 13. Ih,e¡oí¡,’íít,íci,in te feo C.’¡e’nch,s eh’ ieí Jn/Ar,,¿,cir$h. ir’’ [7—ECli ce-ial coi,ipi,iicnsc. Xleídríd 1994

Upload: others

Post on 17-Nov-2021

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Niveles de análisis documental de contenido

Nivelesde análisisdocumentalde contenido

Blanca GIL URDR’iAiN

Profesora de la EU BD Complutense

RESUN

Análisis de las característicasy funcionesque desempeñanlas opera-cionesde Análisis documentalde contenidoen el procesode normaliza-ción y tratamientode la información. En relacióncon la indización,se tie-nen en cuenta los sistemas tradicionales: en cuanto al segundo nivel deanalísis,el resumen,seapuntala imprecisiónterminologicaexistenteen loque a su categorización se refiere.

Palabrasclave: Análisis documental1 Indización 1 Resumen.

INTRODt.JCCION

El análisisconstituyeunafasefundamentaldel procesodocumental.Setratade una «operacióno conjuntode operacionesdestinadasa presentarel contenidode un documentodeunaforma distintade la original, a fin defacilitar su consultao sureferenciaen faseposterior»’.

Las operacionesde entraday salidade información en un sistemado-cumental.estrechamenterelacionadas,searticulanen baseal Análisisdecontenidode la documentación,queconstituyeunade lasetapasclavesdesuprocesode normalizacióny tratamiento.Comomedio de evitar solapa-míentoscon otras disciplinas, me parececonvenienteadoptarla denomi-naciónde Análisis [)ocumental de Contenido(ADC) paradescribirlasope-racionesmediantelasque,tras la lecturadel documentoo trasla inspección

CHALMIER. 1. Les ‘leeniques documentaires. París: PUF. 1979, p. 13.

Ih,e¡oí¡,’íít,íci,in te feo C.’¡e’nch,s eh’ ieí Jn/Ar,,¿,cir$h. ir’’ [7—ECli ce-ial coi,ipi,iicnsc. Xleídríd 1994

Page 2: Niveles de análisis documental de contenido

78 Bícíuíecl Gil Iirelic icící>

de sutitulo, indice, introducción,conclusionesy otraspartesfundamenta-les,sedeterminael significadogeneraldel texto y seidentifican y aislanlosconceptosrepresentativosdel contenido.

Hablar de análisisde contenidopuedegenerarfalsasinterpretacionespor su posibleacepcióna otros análisisde estetipo, talescomo el análisissemióticoo el análisis de contenido entendidocomo técnicade i nvestiga—ción. El análisisal queaquí nosreferimos,se limita al ámbitodocumental.con las característicasque le son propias.

El ADC tropiezacon unadificultad debidoa quecadaanalistase valede suspropios mediosintelectualesparadesarrollarla tarea,y dentrodelmareo de referencia constituido por su cultura, experienciase intereses,factores que impiden la concordanciatotal entre los analistas.Acerca deesteproblemade la uniformidad escribeCourrier «dos indizadoreselegi-rón parael mismo documentomuy pocos descriptoresidénticos,a vecesmenosdel cincuentapor ciento. Eso ocurrirá tambiénen el mismo indiza-dor al operaren dos períodosdiferentes»2.

1-II lenguajedocumentaldesempeñaun rol mediadory normalizadorque evita, en muchoscasos,la arbitrariedaddel indizador y, comoconse-cuencia,facilita la tareaderecuperación,ya queproporcionapuntosde ac-cesoa la informaciónde interésparael usuario.

Me pareceoportuno apuntarla imprecisión terminológicaque afectaal ADC, ya que bajo estadenominaciónse incluyen tantotareasde análi-sísnroniamentedicho,como de sinI.esis. F.l A_DC compreneIe en efecto u noprimera fase analítica,que correspondea la captacióndc información,yunasegunda,en la que sesintetizanlos datosanalizados.1a terminologíautilizada por la escuela soviética para clescri bi r el proceso: «an áI isi s-sínte—sís»refleja sin ambigíledadeslos dosestadiosquelo componen.IzquierdoArroyo3 proponela denominaciónTratamientodocumentaldc Contenido(TDC) paraevitar centrartodo el procesocíe tratamientoen la Ofld=ración

de análisis.LII ADC puedellevarsea caboen niveles de menoro mayorprofundi-

dad,en respuestaa las necesidadesinformativasdel usuario.El primer ni-vel, la indización, atiendea la necesidadde identificar y localizar el docu-

mento, el segundo,el resumen,cumple con los anterioresobjetivos yrepresentaademás,deformaabreviada,al documentooriginal.

Pararealizar las tareasde indizacióny resumencon éxito es necesarioexaminarel contenido e ide nti ficar las estructurasdel texto original; cíes-cribir esasestructurasen mayoro menorprofundidaddependiendodel ni-

- COL~R Rl EH. Y. A n aiyse et laogage documeni aires. Doe>iííceuiteilts-/e,y. 13. n. 5-6 ti 976),p. 182.

¡ /0 Lii ERIJOARROYO.J .M. De la semiótica del texto a la semiólica docuniental. tEnMoreiro ([Ciii-, u le,, J .A - Ap/fr-ae.-jcie> ele 1cm cien(‘jets e/el ee’xec> cd renlí iii en e/c>ci ciii cii icíl. Madrid:Universidad CarlosII i/B.O.E.. 1993.p~v 199-216.

Page 3: Niveles de análisis documental de contenido

.Vivelescíe’ análisisciocimníental deeen/enielo 79

vel de análisis a quesometamosal texto (descripcióncaracterísticay des-crípción sustancial)y, por fin, representariasmedianteun lenguajedocu-mentalen el casode llevar a cabounadescripcióncaracterísticadel texto,o, en el segundocaso,mediantela redacciónde un nuevo texto conden-sando al original.

La importancia de la lectura en ambos casos, es indiscutible ya que pro-porcionala únicavía de accesoa la informacióncontenidaenel documento.

La anticipacióno conocimientospreviossobrela materia,el dominiode las formasbásicasde expresióndel pensamiento,la capacidadde reco-nocer el significado de determinadas palabras señales del texto y el controlde posiblesdefectosen la percepcióndebidosa hábitos,tales comolas re-gresioneso la subvocalización,son, entremuchosotros, factoresquebe-nefician el eficazdiálogo autor-lector,necesarioparala captaciónde lasestructurasu organizacióninternadel texto.

LA INDIZACION

La indizaciónhaceposiblela entradade documentosen el sistemado-cumental.desempeñaunafunción determinanteen el momentode la re-cuperación,y uno de susproductosresultantes,el indizado,constituyelabaseparala creaciónde los lenguajesdocumentales.

Se trata de la fase de identificación de losconceptosque de formaex-plícita o implícita estánpresentesen el contenidodel documento.Es unaoperación compleja, comprendida por varias fases:la norma 150.5963-1985>prescribelas siguientes:

— examendel documentoy determinaciónde sucontenido— identificacióny selecciónde losconceptosprincipalesdel contenido.— selecciónde los términosde indizaciónRowle< creenecesarioseguir los siguientespasospara determinar el

perfil del textofamiliarízacioncon el contenidodel documento.

— análisisy seleccióndelasmateriasrepresentativasdel temaprincipal.—— elecciónde términos representativosdel documentoque expresen

sin ambigúedadsucontenido.Chaumier<por suparte identifica las fasesde reconocimientoy extrac-

ción de los conceptosinformativos y traducciónde estosconceptosal len-guajedocumental.

1505963— 1 985.1) oe:ícnhenteitio rl. Al eehe)cies’ pommr leíncmlvveelese/ocu~íí enes, la dé>c<rm in a—

ejemele Icor ce>ntenuet la sélectie>nelestermescl ‘jnc/exe>tjc>n. Genéve:150, 1985.ROWLEY, J. Abs/racting uncí inelexíng. London: Ctive Bingíey, [988,p. St).(Si-JAU MIR, J.Análisis ji leí> gucíjesele,eumenta/es:El tra/uenieeite> lingtiís’/ice> ele la in.-

forníc>c’jón cle)eumentc>l.Barcelona:Mitre, 1986. p. 28.

Page 4: Niveles de análisis documental de contenido

80 Blan ce> Gil Ureliciaie,

La selección de términos de indización se hace en función dedos pará-metros:exhaustividady especificidad,tambiéndenominadosprofundidady precisión,respectivamente.La exhaustividadestárelacionadacon el nú-merode conceptosque se tienenen cuentay quecaracterizanel conteni-do de un documento.La especificidadestárelacionadaconla exactitudconqueun conceptoparticularqueapareceen un documentoestárepresenta-do por un término de indización..esdecir,mide la proporciónde términosextraídosde un documentoqueson realmenterelevantes.Los dospará-metrosestáninversamenterelacionados,de modo queel indizadorhabráde establecerel equilibrio entreambos;la balanzase inclinaráenfavor deuno u otro en función de las necesidadesde profundidado precisiónde-terminadaspor el usuario.Se puedenhallar los indicesde exhaustividadyespecificidadde la siguienteforma:

Exhaustividad N0 de documentosrecuperadosy relevantesN’ de documentosrelevantesde la colección

Especificidad N” de documentosrecuperadosy relevantesNc de documentosrecuperados

La mayoría de los especialistas dan por supuesta la necesidad de utili-zar en todo sistemaun lenguajedocumentalque garanticela extracciónde los conceptoscontenidosen el documento,ya seade formaexplícita oimplícita. Una páginamásarriba mencionamosla referenciade Chaumiera esterespecto.Van Slype& por su parte,definela indización humanaco-mo la «operaciónque consisteen enumerarlos conceptossobrelos quetrata un documentoy representarlospor medio de un lenguajecombi-nato rio».

Incluso Salton5,defensordel tratamientode la información en len-guaje libre, escribesobrela utilidad del lenguajedocumentalen el pro-cesode indización«Paraobtenerun alto nivel de exhaustividaden la in-dización, es probadala utilidad del lenguajede indización. que proveeuna variedadde enfoquespara cubrir un áreatemáticadada.Para ase-gurar la precisión. debeutilizarse un sumamenteespecíficolengtíajedeindización y los términosdebenllevar indicacionesadicionalesde conte-nido, talescomoponderacionesdel términoe indicadoresde relaciónconotros términos».

5LY PE. G. van. Leis lenguajesele jnclízcíe.’ic5íí:Ccnccspc:ión.(2OnStruCcie,liji utiliac<joii en

bis .sí,seeníus í.ioeííocencole.s. Madrid: Fundación Germán Sánchez Ruipérez, t99i , ji. 1 tS.SALiON, (1. Introcicíe.’eic,n le> ínoclern infornícítion. retriet’al. New York. etc.: Mc(i raw-

Hill Pubíisbing Conipaoy. 1983. p. 160.

Page 5: Niveles de análisis documental de contenido

Nivelescíe cíncilisis ele>cuníeneal ele cantejuelo 81

SISTEMAS DE INDIZACION

Existentresmétodostradicionalesdeindización:por unitérminos,pordescriptoresy por materias,quese basanen la lectura lineal del texto y enla representaciónformal del contenido.Estostressistemasrespondenalanálisis del texto a nivel de palabras,conceptoso temas,respectivamente.

La indización por temasfue la primeraen utilizarse; realizala norma-lización de los documentos en base a listas de encabezamientos de mate-ríasque permiten la caracterizacióna un nivel muy general.La recupera-ción por medio de estesistemase haceparticularmentecomplejacuandola informaciónsepresentaen soportesno tradicionales.

El procedimientodeunitérminosconsisteen la consideraciónde las pa-labras,no de las materiascomponentesdel texto. Estemétodo,ideadoporTaube, ofrece la posibilidad de profundizar en el análisis del texto, aunqueal excluir del mismo tan sólo los términos vacíos.generaun alto nivel deexhaustividad que provoca distorsiones en la comunicación. El sistema deunitérminospresentaotro inconvenientede caráctersintácticoen el mo-mentode la recuperación,ya queal utilizar términossimples.puedenpro-ducirsefalsascombinacionesentreellos, provocandola recuperacióndeinnumerablesdocumentosno pertinentes.

A este tipo de indizaciónsiguió el procedimientode caracterizaciónpormediode descriptores,quela normaISO definecomo«términousadoparare-presentarun conceptodado,conocidotambiéncomo«términopreferente><.

Mooersfue el primeroen referirseal descriptoren relación con la in-dizaciónde documentos,abandonandola descomposiciónmorfológicaes-tricta y la indizacióna nivel depalabra.Estesistema,al posibilitar la utili-zación de más de un término en la descripción,elimina la ambiguedadyalteracionesdesentido.Sebasaenlosconceptos,lo quedotade mayorfle-xibilidad a la tareade indizar y permitehacerfrente a cuestionesespecifi-casformuladaspor el usuario.

Con estosmétodostradicionales,tanto si se tratade indizaciónmanualcomo automática,el procedimientoserealizamediantela segmentacióndeltexto en términossignificativosdel contenido.Ni semánticani sintaxissonsuficientesparallevaracaboel análisisdel texto con exactitud,lo hacenporaproximación;bien escierto que eliminan ambiguedad,peroparaprofundi-zar en el contenidodel documentoseprecisatrabajara nivel de contexto.

Algunas líneasde investigación,representadasen Españapor GarcíaGutiérrez”’, proponenmétodosde análisis basadosen la significación, en

‘ORGANIZACION INTERNACIONAL DE NORMALIZACION: 150 5963-1985:Dc>e:,enceuítatje>n.Mé/hoelenpour 1 ‘analysee1e~’ ele>cuníene,s’,la eieeerín.í,ícítíeíncíeleur e:e>ntenuíceleí nélee:tjonele cerchesel ‘unelexatie>n. Cii enéve:150. 1985 p. 3.

GARCíA GUTIERREZ. A. Análisis documentaldeldjscursoperiodi?s’tie’o. Madrid:CTD. 1992.pp’

136-154.

Page 6: Niveles de análisis documental de contenido

82 Blanca Gil Urelicícun

los queel significanteesconsideradocomo simplemedio de accesoal sig-nificado. Se tratade métodosexperimentalesquesubrayanla importanciadel contextoen el análisis y que,aunqueson útiles para la interrogacióndel texto, aúnno han demostradosuvalidezparala representaciónformalde los resultadosdel análisis.

LA OPERACION DE RESUMIR

Esta tarea,quetiene analogíascon la indización, constituyeel segun-do nivel del análisisdocumentalde contenido.

En nuestroidioma seutiliza el término resumentanto paradenominara la operacióncomo al productoresultante,lo quepuedegenerarfalsasin-terpretaciones.Otros idiomas, como el inglés, tienenrecursosgramatica-les queobvian estadificultad. En España,algunosteóricosrecurrenal usodel verbo para referirsea la operacióny al sustantivocuandohacenalu-siónal productode la misma.Tambiénsehabladecondensacióny de des-cripción sustancialparahacermencióna la operaciónde resumir.

Por resumenseentiendela representacióncondensadadel contenidodc un documento,presentadopreferentementeen un único párrafodelon-gitud determinada,y no incluyendoelementoscríticospersonalesde quien

lo redacta.-Entre-los-fines-que-st-persiguen-con-la-ope-ra-ción-dccsumiú-sun-des~

tacableslossiguientes:Su objetivo primordial es el de permitir la rápida y precisaidentifica-

ción de los puntosesencialesdel texto original, de maneraqueel usuariopuedadecidir, sin pérdidade tiempo,si le interesao no su lecturacomple-[a. Sirve ademásel resumenparasuperarbarreraslingúisticas,ya que.co-¡‘no recomiendaUnesco.se redactaen la lengua utilizada en el servicio ocentrode documentacióndondeeselaboradoy se traducea uno delosidio-masde másgeneralizadadifusión, Grancantidadde resúmenesofrecendeestemodo la oportunidaddeconoceral menosla informaciónesencialpre-senteen los documentosprimarios.

Destacaremostambiénaquíel papelquedesempeñaesteproductodo-cumentalcomoauxiliar deindización.tantomanualcomo automática.Da-do que en su senofiguran los temasesencialesdescritosen el texto origi-nal, indizaren baseal resumensuponela garantíade darcon los términospertinentes bien sea extraídos de forma manual, como por los métodos lin-guistícosde losqué se ~irV&la indi~ación autoinática.

Ahora bien, el resumensólo cumplirá con los fines señaladosante-riormente si en el momento de su redacción se tienen presentes principioscomola entropía,pertinenciay relevancia,esdecir, si transmitimosla ma-yor información posibleutilizando el menor númeroposiblede signos,sitrasladamosconvenientementela informaciónquecontieneel documen-

Page 7: Niveles de análisis documental de contenido

Nivelende análisisclocumenteilele ce> títenjele> 83

to original y si expresamossin ambigiledadesel mensajedel documentoprimario.

CATEGORIZACION DEL RESUMEN

El resumenpuedeserllevado a cabopor un documentalistao analistao por el propio autordel documentooriginal. Uno y otro tipo deresumentienenventajase inconvenientes.La ventajadel resumenescritopor el au-tor resideen su perfectoconocimientode los temasabordados.Comoin-conveniente,se le puedeachacarel excesode subjetividadal caracterizarsupropiaobra.

La ventajade los resúmenesescritospor documentalistasresideen suexperienciaprácticay suconocimientode lasnecesidadesdel usuario.Pre-sentacomo inconvenientesu desconocimientoo conocimientoparcial demateriasespecializadas.

Aparte de estatipificación en función del sujetoejecutordel resumen,existeotra en basea la cargainformativa. La escuelade pensamientomásgeneralizadadistingue,segúnestecriterio, dostipos de resúmenes:infor-mativo e indicativo. Rowley’’ y Pinto),entreotros, identifican ademáselindicativo-informativo, queseriaaquel quese redactaen parteen un esti-lo informativo. tratando en estilo indicativo los aspectos menos relevantesdel texto.

El resumeninformativo presentala mayorcantidadposible de infor-macióncuantitativao cualitativaaportadapor el autordel documento.Es-tá indicado especialmente para la condensación del contenido de doen-mentoscientíficos y técnicos. El resumeninformativo debe indicar laestructuradel contenidosignificativo del documentoy presentaráinfor-mación relativaa losobjetivos, la metodologíaexperimentalpropuesta,losresultadosobtenidosy las conclusionesdel autor.

El resumenindicativo se imita a señalarel tema de estudio.Puedeserde gran utilidad en el tratamiento de material audiovisual y de documen-tación presentadaen soportesinformáticos,o en microformas,ya queper-mite la descripciónde esosdocumentos,cuyo tratamientono puedelimi-tarsea la cumplimentacióndel tradicional asientobibliográfico.

En cuantoa la extensióndel resumen,consideroquesulongitudno de-pendeni de las dimensionesdel documentoa analizarni del caráctermdi-cativo o informativo dcl resumen,sino que responderáa la exhaustividaddel análisis.

ROWI.EY. J. iypes ol abstracis. Epigr. 2.3. de A bstraeting cínel unclexing.London: Cli-ve Bingíey. 1988. Pp. 14-15.

‘2 PiNTO MOLINA. M. El resímenecícle>ccíenental.’Pr~ncipíony méte>eion. Madrid:Funda-ción Germán Sánchez Ruipérez. 1992. pp. 249-251,

Page 8: Niveles de análisis documental de contenido

84 Blanea Gil Urelicíaun

No voy a tratar aquí del estilo, metodología,normalizacióny otros as-pectosrelativosa la descripciónsustancialde documentos.dadala exten-sión que ello conllevaría;solamenteseñalaré,para terminar, la gran im-portanciaque tiene el cuidadodel estilo y contenidode los resumenesespecialmentecuandose incluyenen unabasede datos,en donde,en mu-choscasos,las palabrasque lo componenson utilizadaspararealizarbús-quedasen texto libre,pasandoaconvertirseen unaimportanteherramientade recuperación.

Apuntaré,por último, un hechoque seda demasiadoa menudoen laspruebasselectivaspara el ingresoen la Escalade Ayudantesde Archivosy Bibliotecas.La imprecisiónencuantoa la categorizacióndel resumendo-cumentalgeneraconflictos a las personasquepretendenpasardetermina-daspruebasde oposición,ya que en las basesde las convocatoriassepidela redacciónde un resumenanalítico,ademásde uno informativo y otro in-dicativo.Consultadaslas fuentes’’ quemeha sido posible.todascoincidenen identificar el resumen analítico con aquel, de carácter informativo, re-dactadopor el propio autor del texto original. Dado que son muchoslosCtflO5 en quese vienenconvocandoplazasparael mencionadocuerpo pa-ra las que se exigen estetipo de pruebas,me gustaríadesdeaquí urgir lanecesidadde normalizaciónen la denominaciónde los resúmenesdocu-mentalesparaevitar tanto la faltade rigor científico,como losmalosratosde los opositores que no saben qué hacer cuando se les pide llevar a caboun resumenque,por principio,no puedenredactar.

BIBLIOGRAFíA

CLEVELAND. D.B. & CLEVELAN[). AD. líctraduction fo indexingand abs-lrae’ting. 2th cd. Engiewood.Col.: Libraries Unlimited. 1990.pp. 163-167.

Nl ORE1RO.J .A. Aplícc>cíóííde leis cienciasdel teste> al resumendoc>> titen/cH. Nl a —

drid: UniversidadCarlo lli/B.O.E.. 1993, pp. 162-167.

N E ET. HE. A la reclíercheclii motcIé: Anaijise documentcíireet inclexationalpha-l)é/iqlle. Genéve:Les Editions lES. 1989. p. 95.

PINTO MOLINA. Nl. El resemínenelocuine,íie¡l.’ prin cipie)sy níéte>dos.Madrid: Fun—

daciónGermánSánchezRuipérez,1992.p. 253.

ROWLEY, J. Abstruceingand iuídexung.2th ed. London: Clive Bingley. 1990.pp. 14-18.

UN ESCO- Oit/a /)e>rel leí rede,ce:íeinele ur/ículas científicos eíestie>acle>su la publie:eí—

ción. Paris: Unesco-ProgramaGeneralde Informacióny UNISIST, 1983.

‘‘AFNOR (ASSOCiA’FiON FRANQAi5E DE NORMALISATION). Dc>e,c,íientaeion:rec’c>ni tite>n e/a>je)i>2< cm ccx ame iríe rs- cíeneír/ie’lesse-jenuf >e/ icenci tee-liníd llespe> ur leí it ele>eíje)nele<s ré—nímííí cn: NI” Z 44-004, Paris: 1984.