un thesaurus per organizzare la conoscenza ambientale fulvio mazzocchi, paolo plini prima giornata...
TRANSCRIPT
Un thesaurus per organizzare la conoscenza ambientale
Fulvio MAZZOCCHI, Paolo PLINI
Prima Giornata dell’Italiano Istituzionale
Commissione Europea (Bruxelles) - Mercoledì 23 novembre 2005
Definizione funzionale e strutturale di thesaurus
In termini di funzione è uno strumento di controllo terminologico usato per tradurre il linguaggio naturale di documenti, indicizzatori e utenti in un “linguaggio di sistema” più ristretto (linguaggio documentario) [ISO 2788/1974]
In termini di struttura è un vocabolario controllato e dinamico di termini correlati gerarchicamente e semanticamente che copre uno specifico campo di conoscenza [ISO 2788/1974]
Environmental Knowledge Organisation Laboratory
E’ un dominio esteso ed eterogeneo.
Presenta problemi di delimitazione (una delle schematizzazioni più utilizzate è il modello Stato-Pressioni-Risposte, che include anche gli aspetti sociali e politici, le attività produttive, ecc.).
Carattere dinamico
Nuove problematiche emergono con una certa continuità. Vi è una forte spinta verso lo sviluppo delle conoscenze e soprattutto verso l’innovazione tecnologica.
Multidisciplinarità
La scienza ambientale costituisce un settore complesso e multidisciplinare che interagisce con molti altri settori (p.e., scienze sociali).
Il linguaggio speciale dell’ambiente è in costante evoluzione, mantiene un forte contatto con la lingua comune, è formato da termini che possono essere definiti sulla base di diverse prospettive disciplinari.
Il dominio “ambiente”
Environmental Knowledge Organisation Laboratory
La realizzazione di un thesaurus che contribuisca a razionalizzare la gestione dell’informazione ambientale.
Obiettivi del progetto EARTh
proporre uno strumento in grado di garantire, allo stesso tempo, un controllo rigoroso dell’organizzazione concettuale e un’ampia applicabilità verso diversi ambiti operativi;
proporre una mappa semantica e terminologica ben organizzata e aggiornata del dominio ambientale
il thesaurus dovrà essere sviluppato tenendo in considerazione la dimensione culturale dell’organizzazione della conoscenza (una versione multilingue, per meglio riflettere le diverse identità culturali e linguistiche, potrà essere composta da strutture, sviluppate nelle singole lingue, tra loro non totalmente coincidenti o simmetriche).
Environmental Knowledge Organisation Laboratory
EARTh Environmental Applications Reference Thesaurus
Struttura sistematica
Relazioni semantiche
Versioni applicative
Contenuto terminologico
Environmental Knowledge Organisation Laboratory
Struttura sistematica di EARTh: il sistema di categorie
La struttura sistematica di EARTh è basata su un sistema di categorie logiche.
Le categorie rappresentano il livello più alto della struttura sistematica.
Costituiscono i termini più generali a cui sono riconducibili tutti gli altri termini presenti nel thesaurus.
Il sistema di categorie di EARTh
Entità Entità materiali Entità immateriali
Attributi Struttura e morfologia Composizione Proprietà
Aspetti dinamici Processi Condizioni Attività
Dimensioni Spazio Tempo
Environmental Knowledge Organisation Laboratory
Modelli categoriali Entità Principi
Oggetti immateriali Oggetti materiali
Proprietà Quantità QualitàRelazioni
AttivitàOperazioniStati Processi
Dimensioni TempoPosizioneSpazio
Lettura delle categorie di Aristotele in base a 4 categorie fondamentali (Ur-categories) secondo Dahlberg
Personalità MateriaEnergia Spazio Tempo
Categorie (PMEST) di Ranganathan
Entità/OggettoTipo Parte Proprietà Materiale Processo Operazione Paziente Prodotto Sottoprodotto Agente Spazio Tempo
Categorie del Classification Research Group
Environmental Knowledge Organisation Laboratory
Struttura sistematica di EARTh: l’albero
La struttura sistematica del thesaurus comprende diversi livelli classificatori e gerarchici.
Dal punto vista topologico, è un albero (tendenzialmente monogerarchico).
Entità Entità materiali Entità non viventi Entità naturali Costituenti fisici e chimici Sostanze chimiche Sostanze organiche Sostanze org. aromatiche Benzene
Dalla struttura ad albero di EARTh
Environmental Knowledge Organisation Laboratory
Caratteristiche della struttura relazionale dei thesauri
I thesauri prevedono tre tipi di relazioni paradigmatiche.
Ogni relazione aggrega una famiglia di sottotipi che nei thesauri tradizionali non vengono, però, differenziati.
Esistono almeno tre tipi di relazione GERARCHICA (relazione generica, relazione partitiva e relazione esemplificativa).
La relazione di EQUIVALENZA include sinonimi, quasi-sinonimi e varianti lessicali.
Un insieme molto eterogeneo di relazioni viene etichettato come relazione ASSOCIATIVA: “it exists when a thematic connection can be established between concepts by virtue of experience” (ISO 704).
Telerilevamento Gestione della qualità dell’aria Eutrofizzazione
RT Cartografia RT Qualità dell’aria RT Reflui
(EnVoc, 1997) (EnVoc, 1997) (EnVoc, 1997)
Environmental Knowledge Organisation Laboratory
Implementazione della struttura relazionale nei thesauri esistenti
In molti thesauri esistenti l’implementazione delle relazioni semantiche avviene in modo improprio.
Probabilmente, la relazione più “abusata” è quella gerarchica- generica: molte relazioni classificate come BT/NT sono, infatti, relazioni associative.
Riciclaggio Monitoraggio
NT Percentuale di riciclaggio NT Tecniche di monitoraggio
(GEMET, 1999) (GEMET, 1999)
Environmental Knowledge Organisation Laboratory
Progetto di rafforzamento della struttura relazionale di EARTh
In EARTh è previsto lo sviluppo di una struttura relazionale più articolata rispetto a quella tradizionale.
L’ipotesi è quella di differenziare in sottotipi le relazioni in base al loro contenuto semantico.
Obiettivi:
migliorare la funzione di controllo semantico del sistema
offrire nuove opportunità ai fini del ricupero dell’informazione
migliorare le possibilità di utilizzo del thesaurus mediante tecniche di elaborazione automatica
Il thesaurus sarà, comunque, leggibile anche secondo lo schema di relazioni tradizionale.
Environmental Knowledge Organisation Laboratory
Relazione gerarchica
In EARTh, le relazioni generiche, partitive ed esemplificativa saranno tra loro differenziate.
Per ciascuna di esse cercheremo, inoltre, di identificare dei sottotipi.
Environmental Knowledge Organisation Laboratory
Relazione di equivalenza Sinonimi e varianti lessicali saranno tra loro differenziati e verranno, inoltre, indicati per entrambi i sottotipi. La categoria dei quasi-sinonimi probabilmente non verrà, invece, introdotta nel sistema.
Environmental Knowledge Organisation Laboratory
Relazione associativa
Ciò contribuirà a rafforzare la reticolarità del sistema e alla rappresentazione di quelle connessioni concettuali che non possono essere considerate dall’albero tassonomico-gerarchico.
Il progetto prevede la valorizzazione ed una più articolata definizione della relazione associativa (suddivisione in sottotipi e esplicitazione del loro contenuto semantico).
Environmental Knowledge Organisation Laboratory
Ciò è importante per la rappresentazione del dominio ambientale.
Il potenziamento della struttura di nessi traversali è importante anche per rendere il thesaurus più utilizzabile ai fini della gestione e della ricerca dell’informazione ambientale su internet (ne viene in parte incorporata l’ottica di rete).
Il modello prevede la possibilità di sviluppare versioni applicative del sistema.La terminologia verrà organizzata in base a criteri classificatori locali ed idonei al contesto operativo.
Possono essere sviluppate, p.e., versioni del thesaurus organizzate tematicamente. I gruppi tematici riaggregano termini connessi, ad un determinato settore (la struttura ad albero tende invece a sparpagliare i termini collocandoli sotto la categoria logica di riferimento).
In tal modo, potranno anche essere attualizzate, ove necessario dal punto di vista operativo, quelle componenti di significato non considerate dalla struttura ad albero.
Versioni applicative di EARTh GRUPPO SUOLO Acidificazione del suolo Acqua nel suolo Acquifero AdsorbimentoChernozemErosioneGestione del suolo Inquinamento del suolo Pedologia Suolo superficiale Umidità del suolo
CLASSIFICAZIONI TEMATICHE DI BENZENE HEA: sostanza tossicaPOL: sostanza inquinante SAF: sostanza pericolosa
Environmental Knowledge Organisation Laboratory
Una struttura generale di raccordo, lo strumento principale di controllo semantico, costruita sulla base di categorie logiche (l’albero di EARTh)
La possibilità di derivare da questa struttura, diverse versioni applicative, più agili e organizzate in base a criteri classificatori definiti localmente, ma comunque compatibili e raccordate con la struttura generale
Un modello per la gestione dei problemi di interoperabilità
Environmental Knowledge Organisation Laboratory
Fonti di terminologia
EARTh rappresenta la continuazione dell’esperienza del GEMET - General European Multilingual Environmental Thesaurus (1997) sviluppato da CNR-EKOLab e UBA-Umweltbundesamt per l’Agenzia Europea per l’Ambiente.
GEMET è la fonte più importante per lo sviluppo di EARTh (circa 4000 termini selezionati).
Altre fonti:
fonti di terminologia generale dell’ambiente – Environment and Development (UN, 1992)
fonti di terminologia settoriale – Thesaurus Italiano di Scienze della Terra (APAT, 2000)
– Terminology of Inland Waters (progetto EDEN/IW, 2001)
– Thesaurus for Emergencies and Disasters (UBA-Austria, 1998/2003)
– Terminologia di GIS e Telerilevamento (CNR, 2004)
– Documenti riguardanti la terminologia della complessità e gli aspetti bioculturali.
Environmental Knowledge Organisation Laboratory
EARTh: contenuto terminologico
Attualmente, EARTh contiene circa 7000 termini.
~ 1500 termini riguardano le pressioni ambientali (p.e., attività industriali ed agricole).
~ 2500 termini descrivono lo stato dell’ambiente (p.e., processi e componenti naturali).
~ 1000 termini si riferiscono all’impatto ambientale (p.e., rifiuti, inquinamento, perdita di biodiversità).
~ 2000 termini riguardano le risposte della società (p.e. misure giuridiche ed economiche, educazione ambientale, ricerca).
Environmental Knowledge Organisation Laboratory