applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della...

25
Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide Ceriani Milano, 23 Luglio 2004 “Il potere del web sta nella sua universalità. Un aspetto essenziale è che tutti possano accedervi a prescindere dalle disabilità” Tim Berners-Lee

Upload: detta-fabris

Post on 02-May-2015

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Applicazione di tecniche e strumenti dicomunicazione multimodale e di valutazione

della leggibilità e complessità di contenuti web

Applicazione di tecniche e strumenti dicomunicazione multimodale e di valutazione

della leggibilità e complessità di contenuti web

Tesi di Laurea di Davide CerianiTesi di Laurea di Davide Ceriani

Milano, 23 Luglio 2004

“Il potere del web sta nella sua universalità. Un aspetto essenziale è che tutti possano accedervi a prescindere dalle disabilità”

Tim Berners-Lee

Page 2: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Indice di presentazioneIndice di presentazione

Introduzione al tema AccessibilitàIl progetto navigAbileProject Management di navigAbileIl Dizionario di navigAbile

Un sistema di analisi di leggibilità e comprensibilità di un testoConclusioni e Future Works

Page 3: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Accessibilità e usabilitàAccessibilità e usabilità

Usabilità. Un sito usabile soddisfa i bisogni informativi dell’utente in modo efficace ed efficiente, fornendogli facilità di accesso e navigabilitàAccessibilità. Un sito accessibile è un ambiente multimediale in cui il contenuto informativo, le procedure di navigazione e i servizi disponibili siano pienamente fruibili da qualsiasi tipo di utente indipendentemente:

dalle sue capacità, dalla sua abilitàdalla configurazione hardware e software disponibile

Il rapporto tra queste due caratteristiche in un sito web è di fondamentale importanza per la sua corretta fruizione

Page 4: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

AccessibilitàAccessibilità

Progettare pagine web accessibili significa:garantire a tutti gli utenti della rete la fruibilità delle informazioni e dei servizi disponibiliporre l’utente e le sue esigenze al centro dell’attenzione

Benefici non solo per i disabili, ma per chiunque utilizzi il web per lavoro o per reperire informazioniFondamentale per l’accessibilità è la separazione della forma dal contenuto: il significato di un documento deve essere salvato separatamente da come deve apparireCSSUn sito accessibile dovrebbe sfruttare i cosiddetti equivalenti multimodali

Page 5: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

NormativaNormativa

A livello internazionale, l’ente più rappresentativo preposto alla definizione delle linee guida per il tema dell’accessibilità dei documenti web è il WAI (Web Accessibility Initiative) proposto dal W3COttenere una certificazione riconosciuta spesso non basta: con i validatori si può verificare solamente un sottoinsieme dei requisiti di accessibilità (accessibilità sostanziale e non formale)Legge Stanca (Gennaio 2004): lo scopo della legge è quello di abbattere le "barriere virtuali" che limitano l’accesso dei disabili alla Società della InformazioneLimiti della normativa: carenza di norme per la tutela dei disabili cognitivi

Page 6: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Perchè un sito accessibilePerchè un sito accessibile

Valore etico e sociale del progettoPossibilità di raggiungere un bacino di utenza più vasto e di conseguenza la possibilità di aumentare la propria quota di mercatoL’attenzione alla tematica sociale dell’accessibilità può costituire un vantaggio competitivo in termini di immagineIl disaccoppiamento contenuti-presentazione può aprire la strada alla portabilità del sito (su browser speciali per disabili, WAP, UMTS, PocketPC, Digitale Terrestre…)

Page 7: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

La CAALa CAALa Comunicazione Aumentativa Alternativa è un insieme di metodi, strategie e ausili di comunicazione che servono per potenziare le capacità del soggetto di comunicareQuando una persona non può accedere ai normali mezzi espressivi (parola - scrittura), può ricorrere ad un codice alternativo per rendere trasmissibile il proprio pensieroI sistemi iconici, in sostituzione del sistema alfabetico, strutturalmente molto più complesso, per la loro facilità di comprensione del significato rappresentato, costituiscono una notevole facilitazione nell’ambito della CAAEsempi di linguaggi iconici: PCS, Bliss, PICSYM

Page 8: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Il progetto navigAbileIl progetto navigAbile

Un web che possa essere uno strumento di formazione e di crescita per tutti, e in particolare per i disabili in età evolutivaUn web a cui la persona disabile possa accedere in modo semplice e intuitivoUn web che si adatti al linguaggio e alle esigenze di accessibilità / navigabilità dell’utente e non viceversa

Progettare, sviluppare e validare scientificamente un’architettura abilitante per migliorare l’accessibilità del web prioritariamente ai disabili in età evolutiva, permettendo loro, attraverso l’utilizzo e l’esplorazione della Rete, di recuperare, valorizzare e potenziare le diverse abilità possedute.

LA VISION

LA MISSIONI disabili in Italia sono circa 3 milioni. Moltissimi di loro sono giovani e potenziali utenti di internet ma esclusi dal web. La vision del progetto navigAbile è quella di contribuire a realizzare un web diverso:

in partnership con:

Page 9: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Focus del progettoFocus del progetto

Oggi vi è una “cultura web” diffusa (soprattutto tra i giovani anche disabili) e gli ausili hanno raggiunto una ragionevole maturità. Sono invece bloccanti le barriere che riguardano il cuore del “sistema web”, ossia le caratteristiche di accessibilità di siti e portali. Da lì bisogna partire per creare un web più accessibile

Strumenti personali - ausili e strumentazione

HW e SW (e.g. tastiere e mouse

speciali)

Caratteristiche di accessibilità

sito/portale: sono le “rampe di

accesso elettroniche” per il

web

Formazione e

“cultura web”

Servizi futuri

Servizio

Servizio

Servizio

Focus del progetto navigAbile

Page 10: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

I servizi di navigAbileI servizi di navigAbile

Servizio I Requisiti dell’Evoluzione navigAbile

Servizi di Registrazione e Profilazione

Il servizio di registrazione e profilazione deve permettere di raccogliere anche informazioni rispetto alle esigenze di accessibilità dell’utente

Servizi di Personalizzazione e Navigazione:

I contenuti devono essere presentati nel modo più adatto all’utente fornendo on-line, dove possibile, il supporto necessario per la navigazione e la fruizione degli stessi da parte di tutti

Servizi di Gestione dei Contenuti:

I servizi redazionali devono mettere in condizione i “redattori” di fornire contenuti altamente accessibili e disponibili in versioni alternative

Servizio

Servizio

Servizio

Page 11: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Risultati del progettoRisultati del progetto

Servizi architetturali: navigAbile è innanzitutto un’architettura orientata ai servizi (SOA). Servizi di base:

Semplificazione struttura e contenuti: esistono 3 livelli di semplificazione dei contenuti: Basic, Easy, StandardDizionario multimodaleTabella di comunicazione

Sito dedicato di navigAbile (www.navigabile.it): è nato per tre esigenze diverse:

Sottoporre a test i servizi architetturali, realizzando un primo esempio di applicazione che li mostrasse in azioneApplicare i servizi navigAbile a un contesto semplice ma realistico di un sito di informazioneMettere a disposizione agli utenti coinvolti nella sperimentazione alcuni servizi web accessibili, quali la bacheca o le news

Page 12: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

L’architetturaL’architettura

Obiettivi dell’architettura SOA:

Non ghettizzazioneServizi condivisibiliNon invasivitàSemplicità d’usoProfilazione e personalizzazioneFlessibilità

Page 13: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Project ManagementProject Management

Si possono individuare tre componenti fondamentali che hanno caratterizzato il project management di navigAbile:

Interdisciplinarietà: competenze distribuite tra diversi attoriSpecificità del testing: valutazione dell’esperienza della coppia utente-tutorValidazione scientifica sulla base dei risultati del testing

Planning secondo la logica del “think big, start small, scale fast”

Page 14: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Il dizionario di navigAbileIl dizionario di navigAbile

FORMA_FLESSA: la tabella che contiene tutte le forme flesse dei lemmi della lingua italiana. Ad esempio per il lemma “andare” sono presenti le forme flesse: “vado”, “vai”, etc. Per ogni forma flessa è presente una tag grammaticale che permette di ottenere la forma flessa a partire dal lemma origineLEMMA: contiene tutti i lemmi della lingua italiana. I lemmi uguali hanno lo stesso attributo “LINK_LEMMA” che viene usato per la relazione con la tabella “FORMA_FLESSA”. L’attributo “VDB_INFO” codifica l’appartenenza o meno al Vocabolario di Base di De Mauro

FORMA_FLESSA

PK,FK1 ID

VOCABOLO CD_TAG_GRAMMATICALEFK1 LINK_LEMMA

LEMMA

PK ID

FK2 LEMMA_ORIGINEFK1 LINK_LEMMA CD_CATEGORIA_GRAMMATICALE CD_FORMA VDB_INFO ID_CATEGORIA ID_CATEGORIA_PADRE URL_PCS URL_BLISS URL_PICSYM URL_IMMAGINE_GENERICA URL_ANIMAZIONE URL_SUONO_PREREG PCS_VISIBLE

SINONIMI

PK ID

ID_LEMMA SINONIMO ID_GRUPPO

DESCRIZIONI

PK ID

LEMMA SILLABAZIONE ETIMOLOGIA CATEGORIA GRAMMATICALE ID1 ID2 DESCRIZIONE

Page 15: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Scenari di utilizzo del dizionarioScenari di utilizzo del dizionario

Navigazione visuale del dizionario:Per categoriePer ordine alfabetico

Supporto al calcolo degli indici di comprensibilità e leggibilità di un testoVisualizzazione dei dettagli di una voce del dizionario (con tabella DESCRIZIONI)Contiene le informazioni per l’analisi sintattica. Ogni lemma ha nei suoi attributi delle informazioni che specificano la sua categoria grammaticale.Servizio di suggerimento dei sinonimi (thesaurus) più comprensibili (con tabella SINONIMI)

Page 16: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Leggibilità e comprensibilitàLeggibilità e comprensibilità

Entrambe intuitivamente sono legate alla facilità con cui si riesce a catturare l’informazione presente in un testoLeggibilità

VisivaLinguistica

La leggibilità linguistica di un testo dipende dal modo in cui sono strutturate le sue frasi: periodi brevi che contengono parole brevi sono più leggibili di frasi lunghe, così come frasi lineari sono più leggibili di frasi involute, ricche di incisi e subordinateLa comprensibilità di un testo dipende dalle parole che contiene, ma anche dalla condivisione di un universo culturale: gli specialisti di un settore specifico si comprendono perché condividono un contesto comune

Page 17: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Analisi della comprensibilità:il Vocabolario di Base di De Mauro

Analisi della comprensibilità:il Vocabolario di Base di De Mauro

Il Vocabolario di Base della lingua italiana (VdB) di Tullio De Mauro, pubblicato nel 1997, è un elenco dei lemmi più comuni, elaborato prevalentemente secondo criteri statisticiI lemmi del VdB sono classificati in tre livelli:

Vocabolario fondamentale: circa 2000 lemmi: sono i più frequenti in assoluto della nostra linguaVocabolario di alto uso: i successivi 2.750 lemmi dell'insieme preso dal LIF (Lessico di frequenza della lingua italiana contemporanea)Vocabolario di alta disponibilità: 2.350 lemmi determinati in vario modo, soprattutto con dizionari dell'italiano comune

Page 18: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

L’indicatore di comprensibilità di navigAbile

L’indicatore di comprensibilità di navigAbile

L’indicatore di comprensibilità si basa sulla su statistiche di appartenenza delle varie parole del testo ai vari livelli del Vocabolario di Base di Tullio De Mauro e fornisce un’indicazione quantitativa sulla comprensibilità delle parole del testo, sulla base delle scelte lessicali dell’autore.

Nf: numero lemmi del VdB fondamentaleNu: numero lemmi del VdB ad alto usoNd: numero lemmi del VdB ad alta

disponibilitàN: numero totale di lemmi=1, =0.75, =0.5

100

N

NNNI dufCOMP

Page 19: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Analisi di leggibilità: GulpeaseAnalisi di leggibilità: Gulpease

Un indice di leggibilità è una formula matematica che, attraverso un calcolo statistico, è in grado di predire la reale difficoltà di un testo in base a una scala predefinita di valori, dipendente dal grado di istruzione del lettoreLa formula per il calcolo dell’Indice Gulpease è stata determinata verificando con una serie di test la reale comprensibilità di un corpus di testi I limiti di questo indicatore stanno nella sua parzialità: non tiene conto infatti della struttura sintattica della frase, che è un elemento fondamentale che determina la complessità della frase

P

F

P

LG N

N

N

NI 3001089

NL: numero di lettereNP: numero di paroleNF: numero di frasi

Page 20: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Un nuova metodologia per la valutazione della leggibilità con strumenti di analisi sintattica

Un nuova metodologia per la valutazione della leggibilità con strumenti di analisi sintattica

Parser chunk-IT: è uno shallow parser RobustezzaEsistono 10 tipi di chunk per l’italiano:

Chunk nominale: “la mia casa”Chunk preposizionale: “di mio figlio”Chunk verbale “rimangono”Altri tipi: aggettivo, avverbio, gerundio, infinito, participio, predicato, subordinato

Esempio di frase divisa in chunk:“A Milano, una speciale squadra ripulirà la città dai graffiti.”“A Milano”P_C “una speciale squadra”N_C “ripulirà”FV_C “la città”N_C “dai graffiti”P_C

Possibili impieghi del parser:Calcolo leggibilitàDisambiguazione lemmiKeyword extractionAnalisi delle concordanze

Page 21: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

L’indicatore di leggibilità propostoL’indicatore di leggibilità proposto

La metodologia introdotta per la valutazione della leggibilità mira ad arricchire il contenuto informativo dell’indice di Gulpease, attraverso l’impiego di informazioni derivanti dall’analisi sintatticaIntroduzione di un nuovo indicatore ottenuto come media (eventualmente pesata) di una serie di features:

Numero medio di parole per fraseNumero medio di lettere per fraseNumero medio di chunk per fraseDistribuzione delle tipologie di chunk

I pesi sono stati ricavati con criteri statistici sulla base di un corpus di testi semplificati, validati da un team di linguisti

TCGLEGG IcIbIaI

1

100

F

C

C

N

NI

C

T

iii

T N

NwkI

1

Numero medio di chunk per frase

Peso del chunk di tipo i-esimo

Numero di chunk del tipo i-esimo

Page 22: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Lo schema del sistema di analisiLo schema del sistema di analisi

L’insieme di questi due indicatori consente di avere una comparazione quantitativa tra diversi testi e quindi in particolare, nell’ambito del progetto navigAbile, permette di valutare l’efficacia del processo di semplificazione a vari livelli (Normal, Easy, Basic) del testo di una stessa notizia

Page 23: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Conclusioni sull’accessibilitàConclusioni sull’accessibilitàRiassumendo possiamo individuare due strategie principali per affrontare il problema dell’accessibilità dei portali web:

Impiego di versioni paralleleDesign for All: prevede l’impiego di una sola versione che deve tener conto dei bisogni e delle esigenze di tutti gli utenti a cui è rivolto il portale

navigAbile propone una soluzione che unisce i pregi dei due approcci, attraverso la profilazione e personalizzazione, che permettono una presentazione dei contenuti che si adatta alle abilità e alle esigenze dell’utenteCon la condivisione dei servizi si ha una riduzione dei costi legati all’accessibilità dei portali che utilizzano i servizi di navigabile

Page 24: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Nuovo metodo di valutazione di leggibilità e comprensibilitàValutazione comprensibilità: basata sulla su statistiche di appartenenza delle varie parole del testo ai vari livelli del VdBValutazione leggibilità: l’indicatore proposto mira ad arricchire il contenuto informativo dell’indice di Gulpease, attraverso l’impiego di informazioni derivanti dall’analisi sintattica, ottenute attraverso uno shallow parser

Comparazione quantitativa che permette di valutare l’efficacia del processo di semplificazione a vari livelli (Normal, Easy, Basic) del testo di una stessa notizia.Notevole valore aggiunto per navigAbile, che ha come obiettivo primario il raggiungimento della massima fruibilità dell’informazione da parte di tutte le tipologie di utenti

Conclusioni sull’analizzatore di comprensibilità e leggibilità

Conclusioni sull’analizzatore di comprensibilità e leggibilità

Analisi dei 2 indici

Page 25: Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide

Future worksFuture worksIpotesi di attribuzione dei pesi per il calcolo dell’indice di leggibilità complessivo, e relativa validazione, eventualmente effettuata con diverse categorie di utentiIpotesi alternativa di attribuzione dei pesi dell’indicatore di leggibilità, basata sulle probabilità condizionate di concatenamento di chunk consecutiviComponente architetturale per l’estrazione delle keywordsSfruttamento del parser per l’analisi delle concordanzeComponenti architetturali per la gestione del BlissWord Predictor da integrare nel compositore frasi