la sentiment analysis a livello personale: alcune evidenze empiriche dal mondo della musica (caso ma
TRANSCRIPT
LA PERSONAL SENTIMENT ANALYSIS:
ALCUNE EVIDENZE EMPIRICHE DAL MONDO DELLA MUSICA
Tesi di Laurea di:Carla Lucignano
Relatore: Prof. Andrea Cioffi
• Oggetto: quali caratteristiche deve avere affinchè quest’analisi risulti utile? Quali sono gli obiettivi che la personal sentiment analysis supporta?
• Come: Quale approccio all’analisi bisogna prediligere, quello manuale, automatico o una combinazione di entrambi?
• Dove: Quali luoghi virtuali bisogna mappare? Quali sono i driver che devono guidare la scelta dei luoghi da monitorare in base all’oggetto di analisi e agli obiettivi dell’analisi stessa?
• Quando: Quale deve essere la frequenza di analisi?
• Quanto: Quali sono i costi di quest’analisi?
In che modo è possibile attuare una personal sentiment analysis? Come cambia, nel caso in cui ciò avvenga, l’approccio alla sentiment analysis quando l’oggetto dell’ analisi non è un prodotto, ma una persona?
Personal Sentiment Analysis: domanda di ricerca
La metodologia del progetto prevede le seguenti macro fasi
Metodologia: presentazione della metodologia di ricerca
Fase 1: analisi della letteratura mediante la metodologia Systematic Review
• Metodologia che prevede una mappatura e un'analisi approfondita della letteratura disponibile. Conduce all’estrazione di indicazioni chiare e condivisibili relative ad un preciso ambito di studi
• Vantaggi: rigore metodologico, maggiori possibilità di riproducibilità dei risultati raggiunti
• Obiettivo: ricercare trend emergenti dalla letteratura nazionale e internazionale disponibile sul tema oggetto della ricerca
Fase 2: ricerca qualitativa - delineare una metodologia di sentiment analysis per un brand personale.
• In questa fase sarà definito un quadro di riferimento teorico che guiderà l’implementazione della sentiment analysis su un brand associato non ad una azienda, ma ad un cantante, quindi ad una singola persona, per tale motivo si parlerà di “personal sentiment analysis”.
• L’obiettivo: misurare la reputazione sul web di Marco Mengoni e determinare se e in che modo la dimensione personale del cantante vada ad impattare sulla dimensione professionale e quindi sui risultati dell’analisi.
Misurare la reputazione con la
sentiment analysis: il caso Marco Mengoni
Fase1
Fase 2
Fase 3
Definizione del dominio del brandIndividuazione delle le fonti web nelle quali individuare i contenuti generati dagli utenti che parlano del brand e che possono essere utili a determinarne la reputazione.
Costruzione del modello del brandDefinizione e validazione dei concetti da localizzare all’interno delle opinioni degli utenti raccolte nel web.
Analisi linguistica delle opinioniClassificazione dei contenuti rilevanti rispetto agli elementi caratterizzanti il brand e valutazione del sentiment, attraverso un approccio automatico, manuale o integrato.
Il processo di analisi della reputazione sul web prevede tre fasi
principali:
Misurare la reputazione con la sentiment analysis: il caso Marco Mengoni
.
L’analisi è stata condotta su quattro domini del web, scelti in base alla quantità e alla concentrazione dei discorsi presenti intorno al cantante.
Twitter La pagina Facebook ufficiale
Il canale ufficiale di Youtube
Blogosfera
Fase 1 - Definizione del dominio del brand: la mappa dei luoghi da analizzare
Fase 2 - Costruzione del Modello del Brand: aspetti che definiscono la reputazione
REPUTAZIONE DELL’ARTISTA
ASPETTI PROFESSIONALI
- Vocalità - Doti interpretative - Qualità complessiva album - Qualità di scrittura di testi e musica - Originalità di scrittura testi e musica - Performance Live - Carisma - Presenza scenica - Look
ASPETTI PERSONALI
- Il carattere (umiltà, semplicità, autenticità e spontaneità ) - La personalità - Il carisma - Lo stile di vita fuori dal palco
Fase 3 - Analisi linguistica delle opinioni: gli approcci utilizzati
Approccio automatico:
Topsy
Approccio manuale analisi dei
tweet contenenti le parole chiave
Marco Mengoni, Pronto a
correre e i relativi
Hashtag
Blogosfera
Approccio manuale analisi dei
primi trenta risultati di ricerca su
Google con le parole chiave:
Marco Mengoni, Pronto a correre e Pronto a correre
recensione album
Approccio manuale:
analisi dei post
pubblicati sulla bacheca della pagina ufficiale di
Marco Mengoni
Youtube
Approccio manuale: analisi dei
commenti ai video ufficiali
dei singoli estratti
dall’ultimo album
dell’artista e pubblicati su
canale ufficiale
dell’artista
Presentazione dei risultati: Twitter
Neutrali96,6%
Negativi0,4%
Positivi4%
Neutrali87.7%
Nega-tivi
0,4%
Positivi12%
Neutrali98,2%
Negativi0,2%
Positivi1,6%
Neutrali98,2 %
Negativi0,3%
Positivi1,5%
Sentiment analysis automatica Marco Mengoni + #marcomengoni
Tweet analizzati: 130.449
Sentiment analysis automatica Pronto a correre + #prontoacorrere
Tweet analizzati: 36.664
Sentiment analysis automatica #prontoacorrere
Sentiment analysis manuale
«#prontoacorrere"
Tweet analizzati: 1.267Tweet analizzati: 21.583
Presentazione dei risultati: Twitter – confronto tra analisi automatica e manuale
Neutrali96,6%
Negativi0,4%
Positivi4%
Neutrali87.7%
Nega-tivi
0,4%
Positivi12%
Neutrali98,2%
Negativi0,2%
Positivi1,6%
Neutrali98,2 %
Negativi0,3%
Positivi1,5%
Sentiment analysis automatica Marco Mengoni + #marcomengoni
Tweet analizzati: 130.449
Sentiment analysis automatica Pronto a correre + #prontoacorrere
Tweet analizzati: 36.664
Sentiment analysis automatica #prontoacorrere
Sentiment analysis manuale
«#prontoacorrere"
Tweet analizzati: 1.267Tweet analizzati: 21.583
Considerazioni:
Twitter è utilizzato dagli utenti principalmente per condividere informazioni e per promuovere i contenuti pubblicati su altri media, ma poco per esprimere opinioni rilevanti per la sentiment analysis.
I testi sono brevi (limite 140 caratteri, hashtag, link) e ciò semplifica la classificazione.
Presentazione dei risultati: Twitter
PAROLE CHIAVE Positivo Negativo Neutrale Tot
Marco Mengoni
12
0
18
30
Marco Mengoni -Pronto a correre 20 1
9
30
Marco Mengoni -Pronto a correre recensione
14
6
10
30
Totale
46
7
37
90
Neutrali41,10%
Negativi 7,80%
Positivi 51,10%
Sentiment analysis Blogosfera
Sfera privata
12%
Ambito di analisi
Sfera professionale88%
Presentazione dei risultati: Blogosfera
Considerazioni:
Nella Blogosfera il numero di testi contenenti un’opinione rilevante per l’analisi, rispetto a quelli neutrali, è più elevato.
Le principali difficoltà riscontrate nell’analisi della Blogosfera sono state quelle di aver dovuto analizzare testi più lunghi e articolati rispetto a tutti gli altri domini, all’interno dei quali, erano espresse diverse opinioni su più aspetti del cantante.
Presentazione dei risultati: Blogosfera
Tipologia dei post Numero % sul tot.
Post dei sostenitori più coinvolti 992 49,6%
Foto 315 15,8%
Video 287 14,3%
Link 77 3,8%
Spam 49 2,4%
Neutrali 245 12,2%
Opinioni positive 31 1,5%
Opinioni negative 4 0,2%
Totale 2.000 100,0%
Marco ti amo!
I più sentiti complimenti per le tue canzoni.
Sono una meglio dell’altra!
Presentazione dei risultati: Facebook
Presentazione dei risultati: Facebook
Considerazioni:
Facebook è il luogo dei fan e dei sostenitori più coinvolti.
In questo spazio è difficile trovare contenuti che esprimano opinioni obiettive che possano aiutare a determinare la reputazione del cantante.
E’ necessario distinguere i contenuti positivi che possono aiutare a determinare la reputazione dai contenuti positivi estremamente di parte.
Presentazione dei risultati: Youtube
Neutrali39%
Nega-tivi5%
Posi-tivi
56%
Visualizzazioni Mi piace Non mi piace Commenti totali
Commenti analizzati
27.963.477 93.804 5112 19.093 2666
.Sentiment analysis commenti di Youtube
Presentazione dei risultati: Youtube
.Considerazioni:
Youtube è uno spazio frequentato dai fan dell’artista, ma rispetto agli altri due domini in questo luogo la percentuale di utenti, che non si definisce fan, ma che esprime un’opinione dopo aver visto il video, è più elevata.
Il limite di YouTube e dei suoi commenti è che è molto facile che si inneschino delle discussioni che poco hanno a che fare con il brand oggetto del video.
I fan in questo spazio assumono un ruolo attivo nella gestione della reputazione del cantante.
Conclusioni
.
Teoria Caso empirico
OGGETTO
Caratteristiche del brand:- notorietà (celebrità, personaggi pubblici)
Obiettivi supportati:- monitoraggio e gestione della reputazione
Non adatta ad un cantante:- percentuale dei contenuti presenti sul
web per determinare la reputazione molto bassa
- legame utente-brand personale molto forte
- bassa propensione degli utenti ad esprimere opinioni negative
COMEApproccio integrato Approccio prevalentemente manuale:
- mancanza di strumenti per la sentiment in alcuni domini (Facebook, Youtube)
- onerosità dei software presenti sul mercato
DOVE
I driver per la scelta dei luoghi:- target di utenti da monitorare- tema e argomenti discussi- presenza di influencer
I driver utilizzati:- target di utenti da monitorare- tema e argomenti discussi
QUANDOMonitoraggio di:- breve periodo (analisi pre\post evento)- lungo periodo (analisi costante)
Breve periodo: dopo l’uscita dell’ultimo album
QUANTOStruttura dei costi:- analisi manuale: flessibile- analisi automatica: rigida
Analisi automatica: tool gratuito (Topsy)Analisi manuale: costo legati al numero di ore lavoro necessarie per effettuare l’analisi
Conclusioni
.
Teoria Caso empirico
OGGETTO
Caratteristiche del brand:- notorietà (celebrità, personaggi pubblici)
Obiettivi supportati:- monitoraggio e gestione della reputazione
Non adatta ad un cantante:- percentuale dei contenuti presenti sul
web per determinare la reputazione molto bassa
- legame utente-brand personale molto forte
- bassa propensione degli utenti ad esprimere opinioni negative
COMEApproccio integrato Approccio prevalentemente manuale:
- mancanza di strumenti per la sentiment in alcuni domini (Facebook, Youtube)
- onerosità dei software presenti sul mercato
DOVE
I driver per la scelta dei luoghi:- target di utenti da monitorare- tema e argomenti discussi- presenza di influencer
I driver utilizzati:- target di utenti da monitorare- tema e argomenti discussi
QUANDOMonitoraggio di:- breve periodo (analisi pre\post evento)- lungo periodo (analisi costante)
Breve periodo: dopo l’uscita dell’ultimo album
QUANTOStruttura dei costi:- analisi manuale: flessibile- analisi automatica: rigida
Analisi automatica: tool gratuito (Topsy)Analisi manuale: costo legati al numero di ore lavoro necessarie per effettuare l’analisi
Conclusioni
Alla luce di quanto è emerso dunque …
La sentiment analysis non è lo strumento più adatto per determinare la reputazione di un brand personale,
come quello di un cantante, per la mancanza di contenuti adatti ad
ottenere un risultato che rispecchi le reali percezioni di un pubblico più
ampio rispetto a quello composto dai soli fan e sostenitori.
Grazie per l’attenzione