la sentiment analysis a livello personale: alcune evidenze empiriche dal mondo della musica (caso ma

21
LA PERSONAL SENTIMENT ANALYSIS: ALCUNE EVIDENZE EMPIRICHE DAL MONDO DELLA MUSICA Tesi di Laurea di: Carla Lucignano Relatore: Prof. Andrea Cioffi

Upload: carla-lucignano

Post on 01-Jul-2015

223 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

LA PERSONAL SENTIMENT ANALYSIS:

ALCUNE EVIDENZE EMPIRICHE DAL MONDO DELLA MUSICA

Tesi di Laurea di:Carla Lucignano

Relatore: Prof. Andrea Cioffi

Page 2: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

• Oggetto: quali caratteristiche deve avere affinchè quest’analisi risulti utile? Quali sono gli obiettivi che la personal sentiment analysis supporta?

• Come: Quale approccio all’analisi bisogna prediligere, quello manuale, automatico o una combinazione di entrambi?

• Dove: Quali luoghi virtuali bisogna mappare? Quali sono i driver che devono guidare la scelta dei luoghi da monitorare in base all’oggetto di analisi e agli obiettivi dell’analisi stessa?

• Quando: Quale deve essere la frequenza di analisi?

• Quanto: Quali sono i costi di quest’analisi?

In che modo è possibile attuare una personal sentiment analysis? Come cambia, nel caso in cui ciò avvenga, l’approccio alla sentiment analysis quando l’oggetto dell’ analisi non è un prodotto, ma una persona?

Personal Sentiment Analysis: domanda di ricerca

Page 3: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

La metodologia del progetto prevede le seguenti macro fasi

Metodologia: presentazione della metodologia di ricerca

Fase 1: analisi della letteratura mediante la metodologia Systematic Review

• Metodologia che prevede una mappatura e un'analisi approfondita della letteratura disponibile. Conduce all’estrazione di indicazioni chiare e condivisibili relative ad un preciso ambito di studi

• Vantaggi: rigore metodologico, maggiori possibilità di riproducibilità dei risultati raggiunti

• Obiettivo: ricercare trend emergenti dalla letteratura nazionale e internazionale disponibile sul tema oggetto della ricerca

Fase 2: ricerca qualitativa - delineare una metodologia di sentiment analysis per un brand personale.

• In questa fase sarà definito un quadro di riferimento teorico che guiderà l’implementazione della sentiment analysis su un brand associato non ad una azienda, ma ad un cantante, quindi ad una singola persona, per tale motivo si parlerà di “personal sentiment analysis”.

• L’obiettivo: misurare la reputazione sul web di Marco Mengoni e determinare se e in che modo la dimensione personale del cantante vada ad impattare sulla dimensione professionale e quindi sui risultati dell’analisi.

Page 4: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Misurare la reputazione con la

sentiment analysis: il caso Marco Mengoni

Page 5: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Fase1

Fase 2

Fase 3

Definizione del dominio del brandIndividuazione delle le fonti web nelle quali individuare i contenuti generati dagli utenti che parlano del brand e che possono essere utili a determinarne la reputazione.

Costruzione del modello del brandDefinizione e validazione dei concetti da localizzare all’interno delle opinioni degli utenti raccolte nel web.

Analisi linguistica delle opinioniClassificazione dei contenuti rilevanti rispetto agli elementi caratterizzanti il brand e valutazione del sentiment, attraverso un approccio automatico, manuale o integrato.

Il processo di analisi della reputazione sul web prevede tre fasi

principali:

Misurare la reputazione con la sentiment analysis: il caso Marco Mengoni

Page 6: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

.

 

L’analisi è stata condotta su quattro domini del web, scelti in base alla quantità e alla concentrazione dei discorsi presenti intorno al cantante.

Twitter La pagina Facebook ufficiale

Il canale ufficiale di Youtube

Blogosfera

Fase 1 - Definizione del dominio del brand: la mappa dei luoghi da analizzare

Page 7: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Fase 2 - Costruzione del Modello del Brand: aspetti che definiscono la reputazione

REPUTAZIONE DELL’ARTISTA

ASPETTI PROFESSIONALI

- Vocalità - Doti interpretative - Qualità complessiva album - Qualità di scrittura di testi e musica - Originalità di scrittura testi e musica - Performance Live - Carisma - Presenza scenica - Look

ASPETTI PERSONALI

- Il carattere (umiltà, semplicità, autenticità e spontaneità ) - La personalità - Il carisma - Lo stile di vita fuori dal palco

Page 8: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Fase 3 - Analisi linguistica delle opinioni: gli approcci utilizzati

Twitter

Approccio automatico:

Topsy

Approccio manuale analisi dei

tweet contenenti le parole chiave

Marco Mengoni, Pronto a

correre e i relativi

Hashtag

Blogosfera

Approccio manuale analisi dei

primi trenta risultati di ricerca su

Google con le parole chiave:

Marco Mengoni, Pronto a correre e Pronto a correre

recensione album

Facebook

Approccio manuale:

analisi dei post

pubblicati sulla bacheca della pagina ufficiale di

Marco Mengoni

Youtube

Approccio manuale: analisi dei

commenti ai video ufficiali

dei singoli estratti

dall’ultimo album

dell’artista e pubblicati su

canale ufficiale

dell’artista

Page 9: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Presentazione dei risultati: Twitter

Neutrali96,6%

Negativi0,4%

Positivi4%

Neutrali87.7%

Nega-tivi

0,4%

Positivi12%

Neutrali98,2%

Negativi0,2%

Positivi1,6%

Neutrali98,2 %

Negativi0,3%

Positivi1,5%

Sentiment analysis automatica Marco Mengoni + #marcomengoni

Tweet analizzati: 130.449

Sentiment analysis automatica Pronto a correre + #prontoacorrere

Tweet analizzati: 36.664

Sentiment analysis automatica #prontoacorrere

Sentiment analysis manuale

«#prontoacorrere"

Tweet analizzati: 1.267Tweet analizzati: 21.583

Page 10: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Presentazione dei risultati: Twitter – confronto tra analisi automatica e manuale

Neutrali96,6%

Negativi0,4%

Positivi4%

Neutrali87.7%

Nega-tivi

0,4%

Positivi12%

Neutrali98,2%

Negativi0,2%

Positivi1,6%

Neutrali98,2 %

Negativi0,3%

Positivi1,5%

Sentiment analysis automatica Marco Mengoni + #marcomengoni

Tweet analizzati: 130.449

Sentiment analysis automatica Pronto a correre + #prontoacorrere

Tweet analizzati: 36.664

Sentiment analysis automatica #prontoacorrere

Sentiment analysis manuale

«#prontoacorrere"

Tweet analizzati: 1.267Tweet analizzati: 21.583

Page 11: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Considerazioni:

Twitter è utilizzato dagli utenti principalmente per condividere informazioni e per promuovere i contenuti pubblicati su altri media, ma poco per esprimere opinioni rilevanti per la sentiment analysis.

I testi sono brevi (limite 140 caratteri, hashtag, link) e ciò semplifica la classificazione.

Presentazione dei risultati: Twitter

Page 12: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

 PAROLE CHIAVE  Positivo  Negativo  Neutrale  Tot

 Marco Mengoni

 12

 0

 18

 30

Marco Mengoni -Pronto a correre  20 1

 9

 30

Marco Mengoni -Pronto a correre recensione

  14

  6

  10

  30

 Totale

 46

 7

 37

 90

Neutrali41,10%

Negativi 7,80%

Positivi 51,10%

Sentiment analysis Blogosfera

Sfera privata

12%

Ambito di analisi

Sfera professionale88%

Presentazione dei risultati: Blogosfera

Page 13: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Considerazioni:

Nella Blogosfera il numero di testi contenenti un’opinione rilevante per l’analisi, rispetto a quelli neutrali, è più elevato.

Le principali difficoltà riscontrate nell’analisi della Blogosfera sono state quelle di aver dovuto analizzare testi più lunghi e articolati rispetto a tutti gli altri domini, all’interno dei quali, erano espresse diverse opinioni su più aspetti del cantante.

Presentazione dei risultati: Blogosfera

Page 14: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Tipologia dei post Numero % sul tot.

Post dei sostenitori più coinvolti 992 49,6%

Foto 315 15,8%

Video 287 14,3%

Link 77 3,8%

Spam 49 2,4%

Neutrali 245 12,2%

Opinioni positive 31 1,5%

Opinioni negative 4 0,2%

Totale 2.000 100,0%

Marco ti amo!

I più sentiti complimenti per le tue canzoni.

Sono una meglio dell’altra!

Presentazione dei risultati: Facebook

Page 15: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Presentazione dei risultati: Facebook

Considerazioni:

Facebook è il luogo dei fan e dei sostenitori più coinvolti.

In questo spazio è difficile trovare contenuti che esprimano opinioni obiettive che possano aiutare a determinare la reputazione del cantante.

E’ necessario distinguere i contenuti positivi che possono aiutare a determinare la reputazione dai contenuti positivi estremamente di parte.

Page 16: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Presentazione dei risultati: Youtube

Neutrali39%

Nega-tivi5%

Posi-tivi

56%

 Visualizzazioni Mi piace Non mi piace Commenti totali

Commenti analizzati

27.963.477  93.804  5112 19.093 2666

.Sentiment analysis commenti di Youtube

Page 17: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Presentazione dei risultati: Youtube

.Considerazioni:

Youtube è uno spazio frequentato dai fan dell’artista, ma rispetto agli altri due domini in questo luogo la percentuale di utenti, che non si definisce fan, ma che esprime un’opinione dopo aver visto il video, è più elevata.

Il limite di YouTube e dei suoi commenti è che è molto facile che si inneschino delle discussioni che poco hanno a che fare con il brand oggetto del video.

I fan in questo spazio assumono un ruolo attivo nella gestione della reputazione del cantante.

Page 18: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Conclusioni

.

Teoria Caso empirico

OGGETTO

Caratteristiche del brand:- notorietà (celebrità, personaggi pubblici)

Obiettivi supportati:- monitoraggio e gestione della reputazione

Non adatta ad un cantante:- percentuale dei contenuti presenti sul

web per determinare la reputazione molto bassa

- legame utente-brand personale molto forte

- bassa propensione degli utenti ad esprimere opinioni negative

COMEApproccio integrato Approccio prevalentemente manuale:

- mancanza di strumenti per la sentiment in alcuni domini (Facebook, Youtube)

- onerosità dei software presenti sul mercato

DOVE

I driver per la scelta dei luoghi:- target di utenti da monitorare- tema e argomenti discussi- presenza di influencer

I driver utilizzati:- target di utenti da monitorare- tema e argomenti discussi

QUANDOMonitoraggio di:- breve periodo (analisi pre\post evento)- lungo periodo (analisi costante)

Breve periodo: dopo l’uscita dell’ultimo album

QUANTOStruttura dei costi:- analisi manuale: flessibile- analisi automatica: rigida

Analisi automatica: tool gratuito (Topsy)Analisi manuale: costo legati al numero di ore lavoro necessarie per effettuare l’analisi

Page 19: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Conclusioni

.

Teoria Caso empirico

OGGETTO

Caratteristiche del brand:- notorietà (celebrità, personaggi pubblici)

Obiettivi supportati:- monitoraggio e gestione della reputazione

Non adatta ad un cantante:- percentuale dei contenuti presenti sul

web per determinare la reputazione molto bassa

- legame utente-brand personale molto forte

- bassa propensione degli utenti ad esprimere opinioni negative

COMEApproccio integrato Approccio prevalentemente manuale:

- mancanza di strumenti per la sentiment in alcuni domini (Facebook, Youtube)

- onerosità dei software presenti sul mercato

DOVE

I driver per la scelta dei luoghi:- target di utenti da monitorare- tema e argomenti discussi- presenza di influencer

I driver utilizzati:- target di utenti da monitorare- tema e argomenti discussi

QUANDOMonitoraggio di:- breve periodo (analisi pre\post evento)- lungo periodo (analisi costante)

Breve periodo: dopo l’uscita dell’ultimo album

QUANTOStruttura dei costi:- analisi manuale: flessibile- analisi automatica: rigida

Analisi automatica: tool gratuito (Topsy)Analisi manuale: costo legati al numero di ore lavoro necessarie per effettuare l’analisi

Page 20: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Conclusioni

Alla luce di quanto è emerso dunque …

La sentiment analysis non è lo strumento più adatto per determinare la reputazione di un brand personale,

come quello di un cantante, per la mancanza di contenuti adatti ad

ottenere un risultato che rispecchi le reali percezioni di un pubblico più

ampio rispetto a quello composto dai soli fan e sostenitori.

Page 21: La sentiment analysis a livello personale: Alcune evidenze empiriche dal mondo della musica (Caso Ma

Grazie per l’attenzione