come le imprese possono usare i discorsi · 2018. 5. 20. · fare sentiment analysis è difficile...

Post on 24-Aug-2020

3 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Come le imprese

possono usare i discorsi

Perché distinguere dati fattuali e

opinioni

Fabrizio Sebastiani Gruppo Human Language Technologies – NeMIS Lab Istituto di Scienza e Tecnologie dell’Informazione Consiglio Nazionale delle

Ricerche 56124 Pisa

Cos’è la Corporate Reputation?

“Corporate reputation affects the way in which various stakeholders behave towards an organization, influencing, for example, employee retention, customer satisfaction and customer loyalty.”

Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468-

2370.2005.00109.x)

Cos’è la Corporate Reputation?

• Post and Griffin 1997 “reputation is a synthesis of the opinions, perception and

attitudes of an organization's stakeholders including employees, customers, suppliers and investors and community”

• Fombrun 1996 “a perceptual representation of a company's past actions

and future prospects that describe the firm's appeal to all of its key constituents”

• Fombrun et al. 2000 “corporate reputation represents a collective and

multidimensional construct which is an aggregated perception of many individuals”

Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468-

2370.2005.00109.x)

Cos’è la Corporate Reputation?

Cos’è la Corporate Reputation?

User Generated Content

Net-consumatori

Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.

Anche se il negozio fisico resta ancora un luogo importante, • il 62% degli utenti su scala mondiale commenta un prodotto o servizio

online dopo l’acquisto.

• se si aggiungono post e tweet il dato arriva al 69%

• il 55% degli utenti ibridi (coloro che si informano in rete ma poi effettuano l’acquisto in un punto vendita) postano commenti.

www.globalwebindex.com

Net-consumatori

Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.

Anche se il negozio fisico resta ancora un luogo importante,

dobbiamo prendere seriamente in considerazione il modello di impresa che emerge dall’adozione strategica

dei social media.

www.globalwebindex.com

Filtrare l’informazione automaticamente

Fatti Opinioni

Gli spinaci sono ricchi di ferro

Gli spinaci hanno un brutto sapore

Filtrare l’informazione automaticamente

Fatti Opinioni

Gli spinaci sono ricchi di ferro

• Oggettivi

• Ritraggono la realtà

• Possono essere verificati

• Presentati con obiettività

Gli spinaci hanno un brutto sapore

• Soggettive

• Interpretano la realtà

• NON possono essere verificate

• Presentate attraverso una valutazione

Filtrare l’informazione automaticamente

Fatti Opinioni

• Data Mining

• Information Retrieval

• Information Extraction

• Opinion Mining

• Sentiment Classification

• Feature-based Sentiment Analysis

Filtrare l’informazione automaticamente

Metodi Rule-Based

cercano di imitare il modo in cui l’uomo utilizza e

comprende il linguaggio, riproducendo le strutture sintattiche che sono alla

base di questo processo di comprensione, costruendo

risorse lessicali come i dizionari elettronici, le

tassonomie, le ontologie

Metodi Stocastici

trattano la lingua come un insieme di parole,

quantificando queste in modo matematico e cercando di estrarre

informazioni senza la necessità di individuare le

strutture sintattiche o, addirittura, cercando di

rendere capace la macchina stessa di

imparare la sintassi.

Filtrare l’informazione automaticamente

Quali Vantaggi?

• Ads placement

• Text summarization

• Recommendation systems

• Flame and cyberbullying detection

• Literary reputation tracking

• Political texts analysis

Cos’è l’Analisi dei Sentimenti

La Sentiment Analysis (SA) consiste nel trattamento automatico di opinioni e sentimenti espressi all’interno di testi non strutturati.

Sono sinonimi della SA opinion mining, subjectivity analysis, or appraisal extraction.

Alcune sfide nella ricerca sulla SA:

• Sentiment and Subjectivity Classification,

• Feature-based Sentiment Analysis,

• Sentiment Analysis of comparative sentences,

• Opinion search and retrieval,

• Opinion holders, Opinion features and opinion targets extraction.

15

Cos’è un’opinione?

oj, fjk, ooijkl, hi, tl

dove

oj è l’oggetto sul quale viene espressa l’opinione

fjk rappresenta le caratteristiche (features) dell’oggetto

ooijkl è l’orientamento (positivo o negativo) dell’opinione

hi è opinion holder, colui che esprime l’opinione

tl rappresenta il tempo in cui l’opinione viene espressa

16

Liu, B. (2010). Sentiment analysis and subjectivity. Handbook of natural language processing, 2, 568.

Cos’è un’opinione?

Cos’è un’opinione?

Cos’è un’opinione?

Cos’è un’opinione? oj

Cos’è un’opinione? oj, fjk

Cos’è un’opinione? oj, fjk, ooijkl

Cos’è un’opinione? oj, fjk, ooijkl, hi

Cos’è un’opinione? oj, fjk, ooijkl, hi, tl

Cos’è un’opinione? I dati non strutturati

Cos’è un’opinione? I dati non strutturati

Cos’è un’opinione? I dati non strutturati

Indicatori di Sentimento

• Parole dotate di

Orientamento Semantico

1. gentile +2 2. pulito +2 3. abbondante + 4. buono +2 5. esagerato + 6. spettacolare +3 7. lussuoso +2 8. bene +2

Cos’è un’opinione? Strutturare i dati

Indicatori di Sentimento

• Espressioni dotate

di Orientamento Semantico

Contextual Valence Shifters: 1. molto gentile 2. non spettacolare 3. non lussuoso 4. avere da ridire sul prezzo

Dipendenza dal dominio: 1. hotel molto caratteristico 2. Colazione abbondante 3. arredo con tutto

l’occorrente 4. prezzo esagerato

Cos’è un’opinione? Strutturare i dati

Sentiment Polarity Classification

Correzione. Polarity Switching: 4 stars → 2 stars

Ridimensionamento. Polarity Shifting : 4 stars → 3 stars

Sentiment Polarity Classification

Correzione. Polarity Switching: 4 stars → 2 stars

Ridimensionamento. Polarity Shifting : 4 stars → 3 stars

Alcuni task della Sentiment Analysis

Sentiment Polarity Classification

Sentiment Polarity Classification

Classificare interi documenti in base alle seguenti macro-classi • Positivo • Negativo • Neurale

Ciò che differenzia questo task dal comune Topic Detection and Classification è il fatto che le categorie in gioco non sono semanticamente slegate l’una rispetto all’altra. Tali categorie possono essere rappresentate come:

• Un’ opposizione binaria • Una rating scale • Un continuum

Feature-based Sentiment Analysis

Feature-based Sentiment Analysis

T=O(f)

F = {f1, f2, . . . , fn}

Wi = {wi1, wi2, . . . , wim} Ii = {ii1, ii2, . . . , iiq}

Sintetizzare il contenuto delle opinioni espresse nei testi individuando le singole caratteristiche che rappresentano i punti di forza e/o le debolezze discusse nell’opinione. La relazione intercorrente tra features e opinione viene perfettamente espressa grazie al concetto di Target (T) dell’opinione, descritto dalla seguente funzione:

Ogni feature può essere descritta da sottoinsiemi di altre features:

Il Target può essere descritto nei testi da indicatori diretti (W) o indiretti (I)

Feature-based Sentiment Analysis

Un esempio di testo annotato

Sentiment Role Labeling

Sentiment Role Labeling

Il task del Semantic Role Labeling (SRL) ha come finalità il mapping degli elementi sintattici localizzati nei testi liberi e le loro rappresentazioni semantiche. Esse verranno poi etichettate in base ad appropriati ruoli tematici o semantici. Il Sentiment Role Labeling focalizza l’analisi sui frame semantici relativi alla sfera della soggettività.

Frame Semantics Sentiment (SENT)

experiencer (e)

causer (c)

Opinion (OP)

opinion holder (h)

opinion target (t)

Physical Act (PHY)

patient (z)

agent (a)

Sentiment Role Labeling

“ ” Fillmore, C. J. (2006). Frame semantics. Cognitive linguistics: Basic readings,34, 373-400.

Sentiment Role Labeling

Frame Semantics Sentiment (SENT)

experiencer (e)

causer (c)

Opinion (OP)

opinion holder (h)

opinion target (t)

Physical Act (PHY)

patient (z)

agent (a)

Sentiment Role Labeling

Valutazione dell’analisi

Fare sentiment analysis è difficile perché, per esprimere le nostre opinioni ed emozioni, facciamo ricorso a una estrema varietà di sofisticati mezzi espressivi, tra cui la metafora, l’ironia, il sarcasmo, l’allusione, etc.

• Nell’analisi di significato dei testi tutto si può fare, ma solo con un

certo grado di accuratezza.

• Un software di sentiment analysis potrebbe I ▫ riconoscere la presenza di un’opinione inesistente (“falso positivo”); ▫ non riconoscere la presenza di un’opinione esistente (“falso negativo”); ▫ assegnare a un’opinione una polarità erronea; ▫ non riconoscere correttamente il soggetto e/o l’oggetto dell’opinione; I ...

Fabrizio Sebastiani Gruppo Human Language Technologies – NeMIS Lab Istituto di Scienza e Tecnologie dell’Informazione Consiglio Nazionale delle

Ricerche 56124 Pisa

top related