extraction d'opinions appliquée à des critèresurtado/slides/duthil_14_06_2012.pdf ·...

31
Introduction L’approche Exp´ erimentations Conclusion et perspectives Application Extraction d’opinions appliqu´ ee ` a des crit` eres Benjamin Duthil ´ Ecole des Mines d’Al` es - Centre de recherches LGI2P - KID Directeurs de th` ese: Jacky Montmain (LGI2P), Pascal Poncelet (LIRMM) Encadrants: Fran¸cois Trousset, G´ erard Dray 14 juin 2012 1/31 Benjamin Duthil Extraction d’opinions appliqu´ ee ` a des crit` eres

Upload: others

Post on 04-Nov-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Extraction d’opinions appliquee a des criteres

Benjamin Duthil

Ecole des Mines d’Ales - Centre de recherches LGI2P - KIDDirecteurs de these: Jacky Montmain (LGI2P), Pascal Poncelet (LIRMM)

Encadrants: Francois Trousset, Gerard Dray

14 juin 2012

1/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 2: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

2/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 3: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

ObjectifsExemple

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

3/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 4: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

ObjectifsExemple

Objectifs

Objectifs

Extraire l’opinion relative a des criteres.

Classification de textes.

4/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 5: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

ObjectifsExemple

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

5/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 6: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

ObjectifsExemple

Exemple

Exemple : critique cinematographique

6/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 7: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

ObjectifsExemple

Constat

Le score agrege masque la divergence sur les criteres mise enscene et scenario et restitue donc mal la richesse semantique dutexte.

Ce constat n’est pas specifique a l’analyse de critiquescinematographiques :

politique (Thomas et al., 2006).

e-commerce (Castro-Schez et al., 2011).

les systemes de recommandations (Garcia et al., 2011).

7/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 8: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

8/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 9: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Presentation

Processus global

9/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 10: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Problematiques

Problematiques

1 Extraction de criteres (Synopsis : Duthil et al. 2011,DEXA’11).

2 Apprentissage automatique d’un vocabulaire d’opinion(adjectifs, expressions (adverbe + adjectif)) relatif a undomaine.

3 Classification de textes.

10/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 11: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

11/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 12: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Apprentissage

Apprentissage des termes proches (semantiquement) de motsgermes.

Textes web contenant de l’opinion positive : ”good”, ”nice”,

”excellent”, ”positive”, ”fortunate”, ”correct”, ”superior”.

Textes web contenant de l’opinion negative : ”bad”, ”nasty”,

”poor”, ”negative”, ”unfortunate”, ”wrong”, ”inferior”.

Constitution automatique d’un corpus d’apprentissage contenantles mots germes.

12/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 13: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

13/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 14: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Apprentissage

Apprentissage

Utilisation d’une fenetre pour assurer la coherence semantique avec les motsgermes.

Plus un descripteur est correle a un mot germe plus il est vraisemblable qu’il soitde meme polarite que le germe.

Plus un descripteur est ”eloigne” (hors fenetres) moins il est pertinent.

14/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 15: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Apprentissage

Exemple de fenetre

Figure: Exemple de fenetre de taille 2

La Figure 3 illustre un exemple de fenetre de taille 2, i.e. il y a 2 adjectifs a

gauche (positive, correct) et 2 adjectifs a droite (great, nice) du germe good.

15/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 16: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Necessite de considerer quatre ensembles :1 Les mots fortement correles aux germes positifs : classe (X (M)positif ) des

positifs.

2 Les mots fortement correles aux germes negatifs : classe (X (M)negatifs) desnegatifs.

3 Les mots eloignes des germes positifs : anti-classe (X (M)positif ) des positifs.

4 Les mots mots eloignes des germes negatifs : anti-classe (X (M)negatif ) des

negatifs.

Figure: Carre semiotique de Piaget

16/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 17: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Apprentissage

Frequences des mots pour chacune des quatre classes :

Pour les classes :

X (M) =∑g∈P

∑t∈Sg

∑γ∈O(g ,t)

O(M,F (γ, sz , t)) (1)

Pour les anti-classes :

X (M) =∑g∈P

∑t∈Sg

∑γ∈O(g ,t)

O(M,F ′(γ, sz , t)) (2)

17/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 18: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Exemple de Frequences

Exemple de frequences :

Positif Negatif

M X (M) X (M) M X (M) X (M)

good 1467 53 wrong 509 20very nice 832 61 incorrect 190 35dramatic 0 157 not important 12 87

18/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 19: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Discrimination

Discrimination :

A partir des frequences X (M) et X (M) nous pouvons determinerl’appartenance d’un descripteur a sa classe et son anti-classe encalculant son score tel que :

Sc(M) =(X − X )3

(X + X )2(3)

Nous ne conservons seulement les mots qui ont Sc(M) > 0.

19/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 20: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Exemple de Frequences

Exemple apres discrimination :

Nous deduisons la polarite des descripteurs : si Sc(M) < 0 alors Mest negatif et si Sc(M) > 0 alors M est positif.

Mot Sc(M)good 1223

very nice 574

wrong -417

incorrect -73

Le signe symbolisant la polarite du descripteur.

20/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 21: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

1 IntroductionObjectifsExemple

2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

3 Experimentations

4 Conclusion et perspectives

5 Application

21/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 22: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion

Extraction d’opinion

Utilisation d’une fenetre glissante de taille sz successivementcentree sur chaque occurrence d’un adjectif dans le texte t.Pour chaque fenetre f , Score(f ) =

∑M∈f Sc(M).

La polarite de t est determinee par le signe de∑f ∈t Score(f ). Si

∑f ∈t Score(f ) < 0, t est negatif, si∑

f ∈t Score(f ) > 0, t est positif.

22/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 23: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Experimentations

Utilisation du corpus propose par Pang et al. 2002, EMNLP.

Comparaison a SenticNet (Cambria et al. 2010, ArtificialIntelligence) qui propose une collection de concepts polarises.

23/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 24: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Experimentations

Nous proposons ici d’evaluer l’approche dans un contexte declassification de textes sans criteres.

Notre approche SenticNetpositif negatif positif negatif

FScore 0,73 0,69 0,68 0,68precision 0,68 0,75 0,54 0,74rappel 0,79 0,63 0,91 0,25

Table: Resultats sur le corpus de Pang et al. en classification de textes

.

Les resultats sont similaires entre les deux approches pour de laclassification sans critere.

24/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 25: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Experimentations

Critere ActeurNotre approche SenticNetpositif negatif positif negatif

FScore 0,92 0,92 0,70 0,70precision 0,90 0,95 0,60 0,74rappel 0,95 0,90 0,87 0,38

Table: Resultats en classification de textes sur les criteres ”acteur”

.

25/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 26: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Experimentations

Critere ScenarioNotre approche SenticNetpositif negatif positif negatif

FScore 0,83 0,80 0,69 0,69precision 0,76 0,90 0,55 0,74rappel 0,92 0,71 0,91 0,26

Table: Resultats en classification de textes sur les criteres ”scenario”

.

26/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 27: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Conclusion

Conclusion

Le vocabulaire appris est pertinent.

Les experimentations montrent que le critere ”acteur” estdominant dans la majorite des cas sur le corpus considere.

27/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 28: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Conclusion

Conclusion

L’affaire DSK !

28/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 29: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Resume

Conclusion

29/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 30: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Perspectives

Perspectives

Annotation conceptuelle automatique de document.

note floue : Point de vue + Intensite dans le document

Apprentissage automatique individuel de systeme depreferences.

Detection de rumeurs.

30/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres

Page 31: Extraction d'opinions appliquée à des critèresurtado/Slides/Duthil_14_06_2012.pdf · Introduction L’approche Exp erimentations Conclusion et perspectives Application 1 Introduction

IntroductionL’approche

ExperimentationsConclusion et perspectives

Application

Questions

Merci de votre attention.

31/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres