extraction d'opinions appliquée à des critèresurtado/slides/duthil_14_06_2012.pdf ·...
TRANSCRIPT
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Extraction d’opinions appliquee a des criteres
Benjamin Duthil
Ecole des Mines d’Ales - Centre de recherches LGI2P - KIDDirecteurs de these: Jacky Montmain (LGI2P), Pascal Poncelet (LIRMM)
Encadrants: Francois Trousset, Gerard Dray
14 juin 2012
1/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
2/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
ObjectifsExemple
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
3/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
ObjectifsExemple
Objectifs
Objectifs
Extraire l’opinion relative a des criteres.
Classification de textes.
4/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
ObjectifsExemple
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
5/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
ObjectifsExemple
Exemple
Exemple : critique cinematographique
6/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
ObjectifsExemple
Constat
Le score agrege masque la divergence sur les criteres mise enscene et scenario et restitue donc mal la richesse semantique dutexte.
Ce constat n’est pas specifique a l’analyse de critiquescinematographiques :
politique (Thomas et al., 2006).
e-commerce (Castro-Schez et al., 2011).
les systemes de recommandations (Garcia et al., 2011).
7/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
8/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Presentation
Processus global
9/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Problematiques
Problematiques
1 Extraction de criteres (Synopsis : Duthil et al. 2011,DEXA’11).
2 Apprentissage automatique d’un vocabulaire d’opinion(adjectifs, expressions (adverbe + adjectif)) relatif a undomaine.
3 Classification de textes.
10/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
11/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Apprentissage
Apprentissage des termes proches (semantiquement) de motsgermes.
Textes web contenant de l’opinion positive : ”good”, ”nice”,
”excellent”, ”positive”, ”fortunate”, ”correct”, ”superior”.
Textes web contenant de l’opinion negative : ”bad”, ”nasty”,
”poor”, ”negative”, ”unfortunate”, ”wrong”, ”inferior”.
Constitution automatique d’un corpus d’apprentissage contenantles mots germes.
12/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
13/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Apprentissage
Apprentissage
Utilisation d’une fenetre pour assurer la coherence semantique avec les motsgermes.
Plus un descripteur est correle a un mot germe plus il est vraisemblable qu’il soitde meme polarite que le germe.
Plus un descripteur est ”eloigne” (hors fenetres) moins il est pertinent.
14/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Apprentissage
Exemple de fenetre
Figure: Exemple de fenetre de taille 2
La Figure 3 illustre un exemple de fenetre de taille 2, i.e. il y a 2 adjectifs a
gauche (positive, correct) et 2 adjectifs a droite (great, nice) du germe good.
15/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Necessite de considerer quatre ensembles :1 Les mots fortement correles aux germes positifs : classe (X (M)positif ) des
positifs.
2 Les mots fortement correles aux germes negatifs : classe (X (M)negatifs) desnegatifs.
3 Les mots eloignes des germes positifs : anti-classe (X (M)positif ) des positifs.
4 Les mots mots eloignes des germes negatifs : anti-classe (X (M)negatif ) des
negatifs.
Figure: Carre semiotique de Piaget
16/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Apprentissage
Frequences des mots pour chacune des quatre classes :
Pour les classes :
X (M) =∑g∈P
∑t∈Sg
∑γ∈O(g ,t)
O(M,F (γ, sz , t)) (1)
Pour les anti-classes :
X (M) =∑g∈P
∑t∈Sg
∑γ∈O(g ,t)
O(M,F ′(γ, sz , t)) (2)
17/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Exemple de Frequences
Exemple de frequences :
Positif Negatif
M X (M) X (M) M X (M) X (M)
good 1467 53 wrong 509 20very nice 832 61 incorrect 190 35dramatic 0 157 not important 12 87
18/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Discrimination
Discrimination :
A partir des frequences X (M) et X (M) nous pouvons determinerl’appartenance d’un descripteur a sa classe et son anti-classe encalculant son score tel que :
Sc(M) =(X − X )3
(X + X )2(3)
Nous ne conservons seulement les mots qui ont Sc(M) > 0.
19/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Exemple de Frequences
Exemple apres discrimination :
Nous deduisons la polarite des descripteurs : si Sc(M) < 0 alors Mest negatif et si Sc(M) > 0 alors M est positif.
Mot Sc(M)good 1223
very nice 574
wrong -417
incorrect -73
Le signe symbolisant la polarite du descripteur.
20/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
1 IntroductionObjectifsExemple
2 L’approchePresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
3 Experimentations
4 Conclusion et perspectives
5 Application
21/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
PresentationConstitution d’un corpus d’apprentissageApprentissageExtraction d’opinion
Extraction d’opinion
Utilisation d’une fenetre glissante de taille sz successivementcentree sur chaque occurrence d’un adjectif dans le texte t.Pour chaque fenetre f , Score(f ) =
∑M∈f Sc(M).
La polarite de t est determinee par le signe de∑f ∈t Score(f ). Si
∑f ∈t Score(f ) < 0, t est negatif, si∑
f ∈t Score(f ) > 0, t est positif.
22/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Experimentations
Utilisation du corpus propose par Pang et al. 2002, EMNLP.
Comparaison a SenticNet (Cambria et al. 2010, ArtificialIntelligence) qui propose une collection de concepts polarises.
23/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Experimentations
Nous proposons ici d’evaluer l’approche dans un contexte declassification de textes sans criteres.
Notre approche SenticNetpositif negatif positif negatif
FScore 0,73 0,69 0,68 0,68precision 0,68 0,75 0,54 0,74rappel 0,79 0,63 0,91 0,25
Table: Resultats sur le corpus de Pang et al. en classification de textes
.
Les resultats sont similaires entre les deux approches pour de laclassification sans critere.
24/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Experimentations
Critere ActeurNotre approche SenticNetpositif negatif positif negatif
FScore 0,92 0,92 0,70 0,70precision 0,90 0,95 0,60 0,74rappel 0,95 0,90 0,87 0,38
Table: Resultats en classification de textes sur les criteres ”acteur”
.
25/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Experimentations
Critere ScenarioNotre approche SenticNetpositif negatif positif negatif
FScore 0,83 0,80 0,69 0,69precision 0,76 0,90 0,55 0,74rappel 0,92 0,71 0,91 0,26
Table: Resultats en classification de textes sur les criteres ”scenario”
.
26/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Conclusion
Conclusion
Le vocabulaire appris est pertinent.
Les experimentations montrent que le critere ”acteur” estdominant dans la majorite des cas sur le corpus considere.
27/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Conclusion
Conclusion
L’affaire DSK !
28/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Resume
Conclusion
29/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Perspectives
Perspectives
Annotation conceptuelle automatique de document.
note floue : Point de vue + Intensite dans le document
Apprentissage automatique individuel de systeme depreferences.
Detection de rumeurs.
30/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres
IntroductionL’approche
ExperimentationsConclusion et perspectives
Application
Questions
Merci de votre attention.
31/31 Benjamin Duthil Extraction d’opinions appliquee a des criteres