you tubequery+

13
YouTubeQuer y+ Giovanni Gaglione Tesina per il corso di Intelligenza Artificiale 2010-2011 Università Roma3 http://goo.gl/x54Wh

Upload: bitliner

Post on 21-Nov-2014

183 views

Category:

Documents


2 download

DESCRIPTION

YouTubeQuery+ is a didactic experiment about query expansion on top YouTube

TRANSCRIPT

Page 1: You tubequery+

YouTubeQuery+Giovanni Gaglione

Tesina per il corso di Intelligenza Artificiale2010-2011

Università Roma3http://goo.gl/x54Wh

Page 2: You tubequery+

Obiettivi

• Semplice meccanismo di Query Expansion• Applicato alle query sottoposte a

YouTube

Page 3: You tubequery+

Query Expansion

• E’ un meccanismo di espansione di una query per migliorare le performance di un sistema di information retrieval

• Vari approcci (manuale, interattiva, automatica; basati sui sinonimi, sulle cooccorrenze, etc.)

• Approccio utilizzato in YouTubeQuery+– Basato sull’analisi delle co-occorrenze presenti all’interno del

profilo utente– Profilo utente concepito come informazioni e meta-informazioni

dei video che un utente ha visto su YouTube– Le cooccorrenze sono state calcolate sul campo keyword di ogni

video YouTube visto dall’utente

Page 4: You tubequery+

Architettura di YouTubeQuery+

• Lato Client: plugin per browser Chrome– Aggiorna il profilo utente– Fornisce all’utente una interfaccia attraverso cui

poter fare ricerca tra i video YouTube con il meccanismo di query expansion

• Lato Server: WebApp distribuita su server GoogleAppEngine, scritta in python secondo il framework AppEngine

Page 5: You tubequery+

La Chrome extension (1)

Page 6: You tubequery+

La Chrome extension (1)

• Viene selezionato l’id dall’url del browser• Viene fatta una chiamata, lato client, alle YouTube

API per estrarre qualche breve informazione circa il video– Viene estratto in particolare il titolo del brano per

mostrarlo nella notifica data all’utente– Ma potrebbe essere estratta qualsiasi altra informazione

del video• Viene fatta una richiesta POST al server per

notificare l’avvenuta visione del video YouTube

Page 7: You tubequery+

La WebApp

Page 8: You tubequery+

La WebApp: in breve

• Ricevuta una richiesta dal client di notifica di un video viene aggiornato il profilo utente– Vengono estratte, mediante le YouTube API, tutte

le informazioni e meta-informazioni sul video– Su tali informazioni viene fatto il calcolo delle co-

occorrenze (per ora solo delle keyword) e aggiornato il database

– Viene aggiornata la classifica delle keyword utilizzando l’approccio ChiSquare

Page 9: You tubequery+

Chrome extension (2)

• La virgola attiva la ricerca delle cooccorrenze

• Le cooccorrenze possono essere aggiunte alla query

facendoci click sopra

Page 10: You tubequery+

Chrome extension (2)

• Appena l’utente inserisce una keyword della query– Il browser plugin esegue una richiesta al server

per ottenere le co-occorrenze associate alla keyword appena inserita

– Il browser plugin mostra le co-occorrenze che maggiormente co-occorrono

– L’utente, tramite 1click, può selezionare le co-occorrenze per aggiungerle alla query

Page 11: You tubequery+

Risultati

• L’approccio utilizzato presenta il problema del cold start, che si può protrarre anche a lungo– Non sempre si riescono a suggerire all’utente termini di query

expansion– Necessario un profilo utente molto vasto (numerose visioni di

video YouTube)• Le cooccorrenze restituite durante la query expansion

risultano essere poco efficaci nella ricerca di titoli di video– La ricerca delle cooccorrenze per l’estensione della query

andrebbe estesa all’intero database e non solo al profilo utente

Page 12: You tubequery+

Spunti di miglioramento

• Estendere il calcolo delle co-occorrenze non solo alle keyword associate ad un video YouTube ma anche ad altre meta-informazioni (descrizione, categoria, etc.)

• Introdurre un approccio collaborativo• Utilizzare fonti di informazioni esterne (cfr. profilo

Facebook, etc.)

Page 13: You tubequery+

Ulteriori informazioni

• URL del progetto: http://yqueryplus.appspot.com• Bibliografia– http://code.google.com/appengine/docs/python– http://code.google.com/chrome/extensions/index.html– Keyword Extraction from a Single Document using word

co-occurence statistical information – Y. Matsuo, M. Ishizuka

– Tesi «Social Tube: un sistema per la ricerca personalizzata dei video in YouTube» di Salvatore Conte