semantic search engine

49
CORSO DI STRUMENTI E APPLICAZIONI DEL WEB 2014/15 SEMANTIC SEARCH ENGINE The future web 3.0 Prof. Roberto Polillo Bernadette Cama Valentina Primiceri

Upload: valentina-primiceri

Post on 11-Aug-2015

482 views

Category:

Technology


3 download

TRANSCRIPT

  1. 1. CORSO DI STRUMENTI E APPLICAZIONI DEL WEB 2014/15 SEMANTIC SEARCH ENGINE The future web 3.0Prof. Roberto Polillo Bernadette Cama Valentina Primiceri Davide
  2. 2. Queste slides fanno parte del corso Strumenti e applicazioni del Web. Il sito del corso, con il materiale completo, si trova in www.corsow.wordpress.com. Il presente materiale pubblicato con licenza Creative Commons Attribuzione - Non commerciale - Condividi allo stesso modo 3.0 (http://creativecommons.org/licenses/by-nc- sa/3.0/it/deed.it): La licenza non si estende alle immagini provenienti da altre fonti e alle screen shots, i cui diritti restano in capo ai rispettivi proprietari, che, ove possibile, sono stati indicati. L'autore si scusa per eventuali omissioni, e resta a disposizione per correggerle.
  3. 3. Introduzione Web Semantico Freebase Bing DeepDyve DuckDuckGo Wolfram Alpha Conclusioni { { { PRIMA PARTE TERZA PARTE SECONDA PARTE
  4. 4. INTRODUZIONE il Web semantico unestensione del Web corrente in cui le informazioni hanno un ben preciso significato e in cui i computer e utenti lavorano in cooperazione. Fonte: Semantic Web-Scientific American, Maggio 2001
  5. 5. WEB SEMANTICO Il termine Web semantico stato proposto nel 2001 da Tim Berners-Lee. trasformazione del World Wide Web in un ambiente dove i documenti pubblicati sono associati ad informazioni e dati che ne specificano il contesto semantico
  6. 6. WEB 3.0 E INTELLIGENZA SEMANTICA indicare quelle tecnologie in grado di trasformare informazioni non strutturate in un insieme di informazioni strutturate che pu essere interpretato ed elaborato automaticamente sulla base delle propriet semantiche dei dati. in grado di lavorare con i "concetti": reso possibile dalla combinazione di analisi semantica e codici di mark-up, che riescono a tradurre in linguaggio informatico i domini della conoscenza.
  7. 7. STRUTTURA WEB SEMANTICO dati metadati (informazioni sui dati) ontologie
  8. 8. METADATI .raggiungimento dei seguenti obiettivi: Ricerca: individuazione dellesistenza di un determinato documento Localizzazione: rintracciare dove si trova una particolare occorrenza di quel documento Selezione: di un determinato documento in base a valutazioni e/o filtri Interoperabilit semantica: che permette la ricerca in ambiti disciplinari diversi, grazie alluso di descrizioni equivalenti Gestione risorse: gestione di raccolte di documenti tramite cataloghi e banche dati Disponibilit: avere informazioni sulleffettiva disponibilit del documento.
  9. 9. ONTOLOGIE unontologia una collezione di frasi che definiscono le relazioni tra concetti e specificano le regole logiche Fonte: Tim Berners-Lee, 99
  10. 10. MOTORI DI RICERCA SEMANTICI linput dellutente una frase o una domanda il motore guida lutente direttamente verso linformazione ricercata possibile recuperare documenti esprimendo query complesse
  11. 11. Search Monkey Hakia Hakia Searc Monkey Deepdyve Bing Google Squared Wolfram Alpha 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Dbpedia Freebase Cogniti on TIMELINELANCIO E CHIUSURA DEI MOTORI DI RICERCA SEMANTICI PIU NOTI
  12. 12. Freebase 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Multilanguage Creative Commons Risorsa globale che permette alle persone (e alle macchine) di accedere all'informazione pi efficacemente un database aperto di conoscenza condivisa del mondo (Metaweb) Global Rark 36,716 Alexa.com
  13. 13. ABOUT Struttura a nodi
  14. 14. ABOUT Struttura a nodi Circa 44 milioni di argomenti nel 2014
  15. 15. ABOUT Struttura a nodi Circa 44 milioni di argomenti nel 2014 Richiede registrazione solo in fase di sviluppo
  16. 16. ABOUT Struttura a nodi Circa 44 milioni di argomenti nel 2014 Richiede registrazione solo in fase di sviluppo Promozione degli utenti
  17. 17. ABOUT Struttura a nodi Circa 44 milioni di argomenti nel 2014 Richiede registrazione solo in fase di sviluppo Promozione degli utenti Argomenti tradotti in pi lingue
  18. 18. ABOUT Struttura a nodi Circa 44 milioni di argomenti nel 2014 Richiede registrazione solo in fase di sviluppo Promozione degli utenti Argomenti tradotti in pi lingue Verr ritirato entro il 30 giugno 2015
  19. 19. Bing 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Nato da Live Search Terzo motore di ricerca al mondo Suggerimenti e ricerche correlate Fonti: http://www.webmaori.com/blog/bing-il-motore-di-ricerca-semantico-sfida- Global Rank 24 Alexa.com "But it's not Google"
  20. 20. Calcoli matematici Ricerche su enciclopedia Info mediche Risultati sportivi e di borsa Etc..Fonti:http://www.bing.com/?setlang=it
  21. 21. DeepDyv e 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Biblioteca commerciale online 30 milioni di articoli Diverse opzioni di abbonamento e noleggio Fonti:https://www.deepdyve.com/ Global Rank 56,794 Alexa.com
  22. 22. DuckDuck Go 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Migliore pertinenza di ricerca Non traccia gli utenti Filtra pagine con pubblicit eccessiva Fonti:https://duckduckgo.com/ Global Rank 569 Alexa.com
  23. 23. Tipo: motore di conoscenza computazionale Creato da: Wolfram Research Registrazione: Opzionale Lanciato: 15 maggio 2009 Modello di business: Freemium Slogan: Making the World's Knowledge Computable INTRODUZIONE
  24. 24. Fonte: www.alexa.com (26.05.2015) STATISTICHE DEL SITO
  25. 25. Stephan Wolfram, CEO of Wolfram Research Tutto ci che si deve essere in grado di fare quello di rispondere alle domande in linguaggio naturale che la gente pone, e rappresentarle in una forma precisa, rendendo tutta la conoscenza computabile e accessibile da tutti
  26. 26. VIDEO INTRODUTTIVO
  27. 27. PRINCIPALI CARATTERISTICHE: In grado di interpretare query sia in linguaggio formale che in lingua naturale; Attualmente incentrato sulle scienze tecniche (matematica, fisica, chimica,); E solo in Inglese; La registrazione consente personalizzazioni.
  28. 28. COME STRUTTURATO: Scritto in oltre 15 milioni di righe di codice basato sul linguaggio di Mathematica 50.000 algoritmi; Eseguito su pi di 10.000 CPU; l suoi database comprendono centinaia di dataset (es: Condizioni meteo): accumulati in diversi anni; controllati e certificati da esperti con conoscenze pertinenti
  29. 29. Sistema gestione del profilo personale Scelta colore back- ground Social Barra delle informazi oni Comand o di calcolo Le ultime news Funzionalit PRO STRUTTURA PAGINA PRINCIPALE Fonte: www.wolpramalpha.co
  30. 30. ESEMPIO RISULTATI 1/2 Query Pubblicit versione PRO Opzione per disambigua re la query Sommario Pubblici t interna Fonte: www.wolpramalpha.comm
  31. 31. ESEMPIO RISULTATI 2/2 Fonte: www.wolpramalpha.co
  32. 32. Fonte: www.wolpramalpha.comm
  33. 33. PRINCIPALI USI: valori nutritivi Fonte: www.wolpramalpha.com
  34. 34. PRINCIPALI USI: confronto Fonte: www.wolpramalpha.co
  35. 35. PRINCIPALI USI: Calcolo Complesso Fonte: www.wolpramalpha.comm
  36. 36. LA SUA UTILITA: conteggio Fonte: www.wolpramalpha.comm
  37. 37. PRINCIPALI USILI: Dove sono
  38. 38. PRINCIPALI USI: Generare Password Fonte: www.wolpramalpha.com
  39. 39. SELEZIONE ARTICOLI ON-LINE 1/3 Fonte: www.bits.blogs.nytimes.com 09/03/2009
  40. 40. SELEZIONE ARTICOLI ON-LINE 2/3 Fonte: www.theverge.com 06/02/2012
  41. 41. SELEZIONE ARTICOLI ON-LINE 3/3 Fonte: www.theverge.com 30/08/2012
  42. 42. CONCLUSIONI VANTAGGI Supporto come strumento educativo Capacit di eseguire calcoli complessi Creazione di widget intuitivi per il buisness Organizzazione della conoscenza SVANTAGGI Tecnologia ancora non completamente sviluppata Lutente medio non lo utilizza Difficolt di utilizzo
  43. 43. Grazie per lattenzione Applausi (per favore) Lo Staff