il punto su due progetti erc in informatica · recent achievements in multilingual nlp 14/03/2017...

23
Roberto Navigli Il punto su due progetti ERC in informatica 13 marzo 2017 Roma

Upload: vuthuy

Post on 28-Feb-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Roberto Navigli

Il punto su due progetti ERC in informatica

13 marzo 2017 – Roma

• Associate Professor in the Department of Computer

Science, Sapienza University of Rome

• Principal investigator of several projects, including:

– ERC Starting Grant (MultiJEDI, 2011-2016, 1.3M €)

– ERC Consolidator Grant (MOUSSE, 2017-2022, 1.5M €)

– Google Focused Research Award (co-PI, 300k €)

Roberto Navigli

14/03/2017 2Il punto su due progetti ERC in informatica

Roberto Navigli

Giro di boa o no

14/03/2017Recent achievements in multilingual NLP

Roberto Navigli

3

MultiJEDI: ERC Starting Grant (2011-2016)

MOUSSE: ERC Consolidator Grant (2017-2022)

Giro di boa o no

Giro di boa

• La reputazione è in ascesa

• Velocità: carriera, inviti, coinvolgimento

• Vitalità: possibilità di creare e mantenere un gruppo

• Visibilità: hai gli occhi puntati addosso

No

• Non hai vinto alla lotteria: se sei lì, c'è una ragione

• Continui a scontrarti con i problemi quotidiani (leggi:

burocrazia, lungaggini, ecc.)

• Non puoi "concentrarti" sul progetto: hai comunque

sempre gli altri impegni come tutti i tuoi colleghi

14/03/2017 4Il punto su due progetti ERC in informatica

Roberto Navigli

A Key Goal of AI – Multilingual Machine Reading

• Why? Machines could potentially "read" the entire Web

• Answer all kinds of questions, summarize, translate, etc.

Key question: deriving meaning from natural language by

overcoming its inherent complexities

5Il punto su due progetti ERC in informatica

Roberto Navigli

The resource diaspora

• We collect lexicalizations, definitions, translations,

images, etc. from each of the merged resources

BabelNet: Unifying Lexical Knowledge Resources into

a Single Semantic Network

7

WordNet

Il punto su due progetti ERC in informatica

Roberto Navigli

14/03/2017 8

Why do we need BabelNet?

• Multilinguality: the same concept is expressed in tens of

languages

Il punto su due progetti ERC in informatica

Roberto Navigli

14/03/2017 9

Why do we need BabelNet?

• Multilinguality: the same concept is expressed in tens of

languages

• Coverage: 271 languages and 14 million entries!

– 6M concepts and 7.7M named entities

– 119M word senses

– 378M semantic relations (27 relations per concept on avg.)

– 11M images associated with concepts

– 41M textual definitions

– 2M concepts with domains associated

Il punto su due progetti ERC in informatica

Roberto Navigli

14/03/2017 10

Why do we need BabelNet?

• Multilinguality: the same concept is expressed in tens of

languages

• Coverage: 271 languages and 14 million entries!

• Concepts and named entities together: dictionary and

encyclopedic knowledge is semantically interconnected

14/03/2017 10

14/03/2017 11

Why do we need BabelNet?

• Multilinguality: the same concept is expressed in tens of

languages

• Coverage: 271 languages and 14 million entries!

• Concepts and named entities together: dictionary and

encyclopedic knowledge is semantically interconnected

• "Dictionary of the future": semantic network structure

with labeled relations, pictures, multilingual entries

14/03/2017 11Il punto su due progetti ERC in informatica

Roberto Navigli

BabelNet is our biggest success

• Well-known worldwide

• Continuously updated

• Most cited 2012 paper in Artificial Intelligence!

• Attracted the attention of the EU:

14/03/2017NLP: Work at the Sapienza University of Rome Pagina 12

BabelNet is our biggest success

• Well-known worldwide

• Continuously updated

• Most cited 2012 paper in Artificial Intelligence!

• Attracted the attention of the EU

– Workshop organized by EU Parliament, Commission &

Publications Office

– An article appeared in TIME magazine!

14/03/2017 Pagina 13Il punto su due progetti ERC in informatica

Roberto Navigli

Abbiamo creato Babelscape

• Una startup Sapienza ipertecnologica

• Un ambiente ideale per sviluppare idee innovative

• Dare spazio a studenti di ogni livello

14/03/2017Metodologie di Programmazione

Roberto Navigli

14

L'entusiasmo degli studenti

14/03/2017 15

Rifare o non rifare domanda? Questo è il problema

• E' un po' come pensare di avere in mano un secondo

best seller dopo averne sfornato uno

– Non può essere il seguito naturale dell'idea precedente

• Devi crederci davvero

• Provarci non serve

• Dopo alcuni mesi l'idea è arrivata

• Perché no: andare contro corrente

14/03/2017 16Il punto su due progetti ERC in informatica

Roberto Navigli

“Stay hungry, stay foolish” – Think different

14/03/2017Metodologie di Programmazione

Roberto Navigli

17

ERC Consolidator Grant 2016: MOUSSE

14/03/2017Metodologie di Programmazione

Roberto Navigli

18

From MultiJEDI to MOUSSE: a Quantum Leap!

MultiJEDI (2011-16)

Large multilingual repository of

concepts: BabelNet

Disambiguation outputs a bag

of concepts

MOUSSE: Multilingual Open-text Unified Syntax-independent SEmantics

Roberto Navigli

19

MOUSSE (2017-22)

Huge repository of novel structured

universal semantic representations

We will construct a language-

independent structured semantic

representation of the sentence

1

2

1

2

CONCEPTS SENTENCE REPRESENTATIONS

DISAMBIGUATION SEMANTIC PARSING

• N2 Machine Translation– Universal semantics as the long-sought-for interlingua

• Way beyond current machine translation

20

text in source

languagetext in target

language

The holy grail of AI: long-sought-for interlingua!

Il punto su due progetti ERC in informatica

Roberto Navigli

14/03/2017 21Il punto su due progetti ERC in informatica

Roberto Navigli

Thanks or…

m i(grazie)

2214/03/2017Il punto su due progetti ERC in informatica

Roberto Navigli

Roberto Navigli

Department of Computer Science

http://lcl.uniroma1.it

@RNavigli