l’età della parola giuseppe attardi dipartimento di informatica università di pisa esa...

13
L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigData Pisa, 24 febbraio 2015

Upload: dwight-richards

Post on 31-Dec-2015

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

L’età della parola

Giuseppe AttardiDipartimento di Informatica

Università di Pisa

ESA SoBigData Pisa, 24 febbraio 2015

Page 2: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Natural Language LearningChildren learn to speak naturally,

by talking with othersTeach computers to learn

language in a similarly natural way

Page 3: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Statistical Machine LearningTraining on large document

collectionsRequires ability to process Big

Data If we used same algorithms 10 years

ago they would still be runningThe Unreasonable Effectiveness of

Big Data

Page 4: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Example: Machine Translation

Arabic to English, five-gram language models, of varying size

Page 5: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Deep Learning Breakthrough: 2006

…Output layerPrediction of target

Hidden layersLearn more abstract

representations

Input layerRaw input

Page 6: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Lots of Unlabeled Data

Language Model Corpus: 2 B words Dictionary: 130,000 most frequent words 4 weeks of training

Parallel + CUDA algorithm 2 hours

Page 7: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Word Embeddings

neighboring words are semantically related

Page 8: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

A Unified Deep Learning Architecture for NLP NER (Named Entity

Recognition) POS tagging Chunking Parsing SRL (Semantic Role

Labeling) Sentiment Analysis

Page 9: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Deep Text Analysis

Parsing Word Sense Disambiguation Anafora Resolution Information Extraction Sentiment Analysis Text Entailment Question Answering Biomedical Text Analysis

Page 11: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Correlation Simptoms-Diseases

Page 12: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015

Big data, Big Brain

Google DistrBelief Cluster capable of simulating 100 billion

connections Used to learn unsupervised image classification Used to produce tiny ASR model

Similar basic capability for processing image, audio and language

European FET Brain project

Page 13: L’età della parola Giuseppe Attardi Dipartimento di Informatica Università di Pisa ESA SoBigDataPisa, 24 febbraio 2015