contrastive unsupervised word alignment with...

Contrastive Unsupervised Word Alignment with Non-Local Features Yang Liu and Maosong Sun

Upload: phungdien

Post on 26-May-2018

219 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Contrastive Unsupervised Word Alignment with Non-Local Features

Yang Liu and Maosong Sun

Word Alignment

ta zai huiyi shang fabiao yanjiang

he made a speech at the meeting

• Word alignment: aligning words between two languages

Page 3: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Approaches

• Generative [Brown et al., 1993; Vogel et al., 1996, Liang et al., 2006]

• pros: no need for labeled data

• cons: hard to extend

• Discriminative [Taskar et al., 2005; Moore et al., 2006; Liu et al., 2010]

• pros: easy to extend

• cons: rely on labeled data

Page 4: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Latent-Variable Log-Linear Models

sentence pair parametersalignment

featurespartition function

Page 5: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Challenge

intractable to calculate two feature expectations

[Smith and Eisner, 2005; Berg-Kirkpatrick et al., 2010; Dyer et al., 2011]

training data

objective

derivative

Page 6: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Idea

ta zai huiyi shang fabiao yanjiang

he made a speech at the meeting

zai fabiao huiyi shang wo yanjiang

talk a meeting she at the made

observation

noise

Intuition: observations have higher probabilities than noises

Page 7: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Contrastive Learning

training data

objective

derivative

partition function canceled out

Page 8: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Concentration• Alignments with higher probabilities are more important in

calculating expectations

Page 9: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Top-n Sampling

Page 10: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Comparison with Gibbs Samping

Comparison with Gibbs sampling in terms of average approximation error

Page 11: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Effect of Noise Generation

Effect of noise generation in terms of alignment error rate

Page 12: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Final Result

Comparison with state-of-the-art aligners

Conclusion

• Word alignment is important for multilingual NLP tasks

• Unsupervised learning of latent-variable log-linear models combines the merits of generative and discriminative approaches

• We have proposed an efficient and accurate learning algorithm for unsupervised word alignment with arbitrary features

• We will apply our approach to other NLP tasks

Page 14: Contrastive Unsupervised Word Alignment with …nlp.csai.tsinghua.edu.cn/~ly/talks/aaai15_ly.pdfConclusion • Word alignment is important for multilingual NLP tasks • Unsupervised

Thank You

Source code and data sets are freely available at: http://nlp.csai.tsinghua.edu.cn/~ly/systems/

TsinghuaAligner/TsinghuaAligner.html

http://nlp.csai.tsinghua.edu.cn/~ly/systems/TsinghuaAligner/TsinghuaAligner.html

Unsupervised Morphological Word Clustering Sergei A. Lushtak A

Unsupervised morphology induction using word embeddings

Visual Pivoting for (Unsupervised) Entity Alignment

Unsupervised word sense disambiguation rivaling supervised.pdf

A Word Embedding-Based Method for Unsupervised Adaptation

Gum-Net: Unsupervised Geometric Matching for …...Gum-Net: Unsupervised Geometric Matching for Fast and Accurate 3D Subtomogram Image Alignment and Averaging Xiangrui Zeng Min Xu∗

Discriminative Unsupervised Alignment of Natural …gildea/pubs/naim-naacl15.pdf · Discriminative Unsupervised Alignment of Natural Language Instructions with Corresponding Video

Word Lesson 5-Part 1and 2. √Paragraph Alignment√Indents alignment blocked paragraph center alignment first-line indent justified alignment hanging indent

Sequece alignment using ms word

Parallel corpora word alignment and applications

UNSUPERVISED WORD SENSE DISAMBIGUATION RIVALING …

Machine Translation Word Alignment

Unsupervised Knowledge-Free Word Sense Disambiguation

GlobalTrait: Personality Alignment of Multilingual Word

Unsupervised manifold alignment for single-cell multi-omics ......2020/06/13 · Unsupervised manifold alignment for single-cell multi-omics data Ritambhara Singh1,2, Pinar Demetci2,

Adaptive Network Alignment with Unsupervised and Multi

Literature Survey on Unsupervised Word Sense Disambiguation · Literature Survey on Unsupervised Word Sense Disambiguation Devendra Singh Chaplot Roll No: 100050033 ... Example of

Contrastively Smoothed Class Alignment for Unsupervised ......CoSCA for Unsupervised Domain Adaptation 5 interested in learning a deep network G that reduces domain shift in the data

Representing Meaning in Unsupervised Word Sense Disambiguation

Unsupervised Morphology Induction using Word Embeddings...research Unsupervised Morphology Induction using Word Embeddings Radu Soricut, Franz J. Och* NAACL 2015 *now at Human Longevity

Unsupervised learning of word separators with MDLlexicometrica.univ-paris3.fr/jadt/jadt2010/allegati/JADT-2010-1123... · Unsupervised learning of word separators with MDL. ... This

Word order type and alignment type - Lancaster EPrintseprints.lancs.ac.uk/28000/1/WOrderSTUFF.pdf · Word order type and alignment type* 0. ... word order will be used which involves

Syntactic Patterns versus Word Alignment: Extracting Opinion

Research Article A Relationship: Word Alignment, Phrase

Syntactic Patterns versus Word Alignment: Extracting ...liukang/liukangPageFile/acl2013.pdfSyntactic Patterns versus Word Alignment: Extracting Opinion Targets from Online Reviews

Cognates and Word Alignment in Bitexts

Progressive Feature Alignment for Unsupervised Domain ...openaccess.thecvf.com/.../Chen...Domain_Adaptation_CVPR_2019_paper.pdf · Progressive Feature Alignment for Unsupervised Domain

Min-Max Statistical Alignment for Transfer Learning · tistical alignment solutions, and can compete with state-of-the-art solutions on two challenging learning tasks, namely, Unsupervised

Literature Survey on Unsupervised Word Sense Disambiguation

Unsupervised Generative Adversarial Alignment

GCAN: Graph Convolutional Adversarial Network for Unsupervised …openaccess.thecvf.com/content_CVPR_2019/supplemental/Ma... · 2019-06-12 · In the domain alignment, a domain alignment

Collocation Extraction Using Monolingual Word Alignment Method

1 Unsupervised Joint Alignment of Complex Images Gary B Huang, Vidit Jain, Erik Learned-Miller

Parallel corpora word alignment and applicationsalfarrabio.di.uminho.pt/~albie/publications/msc.pdfParallel corpora word alignment and applications Alberto Manuel Brand˜ao Simoes

Unsupervised Word Alignment with Arbitrary Features #aclreading