mt course contents (in russian)

3

Click here to load reader

Upload: dmitry-kan

Post on 26-Jun-2015

576 views

Category:

Technology


0 download

DESCRIPTION

This is course program for the following course slides: http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-2911038 and http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-1 Это программа курса по машинному переводу, прочитанная первый раз магистрам фак-та ПМ-ПУ СПбГУ в 2009 году. Слайды курса: http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-2911038 http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-1

TRANSCRIPT

Page 1: MT course contents (in Russian)

Программа курса Машинный перевод (МП)

1. Введение. Мотивация существования МП 2. Краткая история МП. Основные этапы. Доклад ALPAC 3. Прямой и косвенный МП. Примеры построенных систем МП (СМП) 4. Современные СМП в индустрии 5. Существующие пакеты для обработки языка и построения СМП 6. Два фундаментальных подхода к МП: статистический и традиционный

(лингвистические правила) 7. Методы МП 8. Прямая СМП. Её характеристики 9. Метод трансфер. Типы трансфера. Характеристики метода 10. Понятие интерлингвы. Характеристики метода МП, основанного на

интерлингве. Сравнение с трасфером 11. Компоненты статистического подхода к МП 12. Системы МП, основанные на примерах 13. Теория статистических СМП. Фундаментальное уравнение (теорема

Байеса). Понятие статистической языковой модели. Модель перевода. Вычисление языковой модели

14. Модель перевода в статистической СМП 15. Задача выравнивания слов 16. Характеристики статистических СМП 17. Существующие компоненты статистических СМП 18. Оценка качества СМП. Оценка человеком. Автоматические методы оценки,

их важность в целом 19. Метрика BLEU 20. Метрика METEOR 21. Метрика NIST 22. Round-trip 23. Гибридные СМП 24. Задача переупорядочивания слов в предложении. Классические и

статистические подходы 25. Компьютерная семантика русского языка и предпоссылки для построения

СМП на её основе 26. Прагматика. Анализ контекста 27. Детали программных пакетов для машинного перевода: GIZA++, SRILM,

Moses 28. Реализация алгоритма переупорядочивания по статье [7] Семинар (или темы на реферат): 1. Математика статистического машинного перевода (по статье [1]) 2. Иерархическая модель для статистического МП (статья [2]) 3. Статистический МП, основанный на фразах (статья [3]) 4. СМП, основанные на правилах (статьи [4,5]) 5. Гибридные СМП, основанные на примерах ([6])

Page 2: MT course contents (in Russian)

6. Метрика BLEU в деталях (по статье [8]) 7. Робастные крупномасштабные СМП, основанные на примерах (по статье

[9])

Page 3: MT course contents (in Russian)

Литература [1] Brown P., Della Petra S., Della Petra V., Mercer R.: The Mathematics of Statistical Machine Translation: Parameter Estimation, 1993 [2] Chiang D.: A Hierarchical Phrase-Based Model for Statistical Machine Translation, 2005 [3] Koehn P., Och F., Marcu D.: Statistical Phrase-Based Machine Translation, 2003 [4] Kaplan R., Netter K., Wedekind J., Zaenen A.: Translation By Structural Correspondences, 1989 [5] Landsbergen J.: The Rosetta Project, 1989 [6] Groves D., Way A.: Hybrid Example-Based SMT: the Best of Both Worlds? (здесь, как принятно в западной литературе, SMT означает Статистический Машинный Перевод) [7] Athanaselis T., Bakamidis S., Dologou I.: Words Reordering based on Statistical Language Model, 2006 [8] Papineni K., Roukos S., Ward T., Zhu W.-J.: BLEU: a Method for Automatic Evaluation of Machine Translation, 2002 [9] Gough N., Way A.: Robust Large-Scale EBMT with Marker-Based Segmentation, 2004