Машинный перевод на основе правил
Из Википедии, бесплатной энциклопедии
Эту статью предлагается удалить. |
Этот перевод статьи с другого языка требует улучшения (см. Рекомендации по переводу). |
Машинный перевод на основе правил (RBMT от англ. rule-based machine translation) — обозначение технологий машинного перевода на основе лингвистической информации об исходном и переводящем языках. Такая информация извлекается, как правило, из словарей (как лингвистических, так и переводных), описаний грамматики языков, и структурируется в виде машиночитаемых правил, охватывающих основные семантические, морфологические и синтаксические закономерности каждого языка. На основе таких правил исходный текст последовательно, по предложениям преобразуется в текст перевода.
Системы машинного перевода на основе правил делятся на три группы:
- системы пословного перевода;
- системы машинного перевода на основе трансформации — преобразуют структуры исходного языка в грамматические конструкции переводящего языка;
- системы, использующие промежуточный искусственный язык (интерлингву[англ.])[1][2].
Типичная система машинного перевода на основе правил может включать следующие компоненты:
- лингвистические базы данных: двуязычные словари, справочники имён собственных и правила транслитерации, морфологические таблицы;
- модуль перевода: грамматические правила, алгоритмы перевода.
Исторически использование систем правил в машинном переводе предшествовало применению корпусных методов, в связи с чем такой подход также называют классическим. Преимущества классических систем — синтаксическая и морфологическая точность, стабильность и предсказуемость результата, возможность настройки на предметную область; недостатки — трудоёмкость и длительность разработки, необходимость поддерживать и актуализировать лингвистические базы данных; «машинный акцент» при переводе. По мере развития технологий машинного перевода получил получил распространение гибридный подход, сочетающий как методы на основе правил, так и корпусные технологии (в том числе статистический перевод и перевод на основе примеров).
Примечания
[править | править код]- ↑ Koehn, Philipp. Statistical Machine Translation. — Cambridge : Cambridge University Press, 2010. — P. 15. — ISBN 9780521874151. Архивная копия от 21 апреля 2022 на Wayback Machine
- ↑ Nirenburg, Sergei (1989). "Knowledge-Based Machine Translation". Machine Trandation 4 (1989), 5 - 24. 4 (1). Kluwer Academic Publishers: 5—24. JSTOR 40008396.
Литература
[править | править код]- Гращенко Л. А., Клышинский Э. С., Тумковский С. Р., Усманов З. Д. Концептуальная модель системы русско-таджикского машинного перевода // Доклады Академии наук Республики Таджикистан. 2011. — том 54, № 4. — С. 279—285.
- Arnold, D.J. et al. (1993): Machine Translation: an Introductory Guide
- Hutchins, W.J. (1986): Machine Translation: Past, Present, Future