В блоге Memsource появилась статья, наглядно показывающая всю беспомощность машинного перевода (МП) в отношении русского языка. На большом объеме материала (38 миллионов слов) в различных языковых парах произведено сравнение выполненного человеком профессионального перевода с машинным переводом того же текста. Применялись следующие параметры оценки:
Машинный перевод на французский, португальский, испанский и английский показал наиболее высокие частоты совпадений с человеческим переводом. Так, при анализе профессионального перевода с английского на французский свыше 20% переведенных человеком единиц текстов (сегментов) продемонстрировали полное совпадение с вариантами, предложенными МП, а хоть какое-то совпадение с машинным переводом имели почти 90% сегментов "человеческих" переводов.
Напротив, русский, польский и корейский языки показали значительно более низкую степень совпадений, показав менее 40% или даже менее 20% частичных совпадений и лишь 5% полных совпадений.
Автор статьи справедливо подагает, что причины этого кроются в морфологических и грамматических особенностях языков. Как известно, французский, португальский, испанский и английский являются языками аналитического строя, в которых важен порядок слов и большую роль в передаче смысла играют служебные слова, такие как вспомогательные глаголы “is/are” ("есть, является") или “will” (будет). Русский, польский и корейский являются языками синтетического строя, в которых широко используются окончания и прочие изменения формы слова. Так, одно русское слово "пойдёте" на английском передается тремя словами: "you will go". Машинному переводу словоизменение пока не по зубам.
Пересказал: Л.Н.Пороховник
Профессиональный письменный перевод
Непреодолимые трудности машинного перевода