Logrus

Русский Українська English Deutsch 中文 Français
v
Знания

Журнал

О проекте

Свежий номер

Избранные статьи

Архив

Машинный перевод

Память переводов

Наши публикации

Грабли

Полезные ссылки

Вопрос - Ответ


Отзывы

Лера, спасибо! Я тоже хочу присоединиться к теплым словам Надежды – вы просто молодцы, сработали на высоком профессиональном уровне.

Большое СПАСИБО!

Катя



Машинный перевод

За более чем полвека своего существования машинный перевод из полуфантастического проекта стал реальностью. Разработчики систем МП уже не боятся, что бьются над заведомо нерешаемой задачей, а переводчики — что восстание машин лишит их хлеба насущного. Компьютер вряд ли когда-нибудь заменит переводчика во всех областях, однако машинный перевод уже активно применяется как полезный инструмент, пусть и подходящий для решения строго определённых задач. Для того чтобы понять, в каких случаях стоит и в каких не стоит прибегать к машинному переводу, и чтобы полученный результат не разочаровал, важно знать принципы работы МП, его ограничения и область его применимости.

Виды систем машинного перевода

Системы машинного перевода делятся на три категории: системы на основе грамматических правил (Rule-Based Machine Translation, RBMT), статистические системы (Statistical Machine Translation, SMT) и наиболее перспективные гибридные системы, сочетающие преимущества тех и других. Системы RBMT анализируют текст и строят его перевод на базе встроенных словарей и набора правил для данной языковой пары. В системах SMT применяется принцип статистического анализа: в программу загружаются большие (в миллионы слов) объёмы текстов на исходном языке и их переводы, выполненные человеком. Программа анализирует статистику межъязыковых соответствий, словоупотребления, синтаксических конструкций и т. д., и позже опирается на неё при выборе вариантов перевода — этот процесс называется самообучением. Систему может обучать и человек, корректируя выдаваемые переводы. Именно так работает широко известный сервис «Переводчик Google». Благодаря способности статистических и гибридных систем МП обучаться, накапливая языковые данные, качество перевода у них повышается с каждым переведённым текстом.

Что можно и что нельзя переводить машинным способом

Главное преимущество машинного перевода в том, что он позволяет быстро справиться с очень большими объёмами текста и поэтому иногда оказывается экономически выгоднее перевода вручную. При этом следует помнить, что качество машинного перевода всегда будет уступать человеческому. Поэтому использовать его целесообразно лишь в определённых случаях

Во-первых, машинным способом могут переводиться материалы для внутреннего пользования, например, когда требуется в общих чертах понять содержание сайта, статей или писем на иностранном языке или найти сообщения на ту или иную тему в прессе на нескольких языках мира. Во-вторых, технические и узкоспециальные тексты, которые затем пойдут на редактирование специалистам по данной тематике — в этом случае машинный перевод используется в качестве подстрочника, на основе которого технический специалист будет создавать финальный текст, опираясь на свои знания в предметной области.

Многие типы материалов в принципе не предназначены для машинного перевода. Так, нельзя доверять машине тексты, где неточность перевода может поставить под угрозу здоровье человека, работоспособность сложного прибора или крупный контракт — сэкономленное время здесь не оправдывает риска. Любые документы, подразумевающие юридическую ответственность (договоры, гарантийные обязательства), требуют контроля человека. Машинный перевод непригоден для маркетинговых материалов, где текст фактически переосмысливается в новом культурном контексте и создается заново.

В целом, приемлемого качества можно ожидать при переводе строго формализованных технических текстов, в то время как художественные и рекламные тексты машинному переводу не поддаются.

Предварительная подготовка текста и постредактирование

Предварительная подготовка материалов может значительно упростить задачу системе МП и редакторам, которые будут дорабатывать сырой машинный перевод. Такая подготовка начинается ещё на этапе написания исходного текста — с этой целью для технических писателей и авторов разрабатываются стандарты, соблюдение которых позволяет сделать текст более простым для понимания и перевода, как машинного, так и человеческого.

Существуют три правила, выполнение которых наиболее существенно повышает качество машинного перевода с английского языка.

  1. Использование глаголов в действительном залоге вместо герундия
  2. Использование активного залога вместо пассивного
  3. Отказ от использования составных предложений и однородных членов

В идеале каждое предложение должно содержать одну законченную мысль. Именно это правило, в равной степени применимое для всех языков, является самым эффективным из трёх.

Как показал эксперимент, следование этим несложным правилам в сочетании с надлежащей адаптацией системы МП значительно повышает скорость доработки полученного на выходе текста. Это позволяет судить о том, сколь большую выгоду способна принести формализация и стандартизация текста при подготовке к машинному переводу — будь то управление составлением текста с помощью специальных программ, его предварительное редактирование или простое соблюдение автором нескольких наиболее эффективных правил.

Постредактирование — это правка сырого машинного перевода редактором, обычно имеющим специальную подготовку и опыт работы с машинными текстами. В большинстве случаев машинный перевод нуждается в последующей редакторской доработке, но иногда её можно опустить — в частности, когда тексты переводятся для внутренних нужд с целью понять общее содержание или найти определённые материалы. Затраты времени и труда на постредактирование — один из важнейших факторов, который следует учитывать, оценивая экономическую целесообразность машинного перевода. Художественные, рекламные и другие тексты, изначально не предназначенные для перевода машинным способом, не подлежат и постредактированию: чтобы довести качество текста до уровня, аналогичного человеческому переводу, редактору придётся переписывать его практически с нуля, что сводит на нет всякую выгоду от применения машинного перевода.

Объём и экономия

Прибегая к машинному переводу, важно не только чётко представлять себе желаемый результат и понимать ограничения этого метода, но и учитывать ещё один фактор. Системы МП обычно требуют сложной индивидуальной настройки и доработки, в том числе «обучения» по конкретной тематике — без этого они показывают гораздо худшие результаты. В связи с этим машинный перевод имеет смысл использовать, только если предстоит перевести огромные объёмы однотипных текстов. В этом случае будет экономически целесообразно затратить определённое время на обучение системы, затем применить машинный перевод и получить на выходе текст, пригодный для постредактирования. Если же речь идёт о нескольких десятках страниц, пытаться внедрить машинный перевод бессмысленно и попросту убыточно.

Таким образом, машинный перевод с постредактированием может оказаться действительно выгодным, если переводятся тексты подходящего типа в очень больших объёмах. Поскольку большие объёмы переводов проходят через переводческие компании, которые часто специализируются в конкретных предметных областях, внедрение достаточно эффективных, но дорогих систем машинного перевода последнего поколения экономически оправдано именно в таких компаниях: ни поставщики контента, пусть даже крупные, ни индивидуальные переводчики не смогут самостоятельно эффективно использовать машинный перевод.

 






Новости
Все новости