Logrus

Русский Українська English Deutsch 中文 Français
v
Знания

Журнал

О проекте

Свежий номер

Избранные статьи

Архив

Машинный перевод

Память переводов

Наши публикации

Грабли

Полезные ссылки

Вопрос - Ответ


Отзывы

Поскольку у нас есть очень хороший опыт проведения проекта по локализации с вашей компанией, я надеюсь на продолжение нашего дальнейшего сотрудничества.

Андрей <названия очень известных компаний>



Машинный перевод

За более чем полвека своего существования машинный перевод из полуфантастического проекта стал реальностью. Разработчики систем МП уже не боятся, что бьются над заведомо нерешаемой задачей, а переводчики — что восстание машин лишит их хлеба насущного. Компьютер вряд ли когда-нибудь заменит переводчика во всех областях, однако машинный перевод уже активно применяется как полезный инструмент, пусть и подходящий для решения строго определённых задач. Для того чтобы понять, в каких случаях стоит и в каких не стоит прибегать к машинному переводу, и чтобы полученный результат не разочаровал, важно знать принципы работы МП, его ограничения и область его применимости.

Виды систем машинного перевода

Системы машинного перевода делятся на три категории: системы на основе грамматических правил (Rule-Based Machine Translation, RBMT), статистические системы (Statistical Machine Translation, SMT) и наиболее перспективные гибридные системы, сочетающие преимущества тех и других. Системы RBMT анализируют текст и строят его перевод на базе встроенных словарей и набора правил для данной языковой пары. В системах SMT применяется принцип статистического анализа: в программу загружаются большие (в миллионы слов) объёмы текстов на исходном языке и их переводы, выполненные человеком. Программа анализирует статистику межъязыковых соответствий, словоупотребления, синтаксических конструкций и т. д., и позже опирается на неё при выборе вариантов перевода — этот процесс называется самообучением. Систему может обучать и человек, корректируя выдаваемые переводы. Именно так работает широко известный сервис «Переводчик Google». Благодаря способности статистических и гибридных систем МП обучаться, накапливая языковые данные, качество перевода у них повышается с каждым переведённым текстом.

Что можно и что нельзя переводить машинным способом

Главное преимущество машинного перевода в том, что он позволяет быстро справиться с очень большими объёмами текста и поэтому иногда оказывается экономически выгоднее перевода вручную. При этом следует помнить, что качество машинного перевода всегда будет уступать человеческому. Поэтому использовать его целесообразно лишь в определённых случаях

Во-первых, машинным способом могут переводиться материалы для внутреннего пользования, например, когда требуется в общих чертах понять содержание сайта, статей или писем на иностранном языке или найти сообщения на ту или иную тему в прессе на нескольких языках мира. Во-вторых, технические и узкоспециальные тексты, которые затем пойдут на редактирование специалистам по данной тематике — в этом случае машинный перевод используется в качестве подстрочника, на основе которого технический специалист будет создавать финальный текст, опираясь на свои знания в предметной области.

Многие типы материалов в принципе не предназначены для машинного перевода. Так, нельзя доверять машине тексты, где неточность перевода может поставить под угрозу здоровье человека, работоспособность сложного прибора или крупный контракт — сэкономленное время здесь не оправдывает риска. Любые документы, подразумевающие юридическую ответственность (договоры, гарантийные обязательства), требуют контроля человека. Машинный перевод непригоден для маркетинговых материалов, где текст фактически переосмысливается в новом культурном контексте и создается заново.

В целом, приемлемого качества можно ожидать при переводе строго формализованных технических текстов, в то время как художественные и рекламные тексты машинному переводу не поддаются.

Предварительная подготовка текста и постредактирование

Предварительная подготовка материалов может значительно упростить задачу системе МП и редакторам, которые будут дорабатывать сырой машинный перевод. Такая подготовка начинается ещё на этапе написания исходного текста — с этой целью для технических писателей и авторов разрабатываются стандарты, соблюдение которых позволяет сделать текст более простым для понимания и перевода, как машинного, так и человеческого.

Существуют три правила, выполнение которых наиболее существенно повышает качество машинного перевода с английского языка.

  1. Использование глаголов в действительном залоге вместо герундия
  2. Использование активного залога вместо пассивного
  3. Отказ от использования составных предложений и однородных членов

В идеале каждое предложение должно содержать одну законченную мысль. Именно это правило, в равной степени применимое для всех языков, является самым эффективным из трёх.

Как показал эксперимент, следование этим несложным правилам в сочетании с надлежащей адаптацией системы МП значительно повышает скорость доработки полученного на выходе текста. Это позволяет судить о том, сколь большую выгоду способна принести формализация и стандартизация текста при подготовке к машинному переводу — будь то управление составлением текста с помощью специальных программ, его предварительное редактирование или простое соблюдение автором нескольких наиболее эффективных правил.

Постредактирование — это правка сырого машинного перевода редактором, обычно имеющим специальную подготовку и опыт работы с машинными текстами. В большинстве случаев машинный перевод нуждается в последующей редакторской доработке, но иногда её можно опустить — в частности, когда тексты переводятся для внутренних нужд с целью понять общее содержание или найти определённые материалы. Затраты времени и труда на постредактирование — один из важнейших факторов, который следует учитывать, оценивая экономическую целесообразность машинного перевода. Художественные, рекламные и другие тексты, изначально не предназначенные для перевода машинным способом, не подлежат и постредактированию: чтобы довести качество текста до уровня, аналогичного человеческому переводу, редактору придётся переписывать его практически с нуля, что сводит на нет всякую выгоду от применения машинного перевода.

Объём и экономия

Прибегая к машинному переводу, важно не только чётко представлять себе желаемый результат и понимать ограничения этого метода, но и учитывать ещё один фактор. Системы МП обычно требуют сложной индивидуальной настройки и доработки, в том числе «обучения» по конкретной тематике — без этого они показывают гораздо худшие результаты. В связи с этим машинный перевод имеет смысл использовать, только если предстоит перевести огромные объёмы однотипных текстов. В этом случае будет экономически целесообразно затратить определённое время на обучение системы, затем применить машинный перевод и получить на выходе текст, пригодный для постредактирования. Если же речь идёт о нескольких десятках страниц, пытаться внедрить машинный перевод бессмысленно и попросту убыточно.

Таким образом, машинный перевод с постредактированием может оказаться действительно выгодным, если переводятся тексты подходящего типа в очень больших объёмах. Поскольку большие объёмы переводов проходят через переводческие компании, которые часто специализируются в конкретных предметных областях, внедрение достаточно эффективных, но дорогих систем машинного перевода последнего поколения экономически оправдано именно в таких компаниях: ни поставщики контента, пусть даже крупные, ни индивидуальные переводчики не смогут самостоятельно эффективно использовать машинный перевод.

 






Запрос на дополнительную информацию
Расценки на работы
Новости
Все новости