Logrus

Русский Українська English Deutsch 中文 Français
v
Знання
Машинний переклад

Пам'ять перекладів

Наші публікації


Отзывы

Великолепные переводы, впервые вижу настолько тщательно продуманные и выполненые перерождения игры со сменой языка...

Moисеев Роман



Машинний переклад

За понад півстоліття свого існування машинний переклад з напівфантастичного проекту перетворився на реальність. Розробники систем МП вже не бояться, що «б'ються» над вочевидь нездійсненним завданням, а перекладачі – що «повстання машин» позбавить їх засобів до існування. Комп'ютер навряд чи коли-небудь замінить перекладача в усіх галузях, однак машинний переклад уже активно застосовується як корисний інструмент, нехай і для вирішення чітко визначених завдань. Для того, щоб зрозуміти, в яких випадках варто, а в яких не варто вдаватися до машинного перекладу, важливо знати принципи роботи МП, його обмеження та сферу застосування, щоб отриманий результат не розчарував.

Види систем машинного перекладу

Системи машинного перекладу поділяються на три категорії: системи на основі граматичних правил (Rule-Based Machine Translation, RBMT), статистичні системи (Statistical Machine Translation, SMT) та найперспективніші «гібридні» системи, які поєднують переваги двох вищезгаданих. Системи RBMT аналізують текст і роблять його переклад на базі вбудованих словників і набору правил для даної мовної пари. У системах SMT застосовується принцип статистичного аналізу: у програму завантажуються великі (до мільйона слів) обсяги текстів мовою оригіналу та їх переклади, виконані людиною. Програма аналізує статистику міжмовних відповідностей, слововживання, синтаксичних конструкцій тощо, а пізніше використовує її під час вибору варіантів перекладу. Цей процес можна визначити як «самонавчання». Систему може навчати й людина, виправляючи переклади після їх завершення. Саме так працює загальновідома служба «Перекладач Google». Завдяки здатності статистичних та гібридних систем МП навчатися внаслідок накопичення мовних даних якість перекладу в них підвищується з кожним наступним перекладеним текстом.

Що можна і що не можна перекладати машинним способом

Головна перевага машинного перекладу в тому, що він дає змогу швидко впоратися з дуже великими обсягами тексту і тому іноді виявляється економічно вигіднішим за переклад вручну. При цьому слід пам'ятати, що якість машинного перекладу завжди буде поступатися якості перекладу людиною. Тому його доцільно використовувати лише в певних випадках.

По-перше, машинним способом можуть перекладатися матеріали для внутрішнього користування, наприклад, коли потрібно загалом зрозуміти зміст сайту, статей або листів іноземною мовою або знайти повідомлення на ту чи іншу тему в пресі декількома мовами світу. По-друге, технічні та вузькоспеціальні тексти, які потім будуть передані на редагування фахівцям відповідно до тематики – у цьому випадку машинний переклад використовується як «підрядник», на основі якого технічний фахівець буде створювати фінальний текст, спираючись на власні знання з даного питання.

Багато типів матеріалів загалом не призначені для машинного перекладу. Наприклад, не можна довіряти машині тексти, де неточність перекладу може поставити під загрозу здоров'я людини, роботу складного пристрою або укладення великого контракту – заощаджений час у цьому разі не виправдовує ризику. Будь-які документи, які передбачають юридичну відповідальність (договори, гарантійні зобов'язання), потребують контролю людини. Машинний переклад непридатний для маркетингових матеріалів, де текст фактично переосмислюється в новому культурному контексті та створюється заново.

Загалом, задовільної якості можна очікувати при перекладі строго формалізованих технічних текстів, в той час як художні та рекламні тексти не підлягають машинному перекладу.

Попередня підготовка тексту та постредагування

Попередня підготовка матеріалів може значно спростити завдання системі МП і редакторам, які будуть доопрацьовувати «сирий» машинний переклад. Така підготовка починається ще на етапі написання вихідного тексту: з цією метою для технічних письменників й авторів розробляються стандарти, дотримання яких дозволяє зробити текст простішим для розуміння та перекладу, як машинного, так і людського.

Існують три правила, виконання яких найістотніше підвищує якість машинного перекладу з англійської мови:

  1. використання дієслів у дійсному способі замість герундія
  2. використання активного стану замість пасивного
  3. відмова від використання складених речень й однорідних членів речення.

В ідеалі кожне речення має містити одну завершену думку. Саме це правило, яке однаковою мірою застосовується для всіх мов, є найефективнішим з усіх трьох.

Згідно з експериментом, дотримання цих нескладних правил у поєднанні з правильною адаптацією системи МП значно підвищує швидкість доопрацювання тексту, отриманого на виході. Це дозволяє скласти уявлення про те, наскільки вигідною може бути формалізація і стандартизація тексту під час підготовки до машинного перекладу – чи то керування складанням тексту за допомогою спеціальних програм, чи його попереднє редагування або просте дотримання автором декількох найефективніших правил.

Постредагування – це правка «сирого» машинного перекладу редактором, який зазвичай має спеціальну підготовку та досвід роботи з машинними текстами. Машинний переклад переважно потребує подальшого редакторського доопрацювання, але іноді його можна уникнути – зокрема, якщо тексти перекладаються для внутрішніх потреб, з метою зрозуміти загальний зміст або знайти та відібрати певні матеріали. Затрати часу та праці на постредагування – один з найважливіших факторів, який слід враховувати, оцінюючи економічну доцільність машинного перекладу. Художні, рекламні та інші тексти, які не призначені для перекладу машинним способом, не підлягають і постредагуванню: щоб зробити якісний текст, аналогічний «людському» перекладу, редактору доведеться переписувати його практично з нуля, що зводить нанівець будь-яку вигоду від застосування машинного перекладу.

Обсяг й економія

Вдаючись до машинного перекладу, важливо не тільки чітко уявляти бажаний результат, а й розуміти обмеження цього методу, а також враховувати ще один фактор. Системи МП зазвичай потребують складного індивідуального налаштування та доопрацювання, зокрема «навчання» з конкретної тематики – без цього вони дають набагато гірші результати. У зв'язку з цим машинний переклад можна використовувати за умови, коли потрібно перекладати величезні обсяги однотипних текстів. Саме в цьому випадку буде економічно доцільно витратити певний час на навчання системи, а потім застосувати машинний переклад й отримати вихідний текст, придатний для постредагування. Якщо ж ідеться про декілька десятків сторінок, то намагатися впровадити машинний переклад безглуздо та збитково.

Таким чином, машинний переклад із постредагуванням може виявитися справді вигідним, якщо перекладаються однотипні тексти в дуже великих обсягах. Оскільки великі обсяги перекладів проходять через перекладацькі компанії, які зазвичай спеціалізуються у конкретних предметних галузях, впровадження досить ефективних, але дорогих систем машинного перекладу останнього покоління економічно виправдане саме в таких компаніях: ні постачальники контенту, нехай навіть великі, ні окремі перекладачі не зможуть самостійно ефективно використовувати машинний переклад.






Новини
Усі новини