Автоматизированный перевод: восстание машин

Те, кто хотя бы мельком знаком с автоматизированным переводом (по английски: machine translation (MT)) в какой-то момент реагировали подобным образом: “Отлично!” — вводим текст в известном и бесплатном переводчике Google Translate, и наблюдаем, как через несколько минут появляется перевод. Но даже Google Translate, как и все системы автоматизированного перевода, допускает ошибки, от незначительных до критических (порой очень забавных).human-robot competition

В Интернете полно примеров с неправильным переводом, выполненным в автоматическом переводчике. Чего не понимают моноязычные англоговорящие, так это того, сколько смешных ошибок допускают в переводе с английского языка. Возьмем к примеру, участника акции гражданского протеста в Нью-Йорке “Захвати Уолл-Стрит”, который видимо хотел перевести фразу “No more corruption” (нет (хватит) коррупции!) на китайский язык через автоматический переводчик. В итоге у него получилось: “There is no corruption” (“коррупции нет”).

Автоматизированный перевод сложен. На протяжении десятилетий он занимал умы многих талантливых ученых, вот почему чаще используется старое название “автоматизированный” и не новое — “компьютерный” перевод. В старых моделях грамматику или текст источника пытались разбить на части, чтобы затем реконструировать на языке перевода. Это было настолько трудно, что сегодня, глядя в прошлое, мы понимаем, что такой подход должен был привести к неразрешимым проблемам. Но теперь, уже на ранней стадии применения “обширных данных” (“big data”) (прежде чем эта фраза стала популярной), системы автоматизированного перевода стали работать преимущественно со статистикой. Если вы вводите в модель перевода на языке-источнике и языке перевода много высококачественных текстов, переведенных человеком, модель “уяснит” такую вероятность: «X» на языке A будет переводиться как «Y» на языке B. (И как часто, и в каком контексте, «X» вероятнее всего будет переводится как «Z».) Чем больше данных, тем лучше работает статистическая модель. Именно поэтому Google (который не имел бы никакого значения без большой базы данных) получил такую известность среди систем автоматизированного перевода.

Автоматизированный перевод хорош для перевода отдельных слов, это что-то вроде онлайн-словаря. АП так же хорош при переводе общих устойчивых фраз, потому что это тот костяк языка, который переводился уже много раз, и поэтому его можно легко передать на другом языке. АП неплох при переводе незамысловатых предложений с достаточно четкой структурой, хотя, как только вы попытаетесь вводить предложения целиком, вы увидите некоторую “топорность” в переводе. А в целых отрывках текстов АП испытывает трудности в частности с текстами, которые учебная модель еще не научилась “распознавать”. На блоге Ханци Сматер (Hanzi Smatter) приводится пример картинки байкера с татуировкой (ссылка: http://hanzismatter.blogspot.de/2011/06/from-gunnar-to-tiangotlostgmail.html), которая была переведена через автоматический переводчик. На его торсе красовались огромные китайские иероглифы, которые должны были означать “Ride Hard Die Free” (езжай бесстрашно, умри свободным). Единственной проблемой было то, что слово «die» (умереть) было переведено как “штамп” (инструмент, металлическая форма для серийного изготовления изделий штамповкой, тиснением, давлением или чеканкой), и теперь оно надолго стало атрибутом его тела. Возможно, что автоматический переводчик не нашел в базе данных устойчивые выражения вроде “die free” — умереть свободным (кстати слово “free” — свободно, было также переведено неправильно, в значении “бесплатно”). Возможно, что часть текстов базы принадлежали индустриальной и коммерческой сфере, что и объясняет выбор значения “инструмент” вместо значения “смерть”.

Полагаться на “сырой” результат АП — такая же плохая идея, как если бы вы “украсили” все свое тело надписями на языке, которого вы не знаете. Но ошибочно было бы считать, что АП вовсе уж бесполезная вещь; это инструмент перевода с последующей редакцией текста человеком, который постепенно становится лучше и лучше. Проводятся многочисленные семинары, конференции, посвященные проблемам использования автоматизированного перевода. Чем больше мы будем делится своими идеями по улучшению АП, тем больше каждый из нас сможет выиграть. Однако не все компании согласны с этим, поскольку считают свои базы данных частной собственностью.

Причина, по которой компании не желают делиться своей информацией в том, что качество автоматизированного перевода улучшается быстро лишь в какой-то узкой сфере. Такое узкое ограничение увеличивает точность перевода в разы. И это негативная сторона при стремлении создать единый “движок” для универсального использования. Но эта проблема стирается, поскольку при необходимости быстро создаются новые улучшенные “движки” для пары языков и для сферы (при наличии достаточного количества обучающих текстов, поэтому появляется необходимость призывать компании к обмену информацией).

Это позволяет создать системы автоматизированного перевода, которые будут представлять собой более, чем просто быстрый и “приемлемый” переводчик, а также средство в помощь туристам. Уэйн Бурланд — сотрудник компании Dell,производящей компьютеры, заявляет, что использование АП с последующим редактированием человеком, сокращает время перевода на  40% для его компании, которая имеет локализованный сайт на 28 языках. Что еще важнее, АП экономит деньги: в частности, компания Dell сэкономила 40% бюджета, выделяемого на перевод, начиная с 2011г. По его подсчетам доходы компании Dell  от инвестиций в АП составили 900% — цифры внушительные!

Что же ожидать в будущем: заменит ли АП полностью переводчиков-людей? Или, возможно, даже совсем отпадет необходимость изучать иностранные языки в далекой перспективе? На эти вопросы нам еще предстоит найти ответы.

Оригинал: http://www.economist.com/blogs/prospero/2014/06/computer-aided-translation

Сколько слов в день может переводить переводчик?

сколько слов в день
сколько слов в день

Один из первых вопросов, который задает себе начинающий переводчик-фрилансер: сколько слов в день я должен переводить ?

На самом деле, это непростой вопрос — и ответа на него нет. У всех нас различные специализации, различные подходы к работе, различные программные средства и т.д. Поэтому очень трудно сказать точно. Вы можете заметить сами, перевод двух текстов равного объема будет занимать у вас разное время. Читать далее «Сколько слов в день может переводить переводчик?»

Перевод документов — услуги переводчика

Все письменные переводы различаются по областям и специализациям. Поэтому при выборе переводчика, необходимо иметь в виду специализацию и компетенцию переводчика в интересующей Вас области — от этого будет зависеть качество перевода.

Ниже приведены наиболее популярные области и тематики письменного перевода: Читать далее «Перевод документов — услуги переводчика»

Трудности перевода. Переводческие термины

Иногда переводчику для правильного перевода  требуется некоторая справочная информация. Эта информация позволяет получить дополнительные сведения о предмете, контексте, адресате и терминологии.
Расчет объема текста
Все бюро переводов должны уметь рассчитывать объем текста или так называемое «количество слов». Это помогает определить стоимость, обработку заказа и число переводчиков, необходимое для выполнения перевода. Читать далее «Трудности перевода. Переводческие термины»

Стоит ли выполнять тестовые задания бесплатно?

Тестовое задание на перевод

Многие бюро/агентства переводов просят выполнить бесплатный тестовый перевод  в качестве предварительного условия для размещения платного задания. Приемлемо ли такое требование? И если да, то каков достаточный размер тестового задания, позволяющего заказчику (бюро/агентству переводов) определить  компетенцию переводчика, без возможности перепродать это тестовое задание или дополнить его другими «тестовыми» переводами для получения готового бесплатного текста. Читать далее «Стоит ли выполнять тестовые задания бесплатно?»

Как определить качество перевода

До недавнего времени было принято считать, что качественный перевод — это наилучший результат  работы переводчика. Специалисты в области перевода всегда стремились к совершенству, но этого мало. Сегодня требования к переводу возросли. Можно выделить следующие уровни качества перевода:

Особенности устного перевода

Устный перевод и его особенности

особенности устного перевода
особенности устного перевода

Устный перевод входит в список услуг почти каждого бюро переводов. Устный перевод  нужен на переговорах, конференциях, встречах, там, где люди говорят на разных языках. Обычно устный перевод ассоциируется с международными конференциями, так как он является их неотъемлемой частью. Необходимо помнить о разнице между устным переводом и письменным. Читать далее «Особенности устного перевода»

Основные виды и формы перевода

Существует несколько видов научно-технического перевода. Например, вольный перевод — понимание и передача общего содержания текста. Этот вид перевода употребляется в форме перевода-конспекта, реферата, аннотации и т.д. Помимо знания грамматики и лексики он требует определенного объема знаний по науке и технике.

Дословный перевод раскрывает содержание каждого предложения и помогает правильно понять его. При дословном переводе переведенное предложение имеет ту же структуру и порядок слов, как и соответствующее предложение на иностранном языке. Но дословный перевод не может быть адекватным переводом. Читать далее «Основные виды и формы перевода»