Технология translation memory
В наш век стремительного развития информационных технологий и невиданного до сих пор тесного взаимодействия самых, казалось бы, отдалённых культур потребность в предоставлении быстрых и качественных переводческих услуг становится особенно актуальной. И не удивительно, что сфера письменного перевода, считавшаяся до недавнего времени территорией приложения исключительно человеческого интеллекта, с появлением уже первых компьютеров начала медленно, но заметно видоизменяться. И не могло быть иначе, ведь облегчение труда и постоянный поиск новых решений заложен в самой сути человека.
Как это часто бывает, технический прогресс в сфере коммуникаций не только поставил перед человечеством новые задачи, но и принёс с собой средства для их решения. В сфере письменных переводов одним из таких решений стала технология под названием Translation Memory (ТМ) и использующие её средства автоматизированного перевода (CAT — computer assisted translation).
Важно заметить, что средства автоматизированного перевода ни в коем случае нельзя путать с машинным переводом. Это два совершенно разных подхода к автоматизации перевода компьютерными средствами, две совершенно разные «философии» переводческого процесса. В случае машинного перевода весь перевод — от начала и до конца — делает машина, компьютер, используя для этого имеющиеся в её распоряжении словари и алгоритмы перевода. Как следствие, результат такой работы далёк от того, что можно назвать «качественным переводом» ровно по той причине, что искусственный интеллект до сих не изобретен человечеством. Во втором же случае речь идёт только об инструментах, облегчающих и ускоряющих традиционный процесс человеческого перевода, который выполняется и контролируется непосредственно переводчиком. Бюро переводов «ЛингваКонтакт» никогда не занималось и не занимается машинным переводом.
Translation Memory (TM) или «память переводов» (ПП) представляет собой базу данных, где хранятся все ранее выполненные переводы с её использованием. Для удобства переводчика программы, использующие технологию Translation Memory, разбивают переводимый текст на так называемые сегменты — фрагменты текста, оригинал и перевод которых и хранится в памяти. За единицу сегментирования (минимальную единицу перевода) такие программы обычно принимают предложение или часть сложноподчинённого предложения, но в зависимости от настроек ею также могут быть слово, фраза либо целый абзац.
Принцип работы большинства средств автоматизированного перевода прост. Во время перевода программа, во-первых, «запоминает» все переводы сегментов, подтверждённые переводчиком, а во-вторых, постоянно сверяет каждый новый непереведённый сегмент с уже имеющимися в памяти переводов и в случае обнаружения идентичного или похожего сегмента «напоминает» его перевод. Таким образом, переводчику остаётся только подтвердить предложенный программой перевод или исправить/дополнить его в соответствии с контекстом.
Кроме собственно создания и работы с памятью переводов, современные программы автоматизированного перевода позволяют:
— создавать и использовать глоссарии и словари пользователей;
— создавать памяти переводов из пар уже ранее переведенных текстов без использования средств автоматизированного перевода;
— проводить анализ текста и делать выборку из его ключевых слов, которые потом можно добавлять в глоссарии;
— осуществлять так называемый «предварительный перевод» (pretranslation) на основе уже имеющихся баз ПП.
Наиболее эффективно применение данной технологии для перевода:
— больших проектов, содержащих много однотипных фрагментов и терминов: разного рода научных и технических текстов, документаций, финансовых и юридических текстов;
— одного проекта группой из нескольких переводчиков — в этом случае технология ПП (облачная) позволяет добиться единообразия терминологии и стиля;
— новых версий уже ранее переведённых текстов — это значительно сокращает время на поиск и перевод новых фрагментов;
— файлов, содержащих разметку: файлы с веб-контентом (HTML, XML и др.) и файлы издательских систем (FrameMaker, Interleaf, Pagemaker и др.).
В то же время эта технология оказывается практически бесполезной при переводе художественных, публицистических и рекламных текстов. Другими словами, всего того, что требует творческого подхода и незаурядных решений.
Вот так выглядит интерфейс SDL Trados, интегрированной в MS Word:
Краткий обзор основных средств автоматизированного перевода
Сегодня на рынке представлено несколько десятков программ, поддерживающих работу с технологией Translation Memory. Самыми известными из них являются SDL Trados, Déjà vu, Wordfast, MultiTrans, STAR Transit и Omega-T. Кроме самого очевидного — цены (например, программа Omega-T является полностью бесплатной) — эти программные среды отличаются:
— интерфейсом редактирования текста: некоторые программы интегрируются в MS Word (например, все версии SDL Trados до версии SDL Trados 2007 включительно), другие же имеют свой собственный интерфейс;
— алгоритмами разбиения текста на сегменты (сегменты состоят из предложений, фраз или слов);
— наличием дополнительных функций (например, в программе MemoQ, в отличии от других, существует возможность оценки в процентном отношении однородности текста, т.е. наличия в нём повторяющихся элементов на уровне слов и фраз);
— возможностью интеграции средств машинного перевода;
— количеством поддерживаемых форматов файлов;
— наличием возможности работать с памятью переводов в режиме он-лайн.
Выбор CAT-программы часто зависит больше от личных предпочтений переводчика или требований бюро переводов, с которым он сотрудничает (к примеру, многие западные бюро переводов работают с форматом TTX, а он полноценно поддерживается только средой SDL Trados).
Переводчики бюро переводов «ЛингваКонтакт» знают и владеют на высоком уровне самыми распространенными CAT-инструментами. Кроме того, в нашем арсенале «помощников переводчика» есть не только средства работы с памятью переводов, но также и множество других программ и утилит (инструменты Quality Assurance, создание терминологических баз, межформатная конвертация и пр.), без которых едва ли можно добиться высокого качества и скорости работы. На счету «ЛингваКонтакт» десятки тысяч переведённых страниц с использованием TM-средств!
Вы можете быть уверены, что Ваш текст будет переведён качественно и в срок, в каком бы формате и какой бы сложности он ни был!
Оставляйте заявку на бесплатный расчет стоимости перевода Ваших файлов!
Полезные ссылки:
Он-лайн база ПП Ассоциации TAUS Data Association
Он-лайн база ПП Национального корпуса русского языка
База ПП для SDL Trados
В.Н. Грабовский. Технология Translation Memory