
Информационные технологии и лингвистика XXI века
10. Crystal D. English as a Global Language. Cambridge: Cambridge University Press, 2003. – 212p.
Глава 2
КОМПЬЮТЕР И ПЕРЕВОДЧИК
Краткое описание: общие требования, автоматический перевод, автоматизированный перевод, системы памяти переводов (Translation Memory), использование систем памяти переводов Trados и OmegaT

Переводчики – почтовые лошади просвещения.
А. С. Пушкин«Мой дед Лозинский – в моём детском и подростковом понимании – превращал мутную жесть иностранных языков в прозрачное золото русской речи. Писатели писали что-то там своё комковатое, – а он выпрямлял и разглаживал; они тыркались об стену, не находя дверей; – а он распахивал ворота; они водили руками в тумане, – а он брал их за руку и выводил на свет. <…> Мне открылась вдруг сполна тяжесть каторжного труда переводчика, подвиг его, ничем практически не вознаграждаемый, мало кем ценимый, потаенный. Подобно Адаму, он вынужден вновь и вновь давать имена вещам, предметам, понятиям чужого, тайно и буйно цветущего за оградой сада»
Т. Толстая. Переводные картинки// Т. Толстая. Река. – М.: Эксмо, 2007.«The word ‘translation’ comes, etymologically, from the Latin for ‘bearing across’. Having been borne across the world, we are translated men. It is normally supposed that something always gets lost in translation; I cling, obstinately to the notion that something can also be gained.»
Salman Rushdie, Imaginary Homelands: Essays and Criticism 1981–1991В наши дни невозможно представить себе работу переводчика без персонального компьютера. Компьютер используются как для собственно перевода, так и для решения сопутствующих задач, возникающих в деятельности переводчика, включая: изучение конъюнктуры рынка и поиск заказчиков; поиск справочной информации и изучение терминологии; подготовка коммерческих предложений; поддержание связи с заказчиками и соисполнителями; создание и обновление глоссариев и др. справочных материалов; учет заказов, планирование и учет затрат рабочего времени; выставление счетов; закупка и оплата оргтехники, справочных и расходных материалов; бухгалтерский учет, подготовка и подача налоговых деклараций; профессиональное общение с коллегами; повышение квалификации.
Одним словом, персональный компьютер (далее ПК) является важнейшим техническим средством в инструментарии переводчика. Для того, чтобы работа переводчика с помощью ПК была эффективной с рациональным использованием времени, рабочий компьютер должен соответствовать ряду определенных требований.
I. Аппаратная база
Требования к аппаратной базе (равно как и к программному обеспечению и компьютерной грамотности переводчика) определяются двумя обстоятельствами.
С одной стороны, переводчик является независимым производителем перевода. В этом качестве ему нужен текстовый процессор с проверкой орфографии на языке перевода, средства доступа к Интернету, словари и в некоторых случаях накопители переводов. Все эти программы сами по себе не отличаются особо жесткими требованиями к аппаратной базе.
С другой стороны, переводчик является подчиненным звеном в технологической цепочке заказчика, в связи с чем встает вопрос о пригодности используемых переводчиком технических средств для обработки файлов, создаваемых заказчиком, а это зачастую означает необходимость использования значительно более мощного ПК.
В целом при выборе ПК можно руководствоваться следующими соображениями:
1. расчетный срок службы – 3 года;
2. модернизация вместо замены исключается;
3. рассматриваются модели, попадающие в среднюю треть общего диапазона производительности имеющихся в продаже новых ПК.
Для письменного переводчика самое важное в компьютере – экран монитора, клавиатура и мышь, поскольку от их качества зависит не только производительность труда, но и здоровье, и сохранение работоспособности переводчика.
II. Операционная система
В целом, переводчик может работать в любой операционной системе, для которой существуют офисные приложения, браузеры, словари и специализированные программы-накопители переводов. Для ОС Windows накопителей переводов существует больше, чем для других операционных систем. Кроме того, работа в приложениях для Windows связана с соображениями совместимости.
III. Прикладные программы, используемые в переводческой деятельности
Программы, которыми пользуются переводчики, можно разделить на следующие основные категории.
Программы, используемые непосредственно в процессе перевода. В данной категории речь идет об офисных, верстальных и других программах общего назначения. Первым орудием переводчика был и остается по сей день текстовый процессор, а также программы для обработки электронных таблиц, создания презентаций, верстки и черчения. В прошлом решения о целесообразности освоения навыков работы в тех или иных программах часто упирались в вопрос о стоимости приобретения и обновления соответствующих программ, заказы на работу в которых поступали нерегулярно. Сейчас этот вопрос в отношении многих программ отпал, поскольку их можно загрузить с сайта производителя в виде полностью функциональной пробной версии со сроком действия от 15 до 60 дней (это относится, в частности, к программам фирмы Adobe).
Далее речь идет о накопителях перевода. Начиная с середины 90-х годов, переводчики используют в работе так называемые накопители переводов (Translation Memory, TM-tools, CAT-tools).
В основе накопителя переводов лежит специализированная база, которая содержит пары предложений и (или) терминов на двух языках. Если в переводимом документе встречаются термины или предложения, совпадающие с сохраненными в базе данных предложениями или терминами полностью или в достаточно большой степени, программа предлагает переводчику использовать существующий перевод или доработать его требуемым образом.
Целесообразность и необходимость использования накопителя переводов и выбор оптимального для конкретного переводчика накопителя в большой степени зависят от характера переводимых текстов, стиля работы переводчика, а также от особенностей взаимоотношений переводчика с базой переводов (далее БП) и особенностей технологической цепочки БП. Следует обратить внимание на то, что практически все накопители работают с обменным форматом ТМХ[3], благодаря чему с технической точки зрения БП может использовать для обновления своей базы данных результаты перевода, выполненного в любом накопителе. Более того, файлы формата ТМХ можно сформировать из текстового документа даже в отсутствие накопителя с использованием специализированного бесплатного программного обеспечения или штатных средств программы MS Word. Другое дело, что многие бюро настаивают на применении определенного накопителя (чаще всего – Trados/SDLX[4]) из соображений технологичности, удобства или в силу привычки.
Наряду с накопителями переводов, специалисты, занимающиеся профессиональным переводом, не могут не обращаться к электронным словарям и справочникам. Популярными словарями для перевода с русского и других языков мира являются Lingvo (www.lingvo.ru), Multitran (www.multitran.ru), Контекст (www.dics.ru).
Программы для информационной поддержки и связи (браузеры, программы для локального поиска).
Одной из существенных для переводчика характеристик браузера является его быстродействие, поскольку в процессе работы приходится просматривать большие объемы текстов «по диагонали»; его удобство работы с закладками, т. е. возможность держать «под рукой» множество открытых страниц и сохранять наборы таких страниц для справки на будущее (в связи с чем, браузеры Opera и Firefox традиционно пользуются большой популярностью среди переводчиков).
Кроме того, переводчику полезно уметь работать с FTP-сайтами[5]с использованием предназначенных именно для этой цели клиентских программ (например, Smart FTP (www.smartftp.com) или Cute FTP (www.CuteFTP.com), поскольку FTP-сайты далеко не всегда реально поддерживают заявленную совместимость с наиболее популярными браузерами.
Переводчикам, которые часто пользуются беспроводной сетью WiFi в отсутствии проводного соединения для доступа в Интернет, также полезно владеть навыками диагностики и решения наиболее типичных проблем, возникающих при подключении через Wi-Fi.
Помимо выбора удобного для работы браузера, переводчик может также воспользоваться программами, обеспечивающими локальный поиск необходимой информации (например, Copernic Desktop Search, Yahoo Desktop Search, Google desktop, XI). Программы для поиска файлов на жестком диске по заданным ключевым словам или словосочетаниям, содержащимся в тексте перевода, позволяют специалисту сэкономить рабочее время.
Программы для обработки и подготовки исходных файлов и формирования и доработки конечных файлов.
Наиболее популярной и распространенной программой является ABBYY PDF Transformer. Для обработки графической информации – Paint, CoralDraw, Microsoft Office Document Imaging. Несмотря на то, что работа с графикой не является прямой обязанностью переводчика, тем не менее, во многих случаях возможность и умение решать простейшие задачи, связанные с графическими изображениями, полезны в двух отношениях. Они экономят время переводчику и позволяют выдавать заказчику документы в готовой для распространения форме.
Программы для административного сопровождения (учет работ, выставление счетов, налоговая отчетность).
Наиболее распространенные программы для подсчета объема текста – это PractiCount (www.practiline.com), AnyCount (www.anycount.com). С комплексом административного ПО для переводчиков можно познакомиться на сайте www.translation3000.com. Программа налогового учета и отчетности – 1C: Бухгалтерия[6].
Программы вспомогательного назначения (создание резервных копий, обеспечение надежности и безопасности, преобразование файлов в требуемые форматы).
На сегодняшний день существует достаточно большое количество программ, позволяющих создавать резервные копии и обеспечивать надежность и безопасность информации на рабочем компьютере переводчика. Наиболее популярными из них являются следующие: Nero, Driver Sweeper, Drop Box, Driver Max, DVD shrink, FBackup, Яндекс. Диск; антивирусное ПО:
Kaspersky Internet Security,
Norton Security,
Avast Internet Security,
ESET NOD32 Smart Security,
Dr.Web Security Space,
AVG Internet Security,
Bitdefender Internet Security.
IV. Автоматический перевод документов
Автоматический перевод текстов с одного языка на другой – очень сложная задача, о полном ее решении пока говорить не приходится.
Все проблемы заключаются в объеме переводимого текста. Компьютеризованный словарь вполне может справиться с переводом отдельных слов, особенно если он способен предложить несколько значений на выбор. Однако, когда речь идет о переводе целых фраз и, тем более, абзацев связного текста, все осложняется..
Для таких случаев надежного алгоритма перевода с одного языка на другой не существует. Это связано с тем, что каждая фраза языка имеет два уровня: синтаксический и смысловой. Синтаксический уровень определяет построение предложения, а смысловой – его содержание.
Для правильного смыслового перевода необходимо принимать во внимание не только конкретную фразу, но и смысл всего абзаца или даже целой главы текста. Таким образом, рассчитывать на то, что при автоматическом переводе получится полноценный документ, нельзя.
Программы автоматического перевода рассчитаны, в первую очередь, на тех, кто совсем не знает соответствующего иностранного языка, но должен ознакомиться с содержанием документа хотя бы приблизительно. Кроме того, подобные программы позволяют готовить короткие сообщения электронной почты на иностранном языке. Такие сообщения трудно считать грамотными, но, скорее всего, корреспондент сумеет понять, что ему хотели сообщить, поэтому программу перевода текста иностранного языка на русский, можно рассматривать как средство получения простейшего черновика.
Программные средства автоматического перевода можно условно разбить на две основные категории. Первую категорию представляют компьютерные словари. Назначение компьютерных словарей такое же, как и у обычных словарей: предоставить значение неизвестного слова. Преимущество их состоит в быстром доступе и удобстве автоматического поиска значения выделенного слова. Автоматический словарь обычно предоставляет возможность перевода слова по нажатию выделенной комбинации клавиш.
Ко второй категории относятся программы-переводчики, позволяющие выполнить автоматический перевод связного текста. Они принимают текст на одном языке и выдают текст на другом языке. В ходе работы программа использует обширные словари, наборы грамматических правил и другие средства, обеспечивающие наилучшее, с точки зрения программы, качество перевода. Чем короче предложение, тем больше шансов на то, что преобразование будет правильным.
Программы-переводчики комплектуются, кроме общих словарей, специализированными словарями по разным областям человеческой деятельности и могут переводить потоком фрагмент текста или весь текст.
В России наиболее широкое распространение получили программы автоматического перевода с английского языка на русский и с русского на английский, такие как Stylus и Socrat. Stylus обеспечивает более высокое качество и более высокую гибкость при переводе. Последние версии Stylus сменили название на Promt98, Promt 2000.
Все выше указанные программы способны работать с документами в различных форматах, допускают немедленное редактирование и оригинала и перевода; могут сохранить в нужном виде как оригинал, так и перевод. Кроме того, они включают богатый набор как универсальных, так и специализированных словарей и содержат средства для управления их использованием. Перевод слов, не входящих в словари, можно определить самостоятельно и сохранить в пользовательском словаре. Программы автоматизированного перевода позволяют указать правила работы с именами собственными и другими словами, не требующими перевода. Они имеют отдельные приложения, позволяющие осуществлять пакетный перевод файлов (File Translator), быстрый перевод неформатированного текста (Qtrans), синхронный перевод Web-страниц в Интернете (WebView).
В первой четверти нового тысячелетия характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации. Сегодня уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает о переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, при этом удовлетворять принятым в данной стране стандартам. От переводчика требуется также умение эффективно использовать ранее выполненные заказы на ту же тему, а работодатель, в свою очередь, рассчитывает на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментах текста. Эти жесткие, зачастую противоречивые условия можно соблюсти лишь в том случае, если переводчик не только в совершенстве владеет родным и иностранным языком и глубоко изучил выбранную им предметную область, но и уверенно ориентируется в современных компьютерных технологиях.
Ключевой для переводчика технической документации в данных условиях является технология Translation Memory (ТМ). Системам машинного перевода уделено мало места, так как возможности их ограничены и это не позволяет рекомендовать их для применения в процессе профессиональной работы над текстом.
В последнее время устойчиво возрастает объем переводов, связанных с информационными технологиями, причем переводческим и компьютерным компаниям приходится иметь дело не только с подготовкой документации, но и с локализацией программного обеспечения, т. е. с переводом ресурсов, содержащихся в ехе- и dll- файлах. И с последующим тестированием программного обеспечения.
Что же такое машинный перевод и системы автоматизированного перевода, чем они отличаются и как могут помочь переводчику в его работе?
Машинный перевод – процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой полностью специальной компьютерной программой. Таким же образом называется направление научных исследований, связанных с построением подобных систем.
Существует несколько форм организации взаимодействия ЭВМ и человека при машинном переводе:
• с постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат;
• с предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка;
• с интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.
• смешанные системы (например, одновременно с пред- и постредактированием).
Кроме того, традиционно системы машинного перевода делятся на две категории: основанные на правилах (rule-based) и основанные на примерах (example-based). В первых языковая грамматика проработана глубже, языковых правил больше. Системы второго типа – самообучающиеся, они строятся на динамическом порождении языковых правил для конкретных текстовых примеров. Границы между системами example-based и rule-based не очень четкие, поскольку и те и другие используют словари (статическая информация о языке) и правила работы со словарями. Яркий представитель класса example-based – система Trados (www.trados.com), работающая фактически на одних примерах, без грамматики. Trados предназначена для больших переводческих центров, где накопилось много параллельных текстов (два текста, один из которых является переводом другого). Она позволяет не переводить дважды одно и то же предложение, а просто находит такое же или очень похожее предложение в базе параллельных текстов и выдает уже сделанный кем-то перевод. При больших массивах однотипных текстов такой подход весьма эффективен. Вообще, понятие массива документов очень важно для машинного перевода. Большинство специалистов сходится во мнении, что машинный перевод возможен только для прикладных (технических) текстов, которые могут быть заданы определенными, порой гигантскими массивами. Художественная литература, как антипод технических текстов, никогда не будет переводиться компьютером адекватно.
Вместо термина «машинный» в компьютерной лингвистике иногда употребляется слово «автоматический», что не влияет на смысл. Однако термин автоматизированный перевод имеет совсем другое значение, так как при нём программа просто помогает человеку переводить тексты.[7]
Автоматизированный перевод предполагает такие формы взаимодействия, как частично автоматизированный перевод (например, использование переводчиком-человеком компьютерных словарей) и систему с разделением труда, то есть компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.
Принимая во внимание тот факт, что машинный перевод различной текстовой информации становится все более и более востребованным не только в среде профессионального перевода, но в других сферах общественной жизнедеятельности, осуществим небольшой экскурс в историю создания машинного перевода в России и за рубежом.
Мысль использовать ЭВМ для перевода была высказана в 1946 году в США, сразу же после появления первых электронно-вычислительных машин. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Великобритании, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.
К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:
• MARK (в Департаменте иностранной техники ВВС США);
• GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).
Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинного перевода текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, а иногда и к полному прекращению работ по этой тематике.
Тем не менее, в ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление персональных компьютеров, а с ними всё более сложных словарных, поисковых систем, ориентированных на работу с данными на естественных языках. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области, наступившему примерно с середины 70-х годов прошлого столетия. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.
В настоящее время также существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания 8у81хап. В России большой вклад в развитие машинного перевода внесла группа под руководством профессора Р.Г. Пиотровского (Российский государственный педагогический университет им. Герцена, г. Санкт-Петербург).
Впрочем, мечты, с которыми российские и зарубежные ученые взялись полвека назад за задачу машинного перевода, в значительной мере остаются по-прежнему мечтами, поскольку высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода (по оценкам конца 1980-х) приблизительно до пяти раз.
Качество же перевода зависит от тематики и стиля исходного текста. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение качественного перевода, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.
Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных шуток, особенно в профессиональной среде переводчиков. Например, программа ПРОМТ переводит предложение «Му cat has given birth to four kittens, two yellow; one white and one black» на русский язык следующим образом: «Мой кот родил четырёх котят, два жёлтых цвета, одно белое и одного афроамериканца».
Профессиональная работа невозможна без надежных инструментов. Перевод и локализация[8] как область профессиональной активности в этом смысле не являются исключением. Любой переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются, поэтому оснащение рабочего места (локализатора) автоматизированными средствами является нормой в отрасли, постепенно трансформируясь в отраслевые стандарты.
Большинство таких средств построены на основе концепции памяти перевода (translation memory) – простой базы данных, каждая запись которой представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то, что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, или computer-aided/ assisted translation), их не следует путать с программами машинного перевода (machine translation) – память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.