Е. Н. Филинов
Впервыемысль о возможности машинного перевода высказал Чарльз
Бэббидж (1791-1871),разработавший в 1836-1848 гг. проект цифровой
аналитической машины — механического прототипа электронных цифровых
вычислительных машин, появившихсячерез 100 лет. Идея Ч. Бэббиджа
состояла в том, что память объемом 100050-разрядных десятичных
чисел (по 50 зубчатых колес в каждом регистре) можноиспользовать
для хранения словарей. Ч. Бэббидж привел эту идею в
качествеобоснования для запроса у английского правительства
средств, необходимых дляфизического воплощения аналитической
машины, которую ему так и не удалосьпостроить (см. Апокин и др.
Чарльз Бэббидж. М., Наука, 1981).
Фактическиистория машинного перевода начинается с
«Джорджтаунскогоэксперимента». В январе 1954 г. состоялась первая
публичная демонстрациямашинного перевода с русского языка на
английский, осуществленного на машинеИБМ-701. Сообщение об этом
событии было опубликовано в журнале Computers andAutomation, 1954,
№ 2. А реферат этого сообщения, сделанный Д. Ю. Пановым,появился в
РЖ ВИНИТИ «Математика», 1954, № 10: «Перевод с одногоязыка на
другой при помощи машины: отчет о первом успешном испытании».
Этосообщение явилось толчком для начала работ по машинному переводу
в СССР. Д. Ю.Панов, бывший тогда директором ВИНИТИ (в то время
Института научной информации- ИНИ) привлек к работам по машинному
переводу И. К. Бельскую, которая затемвозглавила группу машинного
перевода в ИТМ и ВТ АН СССР. Первый опыт перевода санглийского
языка на русский с помощью машины БЭСМ был получен уже к концу
1955г. Программы для БЭСМ составляли Н. П. Трифонов и Л. Н.
Королев, кандидатскаядиссертация которого была посвящена методам
построения словарей для машинногоперевода.
Другоенаправление работ возникло в Отделении прикладной математики
Математическогоинститута АН СССР (ныне ИПМ им. М. В. Келдыша РАН)
по инициативе А. А.Ляпунова. К работам по машинному переводу
математических текстов с французскогоязыка на русский он привлек О.
С. Кулагину, аспирантку МИАН, своих учениц Т. Д.Вентцель и Н. Н.
Рикко. С конца 1955 г. в этих работах принимала участие Т.
Н.Молошная, которая затем приступила к самостоятельной работе над
алгоритмомангло-русского перевода. А. А. Ляпунов и О. С. Кулагина
свои представления обиспользовании вычислительных машин для
перевода с одного языка на другойопубликовали в журнале
«Природа»,1955, № 8. Первые программымашинного перевода,
разработанные этим коллективом, были реализованы на
машине«Стрела».
Первоепоколение систем машинного перевода базировалось на
алгоритмахпоследовательного перевода «слово за словом», «фраза
зафразой». Возможности таких систем определялись доступными
размерами словарей,прямо зависящими от объема памяти компьютера.
Перевод текста осуществлялсяотдельными предложениями, смысловые
связи между ними никак не учитывались.Такие системы называют
системами прямого перевода. На смену им со временемпришли системы
последующих поколений, в которых перевод от языка к
языкуосуществлялся на уровне синтаксических структур. В алгоритмах
переводаиспользовался набор операций, позволяющий путем анализа
переводимогопредложения построить его синтаксическую структуру по
правилам грамматики языкавходного предложения (так же, как учат
детей языку в средней школе), а затемпреобразовать ее в
синтаксическую структуру выходного предложения исинтезировать
выходное предложение, подставляя нужные слова из словаря.
Такиесистемы называются Т-системами (Т — от английского слова
«transfer — преобразование»).
Наиболеесовершенным считается подход к построению систем машинного
перевода на основеполучения некоторого, независимого от языков,
смыслового представления входногопредложения путем его
семантического анализа. Затем производится синтезвыходного
предложения по полученному смысловому представлению. Такие
системыназывают И-системами (И — от слова «интерлингва»).
Считается, чтоследующие поколения систем машинного перевода будут
относиться к классуИ-систем.
Какбольшой ученый, которому свойственно видеть всю проблему в
целом, А. А. Ляпуновс самого начала работ по машинному переводу
говорил о переводе путем извлечениясмысла переводимого текста и его
представления на другом языке. Однако такаяпостановка проблемы
перевода оказалась в то время преждевременной. Более того,она не
решена в общем виде мировой информатикой и в настоящее время,
несмотряна усилия, предпринимавшиеся Международной федерацией IFIP
— мировымсообществом ученых в области обработки информации. Однако
многие частныерезультаты, связанные с семантическим анализом
текстов, были получены иопубликованы в трудах IFIP.
Первыйопыт создания программ машинного перевода показал, что
необходимо решать этизадачи постепенно и по частям.
Слишкоммного трудностей и неясностей было в том, как нужно
формализовать и строитьалгоритмы для работы с текстами, какие
словари надо вводить в машину, какиелингвистические закономерности
следует использовать при машинном переводе икаковы вообще эти
закономерности.
Выяснилось,что традиционная лингвистика не располагает ни
фактическим материалом, ниидеями и представлениями, нужными для
построения систем машинного перевода,которые использовали бы смысл
переводимого текста.
Традиционнаялингвистика не могла дать исходные представления не
только в части семантики,но и в части синтаксиса. Ни для одного
языка в то время не существовалоперечней синтаксических
конструкций, не были изучены условия их сочетаемости
ивзаимозаменяемости, не были разработаны правила построения крупных
единицсинтаксической структуры из более мелких. В сущности ни на
один вопрос,поставленный в связи с построением систем машинного
перевода, традиционнаялингвистика в 50-х годах не могла дать
ответа.
Потребностьв создании теоретических основ машинного перевода
привела к формированию новогонаправления в лингвистике, называемого
структурной, прикладной, математическойлингвистикой. Формирование
этого направления в СССР относится ко второйполовине 50-х годов.
Ведущую роль в нем сыграли математики А. А. Ляпунов, В.
А.Успенский, (ученик А. Н. Колмогорова), О. С. Кулагина, лингвисты
В. Ю.Розенцвейг, П. С. Кузнецов, А. А. Реформатский, И. А. Мельчук,
В. В. Иванов.
6мая 1960 г. было принято Постановление Президиума АН СССР «О
развитииструктурных и математических методов исследования языка»,
во исполнениекоторого были созданы подразделения по структурной
лингвистике в Институтеязыкознания, Институте русского языка АН
СССР. В Постановлении Президиума АНСССР отмечалось, что
«недостаточное развитие теоретических исследований вобласти
структурных и математических методов в лингвистических
учрежденияхтормозит практически важные работы по теории и практике
машинного перевода,построению информационных языков и
информационных машин, логической семантике идругим приложениям
языкознания, разрабатываемым в настоящее время в рядетехнических и
математических научно-исследовательских институтов». С 1960г.
началась подготовка кадров в области автоматической переработки
текстов нафилологическом факультете МГУ, в Ленинградском и
Новосибирском университетах,МГПИИЯ. Под математической лингвистикой
понималось изучение языка какабстрактной знаковой системы с целью
построения теоретической основы машинногоперевода и создания
конкретных алгоритмов перевода. В таком пониманииматематическая
лингвистика составляла часть семиотики — общей теории
знаковыхсистем.
Задачааксиоматизации лингвистики была выдвинута одним из виднейших
лингвистовмосковской школы П. С. Кузнецовым как задача формализации
грамматики,восходящая к идеям выдающегося русского языковеда Ф. Ф.
Фортунатова(1848-1914).
Исследованиюформальной теории грамматик, была посвящена диссертация
О. С. Кулагиной,выполненная под руководством А. А. Ляпунова.
Заметим,что в те же годы формальная теория грамматик развивалась в
США в трудах Н.Хомского, ставших классическими для области
искусственных языков, в частностиязыков программирования.
Двадцатилетие(1956-1976) один из основателей направления математик
В. А. Успенский в своихвоспоминаниях назвал «серебряным веком»
структурной, прикладной иматематической лингвистики в СССР (видимо,
по аналогии с «серебрянымвеком» русской поэзии).
В70-х годах разработку основ технологии машинного перевода
продолжила группаспециалистов в ВИНИТИ под руководством профессора
Г. Г. Белоногова. Врезультате в 1993 г. была создана промышленная
версия системы RETRANSфразеологического машинного перевода с
русского языка на английский и обратно,которая применялась в
министерствах обороны, путей сообщения, науки итехнологий, а также
во ВНТИЦ.
Практическоеприменение принципов смыслового анализа текстов
потребовалось при созданиисистем машинного перевода с
иероглифических языков (китайского, японского идр.). Вопросы
создания таких систем были разработаны в диссертации В. М. Зелков
80-х годах.
Первыекоммерческие продукты машинного перевода, нашедшие
практическое использование,появились в середине 80-х годов. Они
были реализованы на персональныхкомпьютерах и являлись системами
прямого перевода, возможности которыхбазировались на огромных (по
сравнению с первыми системами) словарях, а не наумении
анализировать и синтезировать тексты.
Современныекоммерческие продукты машинного перевода предлагают
отечественные фирмы:
«ВистаТекнолоджиз» и «Адвентис», образованные в 1991 г.
коллективомразработчиков, выделившихся из ВИНИТИ;
ПРОМТ,образованная в 1991 г.;
«МедиаЛингва».
Однопользовательская«коробочная» версия продукта Retrans Vista
фирмы «Вистатекнолоджиз» предназначена для автоматизированного
перевода текстов срусского языка на английский и обратно. В ней
использованы оригинальныеалгоритмы сжатия словарных баз и поиска
переводных эквивалентов, позволяющихтранслировать «на лету» не
только фрагменты текста, импортируемые изтекстового редактора MS
Word, но и Web-страницы.
Всловарях Retrans Vista хранятся миллионы понятий, к которым
относятся не толькотрадиционные устойчивые фразеологические
обороты, но, прежде всего,словосочетания, используемые в
повседневной речи. Кроме того, есть программаконцептуального
анализа, автоматически выделяющая из текста новыесловосочетания и
включающая их в словарь. Основные словари системы RetransVista
содержат термины и фразеологические единицы по естественным и
техническимнаукам, экономике, бизнесу и политике. Объем
политематического машинногословаря — около 3,4 млн. слов (1,8 млн.
в русско-английской части, 1,6 млн. — вангло-русской), причем 20%
из них являются словами, а 80% — устойчивымисловосочетаниями со
средней «длиной» в 2,2 слова.
ПродуктRetrans Vista реализован на ПК с процессором, имеющим
частоту от 166 МГц и ОЗУот 32 Мб и выше и жестким диском от 170 Мб.
Продукт работает под управлением ОСWindows 98/NT/2000.
ФирмаПРОМТ (http://www.promt.ru/rus1/news/news.htm) разработала и
поставляетИнтернет-переводчик PROMT Internet Translation Server,
обеспечивающий перевод«на лету» Web-страниц, запросов к поисковым
системам или к базамданных, представленным в Интернете.
Длякорпоративных сетей многонациональных корпораций фирма ПРОМТ
предлагаетаналогичный продукт PROMT Intranet Server.
Модульперевода PROMT Internet встраивается в браузер Microsoft
Internet Explorer,образуя средство для синхронного перевода
Web-страниц Web View. При этом можноустанавливать для перевода
различные языковые пары: английский — русский;английский —
немецкий; английский — испанский; французский —
английский;французский — немецкий. Бесплатный онлайновый переводчик
PROMT доступен вИнтернете по адресу: www.translate.ru.
PROMTInternet Translator Server установлен на поисковой системе
Voila, принадлежащейоператору France Telecom.
Длясистем офисной автоматизации предлагается коммерческий пакет
PROMT LingvoOFFICE — результат сотрудничества двух лидеров
российского рынкалингвистического программного обеспечения — ПРОМТ
и ABBYY.
Компания«Медиа Лингва» выпустила электронные словари серии
«МультиЛекс3.5. Новый большой англо-русский словарь» и
«МультиЛекс3.5.Английский. Экономика и право». Такие словари,
работающие под управлениемоперационных систем Windows CE или
PalnOS, могут быть размещены на карманныхкомпьютерах.
Спрактической точки зрения, имея в виду качество результирующего
текста и егосоответствие исходному, программы машинного перевода
подразделяют на трикатегории:
полностьюавтоматический перевод;
автоматизированныймашинный перевод при участии человека;
перевод,осуществляемый человеком с использованием компьютера.
Программымашинного перевода первой из названных категорий являются
делом далекогобудущего, поскольку в общем виде не решены проблемы
автоматического понимания,перевода и синтеза текстов.
Программывторой категории разработчики называют МТ-программы (от
Machine translation — машинный перевод). Реально автоматизированный
(с участием человека) машинныйперевод возможен только в условиях
искусственно ограниченного, как пословарному запасу, так и по
грамматике, языка.
Вкачестве реального успешного проекта МТ-программы всегда называют
немецкуюсистему Meteo, выполняющую перевод метеопрогнозов с
французского языка наанглийский и обратно.
КМТ-программам относятся и продукты машинного перевода фирмы ПРОМТ,
упомянутыевыше, в том числе программы для просмотра содержимого
Web-страниц в сетиИнтернет с целью поиска нужного документа.
Программытретьей категории разработчики называют ТМ-программы (от
translation memory — память перевода). Эту категорию программ
применяют профессиональныепереводчики, осознавшие выигрыш от
автоматизации их работы с помощьюкомпьютеров. Основу ТМ-программ
составляют специализированные словари,соответствующие тематике
переводимого текста. При переводе используютсяконструкции и
значения слов и устойчивых словосочетаний,
выбранныепрофессиональным переводчиком и занесенные в словари
системы, а полученныйтекст подвергается интенсивному
редактированию. Словари и уже переведенныефрагменты текстов,
запоминаемые в ТМ-системе, могут быть повторно использованыв
больших коллективных проектах, ими можно обмениваться. Поэтому
ТМ-системыпредставляют собой важное средство автоматизации труда
профессиональныхпереводчиков.
ЧастоТМ-программы используют в сочетании с МТ-программами. Наиболее
популярным вмире ТМ-инструментарием является Translation's
Workbench фирмы Trados (длякраткости часто также называемый
Trados).
За17 лет своего существования фирма Trados продала 45 тыс. лицензий
на своюсистему. Все они приобретены профессиональными
переводчиками. В конце 2001 г.Российская фирма ПРОМТ, известная
своими продуктами машинного переводакатегории МТ, объявила о
получении статуса эксклюзивного дистрибьютера системыTrados в
России и других странах СНГ. Для совместного использования
своихМТ-программ и продуктов Trados фирма ПРОМТ предлагает
специальные средства ихсопряжения.
Историямашинного перевода насчитывает немногим более 50 лет. За это
время сменилосьнесколько поколений систем машинного перевода — от
первых программ,использовавших ограниченные ресурсы универсальных
компьютеров первого поколениядо современных коммерческих продуктов,
использующих мощные ресурсы серверов иперсональных компьютеров,
включая ПК, в которых можно размещать карманныесловари, а также
компьютерные сети.
Помере снятия технических ограничений, налагаемых возможностями
компьютеров попроизводительности и памяти, становилось ясно, что
проблема перевода текста содного естественного языка на другой
принципиально не сводится только кперекодировке слов. Для
преодоления основных трудностей проблемы машинногоперевода должны
быть решены задачи автоматизированного представления
контекста,смыслового содержания переводимого текста, знаний о
понятиях предметнойобласти, к которой относится переводимый
текст.
Вместес тем современные достижения в области вычислительной
техники, информационныхтехнологий и технологий телекоммуникаций
позволяют выдвигать на перспективупрактические задачи поиска и
выбора требуемой информации, представленной наразных языках, из
разнородных источников, находящихся в корпоративных иглобальных
информационно-телекоммуникационных сетях.
Вкачестве примера такой перспективной задачи можно привести системы
запросов кинформационным ресурсам сетей, например к базам данных, с
возможностьюформирования ответов по телефону в виде устной речи.
Для этого требуетсясочетание систем машинного перевода с системами
распознавания и синтеза речи.
Список литературы
Ляпунов А. А., Кулагина О. С. Использованиевычислительных машин для
перевода с одного языка на другой. Природа,1955, № 8.
Кузнецов П. С., Ляпунов А. А.,Реформатский А. А. Основные проблемы
машинного перевода. Вопросыязыкознания, 1956, № 5.
Панов Д. Ю., Ляпунов А. А., Мухин И. С. Автоматизацияперевода с
одного языка на другой. В сб.: Сессия по научным
проблемамавтоматизации производства. М., Изд. АН СССР, 1956.
Кулагина О. С. О роли А. А.Ляпунова в развитии работ по машинному
переводу в СССР. Проблемыкибернетики, 1977, вып. 32 (в
переработанном и дополненном варианте — в книге«Очерки истории
информатики в России». Новосибирск, ОИГГМ СО РАН,1998)
Кулагина О. С. Исследования помашинному переводу. М., Наука,
1979.
Молошная Т. Н. Алгоритм перевода санглийского языка на русский.
Проблемы кибернетики, 1960, вып. 3.
Багриновская Г. П., Кулагина О. С.,Ляпунов А. А. О некоторых
методологических вопросах, относящихся к машинномупереводу. В сб.:
О некоторых вопросах теоретической кибернетики иалгоритмах
программирования. Новосибирск, Изд. СО АН СССР, 1971.
Успенский В. А. Серебряный векструктурной, прикладной и
математической лингвистики в СССР и В. Ю. Розенцвейг Как
этоначиналось (заметки очевидца) в кн.: Очерки истории информатики
вРоссии. Новосибирск, НИЦ ОИГГМ СО РАН, 1998.
Панов Д. Ю. Автоматическийперевод. М., Изд. АН СССР, 1958 (первое
издание — 1956.)
Стеблин-Каменский М. И. Значение машинногоперевода для языкознания.
В сб.: Материалы по машинному переводу. Сб. 1.Л., Изд. ЛГУ,
1958
Зелко В. И. Автореферат кандидатской диссертации.
MacDonald N. Languagetranslation by machine — a report of the first
successful trial.Computors and automation. 1954,v. 3, № 2, p.
6-10.
Машинный перевод. Сб. статей. М., АН СССР, 1958.
Кулагина О. С. Машинный перевод:современное состояние. В сб.:
Семиотика и информатика. Вып. 29. М.,ВИНИТИ, 1989.
Иванов В. В. Некоторые вопросымашинного перевода в СССР. Доклады
Конференции по обработке информации,машинному переводу и
автоматическому чтению текста. М., ВИНИТИ АН СССР, 1961.Вып.
10.
Компьютерра,2002, № 21. Тема номера: «Ты меня понимаешь?» Проблемы
машинногоперевода, с. 26-37. Статьи: Жигалов В. Тестер Тьюринга;
Жигалов В.Отложенный разговор; НожовИ. Синтаксический анализ;
Сокурко А. Будущее машинногоперевода.
История машинного перевода
234
0
10 минут
Темы:
Понравилась работу? Лайкни ее и оставь свой комментарий!
Для автора это очень важно, это стимулирует его на новое творчество!