LingvoDA
Ассоциация лексикографов Lingvo
О нас

 Об ассоциации
 Сотрудничество

Словари

 Скачать
 Как подключить
 Как создать
 Как разместить
 Конкурс
 Copyrights...

Страничка Переводчика

 Наш словарь
 Заметки о переводе
 Мосты, Bridging the
    communication gap

 Участники проекта

Форумы

Полезные ссылки

Отправить письмо Главная страница Поиск
Добро пожаловать в форум, Guest     Войти |  Регистрация | В избранное | Подписаться

Все форумы / Школа технического перевода
Сообщение
[0]  Машинный перевод      [new]
Миша Лорман 25 фев 04, 17:25    Ответить | Ответить с цитированием

Уважаемые участники форума, позвольте мне покаяться в страшном грехе: я занимаюсь компьютерной лингвистикой, в частности - машинным переводом. И уже довольно давно. Хотя человек с виду приличный (не маньяк).

Поэтому когда здешние инженеры уверенно говорят, что технический перевод недоступен переводчику, не являющемуся дипломированным инженером, упоминать про компьютерную программу кажется верхом неприличия (накинутся все хором, позабыв про расхождения).

И тем не менее. Почему программа машинного перевода не может, по-вашему, дать качественный технический перевод, даже опираясь на большие терминологические словари и базы параллельных текстов. И хорошее знания языка в целом. Или может? Не боитесь конкурента?

Учтем, что перевод "догугловской" и "постгугловской" поры сильно отличаются. Интернет позволяет (при разумной селекции результатов поиска) восполнить недостатки профессионального образования. В какой-то мере этот опыт можно использоваться и при принятии решений в МП.

Пусть не для всех типов технических текстов. Кроме того, систему МП можно ведь и учить!

Хотелось бы увидеть конкретные примеры, являющиеся принципиально "неберущимися".

Примеры переводов ПроМТ не предлагать - мы говорим о будущих системах МП, а не вчерашних.


[1]  Re: Машинный перевод      [new]
Наталья Шахова 25 фев 04, 21:53    Ответить | Ответить с цитированием

На мой взгляд, главная проблема в том, что между словами разных языков нет взаимнооднозначного соответствия.
Переводим фразу: "Мойте руки перед едой". Hands или arms? Человек знает, какую часть верхней конечности принято мыть перед едой. А машина?
И подобных примеров можно привести огромное количество. Не говоря уж о местоимениях. It is white. Она? Он? Оно?


[2]  Re: Машинный перевод      [new]
Миша Лорман 26 фев 04, 01:14    Ответить | Ответить с цитированием

Спасибо за пример "с руками"!
Мне кажется существенным, что он не из сферы технического перевода. В обыденном языке много таких вот умолчаний, по которым неоднозначное понимается однозначно. Ну, например, "кольцо на пальце" - это явно не toe.

C этим примером можно справиться если "терминологизировать" русские руки - выделить более точное значение, соответствующее английскому hand, и связать его с определенными операциями "вымыть, вытереть".
Тут беда в том, что нельзя утверждать наверное, что в этой фразе речь идет о hand. Вес этой гипотезы поднимает обстоятельство "перед едой".
Для систем МП тут два пути: либо использовать знания, либо их суррогаты в виде больших массивов надежных переводов, в которых фиксируются реальные связи понятий.

Но часто ли в технически точном тексте существуют такие вот "умолчания"? Было бы интересно увидеть такие примеры!

Что касается местоимения IT, то в отличие от предыдущего случая и переводчик, и система МП окажутся в равном затруднении, если фраза дана без контекста. А если есть контекст, то есть и шансы справиться с проблемой.


[3]  Re: Машинный перевод      [new]
Наталья Шахова 26 фев 04, 01:48    Ответить | Ответить с цитированием

Ну вот навскидку (извините, если среди ночи пример не очень удачный, но идея ясна): sems. Лингва про него говорит "винт с шайбой". Но ведь ясно, что человек не станет тянуть эту шайбу по всему тексту: один раз скажет "винт с шайбой", а дальше будет просто "винт". Но до тех пор, пока этот винт не столкнется в тексте с другим винтом, без шайбы. Тут уже про шайбу снова придется вспомнить.
И потом непонятно, как справляться с омонимами. Вот, допустим, текст про бухгалтерские компьютерные программы и про сеть, в которой они работают. Проводка - это что? (Я уж не говорю про такие слова, как сама сеть и система.)
Одним словом, ни мне, ни моим внукам машинный перевод конкуренцию не составит. Я так думаю.


[4]  Re: Машинный перевод      [new]
Миша Лорман 26 фев 04, 15:17    Ответить | Ответить с цитированием

Пример с винтом мне не очень понятен, потому что я не знаю, можно ли раз упомянутый sems далее в тексте заменить каким-то родовым термином, являющимся переводом для "винт" (тем же screw).
Но побороться можно.
Что касается омонимов, то нужная "проводка" все же неплохо идентифицируется контекстом. Так же, как "столы" и "таблицы" для table.

Но главный принцип такой, что нельзя делать выбор без оснований. Если нет оснований - нужно давать варианты, или спрашивать. Действующая таким образом (без вранья) система МП была бы, как мне кажется, очень полезной.


[5]  Re: Машинный перевод      [new]
Наталья Шахова 26 фев 04, 22:41    Ответить | Ответить с цитированием

Все это хорошо выглядит в теории, но совершенно неприемлемо на практике. Если МП сомневается, не зная, какой выбрать омоним, и дает варианты, то каждый из них влечет за собой соответствующие варианты окружения. Результат работы МП становится настолько громоздким, что проще вернуться к оригиналу. А поскольку условие было говорить не о существующих системах МП, а о будущих, идеальных, то разговор заходит в тупик.

И, кроме того, как Лена верно заметила, даже Традос (в основе которого лежит человеческий перевод) не обеспечивает лексическую и логическую связь между соседними предложениями. Для того чтобы переводной текст легко читался, у него должна быть структура, характерная для языка перевода. Где-то нужно убрать повторы (чтобы распаковать ваш принтер возьмите упаковку с вашим принтером и выньте ваш принтер из упаковки вашего принтера), где-то переставить слова, где-то добавить "и", где-то вместо глагола поставить тире и т.д. и т.п. Этого очень трудно добиться от человеческих переводчиков, а как научить этому машину, неясно. Совершенно неформализуемый процесс.
Ведь мы переводим для людей, поэтому текст должен быть читабельным, а не просто адекватным.

А про screw я не поняла. В моем примере перевод шел на русский язык.


[3]  Re: Машинный перевод      [new]
Abazid 2 июн 04, 18:29    Ответить | Ответить с цитированием

>Ну, например, "кольцо на пальце" - это явно не toe.

Ну, например, в Индии (да и в Англии) кольца носят и на toes :)

>Но часто ли в технически точном тексте существуют такие вот "умолчания"?

Если медицинские переводы считать техническими, то в них много умолчаний, рассчитанных на знание темы читателем (кажется, это называется "низкой избыточностью текста"). Вопрос всегда в том, что для перевода текста надо понять, о чём речь. Мне случалось редактировать переводы непрофессионалов (врачей), которые переводили пословно, даже не пытаясь понять новую для них тему. Работа эта адская. Приходилось мысленно восстанавливать оригинал или сравнивать с оригиналом, и часто было "легче закрасить, чем отскоблить" (т.е. легче перевести заново, чем исправить).

Конкретных примеров сейчас привести не могу; общий пример приводит Наталья Шахова -- новая методика операции на сердце. В медицинских статьях терминология часто неоднозначная, постоянно появляются новые термины, а в статьях на стыке дисциплин (с экологией, генетикой и проч.) понять, какое значение надо использовать, может только специалист. То же относится и к социальной гигиене и организации здравоохранения -- там часты пересечения с терминами управленческими или из информационных технологий.

Машинный перевод медицинских текстов (англо-арабский) специализированной программой я тоже видел (программу демонстрировал на конференции её создатель). Получается совершенно непонятный результат (я уж не говорю, что машина не могла отличить родимого пятна от крота -- оба mole). Впрочем, это недостаток программы, а не метода в целом. Автор программы просил нас высказывать пожелания, замечания и предолжения, и мы охотно с ним делились, не опасаясь возможной конкуренции; я, например, согласен с Натальей, что машинный перевод не составит серьёзной конкуренции ни нам, ни даже нашим внукам, по крайней мере -- в нашей области.

Кстати, та программа дала неплохой подстрочник одного немедицинского лимерика. Вероятно, в ней не был установлен приоритет медицинской терминологии.

Медики обычно пишут образно, и по-другому писать трудно -- наша профессия напрямую связана с живыми людьми; может, поэтому среди врачей относительно много писателей (хотя бы Чехов, Вересаев, Булгаков, Чулаки...).


[4]  Re: Машинный перевод      [new]
Евгений Масловский 3 июн 04, 06:14    Ответить | Ответить с цитированием

О перспективах машинного перевода (продолжение разговора по существу)

На мой взгляд, у машинного перевода нет никаких перспектив в обозримом будущем, если не будет радикально пересмотрена сама коцепция МП. Поэтому считаю целесообразным повториться:
Что касается нынешних систем автоматического перевода (например, Промт, Сократ), то их основная беда - пословный перевод, что бы там ни утверждали создатели. Для обнаружения этого факта достаточно простейших тестов: попробуйте, даже настроив на нужный словарь, подать на вход англо-русского "автомата" фразы The doctor was sent for или His being stopped by a policeman surprised him very much, или male-female unit (последнее - из области информационных технологий), и результат будет малоутешительным.
В будущем такие системы (если продолжать считать их перспективными) должны строиться на приципах искусственного интеллекта по типу экспертных систем: только тогда они начнут давать на выходе более или приемлемые результаты, однако при этом может стать неприемлемой их стоимость.
Насколько мне известно, пока во всем опережающем нас мире МП признан неэффективной сферой капиталовложений.


[5]  Re: Машинный перевод      [new]
Наталья Шахова 3 июн 04, 09:00    Ответить | Ответить с цитированием

Я совершенно не верю в возможность машинного перевода обычных (не написанных специально в расчете на такой перевод) текстов. Однако вынуждена заступиться за их разработчиков: с приведенными примерами ПРОМТ, например, довольно успешно справляется (это можно проверить на www.translate.ru, хотя настройки на специализированные словари там нет). Пассивные конструкции они одолели уже полтора года назад. Более того: в программу зашито огромное количество идиом, так что пословным их перевод назвать нельзя. И все же, все же...


[6]  Re: Машинный перевод      [new]
Евгений Масловский 4 июн 04, 01:15    Ответить | Ответить с цитированием

Попробовал. Действительно, есть кое-какой прогресс за счет введения в словарную базу общей лексики известных клише, но в целом перевод остается пословным. Пример - типичный текст из руководства пользователя:
"Select plug-and-play device. Key-in the request. To display the text, click the book icon. Select a print option, then press the left button." Вот машинный перевод:
"Выберите устройство штепселя-и-игры. Ключ - в запросе. Чтобы показывать текст, щелкните книжным изображением. Выберите выбор печати, затем нажмите левую кнопку".
Допускаю, что все огрехи - из-за отсутствия настройки на словарь. И все же...


[2]  Re: Машинный перевод      [new]
FAZAN 26 ноя 04, 23:17    Ответить | Ответить с цитированием

Во, во... Как говорил один мой знакомый - хирурги моют руки по пояс... :)


[1]  Re: Машинный перевод      [new]
Elena I. 25 фев 04, 22:23    Ответить | Ответить с цитированием

Вы подняли интересную для меня проблему.
Как раз сейчас сижу и вычитываю перевод, сделанный Традосом на базе большого накопленного и проверенного материала в памяти.
Не будем говорить про термины: если переводчик хороший, то и терминология будет хорошей.
Но вот какие проблемы я заметила. Программа переводит сегменты. Которые плохо согласовываются в связном тексте. Напр., в описании процедуры встречается "Нажать кнопку", "Нажмите кнопку" и "Нажимайте кнопку". Приходится унифицировать вручную. Потом, программа делает автоматические ссылки "на Рисунок 2" "в Таблица 3" и падеж приходится поправлять вручную. Хотя, конечно, можно везде писать Рис. 2 и Табл. 3. Но все равно возникают проблеммы при ссылках на названия глав и документов.
Программа не умеет учитывать контекст.
По-итал., напр., Decreto Ministeriale - Декрет министерства, а Decreto Legislativo - Постановление Правительства. Когда дальше в тексте встречается просто Decreto, то живой переводчик знает, о чем идет речь, а программа - нет. Она же не полезет в Интернет проверять по номеру, что за декрет.
Программа не сможет исправлять явные ляпы авторов текста. "Президент России Борис Путин" она так и переведет. А переводчик (если он не пьян в дымину) все-таки исправит.
В целом текст после Традоса какой-то искусственный. Его трудно читать. В одном абзаце 4 раза подряд написано "выполнить операцию".
Некоторые недостатки машинного перевода можно исправить. Для этого надо научить техн. писателей готовить специальные оригиналы. Чтобы все было очень точно и недвусмысленно.
Я видела как-то такой текст. "Возьмите 7 и вставьте в 5. Привинтите 6 к 4. И т.п." К нему прилагалась нумерованные картинки деталей. По-моему, это мысль. Помогает избежать ошибок переводчика, не отличающего штифт от шпильки.


[2]  Re: Машинный перевод      [new]
Евгений Масловский 26 фев 04, 00:24    Ответить | Ответить с цитированием

Уважаемая Елена, Trados - это не система машинного перевода, а система переводческой памяти (Translation Memory). Так что вы имели дело не с машинным переводом, а со стандартными фрагментами, накопленными в традосовской базе переводов и сделанными, видимо, слабыми переводчиками. Trados - это средство автоматизации переводческого труда при выполнении больших переводческих проектов множеством переводчиков; особенно любят эту систему фирмы, выпускающие объемистую документацию, нуждающуюся в периодическом обновлении при выпуске новых версий "долгоживущих" изделий. К сожалению, при этом фирма требует от переводчиков строгого соблюдения "прошлой" терминологии, пусть даже неверной с точки зрения очередного исполнителя перевода.
Что же касается нынешних систем автоматического перевода (например, Промт, Сократ), то их основная беда - пословный перевод, что бы там ни утверждали создатели. Для обнаружения этого факта достаточно простейших тестов: попробуйте подать на вход англо-русского "автомата" фразы The doctor was sent for или His being stopped by a policeman surprised him very much. В будущем такие системы (если продолжать считать их перспективными) должны строиться на приципах искусственного интеллекта по типу экспертных систем: только тогда они начнут давать на выходе более или приемлемые результаты, однако при этом может стать неприемлемой их стоимость. Насколько мне известно, во всем мире эта сфера капиталовложений признана неперспективной.


[3]  Re: Машинный перевод      [new]
Elena I. 26 фев 04, 00:49    Ответить | Ответить с цитированием

Вообще-то я знаю разницу между Традосом и прочими САТ и машинным переводом. Но ведь было сказано, что речь идет о будущих программах.
К тому же главный вопрос касался "непереводимых" примеров. Вот я и привела. Если даже Традос автоматически предлагает не лучшие варианты, то что будет при машинном переводе?
Мне не очень понятно, почему вы решили, что я проверяю плохо выполненный текст. Я как раз хотела подчеркнуть, что дело не в квалификации переводчика, а в системе перевода, как таковой.


[4]  Re: Машинный перевод      [new]
Миша Лорман 26 фев 04, 01:28    Ответить | Ответить с цитированием

Действительно, TRADOS я совсем не имел в виду. Для хорошей системы МП проблем с выбором правильной формы не будет именно потому, что она в отличие от систем TM умеет разбирать предложения.
А базы примеров использует для того, чтобы выбирать между потенциально парвильными вариантами на основании опыта прежних переводов.

Проблему с Decreto тоже ясно, как решать. Ведь система МП работает со всем текстом. И переводя некоторое предложение, она в состоянии "вспомнить", какое из двух значений было выбрано ранее (в ситуации, когда это можно было сделать уверенно).

Насчет ляпов - Вы правы, конечно. У системы МП презумпция правильности. Можно, правда, заранее попытаться исчислить типичные ошибки - и пытаться что-то сделать. Но это требует сравнения каких-то конструкций с базой данных фактов. Это не то, чтобы нереально, это все очень трудоемко и не очень надежно.
Могу только заметить, что такие ляпы легко обнаружит читатель - сложнее с такими ошибками, которые в результирующем тексте не видны.


[5]  Re: Машинный перевод      [new]
Elena I. 26 фев 04, 11:25    Ответить | Ответить с цитированием

Нет, Миша, как раз проблему с Decreto машине не решить. Потому что в одном тексте их может быть несколько. Я их различаю, исходя из логики изложения. Вот еще два примера. Presidente по-итал. может быть Президент (компании) и Председатель (собрания). Веселье начинается при переводе протоколов заседаний. Там Президент обычно председательствует. Поэтому вначале надо писать "Президент открывает собрание", а в следующей фразе про него же "Председатель объявляет повестку дня". Выбор между Презид. и Председ. переводчик делает исключительно на основе знания процедуры заседания. И при этом еще учтите, что в какой-то момент председатель может начать выступать в качестве президента компании.
Похожая петрушка с Sindaco. Это мэр и ревизор. Ну, чаще всего, конечно, понятно, что в уставе речь идет о ревизорах. Но очень может быть, что встретив их в одном абзаце, машина может перепутать два значения. Именно это те примеры, когда в готовом тексте читающему и в голову не придет устраивать проверку: все будет очень гладко.
Ну, а в тех.инструкциях часто бывает, что я начинаю писать "установить оборудование", а потом натыкаюсь на необходимость перевести "установить установку". И начинается путаница: установка как процесс и установка как агрегат. Машина ваша различий делать не будет.
При этом я думаю, что если писать тексты по определенным правилам (специально избегать некоторых сочетаний) и натаскать программу на определенный тип текста, то она, наверно, неплохо будет с этим справляться.


[1]  Re: Машинный перевод      [new]
К. Лакшин 27 фев 04, 00:38    Ответить | Ответить с цитированием

М. Лорману

Не думаю, что технический перевод представляет собой нечто особенное с точки зрения МП.

Насколько я понимаю, вклад исходного текста в процесс принятия «переводческих» решений МП значительно выше, чем в процесс принятия аналогичных решений квалифицированным переводчиком. Таким образом, одним из главных препятствий на пути совершенствования МП является непомерно высокая степень зависимости от исходного текста (в отсутствие адекватных методов исчисления смысла с достаточной достоверностью, не говоря уж о соотнесении с действительностью).

Модель смысл<=>текст в качестве основного механизма человеческого перевода, как показывает практика, обычно ведет к сомнительным результатам.

Я бы охарактеризовал работу переводчика в тех областях, в которых переводчик (человек) способен выдавать надежные результаты, скорее как модель опыт=>текст. Т. е. у переводчика имеется некая достаточно детальная модель реальности, о которой (реальности) предстоит писать в переводе, и механизм порождения сообщений, описывающих выбранные подмножества этой реальности. Исходный текст в такой ситуации является всего лишь набором указаний на некоторую совокупность таких подмножеств. Когда все подмножества найдены и сложены в непротиворечивую систему, переводчик составляет описание полученной совокупности на языке перевода.

Из такого описания можно, имхо, вывести следующее, а именно:
а) для построения надежного универсального переводчика сначала потребуется создать «всеобщую теорию всего»;
б) систему МП для перевода руководств к принтерам, ПК, бытовой технике и другим системам с известным механизмом действия, содержащим ограниченное число элементов и операций с ними, вероятно, можно создать довольно быстро (не исключено, что руководства от этого только выиграют).

КЛ


[1]  Re: Машинный перевод      [new]
В.Островский 27 фев 04, 09:46    Ответить | Ответить с цитированием

<Почему программа машинного перевода не может, по-вашему, дать качественный технический перевод, даже опираясь на большие терминологические словари и базы параллельных текстов. И хорошее знания языка в целом. Или может? Не боитесь конкурента?>

По той же причине не может дать качественный технический перевод неинженер. И программа машинного перевода, и переводчик, имеющий только хорошие знания иностранного языка в целом, работают по одним и тем же алгоритмам. Просто делают разбор предложений и автоматически находят формальные аналогии в словарях (печатных или "электронных" для принципов технологии значения не имеет) и составляют предложения на целевом языке по "общеграмматическим" правилам. И правильное значение термина из нескольких значений не может выбрать ни компьютерная программа, ни неспециалист. Про "проверку" словарей я уже не говорю.

С принципиальной точки зрения редактирование "технической части" машинного и неквалифицированного перевода - это редакционная задача одного порядка. И в данном случае бОльшую ценность имеют программы "выдающие" несколько значений терминов или макетный перевод, в котором в случае сомнения их приводит переводчик, или делаются краткие комментарии.

Конкуренция уже есть.

Я сам не сторонник "упования" на машинный перевод и считаю, что он может нанести вред самому переводчику, но я знаю (не претендуя на обширную статистику) уже довольно многих инженеров со слабыми знаниями иностранных языков, которые пользуясь машинным переводом правильно и однозначно понимают оригинал, и при необходимость могут довести его до ума в письменной форме.

Разумеется речь идет о переводе на русский, но шутки ради делались эксперименты по переводу с русского на английский в присутствии "англоязычных товарищей", которые были вполне довольны результатом.

Например. Экспресс- тест программы Stylus.

<Почему программа машинного перевода не может, по-вашему, дать качественный технический перевод, даже опираясь на большие терминологические словари и базы параллельных текстов. И хорошее знания языка в целом.>
<Why the program of machine translation can not, your way to give qualitative technical translation, even leaning(basing) on the large terminological dictionaries and bases of the parallel texts. And good knowledge of language in whole>

И если убрать чисто русское "по-вашему" и объединить предложения, то получаем следующий результат:
<Почему программа машинного перевода не может дать качественный технический перевод, даже опираясь на большие терминологические словари и базы параллельных текстов и хорошее знания языка в целом?>
<Why the program of machine translation can not give qualitative technical translation, even leaning(basing) on the large terminological dictionaries both bases of the parallel texts and good knowledge of language in whole?>

Получается "корявенько", но на интернациональный английский может претендовать. Тем более, что учтен даже деепричастный оборот, которые вообще лучше не применять при подготовке текста для любого перевода.


<Учтем, что перевод "догугловской" и "постгугловской" поры сильно отличаются. Интернет позволяет (при разумной селекции результатов поиска) восполнить недостатки профессионального образования.>

«Гугл»- очень юная поисковая система, которую нет смысла связывать с эпохами в интернете.

А вот самая большая проблема работы в интернете - "разумная селекция результатов поиска". И их может сделать, только специалист. Например, за то, что «публикуют» в интернете молодые специалисты (в.т.ч. вечные и часто не только они, а инженеры неясной квалификации, которые могут иногда занимать и «изрядную должность»), многих нужно просто лишать инженерного диплома а (иногда даже и у. степени) . В.т.ч. и за повторение и тем более внедрение переводной ерунды.

И я ни в коем разе не хочу обижать неспециалистов (для работы неспециалистов давно «предусмотрена» помощь н.т. консультантов и редакторов), но для того, чтобы восполнять недостатки профессионального образования, его нужно сначала иметь.

Это прописная истина для любых областей деятельности. А для квалифицированной работы в области технической литературы нужно не профессиональное, а высшее техническое образование, инженерный и конкретный квалифицированный опыт научно-информационной и публикационной работы.


[2]  Re: Машинный перевод      [new]
Миша Лорман 29 фев 04, 01:52    Ответить | Ответить с цитированием

Вот видите - не случайно образ переводчика-дилетанта то и дело возникает в наших обсуждениях. Похоже, что именно его система МП и может заменить. Спасибо г. Островскому, что поддержал эту идею!

С одной стороны, такая система даст специалисту, не очень хорошо знающему исходный язык, понятный текст с вариантами выбора, который он легко сможет осуществить.
С другой стороны, она даст тому же специалисту возможность сгенерировать правильный в языковом отношении текст на незнакомом языке (а для проверки правильности система будет делать контрольный обратный перевод).
Конечно, текст этот не будет стилистически совершенным, но он, безусловно, будет правильным.


[3]  Re: Машинный перевод      [new]
Наталья Шахова 29 фев 04, 12:18    Ответить | Ответить с цитированием

Это может оказаться верным только при двух обязательных условиях:
1) переводчик является дилетантом в переводах, но не в предметной области;
2) переводимый материал описывает стандартную, хорошо известную специалистам вещь.

Если же речь идет о новой методике, допустим в операции на сердце, то даже опытный кардиохирург может неправильно отредактировать машинный перевод.

Машинный перевод полон скрытых ошибок, для вылавливания которых нужно хорошо знать и предметную область и иностранный язык.

А про контрольный обратный перевод мне вообще непонятно. Кто будет сравнивать расхождения исходного текста и контрольного перевода? Если они не идентичны (а такое очень маловероятно), то для их сравнения нужен носитель языка, который потратит массу времени.


[4]  Re: Машинный перевод      [new]
Vera Fluhr 29 фев 04, 15:34    Ответить | Ответить с цитированием

> Машинный перевод полон скрытых ошибок, для
> вылавливания которых нужно хорошо знать и
> предметную область и иностранный язык.

Абсолютно согласна, а также хочу добавить, что для того, чтобы оценить, а тем более отредактировать, перевод, выполненный МП-системой, очень полезно также представлять себе, хотя бы в общих чертах, ее алгоритмы. Понимать, как работает эта МП-система.

Несколько лет назал мне довелось участвовать в одном исследовании, где сравнивались результаты нескольких МП-систем. В одном из тестов нам давались образцы машинного перевода, но не давался оригинал, и мы должны были без оригинала оценить текст перевода.

Так вот, хочу сказать, что мне как переводчику и специалисту в предметной области, гораздо легче было оценивать и править те машинные переводы, которые выполнялись пословно. Фразы там получались корявые, но хотя бы было видно, откуда они получились. Структура фразы оригинала сохранялась, и, зная исходный язык, легко было догадаться, что же на самом деле было написано в оригинале. И такой контекст помогает увидеть, какие слова переведены неверно. Если при этом еще понимать, по какому принципу система выбирает из нескольких вариантов один (по частотности или как-то еще), то это тоже помогает.

Но та МП-система, которая синтаксически обрабатывала фразу, выдавала что-то совершенно несуразное, потому что часто ради гладкости фразы изменяла ее настолько, что терялся смысл. И восстановить исходную фразу по русской уже не было никакой возможности. И это очень опасная ситуация, потому что на вид - вроде бы гладкий текст, а на самом деле написана чушь.

Т.е., как это ни смешно, но в этом тесте корявый, синтаксически неправильный текст был гораздо понятнее, чем гладкий. Из него при желании можно было все-таки сделать что-то внятное. А из того текста, где синтаксис и стиль обрабатывались машиной, уже ничего путного сделать было нельзя.

Мое мнение относительно систем МП такое. Они не конкуренты переводчикам. Но, в принципе, их можно использовать в помощь переводчикам - например, для подготовки подстрочника. Просто для скорости. Но при этом нужна простая МП-система, которая переводит пословно и не пытается сгладить фразы. Настройка выбора варианта перевода слова тоже очень помогает (обычно это делается при помощи разных словарей для разных тематик и указания приоритетов между ними плюс использование сведений о частотности, но есть и другие способы).

Но все это я говорю теоретически, потому что сама никогда не пользуюсь МП-системами для подстрочников.


[5]  Re: Машинный перевод      [new]
Евгений Масловский 1 мар 04, 01:22    Ответить | Ответить с цитированием

Ответ Вере Флёр.
Основная область, в которой автоматические переводчики могут быть полезны, это быстрая предварительная переработка больших потоков иноязычной корреспонденции, которую важно понять по содержанию и направить на выброс (не имеющую отношения к делу) либо соответствующим исполнителям для перевода. Обычно в больших организациях такая сортировка - дело референта или ученого секретаря. А уж специалистам-переводчикам автоматический переводчик явно не нужен, поскольку будет только раздражать и затруднять работу. А не-специалист с редактированием машинного перевода просто не справится, так как автомат оставит довольно много слов без перевода, не найдя их во встроенных словарях.


[1]  Re: Машинный перевод      [new]
В.Островский 1 мар 04, 06:37    Ответить | Ответить с цитированием

М. Лорману

Вы ставили вопрос о том, что не может МП. А мне ближе вопрос "что может" и тем более уже сегодня или в самое ближайшее время.

Нашел один явный вариант - перевод спецификаций и таблиц технических данных. Уже при "зарядке" надежными словарями можно получить приличные результаты, а автоматический перевод и пересчет единиц измерения - совсем не сложная задача. Хотя и в ущерб интеллекту МП, в данном случае напрашивается стык с ТМ - зарядка контекстными определениями, причем в отличии от стихийно загруженных ТМ не вылезут всякие "пятиренки шестеренчатые".

Перевод многих документов - это в принципе заполнение формуляра по данным оригинала. Уже сейчас нет никаких технических препятствий для работы со многими видами документации. И как раз специальные программы могут дать возможность выпуска качественных стандартных документов на иностранном языке: - формуляр загружен - список вопросов имеется - извольте заполнить. Не хватает данных- обеспечьте. Нужна консультация - извлекайте информацию из справочной базы. Может быть тупо- зато надежно.

Пытаться писать "качественные" деловые письма на иностранном языке, не используя оригинальные образцы, не стоит даже человеку с самыми хорошими знаниями языка, а все случаи оперативной переписки можно свести к довольно ограниченному числу "формуляров", и в принципе уже есть программные средства для "интеллектуальной корректировки" на базе МП .

Но для достижения реального качества такого ПО важно одно условие- работа интернациональной команды.

 МП уже (хотя и косвенно) начинает влиять на классическую переводческую работу. На Западе за переводы активно берутся технические редакторы (их функции сильно отличаются от наших типографских технических редакторов- это гибрид автора и редактора). Они "выступают" за т.н. "контролируемый язык" оригинала, и призывают заказчиков отказаться от неоправданно сложных предложений и явной "национальной специфики". А для доходчивости они предлагают заказчикам представить себе, что текст готовится для машинного перевода. 

 Вы пишете что, похоже, именно переводчика- дилетанта может заменить система МП.

Результаты МП, словарь и оригинал часто дают специалистам, слабо знающим иностранный язык , бОольшие возможности для понимания, чем неквалифицированный перевод со спонтанно выбранными терминами или непредсказуемыми терминологическими изобретениями.


[1]  Кстати!      [new]
Guest 6 мар 04, 16:29    Ответить | Ответить с цитированием

Электронные переводчики заменят живых?


[1]  Re: Машинный перевод      [new]
Анна Вайнберг 16 фев 05, 12:15    Ответить | Ответить с цитированием

Мы сейчас столкнулись с огромным валом технических переводов примерно из одной и той же области.

Нам нужен именно подстрочник, чтобы специалист из этой области мог понять что к чему.

Не могли бы Вы посоветовать (помочь нам) наладить эту работу.

Огромное спасибо,

Ваша anna@solev.ru


Тема на нескольких страницах: [1] 2 3    все
Powered by ActualForum Copyright (c)
Alex Sibilev 2002