LingvoDA
Ассоциация лексикографов Lingvo
О нас

 Об ассоциации
 Сотрудничество

Словари

 Скачать
 Как подключить
 Как создать
 Как разместить
 Конкурс
 Copyrights...

Страничка Переводчика

 Наш словарь
 Заметки о переводе
 Мосты, Bridging the
    communication gap

 Участники проекта

Форумы

Полезные ссылки

ABBYY Lingvo x3

Поиск Главная страница Отправить письмо

Архив сообщений форума
"Технологии создания DSL-словарей".
Октябрь 2002

Предложение по усовершенствованию ссылок

assyrinx () 05.10.2002 19:23

Уважаемый ABBYY! (или уважаемая?) По-моему, назрела необходимость в усовершенствовании системы ссылок. То, что есть сейчас, немного ограничивает свободу действий. Во-первых, нет возможности сослаться на вариант перевода внутри статьи, если, скажем, слово имеет несколько кардинально различающихся значений или может быть разными частями речи - то, что обозначается латинскими цифрами. Т.е. нельзя сослаться на bit I, bit II, а можно только на всю статью bit. Хорошо было бы иметь возможость использовать ссылки типа bit#I и bit#II (как в HTML), отображаемые как "bit I" и "bit II". Или, в общем случае, (загол.статьи)#(имя закладки). Для этого нужно ввести спец. тег - закладку, типа [x I] и [x II] в статью bit. Имя тега и разделитель условны. Второе. Скажем, есть фразеологический словарь и статья в нем. В примере внутри статьи имеется попутно ссылка на другой фразеологический оборот, но не в том времени или не в том падеже или с лишним словом. Здесь простое заключение в не работает. К сожалению, сейчас элегантного выхода из такой ситуации не получается. Приходится писать ссылку в "правильной" форме в скобках, что утяжеляет пример. Для решения всего этого, мне кажется, ссылка должна иметь опционально вторую часть - "правильную форму", т.е. адрес. Типа (отображ.часть ссылки)::(ссылка) . Если второй части нет, то адрес и есть отображаемая часть. Разделитель условен. Это самое щадящее решение, при котором на 100% сохраняется совместимость. Пути выхода можно придумать и другие, более радикальные (при желании). Составители профессиональных пользовательских словарей, а что вы об этом думаете? Светлана.
   

Re: Предложение по усовершенствованию ссылок

assyrinx () 05.10.2002 19:25

Прошу прощения, двойные угловые скобки почему-то напрочь исчезли из текста сообщения!
   

Re: Предложение по усовершенствованию ссылок

От ABBYY Lingvo () 06.10.2002 00:43

Светлана, спасибо за новые идеи.
Новый механизм ссылок, соответствующий первой части Ваших предложений, уже обдуман (на уровне DSL), но реализация его была отложена до момента последовательного введения расширенных ссылок в словарях Lingvo. Мы просто не предвидели, что создатели собственных словарей так быстро выйдут за границы текущей версии DSL. Вы пошли даже немного дальше с идеей различать ссылку и ее отображение. Спасибо за интересное предложение, мы его обдумаем. Кстати, уже реализованы (хотя и не опубликованы) межсловарные ссылки.

Социология

traisy () 05.10.2002 22:04

Где можно достать словарь, который содержал бы социологические термины?!

Усовершенствование списка бесплатных словарей

Назар () 07.10.2002 20:28

Вот ещё несколько советов относительно списка бесплатных словарей на сайте. Недавно ABBYY ввело некоторые формы сортировки этого списка, что было очень кстати. Хвалю! --- Посоветую ввести ещё следующие усовершенствования: - Возле каждого словаря дать количество его загрузок, рейтинг словаря от ABBYY и рейтинг его от пользователей; рейтинг (по меньшей мере от ABBYY) желательно разбить на несколько показателей (скажем: охват словарём тематической лексики, качество устройства словарной статьи, оригинальность (или уникальность, то есть, есть ли другие словари, дающие подобный материал).
   

Re: Усовершенствование списка бесплатных словарей

от ABBYY Lingvo () 12.10.2002 19:02

Назар, все сразу не получится, но думать и действовать в этом направлении мы будем. Спасибо за предложения.

Об ударениях, старо-церковно славянском, и прочем...

Назар () 07.10.2002 20:43

Некоторое время назад я поднимал на Ваших форумах проблемму того, что ударения (U+301 и U+341) над украинскими "і" и "ї" попадают слишком сильно слева от самих этих букв. (Сообщения Вы кажется оставили на форуме по ABBYY Lingvo.) Тут на форумах никто так и не дал вразумительного ответа по этому поводу. --- Я обратился с этим вопросом к разработчику шрифта Code2000 - Джеймсу Кассу (James Kass), нагрузив его дополнительно также замечаниями по поводу того, что как в Code2000 (который является на сегодняшний день пожалуй самым полным Unicode шрифтом, уступающим разве что Arial Unicode MS, но одновременно содержащим многие наборы символов, которых в Arial Unicode MS на данный момент нет), так и в Arial Unicode MS отсутствуют некоторые символы из старо-церковно славянской азбуки, а также не работает диакритика для старо-церковно славянского. --- Джеймс Касс был очень благодарен за мои детальные замечания и советы, и дополнительно познакомил меня с Полом Нельсоном (Paul Nelson), руководителем отдела работы по шрифтам в Microsoft. Пол и Джеймс вместе дружно обещают, что будут усовершенствовать свои системы. Я получил от них некоторую интересную информацию, которая может пригодиться читателям этого форума. --- Джеймс говорит, что проблемма корректного размещения диакритики над буквами решается технологией OpenType. Microsoft сейчас усиленно работает над модулем Uniscript (Uniscript - Microsoft's Unicode engine), который будет смещать диакритику вертикально и горизонтально таким образом, чтобы она попадала над буквами туда, куда нужно. Uniscript позволит также соединять части символов вместе, как это сейчас реализовано для Complex Scripts (например арабского или санскрита). Технология Uniscript уже освоена для латиницы, и сейчас идёт работа над кириллицей. Господа Пол и Джеймс очень просили присылать им для тестирования кириличного Uniscript-а пробные файлы, в которых можно проследить использование богатого набора нестандартных кириличных символов и диакритики. Они также жаловались на отсутствие информации и интереса со стороны государственных учреждений тех стран, которые используют кириллицу. Кое-что я им уже послал. --- Я обратил внимание господина Пола также на отсутствие апострофа в украинской раскладке клавиатуры, за что Пол очень извинялся (поскольку это действительно довольно грубое упущение на уровне такой фирмы, как Microsoft). Пол обещал исправить раскладку, и просил, если это возможно, найти хоть какой-то официальный стандарт украинской клавиатуры, одобренный стандартизационными органами Украины. Я конечно же проведу исследование этого вопроса, и если окажется, что такого стандарта всё ещё нет, то надо будет его ввести, возможно в сотрудничестве с Microsoft. --- Я напомнил господам Полу и Джеймсу также о глаголице, которая пока-что не нашла своего места в Unicode, хотя формальная заявка на её введение была подана ещё в 1997-1998 годах. --- Джеймс уже исправил комбинационную старо-славянскую диакритику (которая раньше не комбинировалась с символами надлежащим образом) и работает над остальными расширениями. Обновленную версию Code2000 скоро можно будет загрузить с его сайта. --- Я ещё раз напоминаю ABBYY о том, что алгоритмы сортировки списков слов должны быть сделаны таким образом, чтобы им не мешали ударение и апостроф. То же касается например огласовок (нэкудот) в иврите. На этом пока заканчиваю...

Макрос для создания словарей

Boris () 08.10.2002 17:42

Уважаемые сотрудники ABBYY! На дворе уже октябрь а обещанного макроса что-то не видн..помнится девушка из вашей фирмы обещалась опубликовать макрос на прошлой неделе. И когда, мы рядовые пользователи лицензионной версии Lingvo 8.0 дождемся наконец ее выходы на белый свет?
   

Re: Макрос для создания словарей

Назар () 08.10.2002 17:50

Мне от ABBYY сообщили, что выиграл мой макрос, недельки ещё две назад. Обещали написать пресс-релиз. Спрашивали, не написал ли бы я более подробного и доступного описания для макроса, поскольку предоставленное мной описание (8 страниц текста A4) трудно воспринималось даже программистами ABBYY. Я ответил, что лучше выложить макрос как есть, а потом дописывать описание и усовершенствовать саму программу, отталкиваясь от полученных от пользователей откликов и советов (которые советы и отклики надо бы направлять прямо на форумы для общего обсуждения). После этого ABBYY замолкло, так макроса и не выложив. Может они пишут сейчас это детальное и доступное описание? А вообще-то я заметил, что даже на простой ответ на письмо обычно приходится ждать довольно долго, а потом приходит ответ, в котором большая половина тем исходного письма даже не упомянута. Наверное, скромных сил коллектива ABBYY просто не хватает на всё сразу. Им помогать бы надо... Как ни как, словари свои они неплохо делают, а за всем остальным кто ж угонится?
   

Re: Re: Макрос для создания словарей

Boris () 09.10.2002 09:54

Нет, ну понятно, что они коллектив скромный, просто не писали бы того, чего не могут выполнить в срок (также как все трубили про сроки выхода Lingvo 8 для КПК а вышел он позже). Просто пожелание им (сотрудникам ABBYY) не давать пустых обещаний, а то это портит их хорошую репутацию. Хорошо бы услышать внятный ответ (без пустых обещаний) со стороны ABBYY, когда они точно выложат макрос-победитель конкурса. И вообще - инструкция нужна от автора а не от них. Пусть выложат макрос, а потом и руководство к нему...я думаю, пользователи действительно во всем разберутся при работе с макросом, а возникшие вопросы могут представить в конце концов через форум непосредственно автору.
   

Re: Re: Re: Макрос для создания словарей

ABBYY Lingvo () 10.10.2002 19:54

Уважаемые посетители форума, макрос будет опубликован завтра на отдельной странице, посвященной созданию словарей.
   

Re: Re: Re: Re: Макрос для создания словарей

Дмитрий () 12.10.2002 16:32

Спасибо! Ещё бы опубликовать новость на главной странице и прилепить ссылочку на новую страницу из форума по DSL...
   

Re: Re: Макрос для создания словарей

Assagai () 09.10.2002 09:59

А этично ли будет выложить макрос, не дожидаясь пресс-релиза? Наверное, ничего страшного не будет. Можно будет начать испытания и усовершенствования. Может быть и другие участники конкурса захотят поделиться результатами своих трудов, не исключено, что будут интересные решения, которые можно будет использовать (с их согласия естественно) в финальной версии макроса.
   

Re: Макрос для создания словарей

Дмитрий () 10.10.2002 12:13

Ответили-ли бы хоть как-то, а то просто невежливо получается?
   

Re: Макрос для создания словарей

andrua () 18.10.2002 13:10

У меня есть свой собственный макрос, с помощью которого я создал два словаря (Account и Oil&Gas Production). Он построен по принципу обработки строк, т.е. оригинал и первод находятся на одной строке, разделенные каким либо символом. По моему опыту, в таком виде в основном и составляются различные глоссарии. Похожий форма получается и при экспорта словарных пар из различных систем. Кому интересно, пишите на мыло - вышлю.

Макрос DSL Converter

Назар () 13.10.2002 02:24

Дорогие друзья! Сегодня я заметил, что ABBYY наконец сделало небольшую страничку в подразделе бесплатных словарей ("В помощь создателю словарей") и выложило там мой макрос. К сожалению, по моим наблюдениям, в выложенной версии нет никаких добавлений или более подробных описаний, составлением которых, как я полагал, ABBYY занималось последние две недели. Более того, я давно присылал ABBYY более свежую версию макроса, которую по непонятным причинам не разместили на сайте. --- Из всего вышесказанного я делаю вывод о том, что дальнейшее использование сайта ABBYY для отладки и усовершенствования макроса может привести к непредвиденным и неоправданным промедлениям в работе. По этой причине я сделал небольшой вспомагательный сайтик (www.nazark.fromru.com), на котором разместил более свежую версию макроса. В будущем этот сайт можно будет эффективно использовать для текущей отладки макроса.
   

Re: Макрос DSL Converter

Дмитрий () 14.10.2002 10:54

Уважаемый Назар, Скачал Выш макрос с сайта ABBYY ещё в субботу. ПОльзуясь случаем хотел бы поблагодарить автора. За выходные успел только адаптировать одну из Ваших template под свои потребности, времени на тестирование макроса пока не было. Правильно ли я понял из описания, что макрос не реагирует на другие цвета кроме зелёного и синего и их можно использовать для более наглядного представления исходного текста (например выделять какой-то из языков красным)? Не скажется ли на работе макроса внесение соответсвующих изменений в стили, а также их переименование и добавление новых стилей по аналогии с существующими? Не могли ли Вы также рассказать подробнее об отличиях новой версии макроса?
   

Re: Re: Макрос DSL Converter

Назар () 14.10.2002 15:06

Уважаемый Дмитрий, Спасибо за Ваш интерес и подробный отзыв. Буду очень рад, если макрос поможет Вам в работе. --- Вот ответы на Ваши вопросы. --- Данная версия макроса узнаёт только зелёный цвет. Синий интерпретируется как условное обозначение тега [ref]. На данном этапе Вы можете использовать все остальные цвета как Вам удобно. На работу макроса они не влияют и останутся только в документе Word. Но возможно я введу опознание большего количества цветов в будущем. Поэтому, для соблюдения формальной строгости было бы целесообразно не злоупотреблять использованием цветов в других целях. Но, если Вы достаточно опытный пользователь Word, то сможете легко поменять нужные элементы в будущем. --- Изменения в стилях не скажутся на работе макроса, если при этих изменениях Вы не нарушите характерных элементов, по которым макрос опознаёт теги DSL. Вы можете также создавать новые стили. Сам макрос реагирует не на стили, а на элементы форматирования, которые я указал в описании. --- В новой версии макроса я исправил некоторое количество ошибок в описании, добавил несколько предложений на тему использования табуляции, и исправил пару ошибок в словаре Бусела. Как мне сообщила сегодня Олеся Юшина из ABBYY, на сайте ABBYY макрос уже тоже обновили. Но версия на моём сайте всё же чуть-чуть новее :)
   

Re: Re: Re: Макрос DSL Converter

Дмитрий () 14.10.2002 20:06

Спасибо за подробный ответ. Одно из первых впечатлений от использования - для корректной работы макроса в Word должна быть отключена функция автоматического определения языка (Tools/Language/Set Lenguage/Detect language automatically). По крайней мере у меня, до того как я её отключил, были проблемы. Насчёт выделения неосновного языка каким-нибудь цветом (например красным), я по-моему неплохо придумал. Иначе аналогичные стили для разных языков внешне неразличимы. В целом использование макроса требует определённого навыка и сноровки, но при наличии таковых, похоже, полностью себя оправдывает. Ещё раз спасибо.
   

Re: Re: Re: Re: Макрос DSL Converter

Назар () 14.10.2002 22:22

Дмитрий, спасибо за положительный отзыв. --- Относительно цветов я согласен, что это может быть весьма удобно. При использовании большего количества настоящих цветов (то есть таких, которые дожны преобразовываться в теги DSL) можно будет для различения языков использовать какой-то другой визуальный эффект. Напоминаю также о том, что на ToolBar стоит вынести кнопки-индикаторы Style и Language. Тогда соответственный язык и стиль будет видно, когда курсор находится на тексте, обозначенном этим языком. Относительно функции автоматического определения языка у меня лично проблем не было, но спасибо за замечание - проблемы могут появляться в определённых условиях.
   

Re: Re: Re: Re: Re: Макрос DSL Converter

Дмитрий () 15.10.2002 11:33

Style и Language у меня конечно же на панель вынесены. Но иногда полезно иметь возможность проверить правильность разметки крупного фрагмента текста не поднося курсор к каждому отдельному слову. Впрочем, как я уже убедился, Ваши Templates довольно легко настраиваются, и каждый может сам выбирать то, что ему удобнее.
   

Re: Re: Re: Re: Re: Макрос DSL Converter

Дмитрий () 15.10.2002 19:18

Ещё одно наблюдение от использования макроса: при вложении зон индексации (например при вставке комментария или пометы в зону перевода или примера) макрос дробит ту зону, куда что-то вложено, т.е. внешняя зона закрывается соответствующим тегом перед началом вложенной, а потом окрывается снова. В этом нет никакой необходимости, а индекс вероятно разбухает. Может быть можно было бы как-то это исправить?
   

Re: Re: Re: Re: Re: Re: Макрос DSL Converter

Назар () 16.10.2002 14:07

Дмитрий, спасибо за замечание. Я обратил внимане на эту деталь ещё во время написания макроса, но как-то так и не собрался с духом ёё поправлять. Может в будущем, когда будет вдохновение.
   

Re: Re: Re: Re: Re: Re: Re: Макрос DSL Converter

Дмитрий () 17.10.2002 10:07

И ещё одно наблюдение: макрос расставляет теги даже вокруг пробелов, если на эти пробелы случайно попали какие-нибудь элементы форматирования, отличные от соседних, т.е. вместо просто пробела " " получается, например, "[i] [/i]". Может быть можно было бы решить эту проблему вместе с той, о которой я писал раньше (вложение зон индексации), при помощи какого-нибудь модуля "зачистки" в макросе, который бы в конце обработки текста убирал лишние открывающие/закрывающие теги? Это позволило бы значительно повысить качество получаемого DSL-текста без кардинальной переделки макроса. Правда, время обработки текста возможно увеличилось бы, но зато не надо было бы править потом DSL-текст вручную.
   

Re: Re: Re: Re: Re: Re: Re: Re: Макрос DSL Converter

Назар () 17.10.2002 19:13

Дмитрий, спасибо ещё раз. Наблюдения Ваши весьма ценны. Я уверен, что они пригодятся, если я возьмусь за усовершенствование макроса. --- На сегодняшний день ABBYY не проявило особого интереса к предлагаемым мною направлениям сотрудничества, а именно: созданию качественного санскритско-русского словаря; созданию базы украиноязычных словарей; расширению работы на международном уровне и созданию универсальной словарной оболочки, которая стала бы доступным каждому качественным средством работы со словарями, глоссариями, и энциклопедическими сборниками. --- Я немного устал не получать никаких ответов на свои предложения, и на данный момент не склонен посвящать время и внимание работе с макросом. Возможно моё настроение переменится в будущем. --- Спасибо ещё раз ва Ваши замечания. Будут ещё замечания - пишите на форуме. Они в любом случае могут пригодиться. Даже если кто-то другой вздумает заняться доработкой макроса.
   

2 Назар

Миша Лорман () 19.10.2002 01:21

Назар, Вы не должны обижаться на то, что реакция ABBYY не всегда является мгновенной. Я нахожусь буквально в таком же положении, но решил, что стоит проявить терпение. Наверняка к ним приходит много разных предложений от пользователей, не только с форума. Да и сами они тоже, наверное, что-то замышляют к следующей версии. Я тоже предлагал в своих письмах идеи международного сотрудничества: создание словарей для 40 языков (и это только для начала!). Кроме того, я готов предоставить ABBYY свою уникальную методику преподавания любого иностраннго языка с помощью Lingvo за 64 дня! Спасибо Вам за Ваш макрос - я обязательно его попробую в своей лексикографической и педагогической работе.
   

Re: Re: Re: Re: Re: Re: Макрос DSL Converter

Назар () 16.10.2002 14:07

Дмитрий, спасибо за замечание. Я обратил внимане на эту деталь ещё во время написания макроса, но как-то так и не собрался с духом ёё поправлять. Может в будущем, когда будет вдохновение.

Зоны индексации: что не надо/нельзя индексировать?

Дмитрий () 14.10.2002 20:56

Вопрос к специалистам ABBYY и вообще к специалистам: что следует исключать из индексации? У меня, например типичная карточка имеет следующую структуру: 1) заголовок, 2) транскрипция, 3) помета с указанием части речи и (if relevant) окончания основных словоформ, 4) перевод или варианты перевода с комментариями и примерами. Транскрипцию и окончания словоформ я не индексирую вообще - тут вроде всё ясно. А вот как быть с переводами, комментариями и примерами, ведь там чуть ли не в каждой карточке встречаются одни и те же предлоги, местоимения и т.п.? Не следовало бы их исключать из индексации внутри зон? А то, например, поиск по слову "что-л." в Lingvo даёт тысячи, а может быть десятки тысяч - устал считать, результатов. Что ещё, согласно вашему опыту, возможно следовало бы исключать? Или в этом нет необходимости, и никому не прийдёт в голову делать поиск по таким словам?
   

Re: Зоны индексации: что не надо/нельзя индексировать?

Дмитрий () 15.10.2002 11:19

Перечитал свой пост на свежую голову и понял, что недостаточно чётко сформулировал вопрос. Идея собственно в том, что в Lingvo, как и в любом словаре, используется некоторое количество слов, которые можно было бы определить как "служебные". Типичный пример это слова "кто-л." и "что-л.", единственная функция которых это пояснение смысла и правил употребления других слов. Не следовало бы как-то формально выделить эту категорию слов и автоматически применять к ним определённые правила индексации, поиска и т.д.?
   

Re: Re: Зоны индексации: что не надо/нельзя индексировать?

от ABBYY Lingvo () 15.10.2002 14:42

Дмитрий, существует концепция "стоп-слов", которые не индексируются, и не ищутся. Однако, это делается не потому, что они не нужны (или вредны), а чтобы сократить размер индекса и время поиска по запросу, содержащему такие частые слова.
В случае словаря почти никакая информация не является лишней. Простой пример - артикль. Что касается "проформ" типа что-л., то и они могут оказаться полезными для поиска. А уж вреда от них - никакого.
   

Re: Re: Re: Зоны индексации: что не надо/нельзя индексировать?

Дмитрий () 15.10.2002 15:56

Спасибо за разъяснение. Правильно ли я понимаю, что эта Ваша концепция "стоп-слов" автоматически распространяется на пользовательские словари?
   

Re: Re: Re: Re: Зоны индексации: что не надо/нельзя индексировать?

От ABBYY Lingvo () 15.10.2002 19:31

Правильно. Принципы индексирования одинаковы. Разумеется, разработчик словаря может управлять зонами индексирования, если очень нужно вывести какое-то слово из-под индексирования.

О пользовательских пополняемых словарях

Гарик () 17.10.2002 18:56

А есть ли возможность экспорта моего пользовательского пополняемого словаря в какой-либо текстовый редактор (Ворд, Эксель) для более глобальной обработки и получения бОльшей обзорности, а также последующей обработки компилятором? Заранее извиняюсь за, может быть, "чайниковский" вопрос, но в Справке Лингво я ничего не нашел.
   

Re: О пользовательских пополняемых словарях

andrua () 18.10.2002 13:28

У меня есть свой собственный макрос, с помощью которого я создал два словаря (Account и Oil&Gas Production). Он построен по принципу обработки строк, т.е. оригинал и первод находятся на одной строке, разделенные каким либо символом. Создай строки из своих пар и обработай моим макросом. Интересно - пиши.
   

Re: О пользовательских пополняемых словарях

ABBYY Lingvo () 18.10.2002 16:22

К сожалению, в текущей версии Lingvo такой возможности нет. Спасибо за вопрос, постараемся реализовать ее к следующей версии.

Оперативная сводка - FreeLang

Назар () 19.10.2002 23:27

Так и не дождавшись конкретного ответа ABBYY по поводу правомерности использования списков FreeLang, я обратился по этому вопросу непосредственно к FreeLang. На сегодняшний день я получил одобрение использования Венгерского словаря от FreeLang. По вопросу Эстонского я успел обратиться дополнительно к его автору (Indrek Hein) и получил благодарность и согласие от него, также как и одобрение со стороны FreeLang. ---
--- Я начал переговоры с FreeLang по поводу совместной работы с Lingvo. Хотелось бы услышать что-то по этому поводу и от ABBYY. Между прочим, одним из первых вопросов со стороны FreeLang было: "А есть английская версия сайта Lingvo?"... ---
--- И действительно, мне например совсем непонятно, почему её до сих пор нет...
   

Re: Оперативная сводка - FreeLang

ABBYY Lingvo () 20.10.2002 02:50

Назар, смотрите ответы на Ваши вопросы темой выше. Английская версия сайта обязательно будет. А сейчас нет потому, что Lingvo пока еще продукт в основном российский.
   

Re: Оперативная сводка - FreeLang

Assagai () 21.10.2002 15:40

Поделитесь секретом, где вы берете исходные тексты словарей? Непосредственно у freelang или авторов? На сайте скачать можно только скомпилированные версии.
   

Re: Re: Оперативная сводка - FreeLang

Назар () 21.10.2002 17:28

Конечно же очень хорошо предварительно связаться с автором или другим лицом ответственным за распространение данного словаря, прежде чем начинать какую-то работу с этим словарём. Часто такое лицо может помочь и посодействовать в планируемой работе.

А словари с FreeLang декомпилируются элементарным образом последовательностью глобальных замен в MS Word.

Сканироварие старых словарей и пр.

Назар () 19.10.2002 23:35

Есть ещё одна интересная идея. Я уже упоминал о сканировании больших санскритских словарей. Особенность этой работы такова, что не должно возникнуть проблем с авторскими правами, поскольку словари эти издавались очень давно. Есть некоторые словари также и других языков, для которых срабатывает этот принцип. Тут можно упомянуть двутомный украинский толковый словарь Гринченка (который был запрещён во времена советской окупации). Этот словарь был издан в начале ХХ столетия. Не захотело ли бы ABBYY взять на себя благородное дело электронизации таких словарей? Если говорить об упомянутых мною работах, как большой санкритско-английский словарь Монье-Виллиамса, восьмитомный петербургский санскритско-немецкий словарь, или толковый словарь Гринченка, то они представляют собой столпы лексикографии и незаменимы на словарной полке любого современного лингвиста.

Работу с украинским словарём Гринченка я мог бы организовать с довольно небольшими расходами скажем во Львове. Но нужен активный интерес и сотрудничество ABBYY. Иначе на определённом этапе у кого-то возникнет вопрос, зачем я запускаю серьёзную работу, нацеливаясь на неконтролируемую мной оболочку, и не убедившись в том, что реализованные в формате Lingvo работы получат должный ход и поддержку со стороны ABBYY. При такой работе не обошлось бы и без украинизации самой оболочки, чего без ABBYY сделать тоже не получится.

А относительно санскритских словарей, а также других старых словарей, то не нашлось ли бы энтузиастов, желающих заняться организацией такого рода работ, или самостоятельно за них взяться? Как насчёт кафедр соответствующего профиля в ВУЗ-ах? Ведь электронизация подобного словаря могла бы быть неплохой работой и для нескольких студентов (как часть курсовой или дипломной работы)...
   

О сканироварие старых словарей, FreeLang и прочем.

ABBYY Lingvo () 20.10.2002 02:44

Уважаемый Назар, во-первых, спасибо Вам за конструктивную активность. Все Ваши идеи заслуживают внимания, некоторые - совпадают с нашими собственными. Однако, не все плодотворные идеи можно тут же и реализовать - ведь у нас имеется определенный план работы, довольно точно расписанный на год вперед. Расширение планов возможно, но мгновенная реакция - вряд ли.

По поводу авторских прав мы уже отвечали на этом форуме. Добавим следующее.

Что касается FreeLang, то мы не планировали вести с ними какие-либо официальные переговоры о переводе в DSL их лексикографических материалов. Мы не изучали специально эти материалы, принципы их формирования и авторской защиты.

На данном этапе мы видели свою задачу в том, чтобы обеспечить пользователей принципиальной возможностью создавать словари под Lingvo. Пусть пока не идеально, но эта задача решена.

Что касается "перевода" под Lingvo уже существующих словарей, то для развертывания этой деятельности сверх задачи комплектования словарной полки Lingvo требуется определенная подготовка, как технологическая, так и юридическая. Мы надеемся, что в следующей версии Lingvo Вы обнаружите существенные изменения в этой области.

Сейчас с авторскими лексикографическими источниками можно работать по двум сценариям:
1. Свободно распространяемые источники могут переводиться в формат DSL кем угодно. Мы готовы представлять свои информационные ресурсы для обмена такими материалами между пользователями Lingvo, но сами обработку таких материалов не планируем ни сейчас, ни в будущем (другое дело - технологическая поддержка). Мы допускаем, что перевод под Lingvo каких-то словарей мог бы поддерживаться учебными или академическими заведениями, заинтересованными в получении удобной среды для работы с этими материалами.
2. Защищенные словари могут переводиться в формат Lingvo только с разрешения правообладателей. Мы занимаемся такой работой только для официального лицензирования словарей, входящих в официальную поставку Lingvo. В следующей версии, кстати, намечается радикальное увеличение числа таких словарей для разных языков. Что касается Украины, то мы надеемся, что здесь оценкой перспектив распространения в составе Lingvo украинских толковых (и прочих) словарей займется наше украинское представительство. Ваши сообщения здесь, на Форуме, безусловно могут подтолкнуть этот процесс. Если соответствующее решение будет принято, будет выпущена специальная украинская версия Lingvo, заключены договоры лицензирования и т.п. Однако, все эти вопросы требуют для решения времени.

С уважением, Владимир Селегей,
рук. лингвистического отдела компании ABBYY
   

Re: Сканироварие старых словарей и пр.

roxfan () 31.10.2002 19:16

Насколько мне известно, международное авторское право действует 50 лет после смерти автора, и 75 лет для компаний. Так что со словарём Гринченка у вас скорее всего проблем не будет, а вот с остальными могут возникнуть вопросы. Насчёт украинизации Лингво: все русские диалоги и строки вынесены в Lingvo1.dll, так что можно просто отредактировать эту dll любым подходящим редактором ресурсов, тут помощь ABBYY не обязательна :)
   

Re: Re: Сканироварие старых словарей и пр.

Vasyl () 10.12.2002 20:05

А существует ли такое понятие как международное авторское право? (не путать з международной охраной)

недостатки компилятора

tolik () 21.10.2002 10:27

1. Зачем программа индексирует для поиска цифры-пункты 1), 2), 3), и я их нахожу при поиске. Цифры вообще не надо индексировать. Такая неприятность происходит только с пользовательскими словарями, надо ставить [!trs]1) [/!trs], иначе позор на вашу голову. Или раз разметка для поиска ставится автоматически, пусть пропускает цифры. 2. Не удаётся менять цвет для помет. Например, тематические пометы зелёным, а грамматические красным. Всё получается зелёным. Поскольку оформление красным цветом важнее, пришлось отказаться от половины помет. Ещё, для вторичной зоны тоже не идут цвета, поэтому вместо [*][ex] лучше сразу ставить эквивалентное [ex][c grey]. 3. Предлагаю, чтобы компилятор выдавал число ошибок, и чтобы после этого программу можно было остановить, видимо она дальше пытается архивировать непригодный словарь, а это занимает время, особенно для китайских словарей. 4. Возникают затруднительные ситуации со словами например "c бухты барахты". Все три варианта (с..., {c }бухты-барахты, бухта-барахта) мне кажутся непригодными. Как быть?.. 5. Если заголовок повторяется, один раз это идёт как ошибка, в другом месте как предупреждение. Почему?
   

Re: недостатки компилятора

assyrinx () 21.10.2002 10:50

Думаю, что разноцветные пометы - это уже экзотика. Хотя в принципе это можно сделать, расширив тег [p]. Но есть другое предложение к ABBYY. Можно вообще некоторые цвета сделать настраиваемыми, дав возможность выбора цвета, например, для помет, основного текста, вторичной зоны (которую вообще можно не выделять цветом). И желательно, чтобы все это было привязано к конкретным словарям. Светлана.
   

Re: Re: недостатки компилятора

reply from tolik () 22.10.2002 14:45

(1) Смена цветов - это уже работает в окне Настройки (2) Я глянул в Словарь Розенталя и решил оформлять как там: {c }бухты-барахты. Плохо, что несортируемая часть не отображается в САМОЙ карточке. Видимо существующие словари это возможность не очень используют, и такой пункт не проработан. (3) Выделение красных помет актуально для грамматики, где приводятся нестандартные формы, и красный цвет обращает внимание.

о несовершенстве русских парадигм

assyrinx () 21.10.2002 10:49

Здравствуйте, ABBYY! Размышляя о "бухте-барахте" из предыдущего сообщения форума, пришла к 2 выводам. 1. Что русские парадигмы немного упрощены. В частности, в русском языке есть составные наименования, в которых склоняются обе части. Например, ковер-самолет, платье-костюм и пр. В стандартном словаре Lingvo парадигмы для этих слов отсутствуют. Попытка их ввести окончилась неудачей, т.к. первая часть никак не хочет склоняться. Поэтому поиск не даст результатов ни по фразе "ковры-самолеты", ни по фразе "бухта-барахта". 2. Что вам все-таки что-то нужно делать с дефисом (я уже раньше писала по поводу double-header), потому-что поисковая система не находит фразу "бухты барахты", хотя в словаре она есть, только "бухты-барахты". Не находит и "ковер самолет". По-моему, это неправильно. Дефис не такая уж важная часть слова. Светлана
   

Re: о несовершенстве русских парадигм

От ABBYY Lingvo () 22.11.2002 11:18

Светлана, спасибо за замечания и извините за длительное молчание. Что касается дефиса, то Вы абсолютно правы и в следующей версии обработка такой ситуации предусмотрена.
Что касается парадигм (и поиска)сложных слов с внутренним словоизменением, то мы не можем твердо обещать, что решим эту проблему быстро. Но разработчикам предложения переданы.

 
НА ПРАВАХ РЕКЛАМЫ
устный перевод    технический перевод    перевод сайтов