1
11435
Газета Наука Интернет-версия

14.03.2018 00:01:00

Электронные словари не так новы и надежны, как думает большинство пользователей

Потенциал компьютерной лексикографии явно преувеличен

Анатолий Череповский

Об авторе: Анатолий Викторович Череповский – кандидат технических наук, геофизик, член Европейской ассоциации геоученых и инженеров (EAGE).

Тэги: компьютер, лексика, словарь, электронный словарь, лексикография


компьютер, лексика, словарь, электронный словарь, лексикография Если судить по цифрам продаж, то электронные словари одержали полную и безоговорочную победу над бумажной справочно-энциклопедической литературой. Фото Уткаршрая Атмарана

Электронные переводные и энциклопедические словари стали появляться тогда, когда их платформа – персональные и портативные компьютеры – стала массовой и доступной, то есть 20–25 лет назад. И уже более 15 лет в Интернете ведутся энергичные споры о сравнительных достоинствах и недостатках электронных и бумажных словарей. Тем временем переводчики и технические специалисты сделали однозначный выбор в пользу электронных словарей.

Количественная победа

Если судить по цифрам продаж, то электронные словари одержали полную и безоговорочную победу. Что не удивительно. Никому не интересно покупать дорогие и увесистые книги и тем более брать их с собой на работу и в командировки, если на рынке предлагается целый ряд электронных словарей. Они занимают не так много компьютерной памяти, но содержат миллионы слов и словосочетаний... К тому же некоторые авторы электронных словарей приняли новую бизнес-модель и предлагают доступ в Интернете совершенно бесплатно!

Электронные словари одержали победу над бумажными предшественниками благодаря явному превосходству по множеству параметров: цена, объем словников, скорость и простота поиска. Но это скорее количественные, а не качественные показатели.

Ожидалось, что электронные словари станут не просто введенными в компьютер бумажными словарями, снабженными удобными средствами поиска и отображения, а «особыми лексикографическими объектами, в которых могут быть реализованы многие продуктивные идеи, не востребованные по разным причинам в бумажных словарях». Так писал специалист в области компьютерного моделирования естественного языка и электронной лексикографии Владимир Селегей в известной статье «Электронные словари и компьютерная лексикография». Опубликован этот текст был более 15 лет назад.

Помимо перечисленных выше количественных показателей к потенциальным преимуществам электронных словарей изначально относили частые обновления и коллективное авторство. В упомянутой выше статье Селегей утверждал: «Для электронных словарей характерны частая смена версий и наличие постоянной обратной связи с тысячами пользователей. Поэтому компьютерная лексикография – это неизбежно актуальная лексикография». Но он сразу же делал оговорку, что речь идет о тенденциях и потенциальных возможностях, часть которых еще не реализована или даже не осознана.

Стали ли эти потенциальные возможности реальностью за последнее десятилетие? Поднялось ли содержание электронных переводных словарей на какую-то качественно новую ступень? Так ли распространена частая обновляемость и так ли положительно коллективное авторство? Я хочу привести примеры, которые иллюстрируют, что на практике все неоднозначно, как и со многими другими благими идеями и намерениями...

Лексикографы – на выход!

Сначала о частой обновляемости. Электронные переводные словари, ставшие популярными в 1990-е годы – такие как Lingvo (компании ABBYY) и «Контекст» (компании «Информатик»), – родились и расширялись в основном благодаря копированию старых добрых бумажных словарей. Несмотря на миллионы пользователей этих программных продуктов, они оставались малоприбыльными – в том числе из-за очень высокой распространенности пиратских версий, продававшихся тогда на каждом углу по бросовой цене...

Низкая прибыль не позволяла содержать достаточный штат лексикографов и редакторов-экспертов и лишала возможности расширять тематику электронных словарей за счет приобретения новых специализированных бумажных словарей у авторов и издателей. В результате бумажные словари по многим темам и отраслям переиздавались и обновлялись гораздо чаще, чем соответствующие разделы в ведущих электронных словарях. И совершенно несправедливо обобщать, что бумажные словари – это терминологические кладбища или неизбежно устаревшие словари. Далеко не все из них.

Рассмотрим ситуацию с терминологией, относящейся к геологии, геофизике и нефтегазовой отрасли. Такая терминология не обновлялась в самых известных электронных словарях с конца прошлого века.

Например, в Lingvo геофизическую тематику можно найти только в Большом англо-русском словаре по нефти и газу, являющемуся копией бумажного словаря, подготовленного отделом переводчиков ВНИИГАЗа и изданного в «РУССО» (Москва, 1998). Этот словарь ВНИИГАЗа не подвергался существенному редактированию или обновлению в Lingvo, судя по тем грубым ошибкам и опечаткам, которые были перенесены из исходного бумажного словаря. А ведь за последние 20 лет было издано более десятка переводных и энциклопедических словарей по геофизике, и каждое новое бумажное издание пополнялось 1–2 тыс. терминов.

Спор о 15 тысячах терминов

Не вполне понятно, почему Владимир Селегей в той же статье, о которой говорилось выше, так иронично отозвался о «тестерах», бескорыстно высылающих свои поправки или предложения по улучшению тех или иных словарей: «Жизнь электронного словаря должна быть похожа на нелегкую жизнь других программных систем: с маниакальным стремлением особо вредных пользователей обнаружить очередную ошибку или лакуну...»

Я и мои друзья, технические переводчики, не раз предлагали свои услуги по обновлению геофизической тематики и исправлению ошибок во время встреч с менеджерами одной из компаний, выпускающей электронные словари, но контакт не получился: «У нас свои эксперты!» К тому же геофизика рассматривается ими как слишком узкая область, ради которой не стоит прилагать усилия. Заметим, что это примерно 15 тыс. терминов.

Что тогда говорить о действительно узкоспециальных бумажных словарях (мелких рыбках!), объемы которых составляют зачастую первые тысячи терминов из всего словника. Дойдет ли когда-нибудь электронизация до таких малозаметных книг? На самом деле они очень интересны тем, что содержат редкие терминологические эквиваленты, которые больше нигде не найдешь. Но их тиражи настолько малы (100–200 экземпляров), что они распространяются по большей части среди друзей и коллег.

Все сказанное выше о лицензированных (продаваемых) электронных словарях относится и к более молодому поколению многоязычных онлайн-словарей (бесплатных в Интернете). Тайна возникновения «собственных баз данных» объемом в миллионы слов и словосочетаний в современных онлайн-словарях – это предмет отдельного исследования. Здесь я просто констатирую, что у этой интернет-медали две стороны: рай для потребителей и кошмар для правообладателей и продавцов книг.

В России известны случаи рассмотрения в судах исков о заимствовании словарей, но такие гражданские дела могут длиться годами и, как правило, не заканчиваются в пользу истцов, авторов специализированных бумажных словарей. Даже в Европе, где суды более независимые, два дела о плагиате были проиграны истцами-лексикографами (со слов одного из менеджеров Европейской ассоциации геоученых и инженеров из Нидерландов).

Видимо, авторам словарей и справочников нужно морально готовиться к неизбежному: свободному распространению информации во Всемирной паутине. Сторонники такой идеи несколько лет назад зарегистрировали в Швеции свое движение как новую «религию». Правда, трудно себе представить дальнейшую кропотливую работу смиренных энтузиастов-лексикографов, годами собирающих свои глоссарии, которые им НИ-ЧЕ-ГО не принесут. Ни денег, ни славы. Ведь Интернет и сегодня очень мало заботится об авторстве, и онлайн-словари не только бесплатные – они еще, как правило, и безымянные!

Автор-локомотив

Рентабельность онлайн-словарей (или, как их называют, переводческих интернет-ресурсов) зависит в первую очередь от рекламодателей. Но покупку большого количества авторских специализированных словарей сложно «отбить» за счет размещения рекламы. Поэтому недостатки онлайн-словарей точно такие же, как и у лицензированных электронных словарей.

Нетрудно убедиться в том, что, к примеру, в «Мультитране» геофизическая терминология относится к 1998 году, как и в рассмотренном выше Lingvo. Анализ словников «Мультитрана» и «Академика» показывает, что источники геолого-геофизической терминологии были, без сомнения, одни и те же и не обновлялись с 1998 года.

Теперь о коллективном авторстве. Во все времена даже самые объемные толковые и переводные словари составляли, как правило, индивидуально, а не коллективно. Кто не знает имя Владимира Даля и его Толковый словарь живого великорусского языка, содержавший около 200 тыс. слов и 30 тыс. пословиц?

Кто-то может вспомнить и знаменитый тандем Ф.А. Брокгауза и И.А. Ефрона и их многотомный Энциклопедический словарь, содержавший более 120 тыс. статей и 7800 иллюстраций. Но в этом случае не имело места равное партнерство: словарь изначально вышел на русском языке как перевод статей энциклопедии Брокгауза с небольшой адаптацией для русского читателя. Ефрон, будучи владельцем типографии в Петербурге, выступал как издатель всех дореволюционных русскоязычных энциклопедий. Кстати, в расширение и редактирование Энциклопедического словаря Брокгауза и Ефрона внес значительный вклад наш знаменитый химик Дмитрий Менделеев, заведовавший химико-техническим и фабрично-заводским отделами энциклопедии.

В некоторых случаях имела место преемственность лексикографов: например, С.И. Ожегов, участвовавший в составлении Толкового словаря русского языка Д.Н. Ушакова до Второй мировой войны, во второй половине ХХ века выпустил исправленные и дополненные издания Словаря русского языка, только под своим именем. С 1970-х годов над этим словарем также работала Н.Ю. Шведова, и с 1992 года стали выходить обновленные издания Толкового словаря русского языка уже под именами С.И. Ожегова и Н.Ю. Шведовой.

Что касается крупнейших переводных словарей, то здесь тоже редко обходилось без помощников. Но всегда выделялся основной автор, выполнявший львиную долю лексикографической работы и бравший на себя всю ответственность, ставя свое имя на обложку. Вспомним такой советский бестселлер, как Англо-русский словарь В.К. Мюллера, содержавший более 53 тыс. терминов и переиздававшийся десятки раз тиражами, превышавшими 100 тыс. экземпляров.

Однако в последнее десятилетие в России часто печатались переводные и энциклопедические словари, в выходных данных которых значилось до 20 (!) соавторов. Большое количество авторов в современных словарях часто объясняется конъюнктурными соображениями и совсем не обязательно свидетельствует о коллективной лексикографической работе. В действительности у каждого словаря был и есть конкретный автор-локомотив!

Почему же тогда коллективное авторство часто подается как потенциальное преимущество компьютерной лексикографии? Рассмотрим подробнее механизмы формирования современных электронных словарей. Их, собственно, всего два:

1. «В новые электронные мехи переливают старое доброе лексикографическое вино» (по выражению Владимира Селегея). Или, приземленнее, создается салат из авторских бумажных словарей, компоненты которых уже невозможно отследить и учесть. Да и зачем? Ни имя «повара», ни происхождение компонент массовому потребителю совершенно не интересны.

2. Постоянная обратная связь с десятками и даже сотнями пользователей, присылающих свои поправки и целые глоссарии на рассмотрение штатных редакторов (в случае лицензированных электронных словарей) или непосредственно вносящих новые слова и словосочетания в общедоступную текущую версию (в случае некоторых онлайн-словарей).

Казалось бы, эти два механизма вместе должны обеспечить полноту и актуальность современных электронных словарей, но... Последние на деле могут уподобиться безразмерным мешкам со всякой всячиной. «Там можно найти всё!» – радуются одни пользователи. «Там ничему нельзя верить», – расстраиваются другие.

Чтобы энтропия (мера беспорядка) в этом мешке оставалась приемлемой для массового потребителя, кто-то должен энергично и компетентно вмешиваться в оба процесса. И выполнять эту колоссальную и кропотливую работу по наведению порядка должны конкретные эксперты, а не коллективы. Хорошо бы, чтобы эти эксперты были уровня Менделеева, как в описанном выше случае Энциклопедического словаря Брокгауза и Ефрона.

Возможно, каждая компания-разработчик электронных словарей гордо заявит, что у нее есть свои эксперты. Но, в соответствии с приведенными в данной статье фактами, штатным экспертам упомянутых выше компаний можно предъявить следующие претензии:

– не всем фундаментальным и прикладным наукам одинаково повезло. Есть науки и отрасли, которые не обновляются в электронных словарях уже 10–15 лет, и есть такие предметные области, которые до сих пор не попали под горячую руку тотальной «электронизации»;

– большое количество опечаток и ошибок, перенесенных из современных бумажных словарей, которые теперь выходят в свет в многочисленных частных издательствах без участия профессиональных редакторов и корректоров. Ошибки приумножаются и неидеальным сканированием бумажных словарей;

– опечатки и ошибки, добавленные непроверенными активистами обратной связи (тестерами).

Таким образом, потенциал компьютерной лексикографии все еще далек от полной реализации. И я бы с большой осторожностью говорил о преимуществах коллективного авторства и тем более обезличенной лексикографии. Мне видится, что роль личности в лексикографии преуменьшать нельзя. И если не сохранить Автора, не сохранить хоть какую-нибудь мотивацию для его подвижнической работы в эпоху де-факто свободного распространения информации, то «переливать в новые электронные мехи» скоро станет просто нечего.


Оставлять комментарии могут только авторизованные пользователи.

Вам необходимо Войти или Зарегистрироваться

комментарии(1)


Тамара 08:33 14.03.2018

Чрезвычайно интересная статья, написанная профессионалом - автором узкоспециального геофизического англо-русского словаря....



Комментарии отключены - материал старше 3 дней

Читайте также


До полноценного биокомпьютера остался один шаг

До полноценного биокомпьютера остался один шаг

Игорь Лалаянц

Нейрональный органоид, выращенный из стволовых клеток, уже умеет распознавать голоса

0
11441
Новости науки. Как наш мозг принимает рискованные решения?

Новости науки. Как наш мозг принимает рискованные решения?

0
9404
Кибернетический круг Павла Флоренского

Кибернетический круг Павла Флоренского

Владислав Дмитриев

Искусственный интеллект – дело рук конкретных людей

0
20816
1. Нейросеть ChatGPT признали конкурентом мозгу человека

1. Нейросеть ChatGPT признали конкурентом мозгу человека

Вскоре чат-боты смогут сами создавать системы искусственного интеллекта

0
7667

Другие новости