Большой курган и около него
В проект добавлен
Большой курган Скифопедии, созданный мною на базе «Большого российского энциклопедического словаря» (2005; сокращенно – БРЭС). Я уместил его всего на 18 веб-страницах общим весом 33,5 Мб, плюс 242 Мб рисунков; в таком компактном виде БРЭС появился в Интернете впервые. Размер отдельных страниц – от 1,5 до 2,5 Мб; поэтому они грузятся довольно быстро (запланирован ряд мероприятий, позволяющих еще более ускорить загрузку).
Рисунки можно просмотреть для букв
А,
В и
Ч-Я. Те, что подчеркнуты синей чертой (их подавляющее большинство), являются превьюшками; щелчок по ним выводит полномасштабное изображение. Над экспозицией рисунков для других букв работа продолжается; она довольно-таки кропотлива.
Заглавия статей выделены бордовым цветом, причем ударные гласные имеют меньший размер, чем остальные буквы. Для большей наглядности я постепенно окрашиваю эти гласные в
синий цвет, как это уже сделано для
Ч-Я.
Красные буквицы
В материалах «Набора лоций» широко используются
красные буквицы. Они позволяют пометить (снабдить якорем со ссылкой на самого себя) любое место в любом тексте. На «Большом кургане» красные буквицы стоят первыми в заглавиях некоторых статей (или вторыми, если первая является синей ударной гласной). Примерами того и другого служат статьи
Я, я и
юсы, связанные взаимными ссылками.
При щелчке на красную букву в адресной строке браузера появляется индивидуальный url данной статьи, по которому на статью может сослаться любой юзер Интернета. Число таких статей на «Большом кургане» (и на других курганах) будет возрастать.
Сокращения и добавления
Познакомьтесь также с
Приложениями – четырьмя списками всевозможных сокращений, позволивших издателям вместить в однотомный БРЭС максимум текста.
«Большой курган» – понятие более широкое, чем БРЭС. Сохраняя неприкосновенным текст полиграфического издания словаря, Курган допускает некоторые добавления, сделанные
зеленым шрифтом, например, даты смерти лиц, скончавшихся после издания БРЭС.
Матрицы
Еще важнее так называемые «матрицы» – специальные добавления (тоже зеленым шрифтом), сделанные в текстах некоторых статей и заключенные в фигурные скобки {}. Чтобы объяснить смысл матриц, сначала кратко охарактеризую, что представляет собой Скифопедия в своем нынешнем состоянии. В нее входят:
1)
Ядро – собрание статей, каждая из которых оформлена в виде отдельного html-файла, подобно статьям «Андреевской энциклопедии» (АЭ).
2)
Курганы – алфавитно упорядоченные, состоящие из одной или нескольких веб-страниц справочники, в которых число статей на одной странице – от нескольких сот до нескольких тысяч.
«Большой курган» (сокр. Бол), отображающий БРЭС,– единственный универсальный словарь в Скифопедии, причем первенствующий по количеству статей. Все остальные словари – специализированные, профилированные. Двумя новинками, например, являются
Философский курган на базе «Краткой философской энциклопедии» (1994), содержащий более 3500 терминов и персоналий философии, логики, психологии, этики и эстетики, и
Христианский курган (сокр. Хр) на базе словаря «Христианство» (1994). Готовятся к загрузке словари библейские, религиоведческие, мифологические, по искусству, литературе и истории.
Существенен тот факт, что одноименные статьи, освещающие одно и то же понятие или имя, но с разных сторон, могут находиться и в АЭ, и в Ядре, и на некоторых курганах. Например, немецкому философу и теологу
Шлейермахеру посвящены статьи и в Бол, и в Фил, и в Хр.
Матрицы позволяют читателю, если он пожелает, познакомиться со всеми этими статьями, а иногда даже заглянуть по ссылке в Википедию. Для этого в статью о Шлейермахере
в Бол вставлена матрица
{Фил Хр }, в статью о нем же
в Фил – матрица
{Бол Хр}, и, наконец,
в Хр – матрица
{Бол Фил}.
– это пиктограмма Википедии, она (как и все ссылки, ведущие за пределы «Набора лоций») подчеркнута коричневой линией. Обратим внимание, что ссылка на Википедию включена только в одну из матриц и не дублируется в других. В матрицу какой именно статьи – об этом говорится в конце следующего раздела.
Вот второй пример, с участием АЭ – статья
«Чудо». В
АЭ помещена матрица
{Бол Фил Хр },
в Бол –
{АЭ Фил Хр} и т.д.
Третий пример, с участием Ядра – статья
«Циолковский». Матрица
в Бол –
{Ядро Фил},
в Ядре –
{Бол Фил },
в Фил –
{Бол Ядро}.
С появлением в Скифопедии новых курганов в уже имеющиеся матрицы можно добавлять новые элементы.
Таким образом, элементами матриц являются гиперссылки на статьи-тёзки во всех справочниках «Набора лоций». Понятно, что это удобство применяется ограниченно, т.е. только к статьям, попавшим в поле моего зрения, ибо полное сличение словников десятков словарей, содержащих десятки тысяч статей – задача не для моих скромных сил и возможностей.
Приоритеты при ссылках
А что же попадает в поле моего зрения? Здесь самое время вспомнить, что «Набор лоций» – это гипертекстовая библиотека, в которой справочникам отведена прикладная роль – обеспечивать формирование локальной гипертекстовой сети проекта. Попросту говоря – служить мишенью для гиперссылок из книг, размещаемых в проекте (ну и, попутно, обмениваться ссылками между самими справочниками).
Вот при работе с текстами я и выявляю, какие имена и термины требуют ссылок на словари, а потом гляжу в словари, оформляю новые красные буквицы, матрицы и т.п.
Но если наличие статей-тёзок в разных словарях – случай довольно частый, то на которую же из них ставить ссылку в текстах? Эту проблему я решил установлением приоритетов справочников. Приоритет №1 имеет АЭ, на нее даются ссылки в первую очередь. Ее статьи рассматривают имена и термины в андреевском контексте, а «Набор лоций» – проект андреевский; так что выбор приоритета понятен.
Если соответствующей статьи в АЭ нет, ссылка дается на «Большой курган» (приоритет №2). Такая важная роль связана с богатейшим составом БРЭСа, с лаконичностью предоставляемой им информации – юзер сразу улавливает квинтэссенцию, а если захочет, может, руководствуясь матрицей, путешествовать дальше, за подробностями.
И только если соответствующей статьи нет и в БРЭСе, ссылка дается на один из специализированных курганов или на Ядро (приоритеты №№ 3, 4 и ниже).
А теперь – обещанное разъяснение насчет Википедии как элемента матрицы. Ссылки на Википедию я включаю только в матрицы статей АЭ и Ядра, даже при наличии их тёзок на курганах; для статей же, которых в АЭ и Ядре нет – в матрицу курганной статьи с наивысшим приоритетом.
Сам я садик насаждаю, сам и буду поливать
Из сказанного явствует, что мы пока имеем дело со стартовыми версиями Большого, Философского и Христианского курганов, которые предстоит полоть, удобрять, поливать и растить (что, впрочем, справедливо и вообще для всех материалов «Набора лоций»). Здесь (если не считать нескольких pdf-файлов) нет окончательных версий, которые можно давать на скачку, да еще в разных форматах – зачем дублировать то, чем и так уже забит весь Интернет? Дублированием пусть занимаются создатели библиотек всевозможных «замков», «фракталов» и т.п., а нам подавай продукт, какого еще нет в Сети, какой создается лишь собственным тяжким трудом. Программистов моего поколения таким трудом не напугаешь – наша косточка крепла на программах, создаваемых вручную в двоичных кодах, когда никаких алгоритмических языков не было еще в помине.
Приведу пример с прополкой. В Фил есть статья
«логистика», где присутствуют несколько весьма специфичных символов математической логики (я этой наукой некогда занимался, применил ее в своей кандидатской диссертации и в дальнейших научно-технических разработках). Если погуглить «логистику», каких только отображений этих символов ни увидишь! – и ни одного правильного. Грамотно эти символы напечатаны в полиграфическом издании словаря и именно так отображены в моем файле. Сколько уже подобных сорняков я выполол, работая над своим проектом!
Что касается Хр, то видно с первого взгляда, насколько файл сыроват. Его еще чистить и чистить от ошибок распознавания. Дело в том, что в бумажной версии этого словаря в заглавиях статей проставлены ударения, а файнридер не считывает правильно гласные с ударениями (а также, кстати, тексты в дореволюционной орфографии, где он хромает на ятях, фитах, ижицах и даже, почему-то, на i; спотыкается он и на буквах латиницы с умляутами, седилями и прочей диакритикой). Что делают наши сетевые доброхоты? Помещают в Интернет выданный файнридером текст «как есть», ибо осуществлять корректуру, выискивая глюки – дело затяжное и громоздкое. Но ИМХО уважение к читателю должно превалировать, и я не жалею времени на правку сырых текстов. Доведу и Хр до ума.
А проблемы с ударениями над гласными возникают не только при распознавании, но и при поиске по веб-странице. Вот почему я крашу ударные гласные в синий цвет, а не ставлю ударения,– цвет на поиск не влияет.