Электронные библиотеки, объединяйтесь!
Слово о Compulib'е
( Вкратце | Искалки и статистика | О ключах | О копирайтах | Прочие ссылки )
Эта страница отражает субъективное мнение ее автора о развитии проекта Compulib и других идеях по поводу литературы в Интернете
ВКРАТЦЕ:
Compulib задуман для облегчения поиска литературных текстов в Сети путем разработки стандарта ключевых слов, по которым их смогут находить искалки. В принципе, идея применима для текстов на любом языке, но пока мы на иностранные языки не замахиваемся.
Одно из основных моих разногласий с Борисом (инициатором Compulib) - следует ли всем, кто захочет применять у себя Compulibовские ключевые слова, вступать с нами в переписку, регистрироваться и т.п. Борис считает, что это, как минимум, желательно. А по-моему основное достоинство его идеи - то, что она может работать как открытая система. Каждый способен присоединиться к ней явочным порядком - просто вписав на страницу ключевые слова и послав ее адрес в искалку. Если он при этом что-то перепутает - никто кроме него особенно не пострадает.
Регистрация библиотеки и персонального ключевого слова должна считаться не обязанностью и даже не жестом хорошего тона, а скорее привилегией, за которой может обращаться тот, кому не лень.
Еще мне не нравится, что у Бориса даются вперемешку стандарты (т.е. нечто обязательное, без чего поиск просто не сработает) и рекомендации (например о том, как решать проблемы фреймов и ФТП-сайтов), из чего может возникнуть впечатление, что присоединиться к системе гораздо сложнее, чем это есть на самом деле.
Официальная страница проекта Compulib
Официальная страница списка рассылки Compulib - для тех, кто хочет участвовать в разработке стандарта.
Compulib-форум на сервере "Русская фантастика" (NB: Основная дискуссия ведется в листе рассылки).
Компьюлибовская страница библиотеки М.Мошкова
ПРИМЕРЫ ЗАПРОСОВ / ДОКЛАД О МАСШТАБАХ УСПЕХА:
Автомат для генерирования запросов в Альтависту (JavaScript) стоит на официальной странице Compulib
По состоянию на 21 марта 1998:
ВНИМАНИЕ! С тех пор (в конце марта) Альтависта "смешала языки" и теперь русских страниц не находит, если к запросу не добавить "&enc=cp1251" или "&enc=koi8r". Я нижеуказанные УРЛы запросов пока не переправил, буду разбираться с новыми стандартами
AltaVista, признаваемая официальной главной искалкой Компьюлиба, выдает
- по запросу CompuLib 1752 документа;
- по запросу +CompuLib +LibMain - 27 (из них только 7 - у Мошкова)
- по запросу +CompuLib +LibAuthor - 1611
- по запросу +CompuLib +LibBook - 1596
- по запросу +CompuLib +LibBook +LibAuthor - 1593. Подавляющее большинство, вроде бы - из разных зеркал Библиотеки русской фантастики (хотя ее персональным ключом помечены только 364 страницы, точнее - только на 364 был персональный ключ на момент индексации Альтавистой)
Как нетрудно догадаться из арифметики,
- по запросу +CompuLib +LibAuthor -LibBook - 18 (из них 7 - в Фантастике, 6 у Мошкова, 3 у меня).
по запросу +CompuLib +LibBook -LibAuthor - 3 (Это списки новых поступлений в Библиотеку русской фантастики)
NB: При поиске по ключам LibBook и особенно - LibMain стоит не забывать добавить главный ключ - CompuLib, т.к. два упомянутых слова применяются на англоязычных сайтах в разных значениях.
- страниц, отмеченных персональными ключами, нашлось: LibRUSF - 364; LibRusLit - 29; LibBorisba - 13; LibMoshkow - 8
Не понимаю, как Дмитрию Ватолину удалось послать в Альтависту столько своих страниц Неужели вручную!? А может у него какой хитрый робот есть?
Другие искалки:
По моему субъективному мнению неплохо бы все-таки приспособиться к какой-нибудь русской искалке. Все-таки, во-первых, обе известнейших искалки - Рамблер и Яндекс научились по запросу в любой русской кодировке находить страницы во всех кодировках. Во-вторых, Яндекс к тому же насчет падежов понимает.
И главное: в отличие от Альтависты, обеим русским искалкам не приходится посылать каждую страничку вручную: они все индексируют сами.
К сожалению, Рамблер (а кажется и Яндекс тоже) принципиально не индексируют содержимое раздела "META". И если они намерены так вести себя и дальше - остаются два выхода - либо дублировать ключи "скрытым" (<!-- ... -->), а то и открытым текстом, либо махнуть на них рукой.
По состоянию на 21 марта 1998:
Rambler по запросу Compulib находит 46 страниц. Строчности/заглавности эта искалка не разумеет. Все найденные страницы - служебные, т.е. дискуссия, а не сами тексты.
Яndex находит
- по запросу Compulib 13 документов,
- по запросу CompuLib - 33, из которых 29 - зеркала Мошкова.
Дело в том, что Яндекс (в соответствии со своими правилами) воспринимает слово Compulib как написанное именно таким ("правильным") образом, а слово CompuLib - как написанное "как попало".
Эти страницы в основном тоже служебные. Кстати, на некоторых из них (в том числе на фасаде у Мошкова) ключевое слово оказалось в "кейвордовом" (с большой L) начертанием это упущение, мы договаривались употреблять его "всуе" только с маленьким "l"..
HotBot - очень мощная и частоиндексирующая заокеанская искалка находит 236 страниц, но понять, что есть что невозможно, т.к. она пожирает большинство русских букв.
У HotBotа уже есть национальная версия - японская. Но, видимо, японские символы сосредоточены не в той части второй половины кодовой таблицы, где русские, поэтому большинство русских символов она глотает. Авось дождемся всепланетарно-подходящей версии.
Кусочек истории и статистика дискуссии: Началось с письма Б.Бердичевского М.Мошкову в рубрику "Безумные идеи вокруг Интернета" (4 сентября 1997). В тот же день Мошков в ответе Бердичевскому помечтал о мэйл-листе. 16 сентября я написал письма обоим. Две недели в тройственной переписке прообсуждали другие варианты: ньюсгруппа, вебборд, залинкованные веб-страницы, общий почтовый ящик на hotmail. Тем временем Борис разослал по библиотекам приглашение к дискуссии. 5 октября к переписке присоединились Д.Ватолин и А.Зубарев.
Mail-list создан Д.Ватолиным 9 октября 1997. Число подписчиков к 13 октября 1997 - 5 человек, к 27 октября - 10, к 25 ноября - 13, к 30 марта 1998 - 81 человек, к 20 июня 1998 - 110 человек. До конца 1997 года по листу прошло 185 писем, к концу марта 1998 - 299, к 30 июня - 391.
В марте 1998 мы решили подвесить старую переписку в заархивированном виде в Интернете. Когда у Дмитрия будет время, он это сделает.
О КЛЮЧАХ: НЫНЕШНЕЕ СОСТОЯНИЕ И ДАЛЬНЕЙШАЯ РАЗРАБОТКА:
У нас сейчас официально признаны 8 ключей, из которых реально задействованы 5.
Ключи можно расклассифицировать на "позитивные" и "негативные". Негативные придуманы в основном для того, чтобы искать страницы ЗА ИСКЛЮЧЕНИЕМ ими помеченных. Поэтому-то их мало кто ставит.
Вот полный список придуманных ключей:
CompuLib - ставится на каждой странице электронной библиотеки
LibMain - для одной заглавной страницы в каждой библиотеке. Допускается дублирование - если существует несколько заглавных страниц в разных кодировках. Если же существует несколько главных страниц для "жанров" (как у Фарбера) - просьба все-таки выбрать из них одну "самую главную", а остальные увязать с нею ссылками.
LibAuthor - после некоторых споров о том, какая страница должна быть помечена этим ключом - та, где перечислены авторы, или та, которая относится к одному из них, сформулировано такое определение: "Среди страниц, в которых упомянуты авторы произведений, ключевым словом "LibAuthor" помечаются те из них, из которых наиболее кратчайшим путом через ссылки можно попасть на список произведений данного автора, либо собственно такой список."
LibBook - аналогично: "Среди страниц, в которых перечислены названия книг(произведений) ключевым словом "LibBook" помечаются те из их, из которых наиболее кратчайшим путем через ссылки можно попасть на сами книги(произведения). Поскольку Борис считает, что собственно тексты книг в бродилку грузить не стоит (например, у него большинство книг лежат в ЗИПе), он сформулировал для пометки этим ключом самих книг такое условие: "Если книги записаны в формате HTML, по желанию ведущего можно ввести этот ключ в сами книги (в этом случае необходимо добавить и ключ "LibTexts")."
LibGenre Ключ пока не действует. Пора бы заняться придумыванием подходящих сопровоздающих слов для обозначения жанров.
Наверное, легче всего плясать от достигнутого: какие именно ключевые слова для обозначения жанра УЖЕ применяются участниками проекта и сочувствующими, т.е. уже ищутся в Альтависте. Например, в одной из страниц Библиотеки русской фантастики я обнаружил такие ключи: fantastika, avtory, pisateli, avtor, pisatel', roman, povest', knigi.
Вопрос - стоит ли делать их латинскими или кириллическими, по-русски или по-английски. Много аргументов есть и за и против каждого варианта.
Это все были позитивные ключи. А теперь - негативные.
Lib** - Персональный Ключ, где ** - не менее двух и не более восьми знаков, которыми могут быть только цифры или буквы (optional). Введен по инициативе хозяина крупнейшей библиотеки - Максима Мошкова - с целью создать возможность поиска во всех библиотеках ЗА ИСКЛЮЧЕНИЕМ какой(-их)-то конкретной(-ых). Ставится на всех страницах библиотеки. Ключ для своей библиотеки можно зарегистрировать у Бориса на официальной странице проекта. Применение этого ключа дает привилегию быть помещенным в список зарегистрированных библиотек на той же странице, так что кое-что позитивное в нем есть. На 22 марта 1998 зарегистрировано 9 персональных ключей. А два ветерана дискуссии в мэйл-листе хотя и числятся там, но до сих пор не сделали себе ключи. Для сравнения, в проекте Новости электронных библиотек - 8 участников.
LibLinks - ключ придуман, чтобы помечать им библиотеки, которые в значительной части (конкретно по цифрам не решили) состоят не из текстов, а из ссылок на другие сайты.
LibTexts - ключ придуман Борисом в качестве противовеса моему предложению ставить ключ LibBook в сам текст соответствующей книги. По мнению Бориса, в browser стоит вызывать только оглавления, но не сами книги, и если уж кто снабжает ключом LibBook файл в несколько сотен килобайт, ему следует поставить рядом LibTexts, чтобы такие файлы можно было исключить из результатов поиска. Я по-прежнему не понимаю, почему их надо исключать и почему размер файла нельзя просто посмотреть в Альтависте. Но если книга разделена на несколько глав, то помечать LibBookом каждую из них в отдельности не стоит, я согласен. В этом случае LibBook уместней в файле-"оглавлении" или "заголовке" этой книги.
Ключи вписываются в шапку HTML-файла (между "TITLE" и "/TITLE") следующим образом:
<META NAME="keywords" CONTENT="CompuLib">
или:
<META NAME="keywords" CONTENT="CompuLib, Libmain">
или:
<META NAME="keywords" CONTENT="CompuLib, LibAuthor, LibBook">
и т.п.
Их можно (и обычно - нужно) совмещать в зависимости от структуры библиотеки.
ВОПРОСЫ КОПИРАЙТА:
Между двумя крайними мнениями (можно все / можно только то, что разрешили авторы) большинство участников Compulib-дискуссии выбирают такой подход: в Сети можно размещать любые тексты до тех пор, пока автор (правопреемник) не выскажет возражения.
Кстати, все произведения переходят в общественное достояние через 50 лет после смерти автора. То есть произведения авторов, умерших до 1948 года могут сейчас свободно воспроизводиться без выплаты гонораров его наследникам. Хотя есть нюанс: до принятия закона 1993 года в России действовал срок 25 лет, так что юристы до сих пор спорят, была ли в 1993 году возвращена охрана книгам, попавшим в интервал 1943-1968, или тексты всех, кто умер до 1968, не охраняются. И еще, не следует забывать о правах переводчиков.
а) по закону
Тут есть одно слабое место: автор может не знать, что его тексты распространяются в сети, и в этом незнании он не виноват. Закон в этом случае, скорее всего, окажется на стороне автора. Хотя можно поспорить, имеет ли тут место нарушение исключительного права автора "сообщать произведение для всеобщего сведения по кабелю, проводам или с помощью иных аналогичных средств" или всего лишь "репродуцирование в единичном экземпляре без извлечения прибыли правомерно опубликованного произведения библиотеками и архивами"
Законодательство об авторском праве и о праве электронных сетей продолжает развиваться, и хорошо бы быть в курсе нововведений, а еще лучше - участвовать в этом процессе, тем более что отдельные депутаты уже обращались к "сетевой общественности" с призывами озаботиться этими проблемами, которые в противном случае будут решены без нас.
Если у Вас есть какие нибудь идеи по этому поводу, или Вы знаете что-то о международных конвенциях, которые Россия может вдруг подписать, или о практике решения подобных вопросов в других странах, напишите, пожалуйста.
Закон РФ об авторском праве и смежных правах от 9 июля 1993 в редакции 19 июля 1995
Бернская Конвенция об охране литературных и художественных произведений (от 9 сентября 1886 года, с изменениями 1896-1979)
Женевская Всемирная конвенция об авторском праве (от 6 сентября 1952, вступила в силу для СССР 26 мая 1973)
Стокгольмская Конвенция, учреждающая всемирную организацию интеллектуальной собственности (от 14 июля 1967 года, с изменениями 1979)
б) по договору
Стоило бы создать в Интернете некий реестрик сведений о том, кто из авторов как относится к публикации их текстов в Сети. Пока такие сведения появляются внутри самих электронных библиотек:
Страница "О копирайтах и др." в библиотеке М.Мошкова
Говорят, большой опыт согласования с авторами вопросов размещения их текстов в Интернете есть у Библиотеки Камелота, но что-то никак не удается мне с ней соединиться.
Если никто из участников Compulib не вызовется в ближайшее время вести такой единый список - вероятно, я попробую создать его в форме webboard'а или guestbook'а, чтобы заполнять его коллективно без чьих-либо персональных постоянных усилий.
А пока я собрал на отдельной страничке все сообщения на тему Copyright notice, которые проходили по списку рассылки Compulib.
Еще о копирайте:
Интервью М.Мошкова в "Русском журнале" и последующая дискуссия о копирайтах
Представления Е.Пескина о копирайте в сети
Теме авторского права в Сети посвящены два номера "Вечернего Интернета" - за 23 марта и за 24-25 марта 1998
ПРОЧИЕ ССЫЛКИ:
Новости электронных библиотек в Русском журнале - еще один центр кристаллизации для разместителей литературных текстов в Сети
Ну вот вроде и все.
Григорий
(diogen@glasnet.ru)