Home Tue Jun 30 02:37:47 1998 [AUTO|WIN|KOI|DOS|MAC|LAT]

Электронные библиотеки, объединяйтесь!

Слово о Compulib'е

( Вкратце | Искалки и статистика | О ключах | О копирайтах | Прочие ссылки )
Эта страница отражает субъективное мнение ее автора о развитии проекта Compulib и других идеях по поводу литературы в Интернете

ВКРАТЦЕ:

Compulib задуман для облегчения поиска литературных текстов в Сети путем разработки стандарта ключевых слов, по которым их смогут находить искалки. В принципе, идея применима для текстов на любом языке, но пока мы на иностранные языки не замахиваемся.
Одно из основных моих разногласий с Борисом (инициатором Compulib) - следует ли всем, кто захочет применять у себя Compulibовские ключевые слова, вступать с нами в переписку, регистрироваться и т.п. Борис считает, что это, как минимум, желательно. А по-моему основное достоинство его идеи - то, что она может работать как открытая система. Каждый способен присоединиться к ней явочным порядком - просто вписав на страницу ключевые слова и послав ее адрес в искалку. Если он при этом что-то перепутает - никто кроме него особенно не пострадает.
Регистрация библиотеки и персонального ключевого слова должна считаться не обязанностью и даже не жестом хорошего тона, а скорее привилегией, за которой может обращаться тот, кому не лень.
Еще мне не нравится, что у Бориса даются вперемешку стандарты (т.е. нечто обязательное, без чего поиск просто не сработает) и рекомендации (например о том, как решать проблемы фреймов и ФТП-сайтов), из чего может возникнуть впечатление, что присоединиться к системе гораздо сложнее, чем это есть на самом деле.

  • Официальная страница проекта Compulib
  • Официальная страница списка рассылки Compulib - для тех, кто хочет участвовать в разработке стандарта.
  • Compulib-форум на сервере "Русская фантастика" (NB: Основная дискуссия ведется в листе рассылки).

  • Компьюлибовская страница библиотеки М.Мошкова


    ПРИМЕРЫ ЗАПРОСОВ / ДОКЛАД О МАСШТАБАХ УСПЕХА:

  • Автомат для генерирования запросов в Альтависту (JavaScript) стоит на официальной странице Compulib

    По состоянию на 21 марта 1998:
    ВНИМАНИЕ! С тех пор (в конце марта) Альтависта "смешала языки" и теперь русских страниц не находит, если к запросу не добавить "&enc=cp1251" или "&enc=koi8r". Я нижеуказанные УРЛы запросов пока не переправил, буду разбираться с новыми стандартами
  • AltaVista, признаваемая официальной главной искалкой Компьюлиба, выдает
    - по запросу CompuLib 1752 документа;
    - по запросу +CompuLib +LibMain - 27 (из них только 7 - у Мошкова)
    - по запросу +CompuLib +LibAuthor - 1611
    - по запросу +CompuLib +LibBook - 1596
    - по запросу +CompuLib +LibBook +LibAuthor - 1593. Подавляющее большинство, вроде бы - из разных зеркал Библиотеки русской фантастики (хотя ее персональным ключом помечены только 364 страницы, точнее - только на 364 был персональный ключ на момент индексации Альтавистой)
    Как нетрудно догадаться из арифметики,
    - по запросу +CompuLib +LibAuthor -LibBook - 18 (из них 7 - в Фантастике, 6 у Мошкова, 3 у меня).
    по запросу +CompuLib +LibBook -LibAuthor - 3 (Это списки новых поступлений в Библиотеку русской фантастики)
    NB: При поиске по ключам LibBook и особенно - LibMain стоит не забывать добавить главный ключ - CompuLib, т.к. два упомянутых слова применяются на англоязычных сайтах в разных значениях.
    - страниц, отмеченных персональными ключами, нашлось: LibRUSF - 364; LibRusLit - 29; LibBorisba - 13; LibMoshkow - 8
    Не понимаю, как Дмитрию Ватолину удалось послать в Альтависту столько своих страниц Неужели вручную!? А может у него какой хитрый робот есть?

    Другие искалки:
    По моему субъективному мнению неплохо бы все-таки приспособиться к какой-нибудь русской искалке. Все-таки, во-первых, обе известнейших искалки - Рамблер и Яндекс научились по запросу в любой русской кодировке находить страницы во всех кодировках. Во-вторых, Яндекс к тому же насчет падежов понимает.
    И главное: в отличие от Альтависты, обеим русским искалкам не приходится посылать каждую страничку вручную: они все индексируют сами.
    К сожалению, Рамблер (а кажется и Яндекс тоже) принципиально не индексируют содержимое раздела "META". И если они намерены так вести себя и дальше - остаются два выхода - либо дублировать ключи "скрытым" (<!-- ... -->), а то и открытым текстом, либо махнуть на них рукой.
    По состоянию на 21 марта 1998:
  • Rambler по запросу Compulib находит 46 страниц. Строчности/заглавности эта искалка не разумеет. Все найденные страницы - служебные, т.е. дискуссия, а не сами тексты.
  • Яndex находит
    - по запросу Compulib 13 документов,
    - по запросу CompuLib - 33, из которых 29 - зеркала Мошкова.
    Дело в том, что Яндекс (в соответствии со своими правилами) воспринимает слово Compulib как написанное именно таким ("правильным") образом, а слово CompuLib - как написанное "как попало".
    Эти страницы в основном тоже служебные. Кстати, на некоторых из них (в том числе на фасаде у Мошкова) ключевое слово оказалось в "кейвордовом" (с большой L) начертанием это упущение, мы договаривались употреблять его "всуе" только с маленьким "l"..
  • HotBot - очень мощная и частоиндексирующая заокеанская искалка находит 236 страниц, но понять, что есть что невозможно, т.к. она пожирает большинство русских букв.
    У HotBotа уже есть национальная версия - японская. Но, видимо, японские символы сосредоточены не в той части второй половины кодовой таблицы, где русские, поэтому большинство русских символов она глотает. Авось дождемся всепланетарно-подходящей версии.

    Кусочек истории и статистика дискуссии: Началось с письма Б.Бердичевского М.Мошкову в рубрику "Безумные идеи вокруг Интернета" (4 сентября 1997). В тот же день Мошков в ответе Бердичевскому помечтал о мэйл-листе. 16 сентября я написал письма обоим. Две недели в тройственной переписке прообсуждали другие варианты: ньюсгруппа, вебборд, залинкованные веб-страницы, общий почтовый ящик на hotmail. Тем временем Борис разослал по библиотекам приглашение к дискуссии. 5 октября к переписке присоединились Д.Ватолин и А.Зубарев.
    Mail-list создан Д.Ватолиным 9 октября 1997. Число подписчиков к 13 октября 1997 - 5 человек, к 27 октября - 10, к 25 ноября - 13, к 30 марта 1998 - 81 человек, к 20 июня 1998 - 110 человек. До конца 1997 года по листу прошло 185 писем, к концу марта 1998 - 299, к 30 июня - 391.
    В марте 1998 мы решили подвесить старую переписку в заархивированном виде в Интернете. Когда у Дмитрия будет время, он это сделает.

    О КЛЮЧАХ: НЫНЕШНЕЕ СОСТОЯНИЕ И ДАЛЬНЕЙШАЯ РАЗРАБОТКА:

    У нас сейчас официально признаны 8 ключей, из которых реально задействованы 5.
    Ключи можно расклассифицировать на "позитивные" и "негативные". Негативные придуманы в основном для того, чтобы искать страницы ЗА ИСКЛЮЧЕНИЕМ ими помеченных. Поэтому-то их мало кто ставит.
    Вот полный список придуманных ключей:
  • CompuLib - ставится на каждой странице электронной библиотеки
  • LibMain - для одной заглавной страницы в каждой библиотеке. Допускается дублирование - если существует несколько заглавных страниц в разных кодировках. Если же существует несколько главных страниц для "жанров" (как у Фарбера) - просьба все-таки выбрать из них одну "самую главную", а остальные увязать с нею ссылками.
  • LibAuthor - после некоторых споров о том, какая страница должна быть помечена этим ключом - та, где перечислены авторы, или та, которая относится к одному из них, сформулировано такое определение: "Среди страниц, в которых упомянуты авторы произведений, ключевым словом "LibAuthor" помечаются те из них, из которых наиболее кратчайшим путом через ссылки можно попасть на список произведений данного автора, либо собственно такой список."
  • LibBook - аналогично: "Среди страниц, в которых перечислены названия книг(произведений) ключевым словом "LibBook" помечаются те из их, из которых наиболее кратчайшим путем через ссылки можно попасть на сами книги(произведения). Поскольку Борис считает, что собственно тексты книг в бродилку грузить не стоит (например, у него большинство книг лежат в ЗИПе), он сформулировал для пометки этим ключом самих книг такое условие: "Если книги записаны в формате HTML, по желанию ведущего можно ввести этот ключ в сами книги (в этом случае необходимо добавить и ключ "LibTexts")."
  • LibGenre Ключ пока не действует. Пора бы заняться придумыванием подходящих сопровоздающих слов для обозначения жанров.
    Наверное, легче всего плясать от достигнутого: какие именно ключевые слова для обозначения жанра УЖЕ применяются участниками проекта и сочувствующими, т.е. уже ищутся в Альтависте. Например, в одной из страниц Библиотеки русской фантастики я обнаружил такие ключи: fantastika, avtory, pisateli, avtor, pisatel', roman, povest', knigi.
    Вопрос - стоит ли делать их латинскими или кириллическими, по-русски или по-английски. Много аргументов есть и за и против каждого варианта.
    Это все были позитивные ключи. А теперь - негативные.
  • Lib** - Персональный Ключ, где ** - не менее двух и не более восьми знаков, которыми могут быть только цифры или буквы (optional). Введен по инициативе хозяина крупнейшей библиотеки - Максима Мошкова - с целью создать возможность поиска во всех библиотеках ЗА ИСКЛЮЧЕНИЕМ какой(-их)-то конкретной(-ых). Ставится на всех страницах библиотеки. Ключ для своей библиотеки можно зарегистрировать у Бориса на официальной странице проекта. Применение этого ключа дает привилегию быть помещенным в список зарегистрированных библиотек на той же странице, так что кое-что позитивное в нем есть. На 22 марта 1998 зарегистрировано 9 персональных ключей. А два ветерана дискуссии в мэйл-листе хотя и числятся там, но до сих пор не сделали себе ключи. Для сравнения, в проекте Новости электронных библиотек - 8 участников.
  • LibLinks - ключ придуман, чтобы помечать им библиотеки, которые в значительной части (конкретно по цифрам не решили) состоят не из текстов, а из ссылок на другие сайты.
  • LibTexts - ключ придуман Борисом в качестве противовеса моему предложению ставить ключ LibBook в сам текст соответствующей книги. По мнению Бориса, в browser стоит вызывать только оглавления, но не сами книги, и если уж кто снабжает ключом LibBook файл в несколько сотен килобайт, ему следует поставить рядом LibTexts, чтобы такие файлы можно было исключить из результатов поиска. Я по-прежнему не понимаю, почему их надо исключать и почему размер файла нельзя просто посмотреть в Альтависте. Но если книга разделена на несколько глав, то помечать LibBookом каждую из них в отдельности не стоит, я согласен. В этом случае LibBook уместней в файле-"оглавлении" или "заголовке" этой книги.

    Ключи вписываются в шапку HTML-файла (между "TITLE" и "/TITLE") следующим образом:
    <META NAME="keywords" CONTENT="CompuLib">
    или:
    <META NAME="keywords" CONTENT="CompuLib, Libmain">
    или:
    <META NAME="keywords" CONTENT="CompuLib, LibAuthor, LibBook">
    и т.п.
    Их можно (и обычно - нужно) совмещать в зависимости от структуры библиотеки.


    ВОПРОСЫ КОПИРАЙТА:

    Между двумя крайними мнениями (можно все / можно только то, что разрешили авторы) большинство участников Compulib-дискуссии выбирают такой подход: в Сети можно размещать любые тексты до тех пор, пока автор (правопреемник) не выскажет возражения.
    Кстати, все произведения переходят в общественное достояние через 50 лет после смерти автора. То есть произведения авторов, умерших до 1948 года могут сейчас свободно воспроизводиться без выплаты гонораров его наследникам. Хотя есть нюанс: до принятия закона 1993 года в России действовал срок 25 лет, так что юристы до сих пор спорят, была ли в 1993 году возвращена охрана книгам, попавшим в интервал 1943-1968, или тексты всех, кто умер до 1968, не охраняются. И еще, не следует забывать о правах переводчиков.

    а) по закону
    Тут есть одно слабое место: автор может не знать, что его тексты распространяются в сети, и в этом незнании он не виноват. Закон в этом случае, скорее всего, окажется на стороне автора. Хотя можно поспорить, имеет ли тут место нарушение исключительного права автора "сообщать произведение для всеобщего сведения по кабелю, проводам или с помощью иных аналогичных средств" или всего лишь "репродуцирование в единичном экземпляре без извлечения прибыли правомерно опубликованного произведения библиотеками и архивами"
    Законодательство об авторском праве и о праве электронных сетей продолжает развиваться, и хорошо бы быть в курсе нововведений, а еще лучше - участвовать в этом процессе, тем более что отдельные депутаты уже обращались к "сетевой общественности" с призывами озаботиться этими проблемами, которые в противном случае будут решены без нас.
    Если у Вас есть какие нибудь идеи по этому поводу, или Вы знаете что-то о международных конвенциях, которые Россия может вдруг подписать, или о практике решения подобных вопросов в других странах, напишите, пожалуйста.
  • Закон РФ об авторском праве и смежных правах от 9 июля 1993 в редакции 19 июля 1995
  • Бернская Конвенция об охране литературных и художественных произведений (от 9 сентября 1886 года, с изменениями 1896-1979)
  • Женевская Всемирная конвенция об авторском праве (от 6 сентября 1952, вступила в силу для СССР 26 мая 1973)
  • Стокгольмская Конвенция, учреждающая всемирную организацию интеллектуальной собственности (от 14 июля 1967 года, с изменениями 1979)

    б) по договору
    Стоило бы создать в Интернете некий реестрик сведений о том, кто из авторов как относится к публикации их текстов в Сети. Пока такие сведения появляются внутри самих электронных библиотек:
  • Страница "О копирайтах и др." в библиотеке М.Мошкова
  • Говорят, большой опыт согласования с авторами вопросов размещения их текстов в Интернете есть у Библиотеки Камелота, но что-то никак не удается мне с ней соединиться.
    Если никто из участников Compulib не вызовется в ближайшее время вести такой единый список - вероятно, я попробую создать его в форме webboard'а или guestbook'а, чтобы заполнять его коллективно без чьих-либо персональных постоянных усилий.
    А пока я собрал на отдельной страничке все сообщения на тему Copyright notice, которые проходили по списку рассылки Compulib.

    Еще о копирайте:
  • Интервью М.Мошкова в "Русском журнале" и последующая дискуссия о копирайтах
  • Представления Е.Пескина о копирайте в сети
  • Теме авторского права в Сети посвящены два номера "Вечернего Интернета" - за 23 марта и за 24-25 марта 1998


    ПРОЧИЕ ССЫЛКИ:

  • Новости электронных библиотек в Русском журнале - еще один центр кристаллизации для разместителей литературных текстов в Сети


    Ну вот вроде и все.

    Григорий
    (diogen@glasnet.ru)