[ AUTO | WIN | KOI | DOS | MAC | LATINICA ]
ПОИСК В "ПОЛИТИКЕ" И НЕ ТОЛЬКО
SEARCH IN "POLITIKA" AND EVERYWHERE
Этот сервер потихоньку индексируется разными поисковыми системами. Соответственно, с их помощью здесь можно что-то найти. Страничка пока находится в стадии экспериментальной наладки.
До предстоящей переиндексации многие искалки вместо адреса www.cityline.ru будут выдавать two.cityline.ru, www.user.cityline.ru или просто cityline.ru, каковые адреса УСТАРЕЛИ. Все файлы htm переименованы в html
Rambler (Win) | Yandex (any) | HotBot (Latin/English)

Я собираюсь убрать DOS- и MAC-версии поиска. Если кто-то вдруг собирается ими пользоваться, напишите.
RAMBLER проиндексировал "Политику" на несколько уровней глубины. Теперь он, как и Яндекс, по запросу в ЛЮБОЙ русской кодировке находит слова во ВСЕХ кодировках. Лучше всего проиндексирована "Политика" в AUTO-кодировке (той, что под Windows видна в Win, а под Lynx - в KOI, т.е. без указания порта 808N,). Поэтому советую переключиться в Auto-кодировку (если Вы под Windows) или в "принудительный" Windows (если Вы в терминалке или под UNIXом).
Индексация была до завершения реформы на "Политике". Теперь все адреса начинаются с www.cityline.ru и заканчиваются на html (а не htm).

[AUTO/WIN] тексты, включающие
в тексты, включающие
в тексты, включающие
в тексты, включающие
в тексты, включающие
Можно использовать выражения And , Or , Not (или, соответственно, & , | , !).
Можно применять ? вместо любого символа и * вместо любой последовательности символов
Регистр (ЗАГЛАВНЫЕ/строчные/СмЕшАнНыЕ) безразличен
  • Подробности о поиске в Рамблере
    ЯNDEX, (искалка фирмы CompTek International) по запросу в ЛЮБОЙ русской кодировке находит слова во ВСЕХ кодировках. Кажется, индексирует глубже, но несколько реже. Пока проиндексировал Политику только в AUTO-кодировке, и почти исключительно по "неканоническому" имени домена - cityline.ru вместо www.cityline.ru. Теперь придется все индексировать заново. :( А пока можно от руки подставлять в находимых Яndexом адресах вместо cityline.ru - www.cityline.ru или www.cityline.ru:номер_порта (8080-win, 8083-KOI, 8084-latinica). Да еще и html вместо htm.
    Как ограничить поиск своим доменом, я не знаю. Тут применен суррогатный вариант: строгий (формализованный) поиск с добавлением (оставлением) ПОСЛЕ интересующих слов, выражения " && diogen". Это слово есть ПОЧТИ на всех страницах Политики (в e-mail адресе).

    вкл/откл строгий поиск (с языком запросов)

    Можно вести поиск в любой кодировке, а придя на саму найденную страничку Политики (которая все равно будет в Win), переключить кодировку на желаемую:


    строгий

    строгий

    строгий
    Основное достоинство - учет формы слов: по запросу шла найдутся страницы, где есть слова идти, идет, шли и т.д. По запросу !шла - только шла
    Основная закавыка "строгого поиска" - по запросу из нескольких слов, разделенных пробелом или & ищется наличие всех этих слов В ПРЕДЕЛАХ ОДНОГО АБЗАЦА. Чтобы искать по всему документу - надо поставить между словами " && "
    По запросу продажа гамбургеров в Москве найдутся страницы, где есть все три слова - продажа, гамбургер, Москва (слово "в" игнорируется) в любой форме В ОДНОМ АБЗАЦЕ.
    Чтобы задать те же параметры для ВСЕГО ТЕКСТА, знаки нужно удваивать (&& , ~~). Пробел удвоению не поддается и вместо него приходится использовать &&.
    По запросу корова (седло, телевизор) - страницы, где есть корова и либо седло либо телевизор В ОДНОМ АБЗАЦЕ.
    корова && (седло, телевизор) - то же для всего текста.
    Отрицание - тильда: " ~ " - действует в пределах абзаца; двойная тильда: " ~~ " - в пределах всего текста.
    С 14 ноября 1997 в Яндекс можно посылать запросы на произвольном человеческом языке (теперь это делается отключением "строгого поиска"). Но учтите, чем произвольнее Вы запросите, тем больше придется разгребать неизвестно чего.
  • Подробности о запросах в Yandex
    HOTBOT индексирует крайне тщательно, но находит только латинские слова.
    Works thorougly, but finds only words in latin letters.
    Search site(s) for
    Search domain(s) for
    Search Web or Usenet for
    ХотБот, в отличие от некоторых популярных англоязычных искалок, обшаривает все доступные страницы сам, не дожидаясь, пока ему пришлют адрес каждой из них.
    У HotBotа уже есть национальная версия - японская. Но, видимо, японские символы сосредоточены не в той части второй половины кодовой таблицы, где русские, поэтому большинство русских символов она не замечает.
    Кроме того, Политику индексируют несколько нерусских роботов типа -
    Politika is also being indexed by robots -
    ozemail, Inctomi, atext.com, scooter.
    © ПОЛИТИКА, 1997 (diogen@online.ru)