Новые поисковые серверы WWW
PC Magazine/RE logo
©СК Пресс 1/97
e-mail: pcmagedt@aha.ru

PC Magazine, October 22, 1996, p. 48

Как усовершенствовать поиск

Джон Моррис


Развитые механизмы поиска помогают находить именно то, что вам нужно.

В статье "Как найти иголку в стоге "Всемирной паутины" PC Magazine/RE, СВ 3/96, с. 14) мы провели обзор шести распространенных механизмов поиска и индексирования в сети World-Wide Web. Хотя такие узлы, как AltaVista и Yahoo!, продолжают притягивать львиную долю любознательных путешественников по Web-серверам, тем не менее и новички, и завсегдатаи Internet постепенно осваиваются среди конкурирующих новейших средств навигации в океане Web.

На сервере Excite (http://www.excite.com), который начал свой путь как инструмент поиска для конференций в системе Usenet, реализована интеллектуальная техника поиска, подкрепленная обширным полнотекстовым указателем. Появившийся позднее сервер HotBot (http://www.hotbot.com) также имеет громадный полнотекстовый указатель, но еще и облегчает работу с четко заданными ключевыми строками поиска, позвол находить именно то, что нужно.

Excite

Сервер Excite претендует на то, чтобы быть чем-то большим, чем просто механизм поиска в Web. Здесь сосредоточен столь широкий набор информации и услуг, что многие пользователи наверняка захотят сделать http://www.excite.com адресом, вызываемым по умолчанию. Сервер оснащен механизмом поиска, основанным на технологии Intelligent Concept Extraction (ICE - интеллектуальное выделение смысла), и позволяет получить описания Web-узлов (в стиле Yahoo!), новости, каталоги и другие справочные материалы, а также предоставляет доступ к инструменту City.Net - поисковой информационной службе, охватывающей многие крупные города США и других стран.

Собственная страница сервера Excite отличаетс хорошей организацией. Вверху расположена инструментальная панель, которая обеспечивает доступ ко всем главным службам. Прямо под ней находится окно поиска. Чтобы начать поиск, достаточно просто ввести слово или фразу и щелкнуть на кнопке Search. Ниспадающее меню дает возможность выбрать один из диапазонов просмотра: вся Web, описания узлов Web, конференции или рубрики Usenet. Реализованная в Excite технология ICE позволяет установить местонахождение и вычислить рейтинг, или уровень достоверности, документов из полнотекстового указателя, базируясь на их релевантности - степени соответствия смыслу или ключевым словам.

Утверждается, что Excite, как и AltaVista, обрабатывает около 50 млн. страниц. Хотя технология ICE ориентирована на минимизацию избыточности информации, зачастую сервер выдает ошеломляющее количество допустимых ответов. В результате поиска по ключевым словам "Боб Доул" и "налоги" были выданы ссылки на 1 457 596 документов - это удручает. Зато Excite корректно подсчитал их рейтинги, исходя из степени релевантности: первые десять ответов точно соответствовали ключу поиска и указали на множество полезных узлов.

В дополнение к просмотру результатов поиска в порядке убывания рейтинга вы можете произвести сортировку серверов по тематической направленности, что позволяет быстро решить, какие узлы наиболее полезны для вас. Под окном поиска расположен каталог описаний серверов Web, отсортированный по категориям. В каждом разделе имеется краткая колонка со ссылками на некоторые особо выделенные узлы этой категории, на множество описаний и подразделов. К примеру, подраздел, касающийся катастрофы авиалайнера компании TWA, совершавшего рейс 800, снабжен ссылками на шесть подходящих серверов.

Наконец, функция City.Net позволяет получить местные новости и связаться с 54 американскими и иностранными городами. Вы можете выбрать ресторан, просмотреть меню и отпечатать карту, показывающую, как туда добраться. City.Net даже дает прогнозы метеослужбы IntelCast дл этих местностей.

Сервер Excite располагает изощренным механизмом поиска и множеством источников полезных новостей и другой информации.

HotBot

Сервер HotBot представляет собой плод совместного предприятия двух фирм - HotWired (http://www.hotwired.com) и Inktomi (http://www.inktomi.com), производящей высококлассные рабочие станции. Утверждается, что HotBot "знает" о местонахождении свыше 50 млн. документов Web, причем 36 млн. из них индексировано и готово для просмотра.

Однако истинная сила HotBot в том, что он может выполнять поиск, настолько простой (или сложный), насколько вы сами хотите. Ниспадающее меню позволяет выбрать характер поиска - всех слов, совпавших с введенной ключевой строкой, некоторых из них, полной фразы или имени персоны. Можете также вести поиск всех документов, имеющих ссылки на конкретный адрес URL.

Если вы обратитесь к HotBot для поиска информации о каком-то лице, тут уж программа забросит широкую сеть. Мы, например, ввели слова "Билл Клинтон", и программа выдала вдобавок документы со словами "Клинтон, Билл" и "Билл Дж. Клинтон".

Как и AltaVista (http://www.altavista.digital.com) корпорации Digital, HotBot индексирует так много страниц Web, что в большинстве случаев для сохранени обозримого числа ответов вам придется ввести более конкретную информацию. Для включения или исключени страниц с определенными словами или фразами мы обращались к меню Modify. Можно также задавать определенные слова, которые предположительно должны находиться на искомых страницах. Меню Expert позволяет сузить поиск, указав дату, область применения (скажем, Java, Shockwave или VRML), имя конкретного домена или сервера, название географического места и число допустимых ответов.

К примеру, мы вели поиск по слову "LandCruiser" - марке спортивного фургона производства фирмы Toyota - и от HotBot получили 797 ответов; многие из них представляли собой тематические рекламные объявления. Исключив Web-архивы со словами "sale" и "sell" ("торговля" и "продажа"), мы сузили результаты до 595; затем мы ограничили поиск страницами Web-серверов, расположенных в Африке, где этот фургон пользуетс популярностью, и получили всего один подходящий ответ: сведения о путешествиях по Малави.

Благодаря развитым средствам поиска сервер HotBot хорошо подходит серьезным исследователям, людям, имеющим хобби, да и любым пользователям, ищущим конкретные и подробные сведения среди безбрежного мор однотипной информации. Все, что способствует сокращению связанных с Web сложностей, будет приветствоватьс усталыми путешественниками по киберпространству.