АНАЛИЗ И ПРИНЦИП ДЕЙСТВИЯ
ПОИСКОВЫХ СИСТЕМ
О.Д. Райнова
(Московский институт электроники и математики,
России)
Стремительное развитие Internet за последние
несколько лет фактически превратило глобальную
информационную сеть в гигантскую «свалку»
информации Изначально у сети не было никакой
структуризации данных, представленных в ней. Для
того, чтобы хоть как-то ориентироваться в таких
объемах информации, были созданы каталоги www
серверов и поисковые машины. Каталог
представляет собой подборки ссылок на web-ресурсы
по различным группам (образование,
программирование, погода и т.д.). Поисковые машины
- позволяют пользователю, по заданному ключевому
слову или набору слов, найти необходимую ему
информацию.
Любая поисковая машина состоит из двух частей:
пользовательского интерфейса и специальной
программы, установленной на поисковом сервере.
которая перебираясь от странички к страничке по
ссылкам, индексирует всю текстовую информацию в
свою базу данных. Обычно такой программе дается
страница с множеством ссылок на различные
каталоги ресурсов. Программа, перебирая по
очереди ссылки, набирает все больший объем
информации. Когда пользователь вводит в эту
систему какое-либо слово для поиска, его
вхождение ищется в базе данных на сервере, а
пользователю выдается набор ссылок на те
сервера, на которых заданное слово встречается.
Так как сервера постоянно меняются, программе
приходится периодически возвращаться к уже
проиндексированным серверам для обновления
информации, в противном случае уже через два-три
месяца половина ссылок, которые поисковая машина
выдает в ответ на запрос, будут недоступны. У
разных поисковых систем период обновления может
существенно отличаться, причем зачастую чем
меньший объем проиидексированной информации
система содержит, тем чаще она возвращается к
каждой из страниц для проверки на наличие
изменений.
При работе с поисковыми системами,
пользователю, следует иметь в виду, что умение
правильно строить запрос может значительно
облегчить перебор результатов поиска на предмет
релевантности.
Каждая поисковая машина обладает своими
специфическими возможностями, ей присущи свои
преимущества и недостатки, сильные и слабые
стороны. Возможности традиционных систем во
многом оказались уже исчерпанными и
недостаточными для работы с массивами данных
больших объемов, доступных сегодня в Internet Это
привело к необходимости в поисковом решении,
которое потребует значительно большей сложности
и функциональности как на стадии исследования и
разработки, так и на стадии написания и обеспечит
пользователю точный и легкий доступ к
информации. |