Одной из самых востребованных поисковых систем является поисковая система Яндекс. В предыдущей статье мы рассмотрели общий принцип построения поисковых систем.
Сегодня мы рассмотрим конкретно поисковую систему Яндекс, которая состоит из следующих модулей:
1. Роботы системы Яндекс:
— Основной индексирующий робот.
— Быстрый робот, необходимый для индексирования свежей, актуальной на данный момент информации. Быстрый робот индексирует потоки информации практически в режиме реального времени. Это важно, например, для новостных сайтов, где информация часто меняется.
— Индексатор картинок. Необходим, если по вашему запросу нашлось большое количество картинок.
— Робот, определяющий зеркала сайтов. Для часто посещаемых сайтов, когда мощности одного сервера недостаточно, размещают зеркала сайтов, то есть стопроцентные копии, на других серверах. Разработчики в этом случае заранее закладывают в проект оптимальное количество серверных стоек.
— Робот, индексирующий пиктограммы сайтов.
— Робот, индексирующий мультимедийные данные.
— Робот, индексирующий страницы сайтов, участвующих в рекламной сети Яндекса.
— Робот поиска по блогам.
2. Агенты системы Яндекс:
-Яндекс.Каталог — выполняет отключение сайта от Каталога, если он недоступен, или подключение, как только сайт начинает отвечать.
-Яндекс.Закладки — для хранения необходимой информации в сети, без привязки к конкретному компьютеру.
-Яндекс.Директ — проверяет корректность ссылок из объявлений перед модерацией.
-Яндекс.Новости — формирует статистические отчеты и информирует о возможных проблемах партнеров, поставщиков новостей.
То есть Яндекс является сложной системой, состоящей из большого количества программ, которые работают каждый в своем направлении.
Кстати, есть сайты, которые Яндекс не индексирует вообще. Это сайты, которые копируют информацию с других ресурсов, не имеют собственного, желательно уникального, контента. Это сайты, которые перенаправляют пользователя на другой ресурс. Это сайты, которые предоставляют товар или информацию по партнерским программам, но не представляющие никакой ценности для пользователя. Это сайты, которые принадлежат одному владельцу и дублируют информацию, например предлагают одни и те же товары или услуги. Это немодерируемые форумы, доски объявлений, которые содержат ссылочный спам. Это сайты или группы сайтов, которые активно ссылаются друг на друга.
3. Web-сервисы:
— Каталог web-сайтов с сортировкой по индексу цитирования.
— Новости — главные новости дня, полученные из основных СМИ, представленных в Интернете.
— Маркет продажи — поиск предложений по продаже товаров и услуг, подбор моделей.
— Словари — энциклопедии, справочники, словари-переводчики.
— Картинки, видео — поиск изображений или видеохостинг, поиск роликов.
— Карты — карты городов мира с детализацией вплоть до поиска улицы, дома (есть погрешность). Информация о пробках на дорогах.
— Народная карта, то есть вы сами можете прорисовать карту местности, на которой находитесь.
— Афиша, информер погоды, телепрограмма, расписания, продажа авто, недвижимость, работа, книги, время, музыка и так далее
— Яндекс.Деньги, открытки — для отправки электронных открыток, бесплатный хостинг для создания своих страничек, подписка на новости.
С тегами: Обучение