Курсовая работа по дисциплине "Информационно-коммуникационные технологии" на тему "Организация хранения и поиска информации в сети Интернет" Направление подготовки


Download 171.45 Kb.
bet6/9
Sana09.06.2023
Hajmi171.45 Kb.
#1473001
TuriКурсовая
1   2   3   4   5   6   7   8   9
Bog'liq
MoumwAgveAUZ

2.2 Особенности Yandex


Яндекс — это российский поисковый мультипортал, который специализируется на поиске любой информации. Сегодня он занимает уже седьмую позицию в мировом рейтинге поисковых систем, а его ежемесячный оборот запросов превышает 2 миллиарда. В настоящее время он является крупнейшим порталом, где не просто находится все, но работают многочисленные бесплатные веб-сервисы - электронная почта, хостинг, фотогалереи, блоги, платежная система, социальная сеть, сервис поиска товаров и услуг, информация о погоде, пробках, телепередачах и многое другое.
Яндекс был запущен 23 сентября 1997 года, но он не сразу стал одной из самых популярных поисковых систем Рунета, хотя выгодно отличился от прочих поисковиков. Его название произошло от английского Yet another indexer, что можно дословно перевести как «очередной индексатор». Некоторые полагают, что термин Yandex стал производным от названия первой поисковой системы, именуемой Wandex, но существуют и другие версии.

Рисунок 3 - Поисковая система Yandex
Яндекс с самого начала:
-вел проверку контента на уникальность, отвергая клонированные тексты;
-исключал клоны из поиска, либо ранжировал их крайне низко;
-вел учет морфологии, как и любой русский болезненно относясь к ошибкам и стремясь их исправлять;
-предложил поиск с учетом удаленности ключевых фраз от начала текста;
-вел оценку релевантности страниц;
-учитывал, помимо количества запросов определенного слова, частоту его употребления (насыщенность), положение в тексте
(разбросанность), расстояние между словами; -реализовал функцию вопрос-ответ.
С годами возможности Яндекса увеличивались. Появился поиск схожих документов, построение списков, поиск по дате, сортировка по последним изменениям. Количество пользователей и объемы информации росли астрономическими темпами, а поисковик развивался в соответствии с требованиями времени. Добавился поиск по частям текста, языковые особенности поиска. В 1999 году появилось понятие индексации и возник тематический индекс цитирования (ТИЦ).
Очень удачно в 2000-м году был придуман для рекламной кампании слоган «Найдется все». До этого момента существовал другой слоган - «Все вопросы к Яндексу», но его популярность со временем была утрачена.
В 2009 году был реализован знаменитый алгоритм «Снежинск», который дал возможность вести по локальным результатам поиск из 1250 городов России и наделил Яндекс навыками и званием настоящего маркетолога. В следующем году Яндекс создал англоязычную версию и вышел на мировую арену.
В структуру поисковика входят три модуля:
-crawler, краулер или робот (он же спайдер (spyder));
-база данных; -клиентская часть.
Робот представляет собой специальную программу с функцией обхода в сети по расписанию интернет-ресурсов, индексации интересных страниц и с загрузки содержимого в базу данных поисковой системы, которая хранится на особых серверах. Клиентская часть отвечает за обработку запросов, поступающих от пользователей, а также за выдачу нужной информации - релевантных результатов поиска. Для их выдачи Яндекс обращается в ту самую собственную базу данных, определяет и выдает наиболее подходящие под запрос страницы.
Качество поиска Яндекса не вызывает сомнений. Его алгоритмы меняются и развиваются с завидным постоянством, приводя к изменениям поисковой выдачи веб-страниц. Поисковая система Яндекс применяет алгоритм ранжирования, который позволяет пользователю осуществить наилучший поиск нужных страниц, максимально соответствующих его запросу.
Алгоритм ранжирования можно назвать сложной системой математических формул. С их помощью происходит оценка факторов, по совокупности которых и их анализу поисковик определяет пользу страницы и ее рейтинг. Как и в прежние годы, сохранились основные факторы ранжирования, к которым присоединились дополнительные показатели - характеристики документа. В настоящее время в ранжировании участвуют около 250 факторов, среди них можно выделить:
-присутствие слов из запроса в контексте страницы;
-присутствие таких слов в мета-тэгах, заголовках;
-существование ссылок на ранжируемый документ; -наличие комментариев к ссылкам и изображениям; -авторитетность ресурса.
Грамотный оптимизатор учитывает все или максимальное число факторов ранжирования, чтобы продвигаемый в поиске ресурс в целом и каждая его страница в отдельности получили высокие позиции. Именно в этом и заключается оптимизация сайтов под поисковые системы, т.е. в обеспечении максимально высоких позиций в поисковой выдаче.
Яндекс с каждым годом и даже месяцем обращает все больше внимания на качество информации, представленной на сайте. Все более востребованным на порталах становится уникальность контента. Применяя такие инструменты создания контента, как синонимайзинг, владельцы сайта рискуют быть запросто забаненными Яндексом.
Так называемые «бредотексты» практически не проходят в индекс. Они становятся первыми на вылет из индекса. Специалисты пока еще успешно применяют копипаст, но и с ним уже лучше не рисковать. Оптимизируя белые сайты, их необходимо заполнять исключительно уникальным и грамотным контентом.
Алгоритмы Яндекса выделяют небольшие по весу страницы с плотностью ключевиков 4-6%. Очень хорошо работает удобная навигация и грамотная внутренняя перелинковка. Они помогают роботу легче индексировать страницы интернет-ресурса. Важно наличие мета-тегов и описаний.
Хорошо способствует ранжированию увеличение количества внешних ссылок на страницы продвигаемого ресурса, но при этом Яндекс применяет ВИЦ. Этот взвешенный индекс цитирования определяет количество и качество обратных тематических ссылок. Продуманные и совершенные алгоритмы позволяют Яндексу легко определять тематику ресурса, так что стоит получать ссылки с тематических и смежных сайтов, при этом они должны быть максимально грамотно вписаны в контекст.

Download 171.45 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling