Учебное пособие Санкт-Петербург 2010


Раздел I. Основы интернет-технологий в связях с общественностью


Download 1.88 Mb.
Pdf ko'rish
bet67/258
Sana14.12.2022
Hajmi1.88 Mb.
#1006960
TuriУчебное пособие
1   ...   63   64   65   66   67   68   69   70   ...   258
Bog'liq
file 1413369127 7051

Раздел I. Основы интернет-технологий в связях с общественностью
Глава V. Поиск информации в Интернете
жение слов. Так, если запрос из четырех слов не имеет точного 
ответа в базе данных, будут отранжированы выше предложения, 
содержащие три слова из запроса, в которых слова стоят точно 
в той же последовательности, что и в запросе. Это дает возмож-
ность решить типичную поисковую задачу — искать документ 
по «неточному цитированию». 
Важными тэгами для определения релевантности документа 
являются (в порядке значимости) слова, содержащиеся в тэгах 
, подписи к рисункам, а также текст документа. 
Yandex подсчитывает так называемый ТИЦ — тематический 
индекс цитирования сайта. Однако этот параметр влияет не на ре-
зультаты выдачи, а только на позицию сайта в каталоге Yandex. 
При ранжировании результатов поиска используется ВИЦ — взве-
шенный индекс цитирования сайта, учитывающий тематический 
вес сайтов, содержащих ссылки. Робот Yandex хорошо умеет опре-
делять кодировку документа, а также индексировать следующие 
форматы документов: HTML, PDF, DOC, RTF и Flash. 
Кроме того, существует ряд особенностей этой поисковой 
системы. 
1.Yandex индексирует российскую сеть, поэтому в поиско-
вую машину вносятся серверы в доменах su, ru, am, az, by, ge, kg, 
kz, md, ua и uz. Остальные серверы вносятся, только если на них 
найден текст на русском языке.
2. Переиндексация документа происходит примерно раз в две 
недели, но под каждый сайт робот подстраивается в отдельности. 
Все зависит от частоты обновления. 
3. Информацию в заголовке (тэг <TITLE>) Yandex отображаб-
ет в результатах поиска. Слова, находящиеся в тэге 
имеют больший вес, чем все остальные. Если в заголовок вклю-
чается ключевое слово страницы, у нее появится шанс оказаться 
выше в списке при поиске по данному ключевому слову. 
Помимо перечисленных способов на релевантность слова 
влияет частота его использования в заголовках, во всплываю-
щих подсказках и в тексте документа.
Rambler. Поисковая система Rambler обрабатывает все 
«динамические» страницы с именами вида *.asp*, *.php*, 
*.pl*, */cgi-bin/* и т. п. для посещаемых сайтов (по данным Top 


75

Download 1.88 Mb.

Do'stlaringiz bilan baham:
1   ...   63   64   65   66   67   68   69   70   ...   258




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling