Учебное пособие Санкт-Петербург 2010
Раздел I. Основы интернет-технологий в связях с общественностью
Download 1.88 Mb. Pdf ko'rish
|
file 1413369127 7051
Раздел I. Основы интернет-технологий в связях с общественностью
Глава V. Поиск информации в Интернете жение слов. Так, если запрос из четырех слов не имеет точного ответа в базе данных, будут отранжированы выше предложения, содержащие три слова из запроса, в которых слова стоят точно в той же последовательности, что и в запросе. Это дает возмож- ность решить типичную поисковую задачу — искать документ по «неточному цитированию». Важными тэгами для определения релевантности документа являются (в порядке значимости) слова, содержащиеся в тэгах Yandex подсчитывает так называемый ТИЦ — тематический индекс цитирования сайта. Однако этот параметр влияет не на ре- зультаты выдачи, а только на позицию сайта в каталоге Yandex. При ранжировании результатов поиска используется ВИЦ — взве- шенный индекс цитирования сайта, учитывающий тематический вес сайтов, содержащих ссылки. Робот Yandex хорошо умеет опре- делять кодировку документа, а также индексировать следующие форматы документов: HTML, PDF, DOC, RTF и Flash. Кроме того, существует ряд особенностей этой поисковой системы. 1.Yandex индексирует российскую сеть, поэтому в поиско- вую машину вносятся серверы в доменах su, ru, am, az, by, ge, kg, kz, md, ua и uz. Остальные серверы вносятся, только если на них найден текст на русском языке. 2. Переиндексация документа происходит примерно раз в две недели, но под каждый сайт робот подстраивается в отдельности. Все зависит от частоты обновления. 3. Информацию в заголовке (тэг <TITLE>) Yandex отображаб- ет в результатах поиска. Слова, находящиеся в тэге имеют больший вес, чем все остальные. Если в заголовок вклю- чается ключевое слово страницы, у нее появится шанс оказаться выше в списке при поиске по данному ключевому слову. Помимо перечисленных способов на релевантность слова влияет частота его использования в заголовках, во всплываю- щих подсказках и в тексте документа. Rambler. Поисковая система Rambler обрабатывает все «динамические» страницы с именами вида *.asp*, *.php*, *.pl*, */cgi-bin/* и т. п. для посещаемых сайтов (по данным Top |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling