Из данных о статистике поисковых систем была выбрана самая популярная на сегодняшний день – Google.com [3]. Система предоставляет мощнейшие средства поиска информации, отбор по временной шкале и географическому положению, параметры для более тонкой настройки поискового ядра. Для решения задачи извлечения информации с разных источников и упаковка данных в специальный формат система может предложить лишь ручной поочередный поиск, что неудобно и требует значительное количество времени и участие человека в процессе поиска.
В наши дни поиск информации стал часто-выполняемой функцией. Построение запроса носит полностью индивидуальных характер для каждого пользователя и важно учитывать нечеткую структуру задания правил для поискового ядра.
Для эффективного построения максимально универсальной системы важно выделить основные возможные характеристики задания поискового запроса и учитывать возможность его дальнейшего расширения. Предполагается рассматривать следующие основные свойства поискового запроса:
Периодичность запроса:
Разовая операция;
Регулярные операции по времени или требованию;
Источник поиска и обработки информации:
Статические ресурсы;
Динамические ресурсы;
Критерий выгрузки информации:
Выгрузка с авто настройкой;
Пользовательские правила выгрузки;
Правила обработки запросов:
Автоматическая обработка;
Обработка по явно заданным правилам.
Рассмотрим каждый из критериев более подробно:
Здесь рассматривается вопрос актуальности информации. Современные веб-ресурсы часто содержат информацию, которая обновляется регулярно через довольно короткий промежуток времени. Если есть необходимость поддерживать актуальность получаемой информации, то ставится вопрос о введении параметра регулярности операции. В таком случае пользователю предоставляется возможность задать шаблон запроса к поисковому серверу и указать правила, по которым этот запрос будет выполняться с изменением лишь некоторых значений.
Do'stlaringiz bilan baham: |