Задачи исследования:
сравнительный анализ методов фильтрации электронной почты и выбор критериев, необходимых для фильтрации;
разработка алгоритма наполнения базы знаний системы фильтрации;
разработка алгоритма фильтрации документов в электронной почте;
разработка модифицированного метода базовых векторов и алгоритма обнаружения спам-сообщений;
разработка алгоритма выявления спам-документов на основе логистической регрессии.
Объектом исследования является спам-сообщения в электронной почте.
Предмет исследования является методы и алгоритмы фильтрации электронной почты и обнаружения спама.
Методы исследования. В процессе исследования использовались методы фильтрации электронной почты и обнаружения спама, нейронные сети, машинное обучение, теория вероятностей, дискретная математика и объектно-ориентированное программирование.
Научная новизна исследования состоит из:
исходя из того, что электронная почта универсальна и многофункциональна, сформированы единые критерии для всех форм спам-сообщений;
на основе распространения существующей базы знаний в организации разработан алгоритм наполнения базы знаний, позволяющий выявлять новые виды спам-сообщений;
на основе многоуровневой базы знаний системы обнаружения спама разработан трехэтапный алгоритм фильтрации документов;
разработан модифицированный метод базовых векторов и алгоритм обнаружения спам-сообщений на основе метода обучения на обучающей выборке;
на основе логистической регрессии разработан алгоритм выявления спам-документов.
Практические результаты исследования состоит из:
разработано программный инструмент для обнаружения спам-сообщений на основе методов фильтрации электронной почты;
усовершенствовано базисно-векторный метод обнаружения спама, основанный на обучении на обучающих выборках.
Достоверность результатов исследования. Достоверность результатов исследования объясняется результатами реального и экспериментального анализа, полученными в различных условиях методами фильтрации электронной почты организации, наполнения базы знаний, выявления спам-сообщений.
Do'stlaringiz bilan baham: |