Солодовников владимир Игоревич Использование методов принятия решения при проектировании нейросетевых структур обработки данных
Download 215.66 Kb. Pdf ko'rish
|
autoref-ispolzovanie-metodov-prinyatiya-resheniya-pri-proektirovanii-neirosetevykh-struktur-obrabotk
- Bu sahifa navigatsiya:
- Специальность: 05.13.12 - Системы автоматизации проектирования Автореферат диссертации на соискание ученой степени кандидата технических наук
- Научный руководитель: Доктор технических наук, профессор Шрамков Игорь Григорьевич Официальные оппоненты
- Ведущая организация
- - 3 - ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы.
На правах рукописи СОЛОДОВНИКОВ Владимир Игоревич Использование методов принятия решения при проектировании нейросетевых структур обработки данных Специальность: 05.13.12 - Системы автоматизации проектирования Автореферат диссертации на соискание ученой степени кандидата технических наук Москва - 2004 Работа выполнена в Московском Государственном институте электроники и математики (Техническом университете) на кафедре «Информационные технологии в автоматизированных системах». Научный руководитель: Доктор технических наук, профессор Шрамков Игорь Григорьевич Официальные оппоненты: Доктор технических наук, профессор Кандидат технических наук, доцент Макаров Валерий Федорович Ульянов Михаил Васильевич Ведущая организация: Государственный научно-исследовательский институт информационных технологий и телекоммуникаций «Информика» Защита диссертации состоится 2004 года в часов на заседании диссертационного совета Д 212.133.03 Московского государственного института электроники и математики (Технического университета) по адресу: 109028 Москва, Большой Трехсвятительский переулок, 1-3/12 стр. 8. С диссертацией можно ознакомиться в библиотеке Московского государственного института электроники и математики. Автореферат разослан 2004 г. И В. Прокофьев - 3 - ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы. Стремительное развитие хранилищ данных и рост объемов хранимой информации в самых различных областях человеческой деятельности предъявляет новые требования к системам обработки информации, в частности, все большую актуальность приобретают системы, способные не просто складировать данные, но и позволяющие осуществлять их анализ и обработку, находить закономерности, производить прогнозирование и выдавать результат в виде доступном человеку. При этом одна из основных проблем заключается в том, что данные могут быть разнотипными (количественными, качественными, текстовыми), многомерными, возможны пробелы в данных, отсутствие априорной информации, сложность зависимостей. Методы обработки данных могут быть разделены на три категории. К первой относятся методы использующие средства формирования простых запросов и отчетов, позволяющие осуществлять выборку тех данных, которые удовлетворяют некоторым, заранее определенным условиям, т.е. помогают в отыскании фактов, которые произошли в прошлом и были зафиксированы. Вторая включает в себя средства OLAP (On-Line Analyzing Processing - Системы оперативной аналитической обработки) позволяющие осуществить комплексный взгляд на собранную в хранилище данных информацию, ее обобщение, получение итогов и сравнений путем экстраполяции, агрегации, построения сводных отчетов и гиперкубического представления. Более глубокий анализ данных осуществляется методами Data Mining или, как их еще называют, методами «интеллектуального» анализа данных. Эта технология направлена на обнаружение в «сырых» данных предварительно неизвестных, практически полезных и доступных интерпретации знаний. Ее важным положением является нетривиальность разыскиваемых шаблоноз, которые представляют собой правила и закономерности, свойственные выборкам данных. Таким образом, найденные шаблоны могут отражать неочевидные, неожиданные регулярности в данных, составляющие так называемые скрытые знания. Data Mining является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. Особенностью алгоритмов и методов, применимых при «интеллектуальном» анализе данных, является отсутствие ограничительных рамок априорных предположений о структуре выборки и виде распределений значений анализируемых показателей, чему наилучшим образом соответствует использование подхода, основанного на нейросетевых технологиях обработки данных или нейросетевой Data Mining. Это обусловлено способностью нейронных сетей к моделированию нелинейных процессов, работе с зашумленными данными, адаптивностью (обучение и самообучение), возможностью работы с малым объемом или полным отсутствием априорной информации. В настоящее время существует достаточно большое количество систем, включающих в себя элементы нейросетевых технологий. Однако, их недостатком может служить то обстоятельство, что в большинстве своем они напрямую не предназначены для анализз информации, накопленной в базе данных, и требуют от пользователя специальной подготовки и понимания в какой ситуации и для каких целей может использоваться т а или иная с е т г а б о т к у и кодирование данных. Кроме того, многие ci дин вид - 4 - нейросети (например: многослойный персептрон с возможностью изменять количество внутренних слоев и нейронов в слоях). В информационных системах наибольшее распространение нейронные сети нашли в информационных хранилищах для решения задач прогнозирования. Однако, в таких системах они являются элементом программного обеспечения, к которому пользователь фактически не имеет доступа, и решают ограниченный, заранее определенный класс задач. В связи с вышеизложенным, актуальной становится задача разработки подсистемы нейросетевой обработки информации, которая предоставляет механизмы, позволяющие осуществлять проектирование и нахождение необходимых параметров сети для решения различных задач Data Mining на имеющихся данных. Целью диссертационной работы является разработка методов, математических моделей и алгоритмов подсистемы принятия решений для автоматизированного проектирования нейросетевых структур обработки баз данных в зависимости от требозаний предъявляемых пользователем и имеющихся у него исходных данных. Для достижения указанной цели были решены следующие основные задачи. - Формирование критериев применимости нейронных сетей для решения различных задач Data Mining, а также анализ зависимостей архитектуры сетей, количества слоев и нейронов в каждом слое, от исходных данных. - Разработка и совершенствование средств и методов принятия решений при выборе и автоматизированном проектировании нейросетевых структур обработки данных в зависимости от поставленной задачи и исходных данных - Разработка информационной и объектно-ориентированной моделей нейронных сетей, структуры фрагмента базы данных (БД) для хранения деревьев решения, семантических сетей, а так же шаблонов и уже построенных нейросетей. Объект исследования. Объектом исследования являются вопросы использования методов принятия решений для автоматизированного проектирования нейросетевых структур обработки данных в зависимости от требований предъявляемых пользователем и исходных данных. Предмет исследования. Предметом исследования настоящей работы является анализ и разработка подсистемы «интеллектуальной» обработки информации хранящихся в БД с использованием нейросетевых технологий. Научная новизна и результаты, выносимые на защиту: - Разработаны модифицированные деревья решений и операции над ними для применения в качестве инструментария в подсистемах поддержки принятия решений. - Разработаны алгоритмы формирования правил, прямого и обратного вывода для модифицированных деревьев решения, а также алгоритм представления деревьев решения в виде фактов семантической сети. - Разработана методика для повышения эффективности выбора и автоматизированного проектирования нейросетевых структур обработки данных с помощью модифицированных деревьев решения. - Разработаны информационная модель нейросетевых структур для хранения в базе данных и объектно-ориентированная модель, представляющая собой иерархию классов, для программной реализации, что позволяет осуществлять их гибкое и эффективное конструирование. Методы исследования. Исследование и решение поставленных в диссертации задач проводилось на основе комплексного использования теории вероятности, теории графов теории принятия решений, искусственных нейронных сетей, теории - 5 - систем. В разработке программного обеспечения использовалась технология объектно-ориентированного программирования. Download 215.66 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling