Задачи, методы и алгоритмы интеллектуальных систем управления (обзор)


Download 4.49 Mb.
bet7/25
Sana11.09.2023
Hajmi4.49 Mb.
#1675868
1   2   3   4   5   6   7   8   9   10   ...   25
Bog'liq
Задачи, методы и алгоритмы интеллектуальных систем управления обзор

Основные этапы решения поставленной задачи:
Шаг 1. Определение структуры и модели нейросетевых регуляторов № 1 (рисунок 17) и № 2 (рисунок 18) при условии, что в качестве типа сети предлагается использовать многослойный пер- септрон.



Рисунок 17- Структура нейросетевого регулятора (НСР) № 1 Дискретная модель НСР № 1 (при условии, что в промежуточном слое функция активации является нелинейной униполярной сигмоидального типа, а в выходном - линейной) имеет
вид: (8)

Рисунок 16 - Структура восстановленного блока регулирования
(9)
(10)

где Wjq^ , w^, w|q}, w[j2) - весовые коэффициенты нейронов промежуточного слоя (1) и выходного нейрона (2); umax, umin, ?™ах, е™" -


максимальные (max) и минимальные (min) значения регулирующего воздействия и ошибки регулирования, взятые из обучающей выборки; uH(i), ?р (i) - нормированные значения регулирующего воздействия и ошибки регулирования.

Рисунок 18 - Структура нейросетевого регулятора № 2 Дискретная модель НСР № 2 имеет вид:
(11)
(12)
(13)
где y?(i), у2 (i), y3H(i) - нормированные значения у* (О, ylT(i), y2t(i); У*шах ^ y*min ^ ymax ^ ymin _ максимальные (max) и минимальные (min) значения задающего и выходного воздействия, взятые из обучающей выборки
Шаг 2. Формирование исследовательских ситуаций: ситуация «А» означает, что w(t) = 0, v(t) = 0, у (t) = l[t); ситуация «Б» -
*
w(t) = 0, реализация v(t) есть рисунок 20, у (t) = 1 [t);
ситуация «В»- реализация w(t) на рисунке 19, v(t) = 0, у (t) = l[t);
ситуация «Г» -$ реализации w(t), v(t) на рисунках 19, 20, у (t) = 1 [t).

Рисунок 19 - Реализация возмущения w(t)

Рисунок 21- Реализации uB(t) и u(t) для ситуации «А»

Рисунок 20 - Реализация возмущения v(t)
Шаг 3. Восстановление идеальных регулирующих воздействий для ситуаций «А», «Б», «В», «Г» (рисунки 21 ^ 24), реализованных на имитаторе действующей системы регулирования (рисунок 29).

Рисунок 22 - Реализации u(t) и u(t) для ситуации «Б»

Рисунок 23 - Реализации u(t) и u(t) для ситуации «В»

Рисунок 24 - Реализации uB(t) и u(t) для ситуации «Г»
Шаг 4. Формирование обучающей выборки обратной нейросетевой модели объекта (нейросетевого регулятора). В качестве желаемого, «заданного учителем» выходного значения сети (НСР № 1 и № 2), предлагается использовать uB(t) (рисунки 21 24), а в качестве входных значений будем рассматривать два варианта: a) ?p(t) (для обучения нейросетевого регулятора (НСР) № 1); б) У*(0, yix(t) = y(t -1 At), y2T(t) = y(t -2 At) (для НСР № 2).
Шаг 5. Настройка НСР № 1 и № 2 по следующим алгоритмам: алгоритм обратного распространения ошибки (АОРО), алгоритм Левенберга-Марквардта (АЛМ), алгоритм сопряженных градиентов (АСГ), алгоритм быстрого распространения (АБР). Для сравнения этих алгоритмов использованы следующие показатели (для ситуации «А»):
1) значение среднемодульной целевой функции ошибки обучения нейронной сети (таблица 3):
(14)
где u(i) - выходное значение сети; uB(i) - желаемое значение u(i); р - количество наблюдений в обучающей выборке;

  • 2) время обучения (и соответствующее ему количество эпох), необходимое для достижения минимума Q(w) (таблица 4);

  • 3) статическая ошибка (таблица 5);

  • 4) время регулирования (таблица 6).

Таблица 3
Значение Q(w) по завершению обучения (63)_

Алгоритмы обучения

Q(w), м3

в САР сНСР №1

в САР с НСР №2

АОРО

9,41

9,51

АЛМ

9,41

10,54

АСГ

12,44

13,48

АБР

10,54

10,60

Таблица 4
Время обучения (количество эпох (КЭ))

Алгоритмы обучения

to, с (КЭ, эпох)

в САР сНСР №1

в САР с НСР №2

АОРО

294 (412587)

402(404782)

АЛМ

20 (26459)

125(27477)

АСГ

3 (127)

2(72)

АБР

360 (537464)

523(586954)

Таблица 5
Статическая ошибка, взятая по модулю

Алгоритмы обучения

mod(8cr), °С

в САР сНСР №1

в САР с НСР №2

АОРО

0,000

0,000

АЛМ

0,003

0,001

АСГ

0,005

0,008

АБР

0,005

0,005

Таблица 6
Время регулирования

Алгоритмы обучения

tp, с

в САР сНСР №1

в САР с НСР №2

АОРО

80

96

АЛМ

105

101

АСГ

110

135

АБР

117

134

В результате сравнительного анализа был выбран АОРО.
Шаг 6. Построение переходных процессов в САР.
6.1) Построение переходного процесса в САР с НСР № 1 (рисунок 17), № 2 (рисунок 18) и в действующей системе (рисунок 15) для ситуации «А» (рисунки 25, 26).

Рисунок 25-НСР№ 1

Рисунок 26 - НСР № 2
6.2) Построение переходного процесса с НСР № 1, № 2 для ситуации «Б» (рисунки 27, 28).

Рисунок 27 - НСР № 1

Рисунок 28 - НСР № 2
6.3) Построение переходного процесса с НСР № 1, № 2 для ситуации «В» (рисунки 29, 30).

Рисунок 29 - НСР № 1

Рисунок 30 - НСР № 2
6.4) Построение переходного процесса с НСР № 1, № для ситуации «Г» (рисунки 31, 32).

Рисунок 31 - НСР № 1

Рисунок 32 - НСР № 2
Шаг 7. Оценка модульного интегрального показателя качества регулирования (таблицы 7 + 10). Таблица 7 Показатель качества регулирования для ситуации «А»

Показатель качества регулирования

П-
регуля-
тор

И-
регуля-
тор

ПИ-
регуля-
тор

пид-
регуля-
тор

НСР
№1

НСР
№2

I

134,46

167,33

37,95

38,71

28,09

28,69

Таблица 8
Показатель качества регулирования для ситуации «Б»

Показатель

П-
регуля-
тор

И-
регуля-
тор

ПИ-
регуля-
тор

ПИД-
регуля-
тор

НСР
№1

НСР
№2

I

129,40

154,88

55,44

53,36

47,26

50,83

Таблица 9
Показатель качества регулирования для ситуации «В»_

Показатель

П-
регуля- тор

И-
регуля-
тор

пи-
регуля-
тор

ПИД- регу ля- тор

НСР
№1

НСР
№2

I

134,36

165,73

39,07

40,20

29,75

30,37

Таблица 10
Показатель качества регулирования для ситуации «Г»

Показатель

П-
регуля-
тор

И-
регуля-
тор

ПИ-
регуля-
тор

пид-
регуля-
тор

НСР
№1

НСР
№2

I

129,31

153,50

53,85

53,26

47,54

51,18

Результаты сравнительного анализа, представленные в таблицах 1, 2, 7 10, подтверждают эффективность использования нейросетевых регуляторов.

Методика обучения нейросетевой модели объекта в системе управления.


Сложные технологические объекты управления характеризуются нестационарностью, поэтому их нейросетевые модели необходимо регулярно обучать в режиме реального времени. Выполненный обзор существующих подходов к обучению нейросетевой модели объекта управления в замкнутом и разомкнутом контуре (по работам Ю.Н. Минаева, О.Ю. Филимоновой, Б. Лиеса, D. Psaltis, М. Kawato, P.J. Werbos, S. Omatu, M. Khalid, R. Yusof и др.) позволяет сделать вывод о необходимости совершенствования методики формирования обучающих наблюдений, в качестве которых используют значения входов и выходов объекта, полученные по результатам его текущей эксплуатации, без учета влияния прямых и обратных управляющих связей. Это, в свою очередь, приводит к нарушению условия правильного применения ИНС, заключающегося в том, что входные обучающие величины должны быть некоррелированными между собой. Для выполнения этого условия необходимо расчетным путем обеспечить независимость управляющих от внешних возмущающих воздействий. Для решения этой задачи предлагается схема обучения нейросетевой модели объекта в системе управления с нанесением тестовых воздействий (рисунок 33). В качестве прототипов и аналогов при построении этой схемы были использованы методы и алгоритмы А.А. Фельдбаума, Д. Гропа, П. Эйкхоффа, Л. Льюнга, Я.З. Цыпкина, В.Я. Ротача, В.П. Авдеева, Л.П. Мышляева [65, 76, 96].
Предлагаемая процедура обучения нейросетевой модели объекта управления включает следующие основные этапы:

  • 1) считывание из базы знаний траекторий программных управляющих воздействий Uin(t), U2n(t), UNn(t), программных выходных воздействий Yn(t), базовых уровней контролируемых внешних воздействий w/j^t), W2BK(t), ..., WmK(0 на заданном интервале обучения;

  • 2) одновременное нанесение тестовых воздействий SU^t), 5Uj(t), ..., 8Uj(t) по отношению к траектории программных управлений (обоснованием этого является требование правильности настройки имитационной нейросетевой модели ТОУ, согласно которому все обучающие ее расчетные значения входов (входных воздействий) должны изменяться и при этом не быть коррелированными между собой) и предоставление подсистеме регулирования возможности выработки регулирующих воздействий 5U,(t), SU2(t), 5UN(t) для компенсации эффектов нанесенных тестовых и возмущающих воздействий, с целью обеспечения нормального режима работы ТОУ ({«Кл 1 »=« 1», «Кл2»=«1», «КлЫ»=«1»},

{«Кл4»=«1», «Кл5»=«1», «КлМ»=«1»} , где «1» - ключ замкнут, «О» - ключ разомкнут);

Рисунок 33 - Схема обучения нейросетевой модели ТОУ

  • 3) расчетное элиминирование эффектов компенсирующих (регулирующих) воздействий выходной переменной Y(t) объекта с использованием предварительно построенных моделей каналов регулирования; построение и поднастройка моделей каналов регулирования выполняется в соответствии с методикой Л.П. Мышляева последовательно:

  • 3.1) для уточнения модели первого канала регулирования (имеющего наименьшее запаздывание и наибольшую частоту использования для оперативного регулирования) выполняются следующие действия:

    • - {«Кл1»=«0», «Кл2»=«0», «KjiN»=«0»}, {«Кл4»=«1»,

«Кл5»=«0», ..«КлМ»=«0»};

  • - нанесение тестового воздействия (например, ступенчатой формы) по первому каналу, при практической неизменности прочих входов;

  • - оценивание параметров модели первого канала по полученным экспериментальным данным;

  • 3.2) для уточнения модели второго канала регулирования, следует:

    • - {«Kji 1 »=« 1», «Кл2»=«0», ..., «KjiN»=«0»}, {«Кл4»=«0», «Кл5»=«1», ..., «КлМ»=«0»};

    • - по второму каналу нанести тестовое воздействие, при условии, что его эффект будет скомпенсирован с помощью первого канала регулирования;

    • - из выхода объекта вычесть эффекты компенсирующих воздействий с использованием модели первого канала;

    • - оценить параметры модели второго канала по расчетным данным и т.д.;

  • 4) полученные расчетные значения выхода ТОУ и независимых друг от друга его входов используются в качестве обучающих наблюдений нейросетевой модели объекта.

Для моделирования предлагаемой процедуры обучения нейросетевой модели объекта управления построена структура модельной системы автоматического регулирования (рисунок 34).
Имитатор объекта управления представлен следующей совокупностью типовых линейных и нелинейных моделей теории автоматического управления:
- интегрирующее звено с отсечкой и запаздыванием (модель

- инерционное звено первого порядка с запаздыванием (модель № 2) 
- нелинейный элемент с зоной нечувствительности и ограничением (модель № 3)

- инерционное звено первого порядка с запаздыванием (модель № 4) 
- инерционное звено второго порядка с запаздыванием (модель № 5) 
- инерционное звено первого порядка с запаздыванием (модель № 6)

Подсистема регулирования представлена типовыми моделями пропорционально-интегральных регуляторов:
1) ПИ-регулятор (модель № 7) f,(s) = kP1 + kpi ;
ТИ1 s
2) ПИ-регулятор (модель № 8) f2(s) = kP2 + kp2 ;
TH2s
k
3) ПИ-регулятор (модель № 9) f3(s) = kP3 + ——.
TH3s

Рисунок 34 - Структура модельной системы автоматического
регулирования
Диаграммы моделирования процесса обучения представлены на рисунках 35, 36. В качестве нейросетевой модели использовали многослойный персептрон, в промежуточных и выходном слоях которого применили нейроны сигмоидального типа с униполярной функцией активации.

Рисунок 35 - Диаграммы процесса обучения нейросетевой модели
объекта управления

Рисунок 36 - Диаграммы процесса обучения нейросетевой модели
объекта управления
В качестве конкретных значений параметров описанных моделей были использованы следующие
значения: 

Формирование и обновление базы знаний на основе концепции программно-возмущенного движения


В ИнтСУ база знаний, являющаяся ее ядром, представляет собой совокупность формализованных знаний, введенных в систему инженером по знаниям через интеллектуальный интерфейс. Для заполнения базы знаний, то есть для обучения ИнтСУ, знания извлекаются из трудов по управлению, технологических инструкций и опыта работы экспертов (операторов-технологов, операторов- контролеров), а также из предыстории работы самой системы. Для извлечения обычно используются различные методы системного анализа: анализ текстов, диалоги, экспертные игры, лекции, дискуссии, интервью и другие. После извлечения знаний необходимо их структурировать, то есть выполнить их неформальное описание в виде графа, таблицы, диаграммы или текста, которое отражает поле знаний, включающее терминологию, список основных понятий и атрибутов, отношения между входной и выходной информацией, стратегии принятия решений, а также ограничения стратегий.
После извлечения и структурирования знаний выполняется этап их формализации. Наибольшее распространение в системах управления сложными технологическими объектами для формализации знаний получила продукционная модель, или модель, основанная на правилах. Правила позволяют представлять знания в виде предложений типа «Если <условие>, то <действие>». Под условием понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под действием - событие, выполняемое при успешном исходе поиска (оно может быть промежуточным, выступающим далее как условия, и терминальным, завершающим работу системы). Если содержимое базы знаний в процессе функционирования ИнтСУ не изменяется, то она называется статической. Логический вывод в такой базе обладает свойством монотонности, то есть ранее выведенные утверждения остаются верными на весь цикл функционирования. В противном случае база знаний является динамической.
На основе концепции программно-возмущенного движения [61], выбора и конкретизации типопредставительных реализаций входных и выходных переменных ТОУ [75], а также опыта управленческого персонала предлагается следующий подход к построению базы знаний, предназначенной для хранения и модификации программ управления. База знаний ИнтСУ продукционного динамического типа должна содержать упорядоченное множество типовых программных траекторий n(t), Un(t)> и условий, когда целесообразно их использовать. Типовое продукционное правило в базе знаний выглядит следующим образом: «Если [«Ситуация в системе» = «№ 1»], то [«Программа управления n(t), Un(t)>» = «№ 1»]». Формализация знаний осуществляется в явном виде с помощью продукционного способа путем решения задачи оптимизации траектории движения системы следующим образом:

  • 1) распознается ситуация на объекте по информативным признакам, в соответствие которой ставится множество ретроспективно фиксированных рациональных структурно близких траекторий, обеспечивающих соблюдение технологических, экономических и экологических требований, контролируемых переменных ;

  • 2) из полученного множества реализаций процесса выбирается одна типопредставительная (Т) реализация T(t), UT(t)>, соответствующая максимальной близости к многомерной

расчетной медиане, что обеспечивает ослабление влияния неконтролируемых возмущений в натурной типопредставительной реализации;
3) в отобранной реализации T(t)> выделяется низкочастотная составляющая. Полученный результат рассматривается в качестве программного движения объекта n(t), Un(t)>, рационального в условиях рассматриваемой ситуации, если оно удовлетворяет эксперта.


Download 4.49 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   ...   25




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling