Определение оценок дисперсий коэффициентов регрессии


N – количество уровней варьирования фактора


Download 57.57 Kb.
bet2/2
Sana23.03.2023
Hajmi57.57 Kb.
#1289905
1   2

N – количество уровней варьирования фактора,


M – количество параллельных опытов,
y1i – первый опыт,
yi – среднее в серии,
S2{y} – дисперсия в серии.

  1. Строится экспериментальный график, по которым делается предположение о виде линии регрессии.

  2. Решается система уравнений, и определяются оценку и коэффициентов регрессионной зависимости

  3. Считается теоретическое значение выходной величины (yi)

5) Считается относительная погрешность по формуле:

E= уii / max{yi,yi}


1.4 Полный факторный эксперимент


В факторных экспериментах, в отличие от классических, происходит одновременное варьирование всеми независимыми переменными. Эксперимент, в результате которого все независимые переменные варьируются на всех выбранных уровнях, называется полным факторным экспериментом (ПФЭ). Количество опытов при ПФЭ подсчитывается так




N=kn,

где k- количество уровней, п — число факторов.


Если эксперименты проводятся только на двух уровнях (при двух значениях факторов), это будет ПФЭ типа 2n, а для k уровней – ПФЭ типа kn . Условия эксперимента представлены в таблице – матрицы планирования, где строки соответствуют опыту, а столбцы значениям факторов.
Например, матрица планирования для ПФЭ 22 (таблица 2)

Таблица 2 Матрица планирования для ПФЭ 22






х1

х2

у

1

-1

-1

у1

2

+1

+1

у2

3

-1

+1

у3

4

+1

-1

у4

Геометрически план такого эксперимента интерпретируется точками, расположенными в вершинах квадрата. Для плана 22 задается вершинами квадрата, для плана 23 задается координатами вершин куба, а при п>3 задается координатами вершин гиперкуба.


ПФЭ типа 2n обладает следующими свойствами:

  1. Симметричность относительно центра эксперимента. Это значит, что алгебраическая сумма элементов вектор-столбца для каждого фактора равна нулю, то есть  xij=0,

где j – номер фактора (j=1,2,…K)
i – номер опыта (i=1,2,…N)

  1. Нормировка – это сумма квадратов элементов каждого столбца равна числу опытов, то есть  x2ij=N

  2. Сумма почленных произведений любых двух вектор-столбцов матрица равна нулю, то есть  xij*хui=0, j=u, j,u=1,2,…k

Это важное свойство для обработки и интерпретации данных называется ортоганальностью матриц планов типа 2n.
ПФЭ позволяет количественно оценить все линейные эффекты факторов и их взаимодействия. Взаимодействие возникает в том случае, если эффект одного фактора зависит от уровня, на котором находится другой фактор.
Для ПФЭ типа 22 матрица планирования (таблица 3) с учетом свободного члена b12 вычисляется так

Таблица 3 Матрица планирования для ПФЭ типа 22 с учетом свободного члена b12



N опыта

х0

х1

х2

х12
у

1

+1

-1

-1

+1

у1

2

+1

+1

+1

+1

у2

3

+1

-1

+1

-1

у3

4

+1

+1

-1

-1

у4

Этот план соответствует модели y=b0*x0+b1*x1+b2*x2+b12*x1*x2


Столбцы x1 и x2 задают планирование – определяют условия проведения опытов.
Столбцы x0 и x1*x2 служат для расчета. Эффект взаимодействия двух факторов называется эффектом взаимодействия первого порядка, трех факторов – второго порядка и так далее.
Обработка результатов эксперимента.

Основной целью регрессионного анализа является получение по результатам активного эксперимента модели, адекватно описывающей поведение исследуемого объекта. Проведение эксперимента должно строго соответствовать выбранному случайному порядку. Установка уровней факторов Xj должна происходить в соответствии с теоретическими предпосылками регрессионного анализа и быть, возможно, более точной. Регистрация результатов измерения выхода Y должна соответствовать реально обеспечиваемой в опыте точности измерения. Если нет уверенности, что условия проведения опытов остаются постоянными, то опыты в каждой точке факторного пространства дублируются (проводится серия опытов). Предположим, что в каждой точке факторного пространства, которой соответствует одна из строк матрицы планирования, проводится серия из опытов. Для любой 1-й точки вычисляется среднее значение выходной величины

у= yiu/m


и построчную дисперсию выходной величины (точнее ее оценку):

S2{y}= (yi-y)2/m-1


Найденные таким образом построчные дисперсии используются для проверки воспроизводимости опытов, заключающейся в проверке однородности построчных дисперсии — одной из основных предпосылок множественного регрессионного анализа.


Среди всей совокупности рассчитанных построчных дисперсии выбирается максимальная S2{y}max и берется отношение данной дисперсии к сумме всех построчных дисперсий S2{y}, то есть определяют расчетное значение коэффициента Кохрэйна

Gр = S2{y}max/  S2{y},


который показывает, какую долю общей сумме построчных дисперсий занимает максимальная из них - эта доля взята как мера различия между дисперсиями. Расчетное значение коэффициента Кохрэйна сравнивается с табличным (критическим) значением G-критерия, которое выбирается из таблиц. Если выполняется условие Gр < Gт, то с выбранным уровнем статистической значимости все построчные дисперсии признаются однородными. В противном случае следует отвергнуть гипотезу об однородности построчных дисперсии, что является нарушением одной из главных предпосылок регрессионного анализа – дальнейшая статистическая обработка результатов не имеет смысла.


Убедившись в однородности, переходят к определению оценок коэффициентов по формулам

а0= yi /N


aj= =xi* yi /N,
где j – номер вектора столбца.
Найденные таким образом коэффициенты регрессии необходимо оценит на статистическую значимость. Оценка производится по t-критерию Стъюдента. Для каждого коэффициента аj вычисляется коэффициент

tр= tр= S{ак},


S{ак}-оценка среднего квадратичного отклонения погрешности определения коэффициента (дисперсия адекватности)


S{ак}= S2в/N*m,


где S2в- дисперсия воспроизводимости,


S2в=  S2{y}/N


При выбранном уровне статистической значимости по таблицам распределения Стъюдента при числе степеней свободы f=N*(m-1) находят табличное значение коэффициента tт. Найденное табличное значение сравнивается с расчетным значением коэффициента. Если выполняется неравенство


tт> tр,


то принимается нуль-гипотеза, то есть с принятым уровнем статистической значимости (статистической достоверностью 1- ) и числе степеней свободы f считается, что найденный коэффициент ак является статистическим незначительным и его следует исключить из уравнения регрессии.


Затем рассчитывают теоретическое значение у для каждого из экспериментов и относительную погрешность по формуле:

E= уii / max{yi,yi}


Полученное уравнение регрессии необходимо проверить на адекватность исследуемому объекту, то есть установить, насколько хорошо оно аппроксимирует полученные экспериментальные данные. Для этой цели необходимо оценить, насколько отличаются средние значения у выходной величины, полученной в точках факторного пространства в результате проведения опытов, и значении у, полученного из уравнения регрессии в тех точках факторного пространства.


Для этого вычисляют остаточную дисперсию, которую чаще называют дисперсией адекватности

S2ад =m/N-L  (yi-yi)2,


где m – число параллельных опытов i-й точке факторного пространства; l- число определенных в результате проведения N опытов значимых коэффициентов.


Отличие S2ад от нуля объясняется тем, в общем случае, двумя причинами: действительно неадекватность уравнения регрессии физическому объекту и наличием случайной погрешности восприятия, характеризуемой S2в.
Адекватность полученной модели проверяют путем сравнения оценок двух дисперсий S2ад и S2в и F-критерию Фишера

Fр= S2ад/ S2в ,


Найденное расчетным путем Fр сравнивают с табличным значением Fт, которое определяется при уровне статистической значимости и числе степеней свободы f ад =N-l и fв= N*(m-1). Если


Fр< Fт,


то полученная математическая модель с принятым уровнем статистической значимости адекватна экспериментальным данным, и ее можно использовать для дальнейших исследований.


1.5 Дробный факторный эксперимент


В полном факторном эксперименте число опытов соответствует N= 2n. Поэтому при большом числе факторов n реализация ПФЭ становится практически невозможной. В действительности эффектами взаимодействия факторов больших порядков в большинстве случаев можно пренебречь (так как влияние их незначительно) или априори известно, что некоторые из них отсутствуют. Известно, что число опытов, по которым определяются оценки коэффициентов аппроксимирующего полинома — уравнении регрессии, должно быть равно числу определяемых коэффициентов или быть хотя бы на единицу больше. Исходя из изложенных предпосылок, число опытов для нахождения оценок неизвестных коэффициентов такого уравнения для большинства практических случаев может быть существенно уменьшено. Это достигается с помощью дробных факторных планов, или дробных факторных экспериментов (ДФЭ) представляющих дробные реплики полного факторного эксперимента. Если в ПФЭ наблюдения производятся во всех вершинах N-мерного гиперкуба, то при использовании дробных реплик наблюдения проводятся в некоторых из них.


Пример построения дробной реплики, с условием, что эффекты взаимодействий отсутствуют, то есть модель имеет вид:
у =а0112233

При таком виде зависимости неизвестными являются четыре коэффициента, для определения которых достаточно, как минимум, четыре опыта. Рассмотрим матрицу ПФЭ типа 23 (таблица 4).


Таблица 4 Матрица планирования для ПФЭ типа 23



N опыта

х1

х2

х3

1

-1

-1

-1

2

+1

-1

-1

3

-1

+1

-1

4

+1

+1

-1

5

-1

-1

+1

6

+1

-1

+1

7

-1

+1

+1

8

+1

+1

+1

Для оценки коэффициентов аj , j=0,3 достаточно четырех опытов (строк). Выберем строки 5,2, 3, 8 и построим матрицу плана


х1 х2 х3


-1 -1 +1
Х= +1 -1 -1
-1 +1 -1
+1 +1 +1

в которой первые два столбца являются матрицей плана двухфакторного эксперимента вида 22. Следовательно, число опытов в данном плане будет N = 22=23-1 или N= 23*2-1 Построенная таким образом матрица обладает тремя свойствами: ортогональностью, нормировкой и симметричностью. Но раз матрица плана обладает данными свойствами, то, следовательно, она выбрана не произвольным образом, а по какому-то расчету. Показатель степени в выражении для числа опытов (3 — 1) показывает дробность матрицы плана ПФЭ N = 23, то есть дробная матрица планирования составляет полуреплику плана ПФЭ. Если сопоставить матрицу Х дробного факторного эксперимента 23-1 и ПФЭ 23, то можно заметить, что переменная х, в точках плана удовлетворяет уравнению


х312


которое имеет свой определенный смысл и называется генерирующим соотношением (ГС).


Таким образом, дробным факторным экспериментом называется эксперимент, реализующий строго определенную часть ПФЭ. Матрицу, получаемую при ДФЭ, называют дробной матрицей планирования (ДМП) Число строк ДМП в общем случае определяется соотношением
N 2n-p,
где n число линейных факторов; p показатель дробности.
Для (п — р) факторов, условно называемых основными, строится матрица полного факторного эксперимента, а для р факторов, называемых дополнительными, уровни варьирования в опытах выбираются на основании генерирующего соотношения. Генерирующее соотношение—это формальное равенство, показывающее, знаки каких основных переменных, стоящих в правой части равенства, необходимо перемножить для получения знака дополнительного фактора (уровня варьирования), чтобы ДМП оказалась ортогональной, нормированной и симметричной.
Разрешающей способностью плана ДФЭ называется его способность получать такие оценки коэффициентов аj при независимых переменных, в которых идеальные коэффициенты аj (их математические ожидания) смешаны с коэффициентами взаимодействий наиболее высокого порядка. Чем с большим порядком взаимодействий смешаны факторы, тем большей разрешающей способностью обладает данный план. Данное определение основывается на том, что в опытах связи сразу между всеми факторами менее вероятны, чем между какими-либо их комбинациями. Поэтому можно считать, что тем выше порядок взаимодействия, тем менее он значим и тем большей уверенностью им можно пренебречь.
Статистическая обработка результатов ДФЭ аналогична обработке при ПФЭ.
1.6 Дисперсионный анализ
Дисперсионный анализ - первый статистический метод отсеивания факторов в активном эксперименте. Он основан на представлении о том, что значимость фактора опре­деляется его вкладом в дисперсию параметра оптимизации. Это обусловило широкое применение дисперсионного анализа при изучении точности различных методов измерений. Он позволяет указать те факто­ры, которые вызвали ошибку, и отсеять незначимые, на улуч­шение которых нецелесообразно затрачивать инженерные усилия.
Дисперсионный анализ нужно использовать при оценке воспроизводимости результатов опытов. Воспроизводимость во времени служит харак­теристикой качества изготовления установки, по которой за­казчик должен принимать установку от изготовителя.
В дисперсионный анализ введена, количественная мера раз­личимости двух дисперсии, называемая - критерием Фишера, которую используют почти во всех схемах планирования эксперимента.
Однофакторный эксперимент
Это простейший вариант задачи, который состоит в том, что оценить результаты измерений, то есть влияние на выходную величину одного фактора х и случайной погрешности Е.
Таким образом, для вычисления соответствующих дисперсии S2(x) и S2(E) необходимо вычислить отклонение от средних.
Основная трудоемкость заключается в том, что вычисление квадратов отклонения средних величин от их средних с учетом соответствующей степени свободы. Математически это выглядит так

Q2х= S2(х)/f (х) и Q2Е= S2(Е)/f(Е),


где Q2х, Q2Е – это квадрат отклонения
S2(х),S2(Е) - это дисперсии
f (х) , f(Е) – это степень свободы.
Двухфакторный эксперимент. Иерархическая и перекрестная классификации
При однофакторном дисперсионном анализе данные только группируются по различным уровням единственного фактора. Для случая двух факторов необходимо учитывать и способ их взаимодействия, то есть вид модели. Существуют два вида взаимодействия факторов х1 и х2 иерархическое и перекрестное, либо иерархическая и перекрестная классификации.
При иерархической классификации различают факторы основной группы и факторы подгрупп. Каждый уровень одного основного фактора может быть связан с множеством уровней второго фактора — фактора подгруппы.
При перекрестной классификации каждый уровень одного фактора может сочетаться со всеми уровнями другого фактора и упорядочение в этом случае, в отличие от иерархической классификации, невозможно.
Надо отметить, что для отсеивающих экспериментов применяют и более поздние моди­фикации дисперсионного анализа. К ним относятся такие схемы планирования, как латинский квадрат, греко-латинский квадрат и гипер-греко-латинский квадрат. Эти схемы позволяют проводить m2 опытов при mк различимых состояниях.
эксперимент квадрат факторный регрессионная зависимость
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

  1. Адлер, Ю.П. Планирование эксперимента пр поиске оптимальных условий /Ю.П.Адлер.-М.:Наука,1976.-267с.

  2. Асатурян, В.И. Теория планирования эксперимента/В.И.Асатурян. -М.: Радио и связь,1983.-260с.

  3. Володарский, Е.Т. Планирование и организация измерительного эксперимента/ Е.Т. Володарский, Б.Н. Малиновский, Ю.М. Туз.-Киев.:Вища школа, 1987.-279с.

  4. Шеффе Г. Дисперсионный анализ/ Г. Шеффе. - М.: Физматиз,1963.-560с.


Download 57.57 Kb.

Do'stlaringiz bilan baham:
1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling