Определение оценок дисперсий коэффициентов регрессии
Download 57.57 Kb.
|
ОПРЕДЕЛЕНИЕ ОЦЕНОК ДИСПЕРСИЙ КОЭФФИЦИЕНТОВ РЕГРЕССИИ. Содержание Основные понятия и определения планирования и организации эксперимента 1.2 Задачи регрессионного анализа 1.3 Метод наименьших квадратов 1.4 Полный факторный эксперимент 1.5 Дробный факторный эксперимент Дисперсионный анализ Список использованных источников 1 Обзор литературы 1.1 Основные понятия и определения планирования и организации эксперимента Планирование эксперимента – это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. При планировании эксперимента существенно следующие: стремление к минимизации общего числа опытов; одновременное варьирование всеми переменными, определяющими процесс по специальным правилам – алгоритмам; использование математического аппарата формализующего многие действия экспериментатора; выбор четкой стратегии, позволяющий принимать обоснованные решения после каждой серии экспериментов. Фактор – это измеримая переменная величина, принимающая в некоторый момент времени определенное значение и соответствующая одному из возможных способов воздействия на объект исследования Все факторы, определяющие процесс, изменяются одновременно по специальным правилам, а результаты эксперимента представляются в виде математической модели, обладающей некоторыми «хорошими» статистическими свойствами. При этом можно выделить следующие этапы: - сбор и анализ априорной информации; - выбор входных и выходных переменных, области экспериментирования; - выбор математической модели, с помощью которой будут представляться экспериментальные данные; - выбор критерия оптимальности и плана эксперимента; - определение метода анализа данных; - проведение эксперимента; - проверка статистических предпосылок для полученных экспериментальных данных; - обработка результатов; - интерпретация и рекомендации. Факторы определяют состояние объекта. Основное требование к факторам — управляемость. Под управляемостью понимается установление нужного значения фактора (уровня) и поддержание его в течение всего опыта. Факторы могут быть количественными и качественными. Примерами количественных факторов являются температура, давление, концентрация и т. п. Их уровням соответствует числовая шкала. Различные катализаторы, конструкции аппаратов, способы лечения, методики преподавания являются примерами качественных факторов. Уровням таких факторов не соответствует, числовая шкала, и их порядок не играет роли. Дисперсионный анализ – это статический метод анализа результатов наблюдений, зависящих от различных одновременно действующих факторов, выбор наиболее важных факторов и оценка их влияния. Измерения или наблюдения могут проводиться как в экспериментальных науках (например, в генетике), так и не экспериментальных науках (например, в астрономии). Теория анализа результатов измерений подсказывает, как планировать проведение опыта или наблюдения, то есть приводит к планированию эксперимента. Исторически современный метод дисперсионного анализа развивается, главным образом, в связи с приложениями к задачам сельского хозяйства. Дисперсионный анализ был развит в значительной мере Р.А. Фишером, который ввел в статистику сами термины дисперсия и дисперсионный анализ. Полный факторный эксперимент (ПФЭ) – это эксперимент, в котором реализуются все возможные сочетания уровней факторов. Дробный факторный эксперимент (ДФЭ) – это эксперимент, представляющий дробные реплики (матрицы планирования) полного факторного эксперимента. Различают регулярные и нерегулярные дробные реплики, Регулярные реплики образуются из полного факторного эксперимента 2n делением пополам, на четыре части, восемь частей и т. д., в. общем, на число частей кратное двум. Они называются соответственно: полуреплика, четверть-реплика, у8-реплика и т. д. Реплики типа 3Д, 5/а и т. д. называются нерегулярными. Матрицей планирования называется таблица, содержащая условия проведения всех опытов в соответствии с выбранным планом. Задачи регрессионного анализа Регрессия — зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Задача регрессионного анализа заключается в восстановлении функциональной зависимости y(x) по результатам измерений. В регрессионном анализе предполагается, что можно прямо или косвенно контролировать одну или нескольких переменных x1 , x2….xn, и их значение вместе с множеством параметров Q1,Q2….Qn определяющие математическое ожидание зависимой переменной i . Задача состоит в вычислении оценок параметров с помощью выборочных данных. Постулаты регрессионного анализа: 1 постулат: Параметр оптимизации y есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости – одна из характеристик этого закона распределения. постулат: Дисперсия y не зависит от абсолютной величины y. постулат: Значения факторов суть неслучайной величины. Метод наименьших квадратов Этот метод был развит усилиями Лежандра и Гаусса, более 150 лет назад. Метод наименьших квадратов (МНК) является самым распространенным, хотя не единственным метом усреднения. Если дано у=b0+b1*x1 – уравнение прямой линии. Надо вычислить коэффициенты b0,b1. Для этого уравнение приравнивается к нулю yi - b0-b1*x1*xi=0, где i=1,2,…N (N-номер опыта) или yi - b0-b1*x1*xi=Еi, где Еi – невязка, то есть разность между экспериментальным и вычисленным по уравнению регрессии значениям у в i-й экспериментальной точке. Невязка возникает по двум причинам: из-за ошибки эксперимента и из-за модели. Надо найти коэффициенты регрессии, при которых невязка будет минимальной: U= Е2i=min, который приводит к методу наименьших квадратов. МНК обладает следующим свойством: он делает определенной любую произвольную систему уравнений равную числу неизвестных коэффициентов. Для определения двух неизвестных коэффициентов требуется два уравнения, например, для уравнения y= a0+a1*x, с двумя неизвестными коэффициентами используется система уравнений: a0*N +ai xi= yi a0 xi + ai x2 i = xi*yi Для определения трех неизвестных коэффициентов требуется три уравнения, например, для уравнения y = a0+a1*x+ a*x2 , с тремя неизвестными коэффициентами используется система уравнений: a0*N +ai xi+а2 x2 i = yi a0 xi + ai x2 i +a2 x3 i = xi*yi a0 x2 i + ai x3 i +a2 x4 i = x2i*yi МНК для обратной зависимости y= a0+a1/x. Чтобы найти два неизвестных коэффициента используется система уравнении: a0*N +ai 1/xi= yi a0 1/xi + ai 1/x2 i =yi/хi Порядок расчета задач методом наименьших квадратов: Строится таблица (таблица 1) Таблица 1 Пример, построения таблицы для данных задачи МНК
где xi- входные величины, уi- выходные величины, Download 57.57 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling