Построение кривых регрессий


и не забываем выразить непосредственно коэффициент


Download 163.78 Kb.
bet4/5
Sana17.06.2023
Hajmi163.78 Kb.
#1543733
1   2   3   4   5
и не забываем выразить непосредственно коэффициент 
В результате, искомая экспонента:  . Напоминаю, что полученное уравнение наилучшим образом приближает эмпирические точки по сравнению с любой другой экспонентой из семейства  . Выполним чертёж:

Если выполняете его от руки, то для построения экспоненты можно использовать опорные значения  , вычисленные в таблице ниже.
3) Найдём индекс детерминации и индекс корреляции. Для этого вычислим среднее значение признака-результата  и заполним расчётную таблицу, сразу с добавочным столбцом для расчёта СОА в пункте 5:

В результате, общая сумма квадратов  , остаточная сумма квадратов  и индекс детерминации:
– таким образом, в рамках построенной модели размножение бактерий (результат  ) на 98,21% объяснено течением времени (фактором  ). Остальные 1,79% вариации признака-результата обусловлены другими, не учтёнными в модели факторами.
Вычислим индекс корреляции:
– таким образом, согласно шкале Чеддока, существует практически функциональная зависимость признака-результата  от фактора  .
4) Проверим статистическую значимость построенной модели. Говоря простыми словами, нужно выяснить – а можно ли доверять полученным выборочным результатам? Или же они случайны? (по той причине, что выборка малА). Ответ на этот вопрос тут очевиден, но нужно оформить формальное решение.
На уровне значимости  проверим нулевую гипотезу  – о том, что генеральный индекс детерминации равен нулю, против конкурирующей гипотезы:  .
Используем статистический критерий  , где  – значение выборочного индекса детерминации. В разных выборках оно будет разным, а посему  – есть величина случайная (как и любой другой статистический критерий).
Для уровня значимости  и количества степеней свободы   по соответствующей таблице или с помощью Расчётного макета (пункт 12) определяем критическое значение критерия: 
Вычислим наблюдаемое значение критерия:  – оно попало, да ещё как, в критическую область  :

– поэтому на уровне значимости  гипотезу  отвергаем в пользу гипотезы  .
Вывод: полученный результат статистически значим, следовательно, статистически значимо и выборочное уравнение  экспоненциальной регрессии. То есть, с точки зрения статистики, получилось не фуфло.
…Да, если вам не очень понятны эти танцы с бубном, то ознакомьтесь с общей моделью регрессии и линейным случаем в частности, где я рассказал, что к чему.
5) Вычислим среднюю ошибку аппроксимации:
– таким образом, регрессионные значения  отличаются от соответствующих эмпирических значений  в среднем на 8,16%, что можно признать хорошим результатом.
6) Спрогнозируем количество бактерий к 12-му и 24-му часу:
бактерий;
бактерий.
Вот такой вот он, экспоненциальный рост. Но это не беда. Domestos, миллионы микробов умрут (с).
Аналогичное задание для самостоятельного решения:
Пример 75
В результате исследования получены следующие данные:

где,  – количество выпущенной продукции (тысяч единиц), а  – себестоимость одной единицы продукции (руб.)
1) Методом наименьших квадратов найти уравнение  гиперболической регрессии, выполнить чертёж.
2) Вычислить индекс детерминации и корреляции.
3) Проверить значимость полученной модели на уровне  .
4) Найти среднюю ошибку аппроксимации.
По каждому пункту сделать выводы.
Система – вот:

а числа уже в Экселе – не ленимся провести вычисления! Ничего страшного, если получится не сильно красиво, важно отработать сам алгоритм.
Обратите внимание, что в этой задаче сразу предложен вид регрессии, и это не случайность. Гиперболическая зависимость характерна для процессов, где есть некий предел («насыщение») – когда дальнейшее увеличение (либо уменьшение) факторной переменной практически перестаёт оказывать влияние на результат (ещё раз проанализируйте числа в таблице выше). Яркий пример есть в физике – это остывание кипятка: наиболее сильно температура падает в первый час, в течение же последующих часов она уменьшается уже незначительно. И пример с ростом: мышечная масса человека будет заметно расти с увеличением физических нагрузок, но настанет такой момент, когда этот рост практически прекратится, как ни увеличивай интенсивность и продолжительность тренировок. И здесь остаётся только «химия», к которой прибегают практически все культуристы (ни в коем случае не призыв).
r = ∑((x - x̄)(y - ȳ)) / √(∑(x - x̄)²∑(y - ȳ)²)
где x и y - значения переменных X и Y, x̄ и ȳ - средние значения переменных X и Y.
Вы можете использовать эту формулу для вычисления выборочных коэффициентов корреляции между X и Y, между X и Z и между Y и Z.Однако это может быть довольно трудоемким процессом,особенно если у вас большое количество данных.В этом случае может быть полезно использовать программное обеспечение для статистического анализа данных, которое может автоматически вычислить коэффициенты корреляции
Выборочный коэффициент корреляции между двумя переменными показывает степень линейной связи между ними. Однако для построения уравнения регрессии с использованием метода наименьших квадратов вам необходимо иметь данные для этих переменных.
Метод наименьших квадратов используется для построения линейного уравнения регрессии вида y = a + bx, где a и b - параметры уравнения регрессии. Эти параметры можно вычислить с помощью следующих формул:
b = ∑((x - x̄)(y - ȳ)) / ∑(x - x̄)² a = ȳ - b * x̄
где x и y - значения переменных X и Y, x̄ и ȳ - средние значения переменных X и Y.Вы можете использовать эти формулы для вычисления параметров уравнения регрессии для каждой пары переменных (X и Y, X и Z, Y и Z). Однако, как и в случае с вычислением коэффициентов корреляции, это может быть довольно трудоемким процессом, особенно если у вас большое количество данных. В этом случае может быть полезно использовать программное обеспечение для статистического анализа данных, которое может автоматически вычислить параметры уравнения регрессии для вас.

Download 163.78 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling