Ч а с т ь I v молодой ученый


Download 3.2 Mb.
Pdf ko'rish
bet50/94
Sana13.10.2023
Hajmi3.2 Mb.
#1701389
1   ...   46   47   48   49   50   51   52   53   ...   94
Bog'liq
moluch 422 ch4

237
“Young Scientist”  # 27 (422)  July 2022
Economics and Management
Чтобы оценить эффективность используемой проце-
дуры, для каждого результата рассчитываются следующие 
метрики:
1. Коэффициент детерминации, который отражает 
долю объясняемой дисперсии модели. Чем ближе зна-
чение коэффициента детерминации к 1, тем сильнее соот-
ветствие модели данным.
2. Средняя абсолютная ошибка (mean absolute 
percentage error — МАРЕ) показывает, на сколько про-
центов в среднем ошибается модель.
3. Медианная Абсолютная ошибка (median absolute 
percentage error — MedAPE) отражает серединное зна-
чение среди всех упорядоченных значений процентных 
ошибок.
4. Всего было рассмотрено 5 моделей. Первой мо-
делью является модель линейной регрессии. Коэффициент 
детерминации модели равен 0.806. Это означает, что мо-
дель объясняет 80,6 % дисперсии зависимой переменной. 
Большинство параметров модели недостоверно отлича-
ется от нуля, но F-критерий, равный 87,99 (p-value близок 
к нулю) говорит, что вся модель значима. В среднем мо-
дель ошибается на 14,94 %.
Из коэффициентов линейной регрессии видно (ри-
сунок 1), что признаки высота потолков, год постройки 
дома, наличие парковки, количества комнат, площадь, ко-
личество этажей дома увеличивают стоимость объекта 
недвижимости. Например, наличие парковки при прочих 
равных увеличивает стоимость квартиры на 29 393, а уве-
личение года постройки всего на год на 16 646. Отсутствие 
ремонта уменьшает стоимость квартиры при прочих 
равных, наибольший вклад вносит дизайнерский тип ре-
монта, он увеличивает стоимость на 1 835 840. Модель ли-
нейной регрессии переобучена, она сильно подстраива-
ется под данные обучающей выборки.
Рис.
 1. Коэффициенты линейной регрессии
Коэффициент детерминации модели дерево решений 
равен 76 %. В среднем модель ошибается на 15,24 %. Из ри-
сунка 2, можно сделать вывод о том, что наибольший вклад 
оказывает признак площади объекта, а также средняя сто-
имость квадратного метра по району, тип ремонта, год по-
стройки дома, количество этажей в доме, этаж. Дерево Ре-
шений плохо справляется с объектами, площадь который 
более 100 м2. Какая бы площадь ни была сверх 100 м
2
мо-
дель будет предсказывать одно и то же значение, среднее 
значение цены по таким квартирам на обучающей вы-
борке. Скорее всего это связано с тем, что таких квартир 
мало и модель не смогла корректно обучиться.
Рис.

Download 3.2 Mb.

Do'stlaringiz bilan baham:
1   ...   46   47   48   49   50   51   52   53   ...   94




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling