Ч а с т ь I v молодой ученый
Download 3.2 Mb. Pdf ko'rish
|
moluch 422 ch4
237
“Young Scientist” . # 27 (422) . July 2022 Economics and Management Чтобы оценить эффективность используемой проце- дуры, для каждого результата рассчитываются следующие метрики: 1. Коэффициент детерминации, который отражает долю объясняемой дисперсии модели. Чем ближе зна- чение коэффициента детерминации к 1, тем сильнее соот- ветствие модели данным. 2. Средняя абсолютная ошибка (mean absolute percentage error — МАРЕ) показывает, на сколько про- центов в среднем ошибается модель. 3. Медианная Абсолютная ошибка (median absolute percentage error — MedAPE) отражает серединное зна- чение среди всех упорядоченных значений процентных ошибок. 4. Всего было рассмотрено 5 моделей. Первой мо- делью является модель линейной регрессии. Коэффициент детерминации модели равен 0.806. Это означает, что мо- дель объясняет 80,6 % дисперсии зависимой переменной. Большинство параметров модели недостоверно отлича- ется от нуля, но F-критерий, равный 87,99 (p-value близок к нулю) говорит, что вся модель значима. В среднем мо- дель ошибается на 14,94 %. Из коэффициентов линейной регрессии видно (ри- сунок 1), что признаки высота потолков, год постройки дома, наличие парковки, количества комнат, площадь, ко- личество этажей дома увеличивают стоимость объекта недвижимости. Например, наличие парковки при прочих равных увеличивает стоимость квартиры на 29 393, а уве- личение года постройки всего на год на 16 646. Отсутствие ремонта уменьшает стоимость квартиры при прочих равных, наибольший вклад вносит дизайнерский тип ре- монта, он увеличивает стоимость на 1 835 840. Модель ли- нейной регрессии переобучена, она сильно подстраива- ется под данные обучающей выборки. Рис. 1. Коэффициенты линейной регрессии Коэффициент детерминации модели дерево решений равен 76 %. В среднем модель ошибается на 15,24 %. Из ри- сунка 2, можно сделать вывод о том, что наибольший вклад оказывает признак площади объекта, а также средняя сто- имость квадратного метра по району, тип ремонта, год по- стройки дома, количество этажей в доме, этаж. Дерево Ре- шений плохо справляется с объектами, площадь который более 100 м2. Какая бы площадь ни была сверх 100 м 2 мо- дель будет предсказывать одно и то же значение, среднее значение цены по таким квартирам на обучающей вы- борке. Скорее всего это связано с тем, что таких квартир мало и модель не смогла корректно обучиться. Рис. Download 3.2 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling