Основы информационных технологий
Download 1.75 Mb. Pdf ko'rish
|
Интеллектуальный анализ данных Чернышова
Оценка параметра
k методом кросс-проверки Один из вариантов оценки параметра k – проведение кросс-проверки. Кросс-проверка – известный метод получения оценок неизвестных пара- метров модели. Основная идея метода – разделение выборки данных на v "складок". "Складки" представляют собой случайным образом выде- ленные изолированные подвыборки. По фиксированному значению k строится модель k -ближайших соседей для получения предсказаний на v -м сегменте (остальные сегменты при этом используются как примеры) и оценивается ошибка классификации. Для регрессионных задач наиболее часто в качестве оценки ошибки выступает сумма квадратов, а для классификационных задач удобней рассматривать точность (процент корректно классифицированных наблюдений). Далее процесс последовательно повторяется для всех возможных вариантов выбора v . По исчерпании v "складок" (циклов), вычисленные ошибки усредняются и используются в качестве меры устойчивости модели (т.е. меры качества предсказания в точках запро- са). Вышеописанные действия повторяются для различных k , и значение, соответствующее наименьшей ошибке (или наибольшей классификаци- онной точности), принимается как оптимальное (оптимальное в смысле метода кросс-проверки). Следует учитывать, что кросс-проверка – вы- числительно емкая процедура, и необходимо предоставить время для работы алгоритма, особенно если объем выборки достаточно велик. Второй вариант выбора значения параметра k – самостоятельно за- дать его значение. Однако этот способ следует использовать, если име- ются обоснованные предположения относительно возможного значения параметра, например, предыдущие исследования сходных наборов дан- ных. Метод k -ближайших соседей показывает достаточно неплохие ре- зультаты в самых разнообразных задачах. Download 1.75 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling