Referee’s report
Download 96.08 Kb.
|
Отношения на много
- Bu sahifa navigatsiya:
- Способы разбиения признаков на группы
Доказательство. Очевидно . Согласно закона больших чисел оценка сходимости по вероятности при 0<ε<1 будет такой
Вес признака xc∈X(n)\F в описании объектов выборки вычисляется через градации из {1,2} в номинальной шкале. Обозначим через – количество значений градации j∊{1,2} признака xc∈X(n)\F в описании объектов соответственно класса K1 и K2. Межклассовое различие по признаку xc определяется как величина (7) Степень однородности (мера внутриклассового сходства) βc значений градаций признака по классам K1, K2 вычисляется по формуле: (8) С помощью (7),(8) вес признака xc∈X(n)\F в номинальной шкале аналогично (2) определяется как произведение внутриклассового сходства и межклассового различия wс=βсλс. (9) Множество допустимых значений весов признаков, вычисляемых по (9), принадлежит интервалу (0;1]. Для вычисления обобщённых оценок объектов на E0 используются вклады градаций признаков. Вклад градации j∈{1,2} признака xc∈X(n)\F определяется как (10) где – количество значений градации j признака xc соответственно в классах K1 и K2, wс – вес признака xc по (8). Обобщённая оценка объекта Sr∈E0 по описанию в номинальной шкале измерений Sr={ari}i∈D на наборе TUPLAM⸦D и вкладам (10) вычисляется как (11) Способы разбиения признаков на группы Множество различных способов (вариантов) разбиения сырых признаков на непересекающиеся группы для формирования из них наборов латентных признаков по (11) ограничено сверху числом n·(n-1)/2. Наличие отношений между признаками позволяет на основе их свойств уменьшить число вариантов разбиения. К качестве таких свойств используются: – выбор подмножеств исходных признаков по правилам иерархической агломеративной группировки; – формирование последовательности из упорядоченных по устойчивости сырых признаков и разбиение её (последовательности) на непересекающиеся подмножества. Алгоритм иерархической агломеративной группировки [ИИ_ПР_2021] реализует жадную стратегию формирования наборов латентных признаков. Количество групп и их состав определяются алгоритмическим путём. Для упорядочения латентных признаков используются значения их меры компактности на числовой оси. Единственность разбиения значений количественных признаков на непересекающиеся интервалы на E0 критерию (2) позволяет использовать общую с номинальными признаками формулу (6) для вычисления устойчивости. Число вариантов (непересекающихся групп) исходных признаков на упорядоченной по значениям их устойчивости (6) последовательности ограничено числом [n/2]. Группы признаков из такой последовательности могут быть сформированы по правилам иерархического агломеративного (не жадного) алгоритма [Тулиев ]. 1> Download 96.08 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling