Referee’s report
Нелинейные преобразования признаков и вычисление обобщённых оценок объектов
Download 96.08 Kb.
|
Отношения на много
3. Нелинейные преобразования признаков и вычисление обобщённых оценок объектов
Суть нелинейных преобразований признаков сводится к замене их исходных значений на значения функции принадлежности объектов к классам Пусть для значений количественного признака xc∊X(n) в описании объектов E0 построена упорядоченная по неубыванию последовательность r1,…,rj,…,rm. (1) Разбиение на непересекающиеся интервалы основана на утверждении, что существуют интервалы, в границах которых частота встречаемости значений признака у объектов из класса Kt будет больше чем частота встречаемости у объектов из класса K3-t, t=1,2. Для разбиения (1) на множество из pc (pc≥2) непересекающихся интервалов {[ru;rv]i}, 1≤u, u≤ v≤ m, i=1,…,pc предлагается использовать критерий из [Игнатьев]. Оптимальное значение, определяемое по критерию, в общем–то не является фиксированным на выборках из генеральной совокупности. Значения в границах интервала [ru;rv]i при анализе данных рассматривается как градация номинального признака. Считается, что множество чисел, идентифицирующих pc градаций номинального признака, всегда можно взаимно–однозначно отобразить в множество {1,...,pc}. Пусть dtc(u,v), d3-t,c(u,v) – количество представителей классов Kt, K3-t в интервале [ru;rv]i, i∈{1,...,pc}. Для рекурсивной процедуры выбора значений ru,rv для покрытие всех значений (1) непересекающимися интервалами используется критерий . (2) В целях унификации обозначений вместо dtc(u,v), t=1,2 для интервала [ru;rv]μ по xc∈X(n) будем использовать dtc(μ). При вычислении функции принадлежности fc(μ) к классу K1 по градации μ∈{1,2,…,pc} в качестве d1c(μ) (d2c(μ)) используется число объектов класса K1 (K2) со значением μ. Значение функции принадлежности fc(μ) к классу K1 по интервалу [ru;rv]μ (градации μ∈{1,...,pc}) определяется как (3) Исключим из X(n) множество признаков F, нелинейные преобразования над которыми недопустимы. Определим условия на признак xc∈X(n) для включения его в множество F. Если частоты встречаемости значений количественного признака при разбиении их на интервалы по (2) равны или существует градация μ∈{1,...,pc} с fc(μ)=0.5 для номинального признака, то F=FU{xc}. Обозначим через D={i | xi∈X(n)\F} – множество индексов признаков, которые можно использовать для нелинейных преобразований. Замена градаций признака на значения функции принадлежности объектов к классу K1 по (3) при pc>2 рассматривается как нелинейное преобразование. При такой замене порядок следования исходных и преобразованных значений количественного признака не совпадают. Граница между объектами классов по значениям функции принадлежности (3) для xc∈X(n)\F определяется как Gc=(q1 + q2)/2, (4) где q2=max{fc(μ)| 0.5 - fc(μ)>0, μ=1,...,pc}, q1=min{fc(μ)| 1 - fc(μ)<0.5, μ=1,...,pc}. При вычислении значения градации aic∈{1,2}, c∈D для объекта Si={xiu}u∈D по (4) используется проверка условия xic∈[ru;rv]μ для количественного признака и xic=μ для номинального. Одно из двух значений градации определяется так Для сравнения разнотипных признаков безотносительно их шкал измерений предлагается использовать значения устойчивости. С учётом (2) формула вычисления устойчивости для количественного признака xc∈X(n)\F имеет вид (5) где ti – число градаций признака со значением i. Так как число градаций номинального признака не меняется на выборках из генеральной совокупности, то значение устойчивости определяется как (6) Число непересекающихся интервалов по (2) на выборках из генеральной совокупности не является постоянной величиной. О существовании зависимости значений устойчивости (5) от числа интервалов доказывается в теореме. Теорема (об устойчивости). Значение устойчивости (5) при неограниченном росте числа объектов выборки E0, разделённых на два непересекающихся класса, стремится к постоянной величине Φ, Φ∈(0.5;1]. Download 96.08 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling