Контрольная работа Дисциплина: Нейросетевые технологии


Download 0.66 Mb.
bet4/5
Sana18.06.2023
Hajmi0.66 Mb.
#1598470
TuriКонтрольная работа
1   2   3   4   5
Bog'liq
ИБ-94з Джиганте КР Нейросетевые технологии





Контрольные вопросы


1) Как вычислить матрицу счетов метода РСА исследуемой матрицы Х, используя сингулярное разложение Х?
Суть метода главных компонент – существенное понижение размерности данных. Исходная матрица X заменяется двумя новыми матрицами T и P:

Матрица T называется матрицей счетов (scores), а матрица P — матрицей нагрузок (loadings). Использование сингулярного разложения подразумевает представление исходной матрицы X на 3 матрицы

если в матрице S оставить только k наибольших сингулярных значений, а в матрицах U и V только соответствующие этим значениям столбцы, то произведение получившихся матриц будет наилучшим приближением исходной матрицы X к матрице меньшего ранга k.
Связь между PCA и SVD выражается соотношениями, позволяющими ответить на исходный вопрос.

2) Опишите процесс выделения главных компонент в многомерном случае своими словами.
Метод главных компонент ставит целью перенести данные в некоторые новые координаты. В общем, многомерном случае, процесс выделения главных компонент происходит так:

  1. Ищется центр облака данных, и туда переносится новое начало координат – это нулевая главная компонента (PC0) 

  2. Выбирается направление максимального изменения данных – это первая главная компонента (PC1) 

  3. Если данные описаны не полностью (шум велик), то выбирается еще одно направление (PC2) – перпендикулярное к первому, так чтобы описать оставшееся изменение в данных и т.д.

И так надо действовать, до тех пор, пока шум уже не станет действительно шумом, т.е. случайным хаотическим набором величин.
В результате, переходим от большого количества переменных к новому представлению, размерность которого значительно меньше. Часто удается упростить данные на порядки: от 1000 переменных перейти всего к двум. При этом ничего не выбрасывается – все переменные учитываются. В то же время несущественная для сути дела часть данных отделяется, превращается в шум. Найденные главные компоненты и дают нам искомые скрытые переменные, управляющие устройством данных.

Download 0.66 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling