Мавзу: Бошкарув системаларини максад ва функцияларини тахлил килиш жараёнини автоматлаштириш


  ОБЗОР ИНСТРУМЕНТА ДЛЯ АВТОМАТИЗАЦИИ


Download 419.66 Kb.
Pdf ko'rish
bet5/7
Sana20.12.2022
Hajmi419.66 Kb.
#1035086
TuriЛекция
1   2   3   4   5   6   7
Bog'liq
1-Лекция

2. 
ОБЗОР ИНСТРУМЕНТА ДЛЯ АВТОМАТИЗАЦИИ 
ПРЕДОБРАБОТКИ И ОЧИСТКИ ДАННЫХ



В процессе решения задач различной сложности и спецификации, 
необходимо провести правильный анализ данных. Это связано с тем, что 
объемы вычисления достаточно велики, а нейронная сеть, что выполняет 
работу, имеет ограниченный диапазон чисел и возможных операций, что 
может сказаться на точности результата. 
Поэтому проводится предварительная обработка данных, которая 
упрощает анализ и помогает очистить информацию от лишнего, используя 
нейросети и машинное обучение. 
Процедура включает следующие этапы: 
1. производится 
масштабирование данных, когда значение 
компонентов заключается в определенный диапазон; 
2. далее происходит нормировка, в этом случае устанавливаются 
ограничения на разброс случайных величин; 
3. последний этап включает факторный анализ, где исключают 
несущественные данные. 
Таким образом, в data mining избегают недопустимых значений или 
комбинаций. 
Описание процесса обработки информации и его задачи 
В предварительной обработке данных используют принцип «мусор на 
входе – мусор на выходе». Лишняя информация и «шумные» данные 
усложняют извлечение необходимого в процессе machine learning. 
Тренировка сопрягается с различными затруднениями, поэтому подготовка с 
последующей фильтрацией занимают немало времени. Предобработка 
данных начинается с подготовки, которая включает: 

очистку информации; 

отбор нужных экземпляров; 

приведение данных в нормальную форму; 

преобразования; 

выделение и последующий отбор признаков. 



В результате получается набор для тренировок машины, который 
впоследствии упрощает задачу и способствует обучению вычислительной 
техники. Подобная работа, включающая сбор и предварительную обработку 
информации, очистку данных и т.д. может использоваться нейросетями или 
для ручной обработки. 
Используются данные методы в следующих разделах анализа: 

вычисление базовых характеристик, например, в центральных 
моментах; 

проверка основных гипотез, чаще всего симметричность или 
однородность; 

проверка для стохастичности приведенной выборки; 

исключение аномальных исследований; 

для разведочного анализа. 
Это помогает избежать ошибки в самых различных областях. Так, 
например, можно использовать предварительную подготовку данных при 
исследованиях в следующих сферах: геофизических, экономических
биологических, медицинских и т.д. Технологический процесс используется 
при разборке результатов лазерного сканирования, медицинских тестов, 
выделения общих или различных признаков каких-либо исследуемых 
объектов и т.д. 
Самые популярные примеры ошибок, которые метод позволяет 
исключить, это: 

доход, уходящий в отрицательное значение; 

положительный тест на беременность для мужчины. 
Поэтому 
качественные 
вычисления 
возможны 
с 
помощью 
обозначенных методов обработки. 

Download 419.66 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling