Лекция Введение. Введение в машинное обучение и его основные концепции
Download 351.38 Kb.
|
Лекция 1. Введение. Введение в машинное обучение и его основные концепции
- Bu sahifa navigatsiya:
- DataMining
- Задача классификации
- Задача регрессии
- Закон распределения
- Недообучение
- Переобучение
Лекция 1. Введение. Введение в машинное обучение и его основные концепции. План: Введение. Основные понятия машинного обучения. Статистические методы и их роль в машинном обучении. Искусственность машинного обучения, применение в разведке. Приложения в различных областях. Существующие приложения МО и их возможности. К основным понятиям машинного обучения относят: DataMining – интеллектуальный анализ данных. TimeSeries DataMining – интеллектуальный анализ временных рядов. Априорная вероятность – назначенная событию вероятность, при условии отсутствия знаний, поддерживающих его наступление. Задача классификации – распределение некоторого множества объектов по заданному множеству групп (классов). Задача кластеризации – разделение некоторого множества объектов на непересекающиеся группы (кластеры) таким образом, чтобы каждая группа состояла из схожих объектов, а объекты разных кластеров существенно отличались. Задача регрессии – приближение неизвестной целевой зависи- мости на некотором множестве данных. Задача таксономии – задача построения древообразной иерар- хической структуры, упорядочивающей исходные данные. Закон распределения – функция, определяющая для выборки вероятность попадания в некоторый интервал или вероятность полу- чения определенного значения. Знание – совокупность утверждений о закономерностях и свой- ствах процессов и явлений, а также связывающих их правил логического вывода и правил использования их при принятии решений. Недообучение – ситуация, когда алгоритм при обучении с учи- телем не дает удовлетворительно малой средней ошибки на обучающем множестве. Нечеткая логика – логика, оперирующая нечеткими выска- зываниями и рассуждениями на базе частичной истинности. Обучение – способность алгоритма при решении задач некото- рого класса выдавать на некотором опыте лучшие результаты в смысле заданной меры качества при предъявлении нового опыта. Переобучение – свойство натренированного алгоритма на объектах тренировочной выборки давать существенно меньшую вероятность ошибки, чем на объектах тестовой. Энтропия – мера неупорядоченности системы. Машинное обучение нацелено на создание систем, способных получать знания из данных, а также способных с помощью обучения улучшать показатели своей работы. Таким образом, можно утверждать, что машинное обучение является одной из областей науки о данных (DataScience). На рисунке 1 представлены ее составляющие и показано место машинного обучения среди них. Download 351.38 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling