Программа для решения задачи Цель работы : практическое изучение вопросов классификации


Download 114.43 Kb.
bet1/4
Sana11.10.2023
Hajmi114.43 Kb.
#1698268
TuriПрограмма
  1   2   3   4
Bog'liq
Лабораторное занятие 3


Лаборатория №3. Классификация алгоритма обработки данных и программа для решения задачи
Цель работы: практическое изучение вопросов классификации
1.Постановка задачи классификации на Python
Классификация — прогнозирование показателя с конечным количеством значений. Более простое определение — прогнозирование категории, к которой относится объект. Распознавание жанра текста или объектов на картинке — это задачи классификации.

Для решения задач классификации используются библиотеки numpy, sklearn.metrics и tensorflow.

2.Алгоритмы K-ближайших соседей на Python
Одно из самых популярных приложений машинного обучения — решение задач классификации. Задачи классификации — это ситуации, когда у вас есть набор данных, и вы хотите классифицировать наблюдения из этого набора в определенную категорию.
Известный пример — спам-фильтр для электронной почты. Gmail использует методы машинного обучения с учителем, чтобы автоматически помещать электронные письма в папку для спама в зависимости от их содержания, темы и других характеристик.
Две модели машинного обучения выполняют большую часть работы, когда дело доходит до задач классификации:
Метод K-ближайших соседей
Метод К-средних
Модели K-ближайших соседей. Алгоритм K-ближайших соседей является одним из самых популярных среди ML-моделей для решения задач классификации.
Обычным упражнением для студентов, изучающих машинное обучение, является применение алгоритма K-ближайших соседей к датасету, категории которого неизвестны. Реальным примером такой ситуации может быть случай, когда вам нужно делать предсказания, используя ML-модели, обученные на секретных правительственных данных.
В этом руководстве вы изучите алгоритм машинного обучения K-ближайших соседей и напишите его реализацию на Python. Мы будем работать с анонимным набором данных, как в описанной выше ситуации.
Используемый датасет. Первое, что вам нужно сделать, это скачать набор данных, который мы будем использовать в этом руководстве. Вы можете скачать https://gitlab.com/PythonRu/notebooks/-/blob/master/classified_data.csv.
Далее вам нужно переместить загруженный файл с датасетом в рабочий каталог. После этого откройте Jupyter Notebook — теперь мы можем приступить к написанию кода на Python!

Download 114.43 Kb.

Do'stlaringiz bilan baham:
  1   2   3   4




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling