ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«Санкт-Петербургский государственный университет телекоммуникаций
им. проф. М.А. Бонч-Бруевича»
Институт непрерывного образования (ИНО)
Контрольная работа
По дисциплине «Анализ больших данных»
7 вариант
Студент: Юшкин Игорь Вадимович
Группа: ИБ-06с
Студ. Билет №: 2010659
Санкт-Петербург
2022
Лабораторная работа №1
Задание: Используя набор данных precip, определите города США с минимальным и максимальным уровнем годовых осадков.
Набор данных precip представлен в виде именованного вектора, поэтому выборку данных лучше делать через переменные.
Создадим переменную p и в нее запишем вектор. Далее в переменную min запишем минимальное значение по осадкам. А уже в переменную minCity определим город, который соответствует этому минимальному значению. То же самое проделаем, чтобы определить город с максимальным количеством осадков.
Лабораторная работа №2
Задание: Скачайте тексты трех русских народных сказок. Сформируйте облако слов, используя stopwords("russian"). Какие слова следует исключить? Добавьте эти слова в вектор исключаемых слов и сформируйте новое облако.
Продемонстрируйте приемы формирования различной цветовой гаммы.
Я скачал три сказки: «Каша из топора», «Гуси-лебеди», «Курочка ряба» и сформировал их текст в файл skazki.txt. Скачаем библиотеки необходимые для работы: tm, wordcloud. Далее с помощью метода Corpus определяем источник сказок (файл skazki.txt). Файл поддаем сортировке, чистке от символов, знаков препинания и т.д. с помощью tm_map.
Результат вывода работы программы:
Попробуем другой стиль цветов палитры (brewer.pal(6, "Paired"))):
Лабораторная работа №3
Задание: Создайте веб презентацию, включающую как минимум 7 слайдов, посвященных семи чудесам света. Каждый слайд должен содержать географическую карту места расположения чуда, время его создания и назначение сооружения.
Для начала установим библиотеки knitr. Создадим презентацию.
Код презентации:
Вывод презентации:
Do'stlaringiz bilan baham: |