Муҳаммад ал-хоразмий номидаги тошкент ахборот технологиялари

bet	60/117
Sana	28.08.2023
Hajmi	3.44 Mb.
	#1670962

1 ... 56 57 58 59 60 61 62 63 ... 117

Bog'liq
KIBER XAVFSIZLIK MUAMMOLARI VA ULARNING (1)

Adabiyotlar

X
Y
Z
0
0
0
0
1
0
1
0
0
1
1
1
Zamonaviy kompyuter texnalogiyalari vositalaridan foydalanish talabalarning
real elementlar va uskunalar hamda ularning elektron sxemalardagi jarayonlarni
o
’rganish to’g’risidagi bilimlarini yanada oshirishi va chuqurlashtirishiga xizmat
qilishi kerak.
Adabiyotlar
1.
Егоров Е.Н., Ремпен И.С. Применение программного
прикладного пакета Multisim для моделирования радиофизических схем,
2008, 24с. URL: http://www.sgu.ru/files/nodes/30844/MULTISIM.pdf
2.
Карлащук В.И. Электронная лаборатория на IBM PC. Программа
Electronics Workbench
и ее применение. – М.: Изд. «Солон–Р», 2001. – 726 с.

ПЛАТФОРМА CASCADING ДЛЯ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ
С ИСПОЛЬЗОВАНИЕМ MAPREDUCE
Саттаров М.А.
1
, Юлдашев А.
1
, Мусаев О.
2
1
Ассистент Самаркандский филиал Ташкентского университета
информационных технологий имени Мухаммада ал-Хоразмий
2
Преподаватель академического лицея при СамМИ
Для извлечения знаний из больших данных были разработаны и
предложены различные модели, программы, программное обеспечение,
аппаратные средства и технологии. Они пытаются обеспечить более точные
и надежные результаты для приложений больших данных. Тем не менее, в
такой среде может быть трудоемким и сложным выбор среди
многочисленных технологий. Фактически следует учитывать множество
параметров: технологическую совместимость, сложность развертывания,
стоимость, эффективность, производительность, надежность, поддержку и
риски безопасности. В этой статье мы представляем обзор последних
технологий, разработанных для больших данных.
MapReduce
[1]
это
фреймворк,
состоящий
из
модели
программирования и ее реализации. Это один из первых важных шагов для
нового поколения инструментов управления и анализа больших данных.
MapReduce
имеет интересное преимущество для приложений с большими
данными. Фактически, это упрощает обработку огромных объемов данных
благодаря своим эффективным и экономичным механизмам. Это позволяет
писать программы, которые могут поддерживать параллельную обработку.

140
Каскадная структура [2] - это богатый Java API, который предоставляет
множество компонентов для быстрой и экономичной разработки,
тестирования и интеграции приложений для больших данных.
Каскадирование имеет интересные преимущества. Оно позволяет управлять
сложными запросами и обрабатывать сложные рабочие процессы в кластерах
Hadoop
. Он поддерживает масштабируемость, переносимость, интеграцию и
разработку через тестирование.
Этот API добавляет уровень абстракции в верхней части Hadoop, чтобы
упростить сложные запросы с помощью каскадной концепции. Фактически,
загруженные данные обрабатываются и разделяются рядом функций для
получения нескольких потоков, называемых потоками. Эти потоки образуют
ациклически ориентированные графы и могут при необходимости
объединяться.
Сборка канала определяет поток, который будет проходить между
источниками данных (ответвления источника) и выходными данными
(ответвления приемника), которые подключены к каналу. Трубная сборка
может содержать один или несколько кортежей заданного размера.
Каскадный поток написан на Java и преобразован во время выполнения
в классические задания MapReduce. Потоки выполняются в кластерах Hadoop
и основаны на следующем процессе:
Экземпляр потока - это рабочий процесс, который сначала считывает
входные данные из одного или нескольких отводов источника, а затем
обрабатывает их, выполняя набор параллельных или последовательных
операций, как определено сборкой канала. Затем он записывает выходные
данные в один или несколько отводов.
Tuple
представляет собой набор значений (например, запись базы
данных таблицы SQL), которые могут быть проиндексированы с помощью
полей и могут быть сохранены непосредственно в любом формате файла
Hadoop
в виде пары ключ / значение. Кортеж должен иметь сопоставимые
типы, чтобы облегчить сравнение кортежей. Для расширения ее
возможностей было добавлено много расширений, включая [3,4]:
•
Шаблон (Pattern): используется для создания прогнозных приложений
для больших данных. Он предоставляет множество алгоритмов машинного
обучения и позволяет переводить документы Predictive Model Markup
Language (PMML
) в приложения на Hadoop.
•
Масштабирование (Scalding): используется в качестве динамического
языка программирования для решения функциональных задач. Он основан на
языке Scala с простым синтаксисом. Это расширение создано и
поддерживается Twitter.
• Cascalog
: позволяет разрабатывать приложения с использованием Java
или Clojure (динамический язык программирования, основанный на диалекте
Lisp). Он поддерживает специальные запросы, выполняя серию нескольких
заданий MapReduce для анализа различных источников (HDFS, баз данных и

141
локальных данных). Он обеспечивает более высокий уровень абстракции,
чем Hive или Pig.
• Lingual
: предоставляет интерфейс ANSI-SQL для Apache Hadoop и
поддерживает быструю миграцию данных и рабочих нагрузок в и из Hadoop.
Благодаря Lingual легче интегрировать существующие инструменты бизнес-
аналитики и другие приложения.

Download 3.44 Mb.

Do'stlaringiz bilan baham:

1 ... 56 57 58 59 60 61 62 63 ... 117