Муҳаммад ал-хоразмий номидаги тошкент ахборот технологиялари


Download 3.44 Mb.
Pdf ko'rish
bet60/117
Sana28.08.2023
Hajmi3.44 Mb.
#1670962
1   ...   56   57   58   59   60   61   62   63   ...   117
Bog'liq
KIBER XAVFSIZLIK MUAMMOLARI VA ULARNING (1)
















Zamonaviy kompyuter texnalogiyalari vositalaridan foydalanish talabalarning 
real elementlar va uskunalar hamda ularning elektron sxemalardagi jarayonlarni 
o
’rganish to’g’risidagi bilimlarini yanada oshirishi va chuqurlashtirishiga xizmat 
qilishi kerak. 
Adabiyotlar 
1. 
Егоров Е.Н., Ремпен И.С. Применение программного 
прикладного пакета Multisim для моделирования радиофизических схем, 
2008, 24с. URL: http://www.sgu.ru/files/nodes/30844/MULTISIM.pdf
2. 
Карлащук В.И. Электронная лаборатория на IBM PC. Программа 
Electronics Workbench 
и ее применение. – М.: Изд. «Солон–Р», 2001. – 726 с.
 
 
ПЛАТФОРМА CASCADING ДЛЯ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ 
С ИСПОЛЬЗОВАНИЕМ MAPREDUCE 
Саттаров М.А.
 1
, Юлдашев А.
 1
, Мусаев О.

1
Ассистент Самаркандский филиал Ташкентского университета 
информационных технологий имени Мухаммада ал-Хоразмий 
2
Преподаватель академического лицея при СамМИ
Для извлечения знаний из больших данных были разработаны и 
предложены различные модели, программы, программное обеспечение, 
аппаратные средства и технологии. Они пытаются обеспечить более точные 
и надежные результаты для приложений больших данных. Тем не менее, в 
такой среде может быть трудоемким и сложным выбор среди 
многочисленных технологий. Фактически следует учитывать множество 
параметров: технологическую совместимость, сложность развертывания, 
стоимость, эффективность, производительность, надежность, поддержку и 
риски безопасности. В этой статье мы представляем обзор последних 
технологий, разработанных для больших данных. 
MapReduce 
[1] 
это 
фреймворк, 
состоящий 
из 
модели 
программирования и ее реализации. Это один из первых важных шагов для 
нового поколения инструментов управления и анализа больших данных. 
MapReduce 
имеет интересное преимущество для приложений с большими 
данными. Фактически, это упрощает обработку огромных объемов данных 
благодаря своим эффективным и экономичным механизмам. Это позволяет 
писать программы, которые могут поддерживать параллельную обработку. 


140 
Каскадная структура [2] - это богатый Java API, который предоставляет 
множество компонентов для быстрой и экономичной разработки, 
тестирования и интеграции приложений для больших данных. 
Каскадирование имеет интересные преимущества. Оно позволяет управлять 
сложными запросами и обрабатывать сложные рабочие процессы в кластерах 
Hadoop
. Он поддерживает масштабируемость, переносимость, интеграцию и 
разработку через тестирование. 
Этот API добавляет уровень абстракции в верхней части Hadoop, чтобы 
упростить сложные запросы с помощью каскадной концепции. Фактически, 
загруженные данные обрабатываются и разделяются рядом функций для 
получения нескольких потоков, называемых потоками. Эти потоки образуют 
ациклически ориентированные графы и могут при необходимости 
объединяться. 
Сборка канала определяет поток, который будет проходить между 
источниками данных (ответвления источника) и выходными данными 
(ответвления приемника), которые подключены к каналу. Трубная сборка 
может содержать один или несколько кортежей заданного размера. 
Каскадный поток написан на Java и преобразован во время выполнения 
в классические задания MapReduce. Потоки выполняются в кластерах Hadoop 
и основаны на следующем процессе: 
Экземпляр потока - это рабочий процесс, который сначала считывает 
входные данные из одного или нескольких отводов источника, а затем 
обрабатывает их, выполняя набор параллельных или последовательных 
операций, как определено сборкой канала. Затем он записывает выходные 
данные в один или несколько отводов. 
Tuple 
представляет собой набор значений (например, запись базы 
данных таблицы SQL), которые могут быть проиндексированы с помощью 
полей и могут быть сохранены непосредственно в любом формате файла 
Hadoop 
в виде пары ключ / значение. Кортеж должен иметь сопоставимые 
типы, чтобы облегчить сравнение кортежей. Для расширения ее 
возможностей было добавлено много расширений, включая [3,4]: 
• 
Шаблон (Pattern): используется для создания прогнозных приложений 
для больших данных. Он предоставляет множество алгоритмов машинного 
обучения и позволяет переводить документы Predictive Model Markup 
Language (PMML
) в приложения на Hadoop. 
• 
Масштабирование (Scalding): используется в качестве динамического 
языка программирования для решения функциональных задач. Он основан на 
языке Scala с простым синтаксисом. Это расширение создано и 
поддерживается Twitter. 
• Cascalog
: позволяет разрабатывать приложения с использованием Java 
или Clojure (динамический язык программирования, основанный на диалекте 
Lisp). Он поддерживает специальные запросы, выполняя серию нескольких 
заданий MapReduce для анализа различных источников (HDFS, баз данных и 


141 
локальных данных). Он обеспечивает более высокий уровень абстракции, 
чем Hive или Pig. 
• Lingual
: предоставляет интерфейс ANSI-SQL для Apache Hadoop и 
поддерживает быструю миграцию данных и рабочих нагрузок в и из Hadoop. 
Благодаря Lingual легче интегрировать существующие инструменты бизнес-
аналитики и другие приложения. 

Download 3.44 Mb.

Do'stlaringiz bilan baham:
1   ...   56   57   58   59   60   61   62   63   ...   117




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling