Муҳаммад ал-хоразмий номидаги тошкент ахборот технологиялари
Download 3.44 Mb. Pdf ko'rish
|
KIBER XAVFSIZLIK MUAMMOLARI VA ULARNING (1)
- Bu sahifa navigatsiya:
- Adabiyotlar
X
Y Z 0 0 0 0 1 0 1 0 0 1 1 1 Zamonaviy kompyuter texnalogiyalari vositalaridan foydalanish talabalarning real elementlar va uskunalar hamda ularning elektron sxemalardagi jarayonlarni o ’rganish to’g’risidagi bilimlarini yanada oshirishi va chuqurlashtirishiga xizmat qilishi kerak. Adabiyotlar 1. Егоров Е.Н., Ремпен И.С. Применение программного прикладного пакета Multisim для моделирования радиофизических схем, 2008, 24с. URL: http://www.sgu.ru/files/nodes/30844/MULTISIM.pdf 2. Карлащук В.И. Электронная лаборатория на IBM PC. Программа Electronics Workbench и ее применение. – М.: Изд. «Солон–Р», 2001. – 726 с. ПЛАТФОРМА CASCADING ДЛЯ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ MAPREDUCE Саттаров М.А. 1 , Юлдашев А. 1 , Мусаев О. 2 1 Ассистент Самаркандский филиал Ташкентского университета информационных технологий имени Мухаммада ал-Хоразмий 2 Преподаватель академического лицея при СамМИ Для извлечения знаний из больших данных были разработаны и предложены различные модели, программы, программное обеспечение, аппаратные средства и технологии. Они пытаются обеспечить более точные и надежные результаты для приложений больших данных. Тем не менее, в такой среде может быть трудоемким и сложным выбор среди многочисленных технологий. Фактически следует учитывать множество параметров: технологическую совместимость, сложность развертывания, стоимость, эффективность, производительность, надежность, поддержку и риски безопасности. В этой статье мы представляем обзор последних технологий, разработанных для больших данных. MapReduce [1] это фреймворк, состоящий из модели программирования и ее реализации. Это один из первых важных шагов для нового поколения инструментов управления и анализа больших данных. MapReduce имеет интересное преимущество для приложений с большими данными. Фактически, это упрощает обработку огромных объемов данных благодаря своим эффективным и экономичным механизмам. Это позволяет писать программы, которые могут поддерживать параллельную обработку. 140 Каскадная структура [2] - это богатый Java API, который предоставляет множество компонентов для быстрой и экономичной разработки, тестирования и интеграции приложений для больших данных. Каскадирование имеет интересные преимущества. Оно позволяет управлять сложными запросами и обрабатывать сложные рабочие процессы в кластерах Hadoop . Он поддерживает масштабируемость, переносимость, интеграцию и разработку через тестирование. Этот API добавляет уровень абстракции в верхней части Hadoop, чтобы упростить сложные запросы с помощью каскадной концепции. Фактически, загруженные данные обрабатываются и разделяются рядом функций для получения нескольких потоков, называемых потоками. Эти потоки образуют ациклически ориентированные графы и могут при необходимости объединяться. Сборка канала определяет поток, который будет проходить между источниками данных (ответвления источника) и выходными данными (ответвления приемника), которые подключены к каналу. Трубная сборка может содержать один или несколько кортежей заданного размера. Каскадный поток написан на Java и преобразован во время выполнения в классические задания MapReduce. Потоки выполняются в кластерах Hadoop и основаны на следующем процессе: Экземпляр потока - это рабочий процесс, который сначала считывает входные данные из одного или нескольких отводов источника, а затем обрабатывает их, выполняя набор параллельных или последовательных операций, как определено сборкой канала. Затем он записывает выходные данные в один или несколько отводов. Tuple представляет собой набор значений (например, запись базы данных таблицы SQL), которые могут быть проиндексированы с помощью полей и могут быть сохранены непосредственно в любом формате файла Hadoop в виде пары ключ / значение. Кортеж должен иметь сопоставимые типы, чтобы облегчить сравнение кортежей. Для расширения ее возможностей было добавлено много расширений, включая [3,4]: • Шаблон (Pattern): используется для создания прогнозных приложений для больших данных. Он предоставляет множество алгоритмов машинного обучения и позволяет переводить документы Predictive Model Markup Language (PMML ) в приложения на Hadoop. • Масштабирование (Scalding): используется в качестве динамического языка программирования для решения функциональных задач. Он основан на языке Scala с простым синтаксисом. Это расширение создано и поддерживается Twitter. • Cascalog : позволяет разрабатывать приложения с использованием Java или Clojure (динамический язык программирования, основанный на диалекте Lisp). Он поддерживает специальные запросы, выполняя серию нескольких заданий MapReduce для анализа различных источников (HDFS, баз данных и 141 локальных данных). Он обеспечивает более высокий уровень абстракции, чем Hive или Pig. • Lingual : предоставляет интерфейс ANSI-SQL для Apache Hadoop и поддерживает быструю миграцию данных и рабочих нагрузок в и из Hadoop. Благодаря Lingual легче интегрировать существующие инструменты бизнес- аналитики и другие приложения. Download 3.44 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling