Apache Hadoop va Spark: Ma'lumotlarni tahlil qilish uchun kirish va foydalanish holatlari Abdullayev Jasurbek kontur


Download 24.83 Kb.
bet8/12
Sana25.03.2023
Hajmi24.83 Kb.
#1295551
1   ...   4   5   6   7   8   9   10   11   12
Bog'liq
Apache Hadoop and Spark Introduction and Use Cases for Data Ana-fayllar.org

RDDlar va boshqalar. DataFrames _


  • RDDlar Spark-ga past darajadagi interfeysni ta'minlaydi

  • DataFrames sxemasiga ega

  • DataFrames keshlangan va Spark tomonidan optimallashtirilgan

  • DataFrames RDD va asosiy Spark API ustiga qurilgan

    Misol: ishlash


      Spark operatsiyalari



      Transformatsiyalar
      (yangi RDD yaratish)

      xarita
      filtr


      namuna
      groupByKey
      kamaytirishByKey
      sortByKey
      chorraha

      flatMap
      ittifoq


      qo'shilish
      guruh
      xarita qiymatlarini kesib o'tish
      kamaytirishByKey


      Harakatlar
      (natijalarni haydovchi dasturiga qaytarish)

      birinchi yig'ing olishni kamaytiring


      Buyurtma berilgan
      Namuna oling countByKey saqlaydi
      qidiruv kaliti har biriga

      Yo'naltirilgan asiklik grafiklar (DAG)

    A
    B


    S
    C
    E
    D
    F
    DAGlar bog'liqliklarni kuzatib boradi (shuningdek, Lineage sifatida ham tanilgan )

    A.1
    A[1,2]


    A.2
    Tor
    Keng
    Xarita
    groupByKey
    Vs.

    tekis xarita


    Xarita
    groupbyKey
    Spark konteksti
    Haydovchi dasturi
    Yig'ish
  • 1   ...   4   5   6   7   8   9   10   11   12




    Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
    ma'muriyatiga murojaat qiling