Apache Hadoop va Spark: Ma'lumotlarni tahlil qilish uchun kirish va foydalanish holatlari Abdullayev Jasurbek kontur

Download 24.83 Kb.

1 ... 4 5 6 7 8 9 10 11 12

Bog'liq
Apache Hadoop and Spark Introduction and Use Cases for Data Ana-fayllar.org

Python RDD API misollari

So'zlar soni

Logistik regressiya

http://spark.apache.org/ dan misollar

RDD barqarorligi
- RDD.persist ()
- saqlash darajasi:
  - MORY_ONLY, MEMORY_AND_DISK, MEMORY_ONLY_SER, DISK_ONLY,…….
RDDni olib tashlash
- RDD.unpersist ()
Eshittirish o'zgaruvchilari va akkumulyatorlari (Birgalikda o'zgaruvchilar)
Eshittirish o'zgaruvchilari dasturchiga uning nusxasini topshiriqlar bilan yuborish o'rniga, har bir tugunda faqat o'qish uchun mo'ljallangan o'zgaruvchini keshda saqlashga imkon beradi.
>broadcastV1 = sc.broadcast ([1, 2, 3,4,5,6])

>broadcastV1.value

[1,2,3,4,5,6]
Akkumulyatorlar faqat assotsiativ operatsiya orqali "qo'shiladigan" va parallel ravishda samarali qo'llab-quvvatlanishi mumkin bo'lgan o'zgaruvchilardir.
to'plash = sc.akkumulyator (0)

Download 24.83 Kb.

Do'stlaringiz bilan baham: