زمان تخمینی مطالعه:‌ 1 دقیقه

عملیات تکراری روی اسپارک RDD


شکل زیر نحوه اجرا شدن عملیات تکراری روی اسپارک RDD را نشان می دهد

در این حالت نتایج میانی به جای حافظه ثابت ( دیسک ) ، روی حافظه های توزیع شده ( Memory ) ذخیره می شوند که این اتفاق سیستم را سریع تر می کند.

نکته : اگرحافظه توزیع شده ( RAM ) برای ذخیره نتایج میانی ( حالت Job ها )کافی باشد، اون موقع نتایج رو روی دیسک ذخیره می کنند.

iterative operation on spark rdd

لطفا در راستای هرچه بهتر شدن کیفیت مطالب نظر خود را در رابطه با این سرفصل برای ما ارسال نمایید.