Chukwa
زیرسیستمی مبتنی بر عامل(agent) جهت جمعآوری logهای سیستم است. به بیان دیگر این زیرسیستم جهت سرویس نظارت (Monitoring Service) استفاده میشود. بدین صورت که هدف Chukwa فراهم نمودن سرویس ETL برای خوشههای دادههای log است. در این حالت برای کاربر نهایی ، مسیری ساده برای دسترسی به رویدادهای مهم log فراهم میشود. این زیر سیستم از فایلسیستم HDFS برای جمعآوری طیف وسیعی از اطلاعات و از MapReduce برای آنالیز اطلاعات جمعآوری شده استفاده مینماید. یکی از ابزارهای مهم چُکوا ، (HICC (Hadoop Infrastructure Care Center است که یک رابط مبتنی بر وب جهت نمایش کارآیی سیستم میباشد. قابلیت اطمینان در این زیرسیستم با استفاده از دو مدل end-to-end reliability و fast-path delivery جهت کاهش تاخیرات زمانی ، فراهم میشود. Chukwa در تعامل با فایل سیستم HDFS از پایگاه داده MySQL استفاده مینماید. مکانیزم چرخشی مورد استفاده Chukwa بدین صورت است که هر از پنج دقیقه فایلها گردآوری شده و در پایان هر ساعت ، فایلهای گردآوری شده تجمیع و در قالب دادهای ساعتی ذخیره میشوند. در پایان هر روز فایلهای ساعتی تجمیع شده و در قالب دادهای روزانه ذخیره میشوند. برای عملیات شرح داده شده از پروتکلی مشابه syslog استفاده میشود.