مروری بر روش‌های کاهش سربار نقطه‌وارسی

نوع مقاله : مقاله مروری

نویسندگان

گروه مهندسی برق و کامپیوتر، دانشکده فنی مهندسی، دانشگاه خوارزمی، تهران، ایران

چکیده

امروزه تحمل‌پذیری اشکال در سیستم‌های مختلف امری ضروری است. استفاده از روش‌های ایجاد نقطه‌وارسی و نقاط امن برای بازگشت به هنگام خرابی باعث افزایش قابلیت اطمینان سیستم‌ها می‌شود. چالش اصلی در استفاده از روش‌های نقطه‌وارسی سربار آنهاست. این سربار بر اثر اجرای فرآیند ایجاد نقطه‌وارسی است و باعث کاهش عملکرد کلی سیستم‌ها می‌شود. روش‌های بسیاری تاکنون به حل این مشکل پرداخته اند. این روش‌ها تلاش می‌کنند تا سربار ناشی از نقطه‌وارسی کاهش یابد و در نتیجه سیستم به حداکثر کارایی برسد. در این مقاله به مطالعه و مرور روش‌های گوناگون پیرامون کاهش سربار نقطه‌وارسی پرداخته شده است. این روش‌ها در گروه‌های مختلفی دسته‌بندی شده اند. در این مقاله، دسته‌بندی‌ها بر اساس نوع پیاده‌سازی نقطه‌وارسی و سطوح مختلف سیستم‌ها مشخص گردیده‌اند. این دسته‌بندی‌ها شامل: نقطه‌های ‌وارسی هماهنگ شده، نقطه‌وارسی در سطح سیستم، نقطه‌وارسی در سطح برنامه و نقطه‌وارسی در سیستم‌های محاسباتی توزیع شده است. در پایان با نمایش کلی دسته‌بندی‌های گفته شده در یک جدول جامع برای هر دسته‌بندی‌ نتیجه‌گیری می‌شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

A survey of checkpoint overhead reduction methods

نویسندگان [English]

  • Mostafa Aghbolaghi Tabrizi
  • Arian Shahbazian
  • Kimiya Shahbakhti
  • Kooshyar Zamani
  • Navid Kanaani
  • Seyyed Amir Asghari
  • Mohammadreza Binesh Marvasti
Department of Electrical and Computer Engineering, Faculty of Engineering, Kharazmi University, Tehran, Iran
چکیده [English]

Nowadays, fault tolerance in different systems is a very essential factor. Using checkpointing methods and safe spots for recovery after faults occur can increase the reliability and dependability of systems. The main issue with using checkpointing methods is their overhead. This overhead made as a result of checkpointing execution and it has negative impact on system performance. Therefore, numerous approaches and methods have been introduced to address this problem. These approaches and methods aim to reduce the overhead in order to increase system performance. this paper, thoroughly studied and reviewed various checkpointing methods. These methods organized into distinct groups. Then, determine These groups based on the type of checkpointing execution and the different systems levels. Those are such as: coordinated checkpointing, system-level checkpointing, application-level checkpointing, and distributed system checkpointing. Finally, this paper provides a detailed summary in a Comprehensive graph and conclusion for each of these groups.

کلیدواژه‌ها [English]

  • Checkpoint
  • Checkpoint Overhead Reduction
  • Coordinated Checkpoint
  • System-level Checkpoint
  • Application-level Checkpoint
  • Checkpoint in distributed computing systems

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 08 آبان 1403
  • تاریخ دریافت: 08 اردیبهشت 1403
  • تاریخ بازنگری: 03 تیر 1403
  • تاریخ پذیرش: 06 شهریور 1403