Fault tolerance چیست؟

تحمل خطا ، عدم تأخير در ارائه سرويس و قدرت تحمل در هنگام بروز مشكل و خطاهاي عمدتا سخت افزاري است بعبارت ديگر Fault tolerance(به اختصار FT) قابليتی است در سيستم عامل که می تواند هنگام بروز مشكلات از تجهيزات جايگزين استفاده کرده و بدون تأخير (يا با تأخير بسيار کوتاه ) بطور خودکار به سرويس دهی ادامه دهد. نکته اصلی درFT این است که هنگام بروز خطا اولا زمان قطعی سرويس صفر يا بسيار کوتاه بوده و ثانيا عمليات جايگزينی بدون عوامل انسانی و بطور خودکار صورت مي گيرد Admin در فرصت مناسب می تواند عيوب را بررسی و رفع کند .مثال:يك سرور داريم (از هر نوع دلخواه ) که با يك کارت شبكه(NIC) به شبكه متصل شده و کامپيوترها از آن سرويس مي گيرند . اگر براي کارت شبكه يا خط متصل به آن اتفاقي بيافتد چه مي شود ؟ بديهی است که سرويس قطع می شود اگر بخواهيم که سرويس قطع نشود بايد:

  1. شرايط سخت افزاري لازم را مهيا کنيد يعنی از ابتدا ٢ عدد NIC روی سیستم نصب کنید.
  2. سیستم عاملی را انتخاب کنید که دارای قابلیت FT در این زمینه باشد.سيستم عامل در شرايط عادي اطلاعات را تقسيم کرده و از هر ٢کارت براي ارسال و دريافت استفاده می کند (که البته باعث افزايش سرعت نيز مي شود) حال اگر به هر دليل يكی از کارتها از کار بيفتد ، سيستم از کارت ديگري براي ادامه کار استفاده می کند.