مفهوم data replication
data replication یا تکثیر داده ها فرآیند کپی کردن داده ها از یک مکان به مکان دیگر است. این فناوری به سازمان کمک میکند تا در صورت وقوع فاجعه، نسخههای بهروز از دادههای خود را در اختیار داشته باشد.
همانندسازی میتواند روی یک شبکه فضای ذخیرهسازی، شبکه محلی یا شبکه گسترده محلی و همچنین در فضای ابری انجام شود. برای اهداف بازیابی فاجعه (DR)، تکرار معمولا بین یک مکان ذخیره سازی اولیه و یک مکان ثانویه خارج از سایت اتفاق می افتد.
رویکردهای تکثیر داده ها
چهار مکان وجود دارد که تکرار می تواند اتفاق بیفتد: در میزبان، هایپروایزر، آرایه ذخیره سازی یا شبکه. تکرار مبتنی بر آرایه زمانی روش غالب بود، اما روش های دیگر محبوبیت زیادی پیدا کردند.
همانندسازی مبتنی بر میزبان از سرورها برای کپی داده ها از یک سایت به سایت دیگر با استفاده از نرم افزار روی سرورهای برنامه استفاده می کند. معمولاً مبتنی بر فایل و ناهمزمان است. نرمافزار تکثیر مبتنی بر میزبان شامل ظرفیتهایی مانند حذف مجدد، فشردهسازی، رمزگذاری و throttling است.
تکثیر مبتنی بر Hypervisor نوعی تکرار مبتنی بر میزبان است که کل ماشینهای مجازی را از یک سرور میزبان یا خوشه میزبان به دیگری کپی میکند. از آنجایی که به طور خاص برای ماشین های مجازی طراحی شده است، تکرار Hypervisor باعث می شود در صورت از بین رفتن نسخه اولیه VM، به راحتی در Replicate شکست بخورد. و می تواند بر روی سرورهایی اجرا شود که به طور طبیعی از تکرار پشتیبانی نمی کنند. تمام تکرارهای مبتنی بر میزبان از منابع CPU استفاده می کنند که ممکن است بر عملکرد سرور تأثیر بگذارد.
تکرار مبتنی بر آرایه به آرایه های ذخیره سازی سازگار اجازه می دهد تا از نرم افزار داخلی برای کپی خودکار داده ها بین آرایه ها استفاده کنند. همانندسازی مبتنی بر آرایه انعطاف پذیرتر است و در هنگام استقرار به هماهنگی بین بخشی کمی نیاز دارد. اما به محیط های ذخیره سازی همگن محدود می شود، زیرا به آرایه های منبع و هدف مشابهی نیاز دارد.
تکرار مبتنی بر شبکه به یک سوئیچ یا ابزار اضافی بین آرایه های ذخیره سازی و سرورها نیاز دارد. همانندسازی مبتنی بر شبکه معمولاً در محیطهای ذخیرهسازی ناهمگن انجام میشود – با هر آرایهای کار میکند و از هر پلتفرم میزبانی پشتیبانی میکند. محصولات تکراری مبتنی بر شبکه در مقایسه با پیشنهادات مبتنی بر آرایه و میزبان کمتر در بازار وجود دارد.
تکثیر داده های همزمان در مقابل ناهمزمان
تکثیر داده ها بسته به زمانی که انجام می شود می تواند همزمان یا ناهمزمان باشد.
تکثیر همزمان در زمان واقعی انجام می شود و برای برنامه هایی با اهداف زمان بازیابی کم که نمی توانند داده ها را از دست بدهند ترجیح داده می شود. این در درجه اول برای برنامه های کاربردی تراکنش های سطح بالا استفاده می شود که در صورت خرابی نیاز به failover آنی دارند. این رویکرد تکرار گرانتر است و تاخیری ایجاد میکند که برنامه اولیه را کند میکند.
تکثیر همزمان توسط بیشتر محصولات تکثیر مبتنی بر آرایه و مبتنی بر شبکه پشتیبانی میشود، اما به ندرت در موارد مبتنی بر میزبان پشتیبانی میشود. تکرار ناهمزمان با تأخیر زمانی انجام میشود. برای کار در فواصل مختلف طراحی شده است و به پهنای باند کمتری نیاز دارد.
این تکرار برای مشاغلی در نظر گرفته شده است که می توانند اهداف طولانی تری نقطه بازیابی را تحمل کنند. از آنجایی که در زمان کپی تاخیر وجود دارد، ممکن است دو کپی داده همیشه یکسان نباشند. همانندسازی ناهمزمان توسط محصولات تکراری مبتنی بر آرایه، شبکه و میزبان پشتیبانی میشود.
تکثیر داده ها با سایر فناوری ها
تکثیر داده ها یک فناوری کلیدی برای بازیابی بلایا است. اغلب با فناوری عکسبرداری ترکیب میشود، که به کاربران اجازه میدهد تا دادهها را به صورت دورهای تکثیر کنند، در حالی که هنوز میتوانند به یک نقطه زمانی خاص برای بازیابی برگردند. Deduplication – که دادههای اضافی را حذف میکند – اغلب با تکرار برای DR و پشتیبانگیری ترکیب میشود. Dedupe با نیاز به داده های کمتری برای جابجایی در شبکه به تکثیر کمک می کند.
یک سازمان باید تکرار خود را آزمایش کند تا از وجود پهنای باند کافی و کپی شدن داده های مناسب اطمینان حاصل کند. مدیران همچنین باید اطمینان حاصل کنند که زیرساخت های موجود می توانند داده ها را با سرعت کافی تکرار کنند تا با رشد داده ها و نرخ تغییر داده ها هماهنگی داشته باشند.
یک مدیر پشتیبان باید حجم دادههای در حال تکثیر را در نظر بگیرد، بهویژه اگر سازمان در یک مرکز داده از راه دور همانندسازی را انجام دهد. همگام سازی مقادیر زیاد داده در یک اتصال کم سرعت ممکن است عملی نباشد. کاشت — کپی کردن داده ها در رسانه قابل جابجایی و سپس در دستگاه مورد نظر — ممکن است گزینه بهتری باشد.