【VMware Cloud Director Availability】挙動について

VCDAの挙動を説明している以下の翻訳

Disaster Recovery technologies discussed; Journal or Delta? - VMware Cloud Provider Blog

・スナップショットとは

スナップショットは、特定時点の仮想マシンの状態とデータであり、バックアップとはみなされない

状態にはVMの電源状態が含まれ、データにはVMを構成するすべてのファイルやフォルダ(メモリやvNIC、vmdkなど)が含まれる

そして、これらはVMを静止することによって取得することができる

OSが静止をサポートしていない場合、アプリケーションの種類の継続性を確保するために災害発生時の回復プロセスを慎重に検討する必要がある

・なぜバックアップとみなされるべきではないか

スナップショットはオリジナルソースからの差分を記録するため、素早いロールバックを実現する

そして、それを実現するにはオリジナルディスクと差分ディスクが同一ストレージインフラストラクチャーに存在する必要がある

バックアップは個別にVM情報をすべて保有する必要があり、障害からの保護対象VMと同じインフラストラクチャーに存在する必要はない

そのため、スナップショット機能はバックアップとみなされない

・VCDAがスナップショットを利用するか

送信元ではデルタvmdkを使用し、宛先ではPoint in Time(PIT) インスタンスを使用するため、スナップショットは利用しない

複数のPoint in Time(PIT)、mPIT はソース ディスクからの差分に基づいており、これらはESXiホスト上のHost Based Replication agent(HBR) IOフィルターを介して送信される

VCDAはソースVMを静止させない点もスナップショットとは異なる

vSphere ReplicationにはVCDAが使用するコンポーネントである、ESXiホスト上のData MoverとHost Based Replicator(HBR)サービスが含まれている

これらはVMの差分同期を軽量化するためにIOをフィルタリングし、Replicator Applianceを介して宛先にレプリケートされる

vSphere ReplicationはmPITSを使用でき、24個のインスタンスをサポートする

これは、初期同期が上書きされずに23個の軽量デルタを保有できることに相当する

初期同期では、VM の「ベース」ディスクの書き込み領域のみが”ダーティ”としてマークされ、vmdk 全体がコピーされる

ディスクがレプリケートされるため、IOがわずかに増加し、かかる時間はソースとターゲットのデータストアのタイプに大きく依存する

この時点から、デルタ変更のみがコピーが必要である”ダーティ”とマークされる

・初期完全同期とは何か

パワーオン状態の仮想マシンに対してレプリケーションが設定されると、はじめにソース仮想ディスク (VMDK)の内容全体が、ターゲットの空の仮想ディスクにコピーされ、チェックサムを使用して比較される

それによりソース仮想ディスクとターゲット仮想ディスクの差異が特定され、新規レプリケーションにおける差異はゼロとなる

その比較処理において必要なCPUリソースはとても少ない

チェックサムが比較されている間、vSphere Replicationは発見された差分を定期的に送信する

完全な同期を完了するのにかかる時間は、主に仮想マシンを構成する仮想ディスクのサイズ、レプリケー ションされるデータ量、およびレプリケーションに利用可能なネットワーク帯域幅によって異なる

・軽量デルタ同期とは

完全同期が完了すると、vSphereに組み込まれたvSphere Replication agent は、レプリケーションが設定された仮想マシンの仮想ディスクの変更を追跡する

軽量デルタ同期は、仮想マシンレプリケーションにて設定されたRPOに応じて、これらの変更を定期的にレプリケートする

たとえば、RPOが4時間の仮想マシンで変更されたデータは、4時間ごとにレプリケートされる

4時間のデータは軽量デルタvmdkに入るため、4時間以内に追加・削除されたものはデルタに含まれない

RPO間隔内に同じブロックに複数回書き込みを行っても、同期時に最後の値のみが送信されるため、ネットワークトラフィックが削減できる

このスケジュールは、データ変更率、各レプリケーションサイクルにかかる時間、同じ vSphere ホスト上でレプリケーション用に構成されている仮想マシンの数など、さまざまな要因に基づいて変更される可能性がある

vSphere Replication は、これらの要因を考慮したアルゴリズムを使用してレプリケーションをスケジュールすることで、レプリケートされた各仮想マシンの RPO が違反されないようにしている

・パフォーマンスについて

軽量デルタ同期vmdkを持てば持つほど、デルタ間の潜在的な変更データが増え、リストアにかかる時間が長期化し、すべての差異を統合するために必要なコンピュートとストレージが増える。

宛先データストアの空き容量がなくなると、新しいデルタインスタンスは作成できなくなるが、既存のインスタンスは影響を受けない。

空き領域が利用可能になると再同期は行われず、新しい増分インスタンスの作成が行われる

VCDAではSLAポリシーを使用して、レプリケーション保持ポリシー(PITインスタンスの数)とRPOを制御する

PITは軽量デルタ同期、つまりvmdkのデルタレコードですが、それはスタニングやクローニングされたvmdk全体ではなく、ベースディスクから指定インスタンスまでのチェーンのサブセットであり、独立したフラットvmdkであることを認識しておく必要がある

軽量vmdkデルタ同期は、カスケード的かつ相互依存的で、インスタンスが期限切れになるたびにディスク領域が解放される。

明示的にインスタンスを削除するか、VCDA保持ポリシーを調整することにより、異常に大きなインスタンスが作成された際にスペースをすぐに開放することができる。

スペースが解放された後に、リテンションポリシーをもとに戻すこともできる。 プロバイダはIAAS消費のあらゆる側面の監視と、テナント組織に割り当てられたストレージ量と使用されたストレージ量を確認できる

・保存されたインスタンスとは

VCDAにて保存されているインスタンスはデルタvmdkである

これらは保持サイクルから「取り出された」デルタであるため、リストアには親ディスクを使用する必要がある

VCDAのレプリケーションは、保存されたインスタンスとローテートされたインスタンス(mPITS)の両方を持つことができ、ポリシーによって制御される これらは、時間の経過とともに増加する継続的なデルタ(ソース親ディスクに近くなる)と比較して、リストアが比較的高速になる

※内容、翻訳に誤りがある際はご了承ください。