DS201の実施_NodeSync
DS201: Foundations of Apache Cassandra™ and DataStax Enterpriseの学習記録。
NodeSyncは、データの整合性を保ちつつオーバーヘッドを最小限に抑える機能。
NodeSyncは、以下の特徴を持つ:
- すべてのレプリカ間でデータの同期を継続的に検証する。
- 常に実行されますが、クラスターのパフォーマンスにわずかな影響しか与えない。
- 完全に自動化されており、手動介入は必要ない。
- アンチエントロピー・リペアの代替として機能する。
NodeSyncサービスは、デフォルトで各ノードで実行される。NodeSyncはテーブルごとに有効にすることができ、有効にされたテーブルのローカルデータ範囲を連続的に検証し、不整合が見つかった場合はリペアを実行する。データ範囲は小さなセグメントに分割され、優先度付けされる。
セグメントは、テーブルの小さなローカルトークン範囲である。NodeSyncはセグメントを選択し、データ全体を読み取り、不整合をチェックし、必要に応じてリペアする。セグメントの検証状態は、system_distributed.nodesync_statusテーブルに保存される。
セグメントの検証状態には、successful(正常終了)、full_in_sync(完全に同期済み)、full_repaired(完全にリペア済み)、unsuccessful(失敗)、partial_in_sync(一部の同期済み)、partial_repaired(一部がリペア済み)、uncompleted(未完了)、failed(エラー)などのステータスがある。
Tags: