【Amazon WorkSpaces】 監視、復旧、バックアップなど

EC2 のステータスチェックみたいな死活監視できるの?

Unhealthy メトリクス

CloudWatch メトリクスで Unhealthy な WorkSpace 数を監視可能。

Amazon WorkSpaces のモニタリング – Amazon WorkSpaces より抜粋。

Available: 正常な状態を返した WorkSpace の数。
Unhealthy: 正常でない状態を返した WorkSpace の数。
Maintenance: メンテナンス中の WorkSpaces の数。

ちなみにこのメトリクス、わりとカジュアルにデータ欠損が発生する模様……。

Unhealthy の定義

こちら。

Amazon WorkSpaces サービスは定期的にステータスリクエストを WorkSpace に送信します。このリクエストに応答しない WorkSpace は、”Unhealthy” と表示されます。

つまるところ、具体的にはよくわからん。 おそらく、TCP と UDP の 4172番ポート?

AutoStop (時間課金) な WorkSpace が STOPPED のときに、ステータスリクエスト失敗 -> Unhealthy 判定食らってまともに監視できなくない?

Amazon?MS?の謎テクノロジーのおかげで STOPPED 状態でも Unhealthy にはならない。

メンテナンス時に Unhealty になる?

同様に謎テクノロジーにより、ならない。

要するに

Unhealthy のメトリクスを監視したり、アラーム作成しておけば、とりあえず EC2 のステータスチェック的なことができそう。

ぶっ壊れたらどう復旧するの?

  1. とりあえず、再起動
  2. 同じ VPC 内の他の WorkSpace から RDP 接続して、トラブルシューティング
    • なんか暴走して高負荷になってないか
    • ステータスリクエストが FW 等で弾かれてないか
    • など
  3. 再構築
    • C ドライブは吹っ飛ぶ
    • D ドライブも最大 12 時間巻き戻る

参考

バックアップできんの?

AWS の自動バックアップを信頼するしか……。

Q: ユーザーのデータはどのようにバックアップされますか?

WorkSpace のユーザーボリュームは 12 時間おきにバックアップされます。WorkSpace に障害が発生した場合、AWS はバックアップからそのボリュームを復旧します。Amazon WorkDocs Sync が WorkSpace で有効になっている場合、ユーザーが同期を選択したフォルダは継続的にバックアップされ、Amazon WorkDocs に保存されます。
よくある質問 – Amazon WorkSpaces(仮想クラウドデスクトップ) | AWS

復旧の項目にも記載したが、AWS の自動バックアップを当てにすると、D ドライブが再構築時点から最悪 12 時間前の状態に巻き戻る。また、世代バックアップでは無さそう。なので、大事なデータ保存には Amazon WorkDocs を使いましょう。

C ドライブは再構築時に吹っ飛びます。諦めましょう……。

カスタムイメージをバックアップ代わりに使えば良いんでは?

(2018/10/15 時点で) API ないらしいので、自動で日次バックアップみたいなことはできません。

また、イメージ作成時に連絡先、画像等のファイルが消されるらしいので、バックアップとして使う性質のものでは無さそうな風味。

カスタム WorkSpaces バンドルの作成 – Amazon WorkSpaces

逆に言うと、手動で今すぐバックアップしたいなぁという場合の苦肉の策としては使えるのかと。