仮想化技術の個人的ニュース

仮想化技術の個人的に気になること

vSAN環境のクラスタのホストでメンテナンスモードにできないことがある件

こんにちは。


今回は、

vSAN環境のクラスタのホストでメンテナンスモードにできないことがある件
についてご紹介します。

 

皆さんもご存じの通り、vSANクラスタでホストをメンテナンスモードに
入れるためには、ケースバイケースで実施する手順が異なります。

①特定のホストを単独で一時的にシャットダウン(再起動)するケース

②特定のホストを単独で永続的にシャットダウンするケース

クラスタ全体をシャットダウンするケース

 

上記の様に3パターンのケースがありますが、
今回は、①のケースでメンテナンスモードに1時間近く経っても変更できず、
予定していた作業を再スケジュールせざるを得なかったという話があったので、
そのお話です。

 

①のケースなために、ホストをメンテナンスモードに入れる際の使用する
オプションは「アクセシビリティを確保する」な訳ですが、
今回の様に(おそらく、あまり容量的に使用してない環境だったりすると)
移行容量『0Byte』で入れると表示される場合があると思います。

 

ですが、、、今回の件、

データ移行が0Byteのはずなのに、、、

1時間近く経ってもメンテナンスモードにホストがならない。

原因は、、、
『vSANクラスタ内のホストとしてのメンテナンスモード』と、
『vSphere ESXi?としてのメンテナンスモード』
この2つが別々に管理?されている「仕組み」に起因していました。


状態としては、、、

vSAN としてのメンテナンスモードは「ON」になっていて、
vSphere側のメンテナンスモードが有効になるのをずっと待っていた
状態だったようです。

こういう事象が発生する原因としては
hostdのプロセスでメモリ確保に問題があったりすると、、、
起こりうるそうです。

 

と、いうことで、対処方法です。

hostd、vpxdのサービスをESXiで再起動をしてみて、
もう一度やってみる、という方法です。
(何度か、、サポートの方にお話していますが、
 vSANデータストアの容量問題でなければ、、、
 この結論に至ります。)

 

ちなみに、vSANとしてのメンテナンスモードがONになってるか、、の確認は、
localcli vsan cluster get
このコマンドをホストで実行します。

 

メンテナンスモードにならない、ということで確認してvSANだけONになっている様なら、、、
その時点でvSANメンテナンスモードはCancelしてしまって良いと思います。

Cancelのコマンドは、
localcli vsan maintenancemode cancel

こちらです。

 

再度、

localcli vsan cluster get

を実行すると、OFFに変わっているはずです。

 

本日はここまで。

ご参考になれば、幸いです。