仮想化技術の個人的ニュース

仮想化技術の個人的に気になること

vSphere 6.0環境からvSphere 7.0環境での仮想マシン移行時に発生した障害

こんにちは。

 

今回は、

vSphere 6.0環境からvSphere 7.0環境での仮想マシン移行時に発生した障害について、

ご紹介します。

 

私が直接応対しているエンドユーザ様ではないのですが、
横で見ていて、、、念のため注意しないといけないな、と
いう話もあったのでこちらで皆さんに周知させて頂こうと思います。

 

事象としては、
タイトルの様に6.0から7.0の新環境に移行するプロジェクトにおいて、

『ESXi6.0の環境で7.0用に新規に追加したデータストア(NFS)へのストレージvMotionを行った際、仮想マシンが予期せずパワーオフされvMotonが失敗した。」

です。​

 

『vMotionやストレージvMotionが失敗したって、移行できないだけだよね?』と、
皆さんお思いだと思います(私もそうでした)、が、、、

なんと、パワーオフされる(場合がある)んです。

 

VMware社のサポートにも協力を仰ぎ、ログ等から状況を調査したところ、
ストレージvMotionが実行された際に該当の仮想マシンの構成ファイルの一つが
不正なステータスにあることが検出され、これにより仮想マシンが停止されていた
ということでした、、、。

ちなみに、

事象の発生後に確認したログバンドルからは異常を示すログは見つからず、
不正なステータスが発生した原因については特定することができなかったので、
大元の発生原因が不明なのが恐ろしいですね、、、。

 

​ということで、

発生する条件などについては、『ESXi6.0P05以前のバージョンで発生する』様で
ESXi6.0P05以降では、同様の構成ファイルに不正なステータスの物がある状態が
発生しても仮想マシンはクラッシュしないよう改善されている様です。

 

一番良いのは、バージョンアップ、、、だとは思うのですが、
このケースの様に、移行したら終息させる環境に
バージョンアップ作業というのも、、、ということもあると思います。


その様な場合には​、、、オフライン移行(システムを予め止めておく)、、、
これもなかなか難しいと思いますので、
(最悪、、、、、、止まっても良い)メンテナンス時間を設けて、
移行を実施しましょう。
(障害発生が許容されない重要なシステムは、、、そもそも移行時間として
 きちんと時間を取られるかと思いますが、、、)

 

 

本日はここまで。

6.0というのは、ちょうど移行している方々もいらっしゃるかも
しれませんので、ご参考になれば、幸いです。