こんにちは、まっすです。
先週は開発用サーバが障害により起動できなくなり天手古舞な週となりました。
ことの発端は、ファイルサーバ。
新しくファイルサーバを立てるため準備を進めており、
追加のハードディスクを入れようとした矢先、
ハードディスクを入れるためのブラケットがないことに気づく。
これはメーカー側の忘れですかね。。。
仕方がないので、現行サーバを空けて合うブラケットを探すことに。
弊社で使用している社内サーバはすべて同じメーカーなので、
もしかしたら合うものがあるかも、と思い開けてみると、
比較的新しいサーバに合いそうなブラケットを発見!
それが現在使用中の開発用サーバでした。
一旦、電源コンセントを抜き、ふたを開けて、ブラケットのみを1つ外し、
ふたを閉じ、電源コンセントをさし、スイッチオン!
OSが起動せず…。
……
……
なぜ?
格闘すること約半日。
起動せず。
その日はあきらめて、翌日。
原因はなんとなくわかってきました。
でも、たぶん、もう起動できないと断念。
データのみを救出して、再構築となりました。
原因は、CMOSバッテリー切れ。
CMOSバッテリーが切れ、電源コンセントを抜いたため、
まずシステムクロックが初期化。
BIOS(すべてではないかもしれないが)もほぼ初期化状態に。
致命的な設定が1つ。
SATA設定のRAIDがAHCIに変わったこと。
そもそも、RAIDで構成されていたことを知らず、
何度も起動を繰り返したり、
Windows修復ツールで修復したり、
挙句の果てにはBIOS設定を初期化したり、
様々なことを繰り返すうちに、気づいたときには時遅し。
従来のRAID設定に戻らなくなりました。
(そもそも出荷時の設定がわからない)
これ、サーバ構成としてはどうなんでしょう?
BIOSの初期化は、工場出荷時の状態にしてもらわないと初期化の意味がないのでは?
サーバの再構築ではRAID構成にはせず、
単独のディスクで運用します。
バックアップは別にとる方向で。
でも、おかげ様でRAID構成(RAID1)のハードディスクからデータを復元するソフトを
会社に買ってもらえたので、今後のことを考えると、いいツールが手に入ったと前向きに考えます。
ただ、こういうことがあるので、
社内サーバは極力なくして、クラウドした方が安全なんでしょうね。
弊社には対応できる優秀なエンジニアがいるのでまだ大丈夫ですが、
不安な企業様はお近くのIT屋さんに是非ご相談ください。