皆様には多大なるご迷惑をおかけしております。(ディスク障害の顛末。)
このたびは、当サーバのディスク障害により
多くの皆様にご迷惑をおかけしましたことを
深くお詫び申し上げます。
----
今回の「事の顛末」を
ご報告します。
7月24日(日) 22時半ころ
サーバは正常に稼動。
稼動しているサーバとは別で、新サーバの構築作業中。
…っとここで…。
サーバのキーボードを
現在むき出しとなっているサーバの上に落っこどす。
先日の記事でも書きましたが、
現在、当サーバはCPU、メモリ、ディスク等が
すべてむき出しの状態で稼動しています。
その上に…ベッドの枕元においていたキーボードが落っこちました。
画面が乱れ、サーバが停止。
すぐさま本体のリセットボタン押下。
起動はしたものの、ホストOS(WinXP)の入ったディスクから
異音(機械的な「カチ…カチ…カチ…」という音)。
BIOSでは認識に少々時間がかかるものの
一応認識はされ、正常に起動。
その後特に異常なし。
サーバのディスプレイ電源を切って、管理人就寝。
7月25日(月) 6時半ころ
サーバのディスプレイ電源を入れる。
いつものWinXPの画面。
特に異常なし…と判断。
ところが…。
7月25日(月) 7時半ころ
Webも表示できない、メールも受信できない、Telnetでも接続できない。
完全にアクセスできないことに気づく。
7月25日(月) 19時半ころ
管理人が本職から帰宅し、サーバの画面確認。
いつものWinXPの画面。
ところが…。
時間が逆転しますが
午前4時04分にホストOS(WinXP)が停止。
マウスも動かない。キーボードもきかない。いわゆるフリーズ状態。
6時半に確認した画面と同じ…よく見ると、時間が4時04分のまま。
ホストOSが停止すれば、必然的にゲストOS(=FreeBSD(サーバ))も停止。
サーバの表示時刻も4時04分のまま。
7月25日(月) 19時40分ころ
本体のリセットボタン押下。
ホストOS(WinXP)の入ったディスクからの異音。
BIOSがディスクを認識しない。
いったんUPSの電源断。
ディスクの再接続を行い、再度電源投入。
問題なく起動。
7月25日(月) 20時50分ころ
サーバの画面を再確認。
いわゆる「ブルーバック画面」に。
再度本体のリセットボタン押下。
異音なく問題なく起動。
サーバのログを確認したところ、20時40分30秒ころに停止した模様。
そして、現在に至っております。
-----
おそらく、根本的な原因は、
昨夜、管理人がサーバ上にキーボードを落としたことによって
ディスクにハード的な(機械的な)障害が発生し
負荷がかかる(CPUの使用率、メモリの使用量が大になる)と
ホストOSが停止するものと思われます。
ちなみに、今朝4時から
サーバのデータチェック用プログラムが起動しており、
負荷がかかったタイミングで、サーバがフリーズしています。
-----
暫定的な対策として、
データチェック用プログラムや、タイム偏差値計算プログラム等
負荷のかかる処理を行わないよう対応してあります。
そして、恒久的な対策として、急遽ではありますが
明後日7月27日(水曜日)の午前中に
ホストOS(WinXP)のディスク交換作業を行います。
空のディスクへのOSインストール作業となるため
3時間ほどサーバを停止させていただき、作業を行います。
-----
ご覧頂いている皆様には、ご迷惑をおかけしました。
本当に申し訳ありません。
なお、現在も大変不安定な(いつ停止するかわからない)状況で
サーバは稼動しています。
27日午前中までは、この不安定な状況が続くと思われます。
27日午後イチで、ディスク交換作業についての報告をさせていただきます。
多くの皆様にご迷惑をおかけしましたことを
深くお詫び申し上げます。
----
今回の「事の顛末」を
ご報告します。
7月24日(日) 22時半ころ
サーバは正常に稼動。
稼動しているサーバとは別で、新サーバの構築作業中。
…っとここで…。
サーバのキーボードを
現在むき出しとなっているサーバの上に落っこどす。
先日の記事でも書きましたが、
現在、当サーバはCPU、メモリ、ディスク等が
すべてむき出しの状態で稼動しています。
その上に…ベッドの枕元においていたキーボードが落っこちました。
画面が乱れ、サーバが停止。
すぐさま本体のリセットボタン押下。
起動はしたものの、ホストOS(WinXP)の入ったディスクから
異音(機械的な「カチ…カチ…カチ…」という音)。
BIOSでは認識に少々時間がかかるものの
一応認識はされ、正常に起動。
その後特に異常なし。
サーバのディスプレイ電源を切って、管理人就寝。
7月25日(月) 6時半ころ
サーバのディスプレイ電源を入れる。
いつものWinXPの画面。
特に異常なし…と判断。
ところが…。
7月25日(月) 7時半ころ
Webも表示できない、メールも受信できない、Telnetでも接続できない。
完全にアクセスできないことに気づく。
7月25日(月) 19時半ころ
管理人が本職から帰宅し、サーバの画面確認。
いつものWinXPの画面。
ところが…。
時間が逆転しますが
午前4時04分にホストOS(WinXP)が停止。
マウスも動かない。キーボードもきかない。いわゆるフリーズ状態。
6時半に確認した画面と同じ…よく見ると、時間が4時04分のまま。
ホストOSが停止すれば、必然的にゲストOS(=FreeBSD(サーバ))も停止。
サーバの表示時刻も4時04分のまま。
7月25日(月) 19時40分ころ
本体のリセットボタン押下。
ホストOS(WinXP)の入ったディスクからの異音。
BIOSがディスクを認識しない。
いったんUPSの電源断。
ディスクの再接続を行い、再度電源投入。
問題なく起動。
7月25日(月) 20時50分ころ
サーバの画面を再確認。
いわゆる「ブルーバック画面」に。
再度本体のリセットボタン押下。
異音なく問題なく起動。
サーバのログを確認したところ、20時40分30秒ころに停止した模様。
そして、現在に至っております。
-----
おそらく、根本的な原因は、
昨夜、管理人がサーバ上にキーボードを落としたことによって
ディスクにハード的な(機械的な)障害が発生し
負荷がかかる(CPUの使用率、メモリの使用量が大になる)と
ホストOSが停止するものと思われます。
ちなみに、今朝4時から
サーバのデータチェック用プログラムが起動しており、
負荷がかかったタイミングで、サーバがフリーズしています。
-----
暫定的な対策として、
データチェック用プログラムや、タイム偏差値計算プログラム等
負荷のかかる処理を行わないよう対応してあります。
そして、恒久的な対策として、急遽ではありますが
明後日7月27日(水曜日)の午前中に
ホストOS(WinXP)のディスク交換作業を行います。
空のディスクへのOSインストール作業となるため
3時間ほどサーバを停止させていただき、作業を行います。
-----
ご覧頂いている皆様には、ご迷惑をおかけしました。
本当に申し訳ありません。
なお、現在も大変不安定な(いつ停止するかわからない)状況で
サーバは稼動しています。
27日午前中までは、この不安定な状況が続くと思われます。
27日午後イチで、ディスク交換作業についての報告をさせていただきます。
[コメント読む(1)]