WebARENA CLOUD9障害中

2010年12月4日

先日からちょこちょこサーバを移行している、WebARENA CLOUD9が現在も障害中でつながらない。

来週やるイベントで配布するフリーペーパーのDTP作業立会いで徹夜して、ひとまず寝ようと帰った矢先、監視サービスで障害発生のメールが来ていた。それが朝、8時半前のこと。
うわっ、と思ってSSHでの接続を試すも駄目で、リソース食いつぶしが起きたかと思いコントロールパネルにアクセスしてみたら、コントロールパネルも重くてなかなか開かない。何とか開いてサーバ再起動を指示したら、再起動処理中のまま、何分待っても変わらない。コントロールパネル自体につながらなくなったりもする。

障害情報もあがっていないので自分のところだけなのかも知れないし、何かしくじったのかと思い、サポートから問い合わせを実施したのが9時過ぎ。それの返事が来たのが13時45分。
その間に、開かないとまずいサイトは並行運用しているWebARENA SuitePRO V2へ移動。最近の更新情報で手元に無いものは、Googleなどの検索エンジンのキャッシュから何とか引っ張り出して復旧。ちなみに、このブログもmysqlサーバを移動した。
作業は11時過ぎに完了。問い合わせから約2時間、その間に返答はなく、障害情報もあがっていなかった。
1時間ほど仮眠して、ランチをしに出かけた時、もしくはランチから戻ってきた14時過ぎのどちらかのタイミングで障害情報があがっていたのを覚えている。(なにせ徹夜でボーっとしてたもので…)

滅多に起きることでは無いのと、眠さと疲れのピークだったので結構ショックだった。WebARENA SuitePRO V2では、そういうトラブルに一度もあっていないので、余計にそう感じた。
問い合わせのレスポンスの速さ、障害情報の速さ、対応の速さ、どれを見てもお客様のサイトどころかテストサーバでも使えないかも知れないなぁと思った。切ない。

個人的にサーバ選定時の第一条件は、問い合わせ対応だと思っている。
普段安定運用できているのは当然の前提で、何か起きた場合、とにかく迅速な対応、仮に障害が複雑で時間がかかるとしても、それならそういうアナウンスを実施できるかは、とても大きな決め手になると思っている。
フューチャースピリッツは、10年以上の付き合いで、トラブルに遭った事は無いが、問い合わせの対応がとにかくしっかりしているという感触を持っており、すごく信頼を置いている。フューチャースピリッツでVPSやクラウドの安価なサービスを始めないかなぁ…なんて勝手なことを思いつつ、状況を見守りたい。

復旧しても特別なにがあるわけじゃない状況までサーバ構成を戻したので、復旧は時間がかかっても構わないのだけれど、はやくサーバ上のデータを消して解約したい。

追記

16時の段階では、まだsshやhttpでの接続は確認できず、コントロールパネルも再起動処理中のままだった。
18時45分、復旧とのことで、そのタイミングで、コントロールパネル含めて問題なく接続できた。データ損失など無く復旧した模様。

追記2

16時段階での復旧に関する案内について問い合わせをしたら、12/6 12:26にお返事いただいた。
問い合わせが立て込んで大変だったのだろうけれど、これじゃあやっぱり厳しいなぁ。