”動かない ストレージ” !? 

この間と同じようなネタになっちゃうけど、日経コンピュータ8/4号「動かないコンピュータ」の記事から思うことを・・・。

特集:「動かないクラウド」!!

ドキっ、ってする題名だよ(汗)。

この記事では、主にメジャーどころのここ最近頻繁しているトラブルについて、その原因などなどを整理してある。主には、AmazonEC2の4月に4日間も停止した大トラブルだ。

その時、身近なところでは、「Hootsuite 」や「 Foursquare 」が使えなくなってたよね(たぶん、あれで相当ユーザー離れた気がする。私も、たぶんこれで「HootSuite」使わなくなったし)。

その他、同様に「Gmail」のトラブルや、日本の著名企業のトラブルなどが並んでいる。

で、実はどれも、ほとんど大規模トラブルには、共通点がある。

それは、 「 ストレージ 」だ!

ただ、それは、単純にハード障害というより、被害が拡大するのは、そこに人為的ミスが重なっているのも共通点。

当社もそうですが、アクセス負荷が高い時や、処理能力を求められる際に、もっともボトルネックになるのはDiskのI-Oなんです。サーバ処理能力をどれだけ高めても、こっちが遅ければなんの意味もないんですよ。

しかも、そこには重要なデータが蓄積されている訳ですから、ただ速ければいい、ってもんでもない。いろんな可能Disk技術なども開発され、徐々に「Hadoop」とかが広がりつつありますが、やはりサービスで取り入れようと思うと、読めない部分が多いのと、それを運営する高いノウハウ、スキル、そして高コストが求められ、なかなか難しいのが現状です、特に我々のような企業には。

クラウドサービスが、震災の影響もプラスして、かなりデファクトなプラットフォームになっています。お客様にとって、比較的、自社構築するよりは、TOC的には抑えられる傾向でもあり、また、最新の技術への適用も進んでいくので、より本業に専念できるというメリットもある。

でも、この記事には書かれていますが、クラウドを100%信用してしまってはいけない、ということが大切と私も思います。

我々もサービス提供者です。当然、SLA記載の通り、99.9%の保証はします。正確にいえば、0.01%もミスらない仕事を続けています。

ただ、あれだけの先進技術を誇る世界企業であっても、とんでもないトラブルを起こします。

小さい我々なら、もっと危ない!っていうことではないです。大小関係なく、どれだけ100%を目指していても、もしかしたら、100%を超えたレベルで何かが起きることもあるのです。

ゆえに、本当に大切なシステムやデータであれば、それをバックアアップできる手段も考えていく必要があります。

ということで、今、そういうサービスも検討中です!!

ただ、まだまだ先はかなり長いですけど・・・・。

燃えコラム
2011/08/04 12:07



コメント

コメントを見る (0)

コメントを投稿

* コメントは記事の投稿者が承認するまで表示されません。