News & Views コラム:CSIRTメンバーから見たクラウドサービスの大規模障害のお話。~ クラウドの安全神話が崩れたのか? ~
pr_team コラムメールマガジンで配信したインターネットに関するコラムを、このブログでも紹介しています。今月は、Internet Week 2019でプログラムの企画をご担当いただいている、株式会社ラック/日本シーサート協議会 運営委員の原子拓さんによるコラムです。どんなことにもまずは冷静な判断、が大切であることを再確認させていただく内容でした。
先日大手クラウドベンダーで大規模な障害が発生した事案は、安易なクラウド導入を再考するきっかけになっているようです。また、同時に多くの著名なサービスが停止したため、クラウドベンダーの障害は多くのシステムに影響を与えるから「使わない方が良いのでは?」「安全神話崩れる」という空気にもなっています。
私の活動はというと、どちらかというとクラウド推進派で、「安全、安心、しかもリーズナブル」というキャッチフレーズで取り組んでいますし、将来は、Security as a Serviceになっていくのであろうと感じています。メールが良い例ですよね。
今回の障害は、CSIRTが運用されている組織では次のような感じで捉えられています。
CSIRTのある組織では通常、障害当日のインシデントハンドリングの手順書が用意されています。今回の障害を受けて、障害の原因がサイバーセキュリティインシデントか否かをまずは一次切り分けします。アプリケーション、そしてネットワーク、サーバ、クライアントと調べているうちに、どうもクラウド上の多数のサービスも障害になっていることを知り、サイバーセキュリティインシデントではなく、クラウドサービスの障害であるとの判断がつきます。原因がわかったところで、システム運用のメンバーは、あらかじめ規定された障害対応手順に沿って粛々と対応を進めます。そしてクラウドサービスが徐々に回復し、システムが再度サービスを開始します。その後、再発防止策を検討し、対応するといったインシデントハンドリングがなされます。
ここで言いたいのは、CSIRTが整備されている多くの組織では、システムのサービスレベルが規定され、SLA (Service Level Agreement)に基づき開発運用されていて、クラウドサービス自体のSLAがいくら高くても、停止も考慮したシステム設計・運用をしていて、想定された手順での対応をしているということです。具体的には、組織によってはシステムをSLAの高いものから低いもののいくつかに定義しています。例えば、メインのWebサイトはSLAが一番高く、24×7無停止のレベルつまり、ほとんど停止しないレベルで定義しており、システム設計時に、ネットワーク、サーバ等が障害に強くなるよう、冗長化構成で設計され、構築、運用されています。
CSIRTのある多くの組織は、障害対応を考慮したシステム開発・運用をしており、セキュリティインシデントが”0″にならないのと同様に、決してクラウドサービスだからといってトラブルが”0″であるとはしていません。
もし、今あなたの組織にCSIRTがなければ、早急にCSIRTを構築・運用していくことをお勧めしますが、これはちょっと極端なお勧めですね。まずは、みなさんの組織のシステムを再点検して、SLAに合った適材適所なシステムの再構築・運用の見直しが必要とされています。安易に別なクラウドにするとか、クラウドからオンプレに戻すことが対策にはなりません。今からメールシステムをSaaSからオンプレには戻さないですよね?そもそも、人間が作って運用しているものは壊れるし、間違ったりしますよね?セキュリティインシデントも障害も”0″にはならないのです。
終わりに、今年もInternet Week 2019が開催されます。CSIRT関連のセッションでは、クラウド時代のインシデントハンドリングの話も聞くことができると思います。ご興味のある方はぜひ参加くださいませ。
■筆者略歴
原子 拓(はらこ たく)
株式会社ラック SSS事業統括部 担当部長/日本シーサート協議会 運営委員。
1988年株式会社日立情報ネットワーク入社、日立製作所システム開発研究所にてネットワーク関連の研究開発に従事。1991年ヤマハ発動機株式会社入社、情報システム部門にて26年間インフラ・アーキテクチャ全般の企画を担当し、クラウド化、デジタル化を推進。CSIRT構築。2016年日本シーサート協議会運営委員。2017年株式会社ラック入社、コンサル部門、新規事業開発、研究開発部門を経て現在は、サイバーセキュリティ関連業務に従事する。その他、現役消防団員として地域防災活動も行っている。