叡智の三猿

三猿×情報セキュリティ×はてな で発信します。

フォールトトレラントで守る

業務で繋がる情報システム

会社には多数の「情報システム」があります。なぜなら、会社にはたくさんの業務があり、その業務をサポートするためにはコンピュータシステムは欠かせないからです。

f:id:slowtrain2013:20200405000424p:plain:w500
基幹業務と情報システム
ここにあげた業務はより細分化され、それぞれの業務をサポートするシステムがあります。以前、わたしがエンジニアとして関わった従業員10,000人の製造業では大小200個程度の「情報システム」が稼働していました。

そして、それぞれのシステムは、業務やネットワークを通じて繋がっています。

仮に「物流システム」が障害を発生させ「出荷指示」が出力できなくなったら大変です。製品が予定通りに倉庫から出荷されず、店舗にモノが届かなくなります。消費者が必要なモノが店頭になければ、需要に応えることが出来ず、販売機会の損失を招きます。これにより売上は悪化するでしょう。もしかしたら、会社ブランドが低下し、事業計画の見直しに発展するかもしれません。

f:id:slowtrain2013:20200405023651p:plain
供給連鎖の崩壊

フォールトトレラント

「情報システム」の障害は、事業の継続に問題を起こす可能性があります。特に日本は環太平洋造山帯に属しているため、地震などの自然災害が多く発生します。ここで気分は中学生!社会のお勉強です。
youtu.be
災害に備えた障害対策フォールトトレラントを検討しておくことが必要です。

規模の大きな自身がある地域で発生した場合、そこにある機器が一斉に使えなくなる可能性があります。そこで距離の離れた別な場所にバックアップ用の機器を保管しておくことで、障害への対応をすることが考えられます。たとえば、メインの物流センターを川崎に置き、バックアップ用の物流センターを東大阪に置くなどです。バックアップとなるサイトの機器は、即時稼働が可能なホットサイトと、時間をある程度置いて稼働が可能なコールドサイトがあります。

システムの機器や系統を2系統(現用系と待機系)として稼働させるシステムをデュプレックスシステムと呼びます。

f:id:slowtrain2013:20200405020843p:plain:w500
デュプレックスシステム

この切り替え方式には、ホットスタンバイ、ウォームスタンバイ、コールドスタンバイがあります。

方 式 説 明
ホットスタンバイ 待機系も現用系と同一プログラムとして、あらかじめ起動する。現用系が故障したら、即座に切り替えて処理を続行する。
ウォームスタンバイ 待機系のOSは起動するが、プログラムは現用系と同じではない。現用系が故障したら、現用系のプログラムと合わせ待機系に切り替えて処理を続行する。
コールドスタンバイ 待機系の電源はOFFとする。現用系が故障したら、待機系のシステムの電源を入れ、現用系のプログラムと合わせ待機系に切り替えて処理を続行する。

ただ、せっかくバックアップ体制を敷いても、災害は突然おきます。その際、エンジニアが運用に慣れてなければ迅速に切り替えするのは大変なことです。年に一度くらいは災害を想定し、バックアップサイトを使った訓練をするのが望ましいと思います。

自然災害がおきても会社として事業の中断を可能な限り、短時間で再開させることで、売上の低下や企業ブランドの低下を防ぐことで、会社を沈没させない経営戦略をBCP(事業継続計画)と呼びます。BCPの策定に於いては、会社にある全ての「情報システム」を対象とするのではなく、システムの復旧の重要性と緊急性を勘案して対象を決定します。