――
みずほ銀行でトラブルがあった。
・ 2月28日に、全国の80%にあたるATMが利用できなくなるシステム障害が起きた。
・ 3月3日夜、一部のATMが最大で3時間使えなくなるトラブルがあり、キャッシュカードが取り込まれたケースもあった。
詳細は下記。
→ みずほ銀行 一部ATMで再びトラブル 最大3時間使えず | NHK
→ みずほ銀行ATM障害で通帳と現金25万が吸われたまま仕事も飛んだ話|note
→ みずほ銀行ATMの障害により異世界体験をした方々 - Togetter
――
この原因については、「みずほのシステム構築は、もともとひどい突貫工事があったので、当然だろ」という見方もある。
→ みずほ銀行を苦しめた「悪夢の記録」が異例のベストセラーになったワケ
→ みずほ銀行の次期システム開発はなぜ炎上した?今さら聞けない合併・統合失敗の歴史
→ 若手技術者の「失われた5年」、みずほ銀のシステム統合に透ける基幹系問題
だが、そもそもどうしてこういうふうに難航したのか? それは、銀行のシステムがきわめて特殊なものだからだ。大量のデータを瞬時に扱うという、大規模なシステムであるので、データの整合性をきちんとやるために、システムが複雑化してしまうらしい。
→ 銀行の基幹系システムはなぜ複雑なのか?|つっちーさん|note
――
だが、そうであるなら、次の解決策が思い浮かぶ。
「大量のデータを瞬時に処理して整合させるのを、やめる。整合性などはどうでもいい。入金と出金だけを、末端で処理すればいい。整合性は、あとでまとめて、ゆっくりとやればいい」
これは、分散処理の発想である。末端では、入金と出金(プラスマイナス)だけを処理すればいい。それで個人の勘定は整合性がとれるから、問題ない。
その結果として、中央における総合データは、どうなるか? 今は、それを瞬時に処理しているが、そんなことは瞬時にやる必要はない。何秒か遅れたとしても、まったく問題ない。遅れたとしても、その遅れのあとでは、正しいデータが得られるのだから、問題ない。データの順番が乱れたとしても、(途中経過はともかく)最終結果は同じになるのだから、問題はない。
このようにすれば、流れるデータは、入金と出金(プラスマイナス)だけとなる。中央における総合データは、通信の過程のどこにおいても流れることがない。また、システムの途中でもそのデータが使われることもないし、参考にされることもない。使うデータはあくまで、入金と出金(プラスマイナス)だけだ。その結果、こうなる。
・ システムの全体で扱うデータ量は激減する。
・ 通信で流れるデータは、数秒の遅れがあっても問題ない。
・ 通信で流れるデータは、順番が変更されても、問題ない。
このようなシステムは、簡単で堅牢なので、問題が起こることも少ない。
――
これに似た話は、下記にもある。
→ 銀行の基幹系システムはなぜ古臭いのか?|つっちーさん|note
みずほのシステムと違って、三井住友のシステムは、分散型であるそうだ。
三井住友銀行(SMBC)のシステムは、三菱UFJとは異なり勘定系システムを一定の支店の集団(店群)に分割して、店群サーバ同士が独立したシステムのようにふるまう水平分散アーキテクチャを採用している。
水平分散アーキテクチャの利点は、ハードウェアの構成とノード間の通信量は増えるが、ノードを自由に足すことで大規模化が容易で、将来的なオープンアーキテクチャへの置き換えも視野に入っている。また、バッチ処理をすべてオンラインで実行するバッチレスシステム化も早くから進んでいて、バッチ障害の危険性を極小化している。
現在から見ても先進的に思えるが、元になるシステムが構築されたのは1994年と割と古く、その間でもHWの入れ替えや、さくら銀行との合併に伴う規模の拡大といった大きなイベントも発生したが、他の銀行よりも1桁少ない構築費用で済んでいるのは設計の先進性にあると思う。
( → 銀行の基幹系システムはなぜ古臭いのか?|つっちーさん|note )
「店群サーバ同士が独立したシステムのようにふるまう」ということだ。これは、私が先に述べたこととは違うが、部分的には似た面もある。( → あとで訂正 )
ともあれ、こういう方式であれば、みずほのような「中央制御方式」とは違うので、みずほのようなシステム障害は起こらなかっただろう。
みずほは、三井住友のようなシステムを採用するべきだった。どうしてそうしなかったのか、理解しかねるところだ。
上の記事には、こうある。
システムの実現している機能はちょっと周回遅れな感じがある。最新技術で20年前のシステム要件を実装したみたいな。
言い得て妙である。
自動車で言えば、「最新技術のコンピュータ設計をした、OHV エンジン」みたいな感じかな。もはや時代遅れである。そこに「ガソリン直噴」みたいな先端技術を導入しても、しょせんはシステムそのものが古臭くて、故障が起こりやすい。
それがみずほの勘定システムだ。
簡単に言えば、「銀行にはコンピュータのことがわかる人がいなかった」とも言える。それと似た俗説は、下記にもある。
→ みずほ銀行ばかり障害を起こす理由|はてな匿名ダイアリー
※ ま、いかにも俗説だが。(半沢直樹 流の解釈)
【 追記 】
三井住友の方式について、「これは、私が先に述べたこととは違うが、部分的には似た面もある」と述べた。だが、よく考えると、両者は同じである。
なぜなら、私が述べたことを実装するとしたら、(中央データとの整合性は必要ないが)顧客データとの整合性は必要だからだ。この場合、顧客データの整合性を取るシステムを、分散処理で実行することになる。つまり、三井住友の方式となる。そうするしかない。
日本初の株式会社が情けないの一言です。
みずほシステム統合の謎、メインフレームは無くせたのか | 日経クロステック
https://xtech.nikkei.com/atcl/nxt/column/18/00942/082900006/