10年周期のみずほ銀行システム障害-運用面の問題はどこにあるのか?
2002年、2011年に続き、3度目の勘定系システム障害を起こしてしまったみずほ銀行ですが、4000億円、最大8000名の人員を投入して2018年に稼働した新システムでの障害なので、今回は当事者にとって、きわめて大きな衝撃だったはずです。新システム導入に関与した富士通は「システムに問題なし」と発表し、みずほ頭取さんは「運用上の問題」を会見で述べておられたので、どう考えても銀行側の問題が大きかったようです。
定期預金のデータ移行作業でシステムに想定を上回る負荷が生じたことが直接の原因とのことですが、では「銀行側の運用上の問題」であるとすれば、どこに根本原因があったのか、とても興味があります。私は全くの素人的発想ですが以下の3点に注目しています。
まずひとつは「構築よりも更新のほうが圧倒的に障害発生のリスクが高い」という点です。効率性の向上を目指してシステムの更新を行うわけですが、そもそも「よくわからないけどうまくいっている状態」で稼働させているので、更新によって効率性が向上する分、どこかに副作用が生じます。更新作業ですから「動かしながら修正する」わけで、不具合が発生すれば利用者の損失に直結します。たぶんシステム障害の本当の原因はわからないまま再稼働していると思いますが、そのあたりのリスク感覚があったのかどうか。
ふたつめは旧富士銀行、旧日本興業銀行、旧第一勧銀の組織力学をいまだにひきづっているのではないか、という点。三井住友、三菱UFJは「片寄方式」でシステム統合を図りましたが、みずほだけが「片寄方式」が採用できず、またそれぞれが提携していた富士通や日立、NTT等4社で統合作業が行われた、という点は、これまでの2度のシステム障害でも問題にされていました。どうしてもチームがひとつになれない、というのが運用面での問題として残っているのではないかと。
そして3つめがみずほの「働き方改革」との関係です。ご承知のとおりみずほ銀行は週休3日制を導入したり、25%の在宅勤務制度を導入しましたので、DXの推進とともに大規模な組織で更なる職務の分業化・専門化が進んでいると推測されます。したがって「システム全体を理解する社員」「隙間を埋める社員」が存在しない。これまでの労務慣行からすると、なにかイレギュラーな状況が生じた場合には、誰の業務なのかグレーであったとしても、誰かがそこを埋める作業ができたわけですが、そこに手を伸ばす社員が存在しなくなった(これはコロナ禍における他社の不祥事にも通じるところですね)。
いずれにしても、過去最大級の新勘定系システムの構築が稼働していたわけですから、運用上のどこに問題があったのか、(限界はあると思いますが)前回と同様、調査委員会を設置して公表していただきたいと思います。
| 固定リンク
コメント
山口先生のブログはコンプラなどの観点からは参考になるが、今回の内容は正直、門外漢ぶりが目立つ。
「構築より更新のほうがリスクが高い」なんてことはない。100%置き換わる構築のほうが当然リスクは高い。また、更新だから動かしながら作業する、も間違い。止めなくても可能な更新だから止めないだけであって、止めないとできない更新は連休などにやっている。
マルチベンダー体制も大規模開発の場合には普通です。
働き方改革との関係は思い付きの範疇を出ませんね。
投稿: システムコンサルさん | 2021年3月 2日 (火) 21時00分
働き方改革とは関係ありません。
大手の銀行や証券では、他部署で使い物にならない要員が情報システム部門に回されます。そして情報システム部門社員の行っているのは外注価格を叩くことだけです。これは20年以上前から指摘されている根本的な問題ですが、全く改善されません。
さらに問題なのは、大手においてはグループ内のシンクタンク(○○総研といったところ)が中途半端な知識で噛んで多額の金を奪って邪魔をしていくことや、一次請けベンダーのPMP有資格者に経験と知識が不足していてメチャクチャな基本設計のまま進めようとすることです。
投稿: IT土方企業経営者 | 2021年3月 3日 (水) 03時06分