ANAシステム障害の原因判明、DB並列参照時にパッチ未適用の既知バグでフリーズ
全日本空輸(ANA)の国内線旅客系基幹システム「able-D」で2023年4月3日午後に発生したシステム障害の原因が判明した。周辺システムからable-Dのデータベース(DB)を参照する際、データベース管理システム(DBMS)のバグをきっかけにDBがフリーズしていた。バグは既知のものでパッチもリリースされていたが、同社はシステム構成上パッチ未適用でも問題ないとみて適用を見送っていた。<中略>
このDBMSでは、同時に複数のクエリーを投げるとまれにエラーが発生するバグが発見されており、2018年にはパッチもリリース済みであった。ただ同社はDBについて「DB1」「DB2」という2系統でクラスタリング構成を組んでいた。このことから、エラーが発生してもどちらかのサーバーに片寄せすることで継続稼働できるとにらみ、パッチの適用を見送っていた。ただ今回の障害では、バグによるフリーズの影響が同社の想定を超える範囲に及ぶ結果となった。
https://xtech.nikkei.com/atcl/nxt/column/18/00001/07915/