2 作業ミスとルール逸脱は、個人の問題でなく、組...

4
33 情報処理システム高信頼化教訓集(ITサービス編) ΨόφϯεʗϚωδϝϯτ2 2. 6ɹۀ࡞ϛスɺϧーϧҳの問題に関する ܇ڭ(G6) 2.6 ۀ࡞ϛスɺルールҳのに関する教訓(G6) ۀ࡞ϛスとϧーϧҳは、個人の問題でな、৫の問題! 教訓 G6 問題 社システム部門は、多数のグループ会社及び関連会社が利用するグループウェア・サービスを運用し ている。同サービスは、統合アカウント管理ツールとグループウェアとから構成されている。統合アカウ ント管理ツールは、運用作業者が通常、ユーザの登録・削除等の運用操作を行うためのシステムである。 グループウェアは、利用者データベースを持ち、利用者データに対する操作が可能となっている。通常運 用作業者は、直接グループウェアのアカウント情報を直接操作してはならないルールである。 そのグループウェア・サービスの障害により、多数の利用者のデータ(送受信メール、スケジュール、 アドレス帳等)が消失してしまい、復旧するのに 日間を費やした。 経緯は、以下の通りである。 ・運用作業者が、統合アカウント管理ツールを使って、新規ユーザ( 名分)のユーザ登録作業を 実施したところ、ユーザの設定が誤っていることに気づいた(図 ①)。 ・再登録するために統合アカウント管理ツールを使い先に登録したユーザを削除しようとしたが、 削除できなかったため(図 ②)、直接グループウェアサーバ上で登録したユーザ( 名分) を削除しようとした(図 ③)。 ・ところが、誤って“全ユーザ削除”を実行してしまった(図 ④)。 ・すぐに気づき、実行処理を停止しようとしたが、できなかったため、グループウェアサーバを強制 再起動した(図 ⑤)。 図 2.6 - 1 障害状況 ͺ;ϋΠーΨ ①⤫合䜰䜹䜴䞁ト⟶理 䝒ー䝹に䜘る、᪂つ䝴ー 䝄のⓏ㘓実施 ③┤᥋、䜾䝹ー䝥䜴䜵 䜰サー䝞上で、᪂つ 䝴ー䝄のⓏ㘓䠋削除 実施 ④誤䛳䛶、䝴ー䝄の䜰䜹 䜴䞁ト䜢削除 ї 䝯ー䝹䜒㐃し䛶削除 䐣ᙉ制㉳ ї 䛥䜙にシステムが不合䛸䛺る ②Ⓩ㘓に誤りが䛒り、᪦削 除し䜘䛖䛸ヨみ䛯が、⤫合䜰䜹 䜴䞁ト⟶理䝒ー䝹での削除䛿 でき䛺いこ䛸が LD A P Έσープ ;Ϳͺ ーΨ グループウェア 統合アカウント管理ツール

Upload: others

Post on 06-Aug-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2 作業ミスとルール逸脱は、個人の問題でなく、組 …情報処理システム高信頼化教訓集(ITサービス編) 33 ガバナンス/マネジ領域の教訓

33� 情報処理システム高信頼化教訓集(ITサービス編)

ガバナンス/マネジメント領域の教訓

2

� 2.6 作業ミス、ルール逸脱の問題に関する教訓(G6)

2.6 作業ミス、ルール逸脱の問題に関する教訓(G6)

作業ミスとルール逸脱は、個人の問題でなく、組織の問題!教訓G6

問題A社システム部門は、多数のグループ会社及び関連会社が利用するグループウェア・サービスを運用し

ている。同サービスは、統合アカウント管理ツールとグループウェアとから構成されている。統合アカウント管理ツールは、運用作業者が通常、ユーザの登録・削除等の運用操作を行うためのシステムである。グループウェアは、利用者データベースを持ち、利用者データに対する操作が可能となっている。通常運用作業者は、直接グループウェアのアカウント情報を直接操作してはならないルールである。そのグループウェア・サービスの障害により、多数の利用者のデータ(送受信メール、スケジュール、アドレス帳等)が消失してしまい、復旧するのに 2日間を費やした。経緯は、以下の通りである。・運用作業者が、統合アカウント管理ツールを使って、新規ユーザ(50名分)のユーザ登録作業を実施したところ、ユーザの設定が誤っていることに気づいた(図 2.6 ‒ 1①)。・再登録するために統合アカウント管理ツールを使い先に登録したユーザを削除しようとしたが、削除できなかったため(図 2.6 ‒ 1②)、直接グループウェアサーバ上で登録したユーザ(50名分)を削除しようとした(図 2.6 ‒ 1③)。・ところが、誤って“全ユーザ削除”を実行してしまった(図 2.6 ‒ 1④)。・すぐに気づき、実行処理を停止しようとしたが、できなかったため、グループウェアサーバを強制再起動した(図 2.6 ‒ 1⑤)。

図 2.6 - 1 障害状況

ト情報

ー 情報ト情報

ー① 合 ト 理ー に る、 ー

の 実施

③ 、 ーサー 上で、ー の 削除

実施

④誤 、 ー のト 削除

ー し 削除

制 にシステムが不 合 る

② に誤りが り、 削除し み が、 合

ト 理 ー での削除でき いこ が

① ②

LD A P

ープ

グループウェア統合アカウント管理ツール

Page 2: 2 作業ミスとルール逸脱は、個人の問題でなく、組 …情報処理システム高信頼化教訓集(ITサービス編) 33 ガバナンス/マネジ領域の教訓

34 情報処理システム高信頼化教訓集(ITサービス編)

ガバナンス/マネジメント領域の教訓

2

2.6 作業ミス、ルール逸脱の問題に関する教訓(G6)

原因直接原因は、運用作業者が運用ルールにない作業を行ったことによる。作業者は、自分の判断でマニュアルに記載がない作業を不用意に行った結果、統合アカウント管理ツールでアカウントの更新を行わなければならないのを、直接グループウェアサーバで作業をしたり(図 2.6 ‒ 1 ‒ 原因①)、全ユーザを削除するボタンを押下して障害を発生させてしまったり(図 2.6 ‒ 1

‒原因②)、グループウェアサーバを強制再起動させたり(図 2.6 ‒ 1 ‒原因③)、障害を拡大させてしまった。

根本原因は、システム部門作業者が作業に入れる状況にないにも関わらず、作業を行わせた組織(システム部門)のマネジメントが働かなかったことである。当時、グループウェア・サービスの移行スケジュールが立て込んでおり、今回のアカウント登録作業

もすぐに行わなければならない状況であった。そのため、組織(システム部門)の作業依頼者から作業の緊急性が運用チームに伝えられていた。運用チームでは、教育、作業手順マニュアルの作成が追いつかず、チーム内のスキルの共有化ができていなかった(作業の属人化)。そのため、作業は、不慣れな作業者一人で行うことになった。作業中、チーム内ではお互い自分の作業に追われていたため、作業者は、問題が出ても熟練者に聞くことができず、また、時間の制約による焦りがあった。そのため、早く作業を終わらせないと業務に影響が生じ、自分がその原因を作ってはいけないというプレッシャを感じていた作業者は、不具合が生じても、独断で作業を進めてしまった(図 2.6 ‒ 2)。

図 2.6 - 2 マネジメントの問題から引き起こされた障害

職場

(運用チーム)

個人

→作業者

運用

プレッシャ(圧力)

プレッシャを感じて、動揺

を ー を 発生

作業依頼部門 システム部門

プレッシャ(圧力)

Page 3: 2 作業ミスとルール逸脱は、個人の問題でなく、組 …情報処理システム高信頼化教訓集(ITサービス編) 33 ガバナンス/マネジ領域の教訓

35� 情報処理システム高信頼化教訓集(ITサービス編)

ガバナンス/マネジメント領域の教訓

2

� 2.6 作業ミス、ルール逸脱の問題に関する教訓(G6)

対策再起動後、バックアップを使ってデータ復旧を行った。バックアップで復旧できないユーザについては、新規にユーザカウントを再作成し、受信メールのみ 3カ月前のメールアーカイブから復旧作業を行なった。

システム部門は、マネジメントの観点から、作業ミスを減らし、ルール逸脱を無くする対策を行った。作業ミス、ルール逸脱は、個人の問題とするのではなく、組織の問題と捉え、総合的な対策を立てることとした。以下、今回の事例を基に検討した対策案を述べる。このような行動をPDCAサイクルで廻していく。

① 作業を受ける場合は、作業を実施した場合のリスクを分析して判断基準を作成し、その基準をクリアした上で作業実施を決定する。システム部門は、作業を受ける前に、自部門の作業者のスキルや稼働状況、及び作業の目的、重要度、影響度を基に、作業を引き受けた場合のリスク分析を行い、作業実施の判断基準を設定する。その場合、過去のヒヤリハット、障害記録なども参考にする。例えば今回の事例では、以下のような判断基準を設定し確認していれば、障害を未然に防げた。・作業マニュアルは、万全か。・作業内容は、チーム内で共有化されているか(作業の属人化に陥っていないか)。・作業者は、作業中に疑問が生じたときの対応が取れるようになっているか。当然、このような判断基準がクリアできない場合は、対策を立てる。また、作業依頼部門に作業実施の再スケジュールを依頼することも必要になるので、作業依頼部門とも十分話し合っておく必要がある。

②作業実施時にルールを逸脱しない作業規定を作る。システム部門は、作業実施時にルールを逸脱しないような方策を立て、それをチーム内作業者

と常に改善していくプロセスを実施する。今回の事例では、以下のような対策を実施していれば、障害の拡大を防ぐことができた。・ 作業のオペミスを防ぐため、作業は 2名体制(実施者、確認者)で行い、手順書に書かれた作業以外は、作業者の判断では、絶対に行わない。また、作業記録をとり、作業実施ログを保存する。

・ 手順書と違う状態が発生した時点で作業を止め、上位者へ報告し、組織として判断、対応する。インシデント管理(障害記録の作成)を実施する。

・ 作業ミスを減らすためのシステムの改善点があれば実施する。今回の場合は、重要コマンドは、簡単に投入できない様に権限を設定する改善を行う。

Page 4: 2 作業ミスとルール逸脱は、個人の問題でなく、組 …情報処理システム高信頼化教訓集(ITサービス編) 33 ガバナンス/マネジ領域の教訓

36 情報処理システム高信頼化教訓集(ITサービス編)

ガバナンス/マネジメント領域の教訓

2

2.6 作業ミス、ルール逸脱の問題に関する教訓(G6)

効果組織としての対策を総合的に行うことで、作業ミスを減らし、ルール逸脱を無くすことができ、シス

テム障害を減らすことができる。

教訓作業ミスとルール逸脱は、個人の問題にするのではなく、組織として取組むことが重要である。組織、職場(チーム)、個人が受けるプレッシャによって誘発される作業ミス、ルール逸脱は、組織内、職場(チーム)内の問題として取組むことによって減らすことができる。それには、組織内、職場(チーム)内の体制作り、ルール策定、システムによる防御対策を常に PDCAサイクルで回しながら改善を行う。また、日ごろからの組織内、職場(チーム)内のコミュニケーションが重要な事は言うまでもない。