⾼信頼システム 01 - tohoku university official...
TRANSCRIPT
![Page 1: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/1.jpg)
⾼信頼システム 01 〜信頼性の基礎〜
張⼭昌論
1
2019年
![Page 2: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/2.jpg)
連絡先
2
•張⼭昌論 (はりやままさのり)
•メールアドレス: [email protected]
•居室: 3号館 308号室 (地下鉄⻘葉⼭駅の後ろ) (事前にアポイントいただけますよう)
•電話: 022-795-7153
![Page 3: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/3.jpg)
授業の資料
3
•張⼭のWEBの授業のページでPDFを公開
•http://www.ecei.tohoku.ac.jp/hariyama
•PC / タブレットで持ち込んでも結構です
![Page 4: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/4.jpg)
評価⽅法
4
•基本的にはテストで成績を判定する
•授業中に渡した印刷資料と⾃筆ノートを持ち込んで良い.
•電卓持ち込みOK.通信機能のあるデバイス使⽤はダメ
•レポートなどの平常点を考慮する場合もある
•出席はとらない
![Page 5: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/5.jpg)
本講義で主に対象とするシステム:情報システム
5
携帯⾃動⾞
100個以上のLSI!
家電
銀⾏システム
IoT: Internet of things, 全てのモノが情報システム
インターネット・クラウドスーパーコンピュータ, サーバー
システムの信頼性が損なわれるとパニックに
![Page 6: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/6.jpg)
システムを安定的に運⽤できる
信頼性とは?
6
システムが与えられた条件で規定の期間中, 要求された機能を果たすことができる性質
システムは時間が経てば故障する
どの程度時間が経つとシステムが壊れるのか?単位時間内にシステムが壊れる確率は?
![Page 7: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/7.jpg)
情報システムの⾼信頼化の課題
7
•故障・誤動作の観点
•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム
•⾃動⾞の制御⽤LSI→電磁波・⾼熱による誤動作
•⼈⼯衛星⽤コンピュータ→強烈な宇宙線による誤動作
![Page 8: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/8.jpg)
情報システムの⾼信頼化の課題(続き)
8
•プログラムにおけるバグ •集積回路(LSI)の設計におけるバグ •プリント基板の製造時の⽋陥:半⽥の不良
![Page 9: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/9.jpg)
情報システムの⾼信頼化の課題
9
•情報セキュリテイへの対策
- データの改ざん,システムのハッキング
近年,⾃動⾞などの組み込みシステムでも重⼤な問題に!
![Page 10: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/10.jpg)
10
![Page 11: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/11.jpg)
シラバス
11
1 情報システムの高安全化・高信頼化の背景 2 信頼性評価の基礎(信頼度、MTTF、アベイラビリティなど) 3 フォールト・トレラント設計: 静的冗長技術 4 フォールト・トレラント設計: 動的情報技術 5 フォールト・トレラント設計: 誤り訂正符号1 6 フォールト・トレラント設計: 誤り訂正符号2 7 システムの集中と分散 8 分散システムの構成 9 ソフトウェアシステム設計手法:オブジェクト指向モデリング1 10 ソフトウェアシステム設計手法:オブジェクト指向モデリング2 11 TDD(テスト駆動開発)によるソフトウェアの高信頼化設計 12 情報工学的アプローチによる異常検知技術1 13 情報工学的アプローチによる異常検知技術2 14 高信頼システム設計の実例 15 まとめ
![Page 12: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/12.jpg)
信頼度評価の基礎(信頼度、MTTF、アベイラビリティなど)
12
![Page 13: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/13.jpg)
システムの信頼性の尺度
13
1.信頼性 (Reliability) 2.可⽤性 (Availability) 3.保守性 (Serviceability)→ RAS技術
+ 完全性 (Integrity), 安全性 (Security) → RASIS (レイシス)
![Page 14: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/14.jpg)
1. 信頼性(Reliability)
14
部品/機器/システムが正しく機能していることを 定量的に表現するための尺度
信頼度, 故障率
![Page 15: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/15.jpg)
信頼度, 故障率
15
S(t): 総数N個のサンプルを動作させている時に,時刻 t まで正常に動作 しているサンプル数
F(t): 時刻 t までに故障してしまったサンプル数
S(t) + F(t) = N
信頼度 R(t):
故障率 λ(t): λ(t) = 1S(t)
dF(t)dt
R(t) = S(t)N
残存している構成要素に対する単位時間の故障の数
![Page 16: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/16.jpg)
故障率の意味
16
「動作中の装置が単位時間に故障する確率」
λ=10-5 [/hour] → 1時間以内に10-5 の確率で故障 → 106個の装置を使っていた場合, 1時間以内に1個が故障する
時間の単位として「hour」を⽤いた場合,
故障率の単位として,fit (failure in time) が⽤いられる 1[fit] = 10-9 [/hour]
![Page 17: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/17.jpg)
故障率の変化のモデル:バスタブ(Bath-tub)
17
1. 初期故障期:初期不良が主たる故障の原因.故障率は時間と共に減少. 2. 偶発故障期:故障率は⼀定.λ(t) = λ → 3. 摩耗故障期:故障率は時間と共に増加,寿命を迎える.
R(t) = e−λ t
λ(t)=λ(⼀定)
次ページで補⾜
故障率λ(t)
![Page 18: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/18.jpg)
(補⾜)故障率が⼀定の場合の信頼度関数
18
故障率が⼀定の場合の信頼度関数
![Page 19: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/19.jpg)
MTBF, MTTF
19
MTTF: Mean Time To Failure(平均故障時間)
MTBF: Mean Time Between Failures(平均故障間隔)システムが故障するまでの時間の平均値。修理系(直しながら使うシステム)に適⽤
故障なしで使⽤できる時間の平均値.⾮修理系(修理せず交換するシステム)に適⽤
例)部品類など → 故障の場合,修理せずに交換・廃棄
例)⾞,コンピュータ → 故障した部品を交換して再度利⽤可能. 修理・使⽤から再度故障するまでの時間
![Page 20: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/20.jpg)
計算例 MTTF
20
時間
稼働 10,000時間
稼働 12,000時間
稼働 14,000時間
交換 交換 交換
コンピュータのハードディスクは下記のように稼働して故障し交換した. ハードディスクのMTTFを求めよ.
![Page 21: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/21.jpg)
計算例 MTBF
21
時間
稼働 100時間
稼働 120時間
稼働 140時間
修理 3時間
修理 2時間
修理 4時間
下記のシステムのMTBFを求めよ
![Page 22: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/22.jpg)
MTTF,MTBFと故障率の関係
22
MTTF = 1λ
MTBF = 1λ
参考までに求め⽅:
※故障率λが⼀定の場合
![Page 23: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/23.jpg)
演習
23
平均して20⽇で故障するシステムを考える.
(1) このシステムのMTBFを求めよ
(2) このシステムの故障率を求めよ
(3) このシステムの信頼度R(t)を求めよ
![Page 24: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/24.jpg)
演習(続き)
24
(4) (修理が完了してから)20⽇でシステムが故障せずに動作している確率を求めよ.下記のグラフを使って良い.
信 頼 度
時間(⽇)
λ=1/20の時の信頼度のグラフ
(5) 信頼度が0.5となるのは何⽇⽬か.
![Page 25: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/25.jpg)
2. 可⽤性 (Availability)
25
システムが利⽤可能であるかどうかを定量的表現
定量的指標: 稼働率(システムが利⽤可能である確率)
(稼働率) =MTBF
MTBF + MTTR
MTBFが同じでも,MTTRが⼩さい⽅が稼働率が⾼い. → 故障を早く検出でき,修理しやすいシステムが⼤切
※ 稼働率は定常アベイラベリティとも呼ばれる
![Page 26: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/26.jpg)
3.保守性 (Serviceability)
26
故障検出から修理のしやすさまでを考慮した指標システムが故障→ 故障検出・部品交換・修理
定量的な指標: 平均修理時間 (MTTR, Mean Time To Repair)
MTTRが⼩さい → 保守性が良い
![Page 27: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/27.jpg)
計算例 MTTR
27
時間
稼働 100時間
稼働 120時間
稼働 140時間
故障 修理中 3時間
故障 修理中 2時間
故障 修理中 4時間
下記のシステムのMTTRを求めよ
![Page 28: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/28.jpg)
直列及び並列システム
28
世の中のシステムは,多くの部品・ サブシステムからなっている
![Page 29: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/29.jpg)
直列システム(Series)の信頼度・稼働率
29
すべての構成要素が正常に動作 → システム全体が正常動作
ROV = R1 ⋅R2 ⋅R3!RN
= exp(−λ1t) ⋅exp(−λ2t) ⋅exp(−λ3t)!exp(−λNt)
= exp(−(λ1 + λ2 +!+ λN )t)
ROV = exp(−λOVt) より λOV = λ1 + λ2 +!+ λNなお,
信頼度
稼働率 UOV =U1 ⋅U2 ⋅U3!UN
直列系の信頼度グラフ ※故障は独⽴
信頼度グラフ: 左から右端まで繋がっている → システムは正常故障により切断 → システムダウン
![Page 30: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/30.jpg)
ROV = 1− (1− R1) ⋅(1− R2 ) ⋅(1− R3)!(1− RN )
= 1− {1− exp(−λ1t)} ⋅{1− exp(−λ2t)}⋅{1− exp(−λ3t)}!{1− exp(−λNt)}
並列システム(Parallel)の信頼度・稼働率
30
どれか1個の構成要素が正常に動作 → システム全体が正常動作
すべての構成要素が故障する場合以外の確率
例)冗⻑システムで切り替えが完璧にうまくいく場合
UOV = 1− (1−U1) ⋅(1−U2 ) ⋅(1−U3)!(1−UN )
信頼度
稼働率
M1
M2
M3
MN
![Page 31: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/31.jpg)
直並列(Series-to-Parallel) の信頼度
31
直並列の信頼度:
![Page 32: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/32.jpg)
並直列(Parallel-to-Series)の信頼度
32
並直列の信頼度:
![Page 33: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/33.jpg)
演習問題1
33
表よ⽰す構成のコンピュータシステムがある. 機能を満たすためには全ての構成部品が正常に 動作する必要があるとする.
(1)このシステムのMTBFを求めよ (2)1000時間使⽤した時の信頼度を求めよ
部品 個数 故障率 [/hour]メモリ 4 (λ1) 10×10-7 CPU 1 (λ2) 20×10-7 HDD 2 (λ3) 200×10-7
キーボード 1 (λ4) 30×10-7ディスプレイ 1 (λ5) 50×10-7
![Page 34: ⾼信頼システム 01 - Tohoku University Official …...•コンピュータの部品(HDD,メモリ)の故障 •ネットワークルータの故障 •厳しい環境での組み込みシステム](https://reader033.vdocuments.net/reader033/viewer/2022041922/5e6c3f32a9596c627e6e5143/html5/thumbnails/34.jpg)
演習問題2
34
N=2の並列システムにおいて,全てが同じ構成要素であり, 1個の信頼度がR=0.75であるとする.この時の全体のシステム の信頼度を求めよ.
R=0.75
R=0.75