「《ベイズ信頼性》」の版間の差分
(新しいページ: ''''【べいずしんらいせい (Bayesian reliability) 】''' システムやその構成要素の信頼性を設計, 評価するための信頼性理論では, 確率...') |
|||
5行目: | 5行目: | ||
故障データを統計的に解析する際, その方法は標本論的立場からの方法と, [[ベイズ統計]] (Bayesian statistics) 学の立場からのそれとに大別できる. 後者のベイズ統計学の立場からデータを解析し, 各種信頼性設計や評価を行うための体系を[[ベイズ信頼性]] (Bayesian reliability) 理論と呼ぶ. | 故障データを統計的に解析する際, その方法は標本論的立場からの方法と, [[ベイズ統計]] (Bayesian statistics) 学の立場からのそれとに大別できる. 後者のベイズ統計学の立場からデータを解析し, 各種信頼性設計や評価を行うための体系を[[ベイズ信頼性]] (Bayesian reliability) 理論と呼ぶ. | ||
− | 確率変数$X$が故障時間を表すものとし, $X$の確率密度関数を$p(x|\ | + | 確率変数$X$が故障時間を表すものとし, $X$の確率密度関数を$p(x|\boldsymbol{{$\theta$})$と表すこととする. 但し, $\boldsymbol{{$\theta$}$は分布パラメータである. ベイズ統計学では, 分布パラメータ$\boldsymbol{{$\theta$}$の値に対する確信の度合いを主観確率を用いて表現することを目的に, $\boldsymbol{{$\theta$}$を確率変数として取り扱う. |
− | 対象とするシステムあるいは構成要素の故障時間データ$\ | + | 対象とするシステムあるいは構成要素の故障時間データ$\boldsymbol{{$x$}$$=(x_1,x_2,\ldots,x_n)$を入手している場合を考える. このようなデータを入手する前の分布パラメータ$\boldsymbol{{$\theta$}$に対する事前確率密度(パラメータの値に対する事前の確信の度合い)を$g(\boldsymbol{{$\theta$})$と書くと, $\boldsymbol{{$x$}$を入手した後の$\boldsymbol{{$\theta$}$に対する事後確率密度$g(\boldsymbol{{$\theta$}|\boldsymbol{{$x$})$は, ベイズの定理 [1], [2] により |
− | g(\ | + | :<math> |
− | = \frac{ g(\ | + | g(\boldsymbol{\theta} | \boldsymbol{x}) |
− | l(\ | + | = \frac{ g(\boldsymbol{\theta}) |
+ | l(\boldsymbol{\theta} | \boldsymbol{x}) | ||
}{ | }{ | ||
− | \int_{\ | + | \int_{\boldsymbol{\theta} \in \boldsymbol{\Theta}} |
− | g(\ | + | g(\boldsymbol{\theta}) |
− | l(\ | + | l(\boldsymbol{\theta}|\boldsymbol{x}) |
− | {\rm d}\ | + | {\rm d} \boldsymbol{\theta} |
} | } | ||
+ | </math> | ||
− | で与えられる. ここに, $\ | + | で与えられる. ここに, $\boldsymbol{{$\Theta$}$はパラメータ空間であり, $l(\boldsymbol{{$\theta$}|\boldsymbol{{$x$})$はデータ$\boldsymbol{{$x$}$を入手したときの$\boldsymbol{{$\theta$}$に関する尤度関数を表している. この尤度関数は, $x_1,x_2,\ldots,x_n$が互いに独立であるならば |
− | l(\ | + | :<math> |
− | = \prod_{i=1}^n p(x_i|\ | + | l(\boldsymbol{\theta}|\boldsymbol{x}) |
+ | = \prod_{i=1}^n p(x_i|\boldsymbol{\theta}) | ||
+ | </math> | ||
で与えられる. | で与えられる. | ||
− | 以上のようにして導出された事後密度は, $\ | + | 以上のようにして導出された事後密度は, $\boldsymbol{{$\theta$}$に対する事前の確信の度合いに, データ$\boldsymbol{{$x$}$がもつ情報を加味したときの$\boldsymbol{{$\theta$}$に対する確信の度合いを, 確率分布という形で表している[3]. このため, 分布パラメータやその関数である平均故障時間, 時刻$t$における信頼度などを次のようにして推定することができる[4]. |
− | 分布パラメータ$\ | + | 分布パラメータ$\boldsymbol{{$\theta$}$の推定量として |
− | \tilde{\ | + | :<math> |
− | = \int_{\ | + | \tilde{\boldsymbol{\theta}} |
− | \ | + | = \int_{\boldsymbol{\theta} \in \boldsymbol{\Theta}} |
− | g(\ | + | \boldsymbol{\theta} |
− | {\rm d} \ | + | g(\boldsymbol{\theta} | \boldsymbol{x}) |
+ | {\rm d} \boldsymbol{\theta} | ||
+ | </math> | ||
− | のように, 事後密度の$\ | + | のように, 事後密度の$\boldsymbol{{$\theta$}$に関する期待値を用いることができる. また, 平均故障時間や時刻$t$における信頼度のように$\boldsymbol{{$\theta$}$の関数である量$h(\boldsymbol{{$\theta$})$を推定する場合についても同様である. つまり, $h(\boldsymbol{{$\theta$})$の推定量として |
− | \tilde{h}(\ | + | :<math> |
− | = \int_{\ | + | \tilde{h}(\boldsymbol{\theta}) |
− | h(\ | + | = \int_{\boldsymbol{\theta} \in \boldsymbol{\Theta}} |
− | g(\ | + | h(\boldsymbol{\theta}) |
− | {\rm d} \ | + | g(\boldsymbol{\theta} | \boldsymbol{x}) |
+ | {\rm d} \boldsymbol{\theta} | ||
+ | </math> | ||
− | を用いることができる. このようにして得られる推定量を[[ベイズ推定]]量 (Bayes estimator) と呼ぶ. また, 前述したように$g(\ | + | を用いることができる. このようにして得られる推定量を[[ベイズ推定]]量 (Bayes estimator) と呼ぶ. また, 前述したように$g(\boldsymbol{{$\theta$}|\boldsymbol{{$x$})$が確率密度関数の形で$\boldsymbol{{$\theta$}$に関する情報を有していることから, その応用は[[ベイズ信頼性実証試験]] (Bayes reliability demonstration testing) をはじめ多岐にわたっている. |
− | ここで, 確率変数$X$の振る舞いを表す密度関数$p(x|\ | + | ここで, 確率変数$X$の振る舞いを表す密度関数$p(x|\boldsymbol{{$\theta$})$に対してベイズ推定量の考え方を適用してみる. すなわち |
− | p(x|\ | + | :<math> |
− | = \int_{\ | + | p(x|\boldsymbol{x}) |
− | p(x|\ | + | = \int_{\boldsymbol{\theta} \in \boldsymbol{\Theta}} |
− | g(\ | + | p(x|\boldsymbol{\theta}) |
− | {\rm d} \ | + | g(\boldsymbol{\theta} | \boldsymbol{x}) |
+ | {\rm d} \boldsymbol{\theta} | ||
+ | </math> | ||
− | のようにして導出された密度関数$p(x|\ | + | のようにして導出された密度関数$p(x|\boldsymbol{{$x$})$を考える. これは, データ$\boldsymbol{{$x$}$入手後の, 確率変数$X$の振る舞いを表現していることから予測密度 [5] と呼ばれ, もはやパラメータ$\boldsymbol{{$\theta$}$には依存していない. なお, データ$\boldsymbol{{$x$}$の入手が困難である場合, 事後密度の代わりに事前密度$g(\boldsymbol{{$\theta$})$を用いることも可能である. すなわち, |
− | p(x) | + | :<math> |
− | = \int_{\ | + | p(x) = \int_{\boldsymbol{\theta} \in \boldsymbol{\Theta}} |
− | p(x|\ | + | p(x|\boldsymbol{\theta}) |
− | g(\ | + | g(\boldsymbol{\theta}) |
− | {\rm d} \ | + | {\rm d} \boldsymbol{\theta} |
+ | </math> | ||
なる$p(x)$を予測分布の代わりに用いることも可能である. | なる$p(x)$を予測分布の代わりに用いることも可能である. | ||
− | なお, これまで, パラメータ$\ | + | なお, これまで, パラメータ$\boldsymbol{{$\theta$}$の事前密度が与えられていることを前提としてきた. 事前密度を機械的に決定する方法としては, 事前情報がない, あるいは漠然としすぎている場合を想定した局所一様事前分布 [3] を用いる方法と, 十分統計量の概念に基づき, 事前分布と事後分布が同じ分布族に属し, 数学的な取り扱い易さを重視した共役事前分布 [2] の考え方を適用する方法とが代表的である. また上では, 確率変数$X$が連続型である場合を対象として展開したが, 離散型である場合についても全く同様の議論が展開可能である. |
---- | ---- | ||
− | |||
'''参考文献''' | '''参考文献''' | ||
2007年7月11日 (水) 21:47時点における版
【べいずしんらいせい (Bayesian reliability) 】
システムやその構成要素の信頼性を設計, 評価するための信頼性理論では, 確率論, 確率過程論, グラフ・ネットワーク理論などが用いらる, 特に故障の時間的振る舞いは, 確率分布 (故障時間分布) を用いて表現されている. こうした信頼性理論を実際に適用する場合, システムやその構成要素それぞれの信頼性特性あるいは故障時間分布を把握しておく必要がある. このような場合, システムやその構成要素各々の故障データを収集し, 統計的に故障時間分布を同定したり, 分布パラメータを推定することとなる. また, 新たなデータ収集が困難である場合には, 過去に蓄積されたフィールド・データや経験に基づいて故障時間分布の同定や, パラメータの推定を行うこととなる.
故障データを統計的に解析する際, その方法は標本論的立場からの方法と, ベイズ統計 (Bayesian statistics) 学の立場からのそれとに大別できる. 後者のベイズ統計学の立場からデータを解析し, 各種信頼性設計や評価を行うための体系をベイズ信頼性 (Bayesian reliability) 理論と呼ぶ.
確率変数$X$が故障時間を表すものとし, $X$の確率密度関数を$p(x|\boldsymbol{{$\theta$})$と表すこととする. 但し, $\boldsymbol{{$\theta$}$は分布パラメータである. ベイズ統計学では, 分布パラメータ$\boldsymbol{{$\theta$}$の値に対する確信の度合いを主観確率を用いて表現することを目的に, $\boldsymbol{{$\theta$}$を確率変数として取り扱う.
対象とするシステムあるいは構成要素の故障時間データ$\boldsymbol{{$x$}$$=(x_1,x_2,\ldots,x_n)$を入手している場合を考える. このようなデータを入手する前の分布パラメータ$\boldsymbol{{$\theta$}$に対する事前確率密度(パラメータの値に対する事前の確信の度合い)を$g(\boldsymbol{{$\theta$})$と書くと, $\boldsymbol{{$x$}$を入手した後の$\boldsymbol{{$\theta$}$に対する事後確率密度$g(\boldsymbol{{$\theta$}|\boldsymbol{{$x$})$は, ベイズの定理 [1], [2] により
で与えられる. ここに, $\boldsymbol{{$\Theta$}$はパラメータ空間であり, $l(\boldsymbol{{$\theta$}|\boldsymbol{{$x$})$はデータ$\boldsymbol{{$x$}$を入手したときの$\boldsymbol{{$\theta$}$に関する尤度関数を表している. この尤度関数は, $x_1,x_2,\ldots,x_n$が互いに独立であるならば
で与えられる.
以上のようにして導出された事後密度は, $\boldsymbol{{$\theta$}$に対する事前の確信の度合いに, データ$\boldsymbol{{$x$}$がもつ情報を加味したときの$\boldsymbol{{$\theta$}$に対する確信の度合いを, 確率分布という形で表している[3]. このため, 分布パラメータやその関数である平均故障時間, 時刻$t$における信頼度などを次のようにして推定することができる[4].
分布パラメータ$\boldsymbol{{$\theta$}$の推定量として
のように, 事後密度の$\boldsymbol{{$\theta$}$に関する期待値を用いることができる. また, 平均故障時間や時刻$t$における信頼度のように$\boldsymbol{{$\theta$}$の関数である量$h(\boldsymbol{{$\theta$})$を推定する場合についても同様である. つまり, $h(\boldsymbol{{$\theta$})$の推定量として
を用いることができる. このようにして得られる推定量をベイズ推定量 (Bayes estimator) と呼ぶ. また, 前述したように$g(\boldsymbol{{$\theta$}|\boldsymbol{{$x$})$が確率密度関数の形で$\boldsymbol{{$\theta$}$に関する情報を有していることから, その応用はベイズ信頼性実証試験 (Bayes reliability demonstration testing) をはじめ多岐にわたっている.
ここで, 確率変数$X$の振る舞いを表す密度関数$p(x|\boldsymbol{{$\theta$})$に対してベイズ推定量の考え方を適用してみる. すなわち
のようにして導出された密度関数$p(x|\boldsymbol{{$x$})$を考える. これは, データ$\boldsymbol{{$x$}$入手後の, 確率変数$X$の振る舞いを表現していることから予測密度 [5] と呼ばれ, もはやパラメータ$\boldsymbol{{$\theta$}$には依存していない. なお, データ$\boldsymbol{{$x$}$の入手が困難である場合, 事後密度の代わりに事前密度$g(\boldsymbol{{$\theta$})$を用いることも可能である. すなわち,
なる$p(x)$を予測分布の代わりに用いることも可能である.
なお, これまで, パラメータ$\boldsymbol{{$\theta$}$の事前密度が与えられていることを前提としてきた. 事前密度を機械的に決定する方法としては, 事前情報がない, あるいは漠然としすぎている場合を想定した局所一様事前分布 [3] を用いる方法と, 十分統計量の概念に基づき, 事前分布と事後分布が同じ分布族に属し, 数学的な取り扱い易さを重視した共役事前分布 [2] の考え方を適用する方法とが代表的である. また上では, 確率変数$X$が連続型である場合を対象として展開したが, 離散型である場合についても全く同様の議論が展開可能である.
参考文献
[1] T. Bayes, "Essay Towards Solving a Problem in the Doctrine of Chances," Biometrika, 45 (1958), 293-315.
[2] D. V. Lindley, Introduction to Probability and Statistics from a Bayesian Viewpoint, Part 1, Probability and Part 2, Statistics, Cambridge University Press, 1965.
[3] G. E. P. Box and G. C. Tiao, Bayesian Inference in Statistical Analysis, Addison-Wesley, 1973.
[4] H. F. Martz and R. A. Waller, Bayesian Reliability Analysis, John Wiley and Sons, 1982.
[5] J. Aitchison and I. R. Dunsmore, Statistical Prediction Analysis, Cambridge University Press, 1975.