リンクメーカー| トラック| ヘルプ| ログイン

二項分布

百科事典|ウェブ|画像|動画
二項分布
確率質量関数
分布関数

色は上図と同じ
母数 n \geq 0 試行回数(整数)
0 \leq p \leq 1 成功確率(実数)
k \in \{0,\dots,n\}\!
確率質量関数 {n\choose k} p^k (1-p)^{n-k} \!
分布関数 I_{1-p}(n-\lfloor k\rfloor, 1+\lfloor k\rfloor) \!
期待値 n\,p\!
最頻値 \lfloor (n+1)\,p\rfloor\!
分散 n\,p\,(1-p)\!
歪度 \frac{1-2\,p}{\sqrt{n\,p\,(1-p)}}\!
尖度 \frac{1-6\,p\,(1-p)}{n\,p\,(1-p)}\!
モーメント母関数 (1-p + p\,e^t)^n \!
特性関数 (1-p + p\,e^{i\,t})^n \!
  

数学において、二項分布(にこうぶんぷ)は、結果が成功か失敗のいずれかである n 回の独立な試行を行ったときの成功数で表される離散確率分布である。各試行における成功確率 p は一定であり、このような試行を、ベルヌーイ試行と呼ぶ。二項分布に基づく統計的有意性の検定は、二項検定と呼ばれている。

目次

二項分布の典型例を次に示す。全住民の5%がある感染症に罹患しており、その中から無作為に500人を抽出する。ただし住民は500人よりずっと多いとする。このとき、抽出された集団の中に罹患者が30人以上いる確率はどれくらいか。抽出された集団の中に含まれる罹患者数を確率変数 X で表すとき、Xn = 500、p = 0.05 の二項分布に近似的に従う。ここで、求める確率は Pr[X ≥ 30] である。

定義

一般に、確率変数 X がパラメータ np の二項分布に従うとき、X ~ B(n, p) と記述する。ちょうど k 回の成功を得る確率は、

P[X=k]={n\choose k}p^k(1-p)^{n-k}\quad\mbox{for}\ k=0,1,2,\dots,n

ここで、

{n\choose k}=\frac{n!}{k!(n-k)!}

n 個から k 個を選ぶ組合せの数であり、二項係数と呼ばれている(C(n, k) とも表記する)。二項分布という名前は、この二項係数に由来している。この公式は、次のように解釈することができる。pkk 回成功する確率を表し、(1 − p)nknk 回失敗する確率を表している。ただし、k 回の成功は n 回の試行の中のどこかで発生したものであるから、C(n, k) 通りの発生順序がある。

もし X ~ B(n, p) ならば、X期待値

E[X] = np

であり、分散

var(X) = np(1 − p)

X最頻値は、(n+1)p 以下の最大の整数によって与えられる。ただし、m = (n+1)p において m が整数である場合、m − 1 と m の双方が最頻値となる。

X ~ B(n, p) と Y ~ B(m, p) が互いに独立であるとき、X + Y は次の二項分布に従う。

B(n+m,\ p)

n = 1 の場合を特に、ベルヌーイ分布と呼ぶ。

近似

二項分布の近似として、2種類の分布がある。

正規分布

np および n(1 − p) が5よりも大きい場合、B(n, p)に対する良好な近似として正規分布がある(適切な連続修正がなされている場合)。

N(np,np(1 − p))

正規分布による近似を用いることにより、計算の労力を大きく削減することができる。正規分布への近似は、アブラーム・ド・モアブル1733年に著書 The Doctrine of Chances の中で紹介したのが最初である。今日では、互いに独立で同一の分布に従う n 個の確率変数の和の分布は B(n, p) になることが、中心極限定理によって確認されている。警告:適切な連続修正がなされていない場合、不正確な結果になる可能性がある。

例えば、多数の住民の中から n 人を無作為に抽出し、ある質問について同意するかどうかを尋ねる場合を考える。同意する人数の割合は、もちろんサンプルに依存する。n 人を無作為に抽出する作業を何度も繰り返し行うとき、同意する人々の割合の分布は、実際の全住民の合意割合 p とほぼ等しい平均を持ち、標準偏差 σ = (p(1 − p)/n)1/2 である正規分布に近似される。未知の変数 p は、標準偏差が小さいほど正確な推定が可能である。そのため、抽出する人数 n は多い方が好ましい。

95%信頼区間ならば、正規分布で近似すると、その範囲は、

p-2\sqrt{\frac{p(1-p)}{n}} \sim p+2\sqrt{\frac{p(1-p)}{n}}

となる。たとえば、p = 50%の場合、n = 100なら40%〜60%、n = 1,000ならば47%〜53%、n = 10,000ならば49%〜51%となる。n = 10の場合、正規分布近似ではなく、本来の定義に従って計算すると、89%信頼区間で、30%〜70%となる。

ポアソン分布

n が大きく p が小さい場合、np は適度な大きさとなるため、パラメータ λ = np であるポアソン分布が B(n, p) の良好な近似となる。

関連項目

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Text is available under GNU Free Documentation License.
二項分布と関連のある記事を表示しています。
負の二項分布
負の二項分布(ふのにこうぶんぷ)とは、確率分布の一種で、二項分布の拡張。
関連7百科事典ウェブ画像動画
多項分布
多項分布(たこうぶんぷ、)は、確率論において二項分布を一般化した確率分布である。 二項分布は、n 個の独立なベルヌーイ試行の「成功」の数の確率分布であり、各試行の「成功」確率は同じである。多項分布では、各試行の結果は固定の有限個(k個)の値をとり、それぞれの値をとる確率は p1, ..., pk(すなわち、i  1, ..., k について pi ≥ 0 であり、\sum ^k p i 1 が成り立つ)であり、n 回の独立した試行が行われる。確率変数 X i は n回の試行で i という数が出る回数を示す。X(X 1,\ldots,X k) は n と p をパラメータとする多項分布に従う。
関連5百科事典ウェブ画像動画
カイ二乗検定
カイ二乗検定(カイにじょうけんてい、カイじじょうけんてい、英語:Chi-square test)、または\chi ^2分布とは、帰無仮説が正しければ検定統計量がカイ二乗分布に従うような統計学的検定法の総称である。次のようなものが含まれる。 - ピアソンのカイ二乗検定:カイ二乗検定として最もよく利用されるものである(本項で述べる)。 - 一部の尤度比検定標本サイズが大きい場合には近似的にカイ二乗検定となる場合がある。 - イェイツのカイ二乗検定(イェイツの修正) - マンテル・ヘンツェルのカイ二乗検定 - 累積カイ二乗検定 - Linear-by-linear連関カイ二乗検定 これらはいずれも :\chi^2\sum\frac, (ここで'expected' という語は期待値その...
関連4百科事典ウェブ画像動画
関連記事をすべてみる
出典: フリー百科事典『ウィキペディア(Wikipedia)』
Text is available under GNU Free Documentation License.
動画検索:二項分布
二項分布の動画検索結果を表示しています。
04:17
ビデオ講座2-2.「政策分析手法Ⅱ (二)二項分布とポワソン分布」
再生回数:9回評価:なし提供:You Tube
  
00:39
二項分布.mp4
再生回数:44回評価:なし提供:You Tube
  
00:26
二項分布と正規分布 リスーピア
再生回数:115回評価:なし提供:You Tube
  
02:50
Finance Session 5 (Real Options) 2007.7.13
再生回数:454回評価:なし提供:You Tube
  
02:11
Finance Session 5 (Real Options)
再生回数:499回評価:なし提供:You Tube
  
ようこそDIS/MASへ
ログイン | 新規登録
おすすめキーワード
関連ワード
おすすめの作品