標籤: 暫無標籤

1英文名

英:Hypergeometric Distribution

2引出

產品抽樣檢查中經常遇到一類實際問題,假定在N件產品中有M件不合格品,即不合格率p=M/N。在產品中隨機抽n件做檢查,發現k件不合格品的概率為P(X=k)=C(M,k)*C(N-M,n-k)/C(N,n),k=0,1,2,...,min{n,M}。通常稱這個隨機變數X服從超幾何分佈。這種抽樣檢查方法等於無放回抽樣。數學上不難證明,N趨近無窮,limC(k,M)*C(n-k,N-M)/C(M,N)=B(n,p) (二項分佈) 因此,在實際應用時,只要N>=10n,可用二項分佈近似描述不合格品個數。
也就是已經知道某個事件的發生概率,判斷從中取出一個小樣本,該事件以某一個機率出現的概率問題。
例子:假設細胞中有某種現象以90%的幾率在發生著,被我們的三次實驗抓到三次的幾率是多大呢?不過可惜的是我們往往不能知道某個事件發生的先驗的概率。不過至少可以拿來做假設檢驗。

3定義

超幾何分佈是統計學上一種離散概率分佈。它描述了由有限個物件中抽出n個物件,成功抽出指定種類的物件的次數(不歸還)。
在產品質量的不放回抽檢中,若N件產品中有M件次品,抽檢n件時所得次品數X=k
則P(X=k)=C(M k)·C(N-M n-k)/C(N n), C(a b)為古典概型的組合形式,a為下限,b為上限
此時我們稱隨機變數X服從超幾何分佈(hypergeometric distribution)
1)超幾何分佈的模型是不放回抽樣
2)超幾何分佈中的參數是M,N,n
上述超幾何分佈記作X~H(n,M,N)。

4應用

例:在一個口袋中裝有30個球,其中有10個紅球,其餘為白球,這些球除顏色外完全相同.遊戲者一次從中摸出5個球.摸到4個紅球就中一等獎,那麼獲一等獎的概率是多少?
解:由題意可見此問題歸結為超幾何分佈模型。
其中N = 30. M = 10. n = 5.
P(一等獎) = P(X=4 or 5) = P(X=4) + P(X=5)
由公式P(X=k)=C(k,M)*C(n-k,N-M)/C(n,N),k=0,1,2,...得:
P(X=4) = C(4,10)*C(1,20)/C(5,30)
P(X=5) = C(5,10)*C(0,20)/C(5,30)
P(一等獎) = 106/3393
方差
對X~H(N,M,n),D(X)=nM(N-M)(N-n)/[(N^2)(N-1)]
證明:
DX=E(X^2)-(EX)^2 (此公式利用定義式簡單展開即得)
=∑{k^2*C(k,M)*C(n-k,N-M)/C(n,N),k=0..min{M,n}}-(Mn/N)^2
=1/C(n,N)*∑{M*k*C(k-1,M-1)*C(n-k,N-M),k=1..min{M,n}}-(Mn/N)^2(提取,變形)
=M/C(n,N)*∑{(k-1)*C(k-1,M-1)*C(n-k,N-M)+C(k-1,M-1)*C(n-k,N-M),k=1..min{M,n}}-(Mn/N)^2
(拆項,變形)
=M/C(n,N)*∑{(M-1)*C(k-2,M-2)*C(n-k,N-M),k=2..min{M,n}}+M/C(n,N)*∑{C(k-1,M-1)*C(n-k,N-M),k=1..min{M,n}}-(Mn/N)^2 (拆開∑,就是分組求和)
=M(M-1)*C(n-2,N-2)/C(n,N)+Mn/N-(Mn/N)^2
=nM(N-M)(N-n)/[(N^2)(N-1)] (化簡即得)
超幾何分佈期望與方差和二項分佈的聯繫
視M/N=p
則EX=np
DX=np(1-p)*(N-n)/(N-1)
可以看出,均值的公式形式上與二項分佈是一至的,而方差也只相差(N-n)/(N-1)。
這一點即有利於對這兩個公式的記憶,又從另一個角度說明了:「 因此,在實際應用時,只要N>=10n,可用二項分佈近似描述不合格品個數。」
補充一個ASP的計算程序,估計明白計算機語言的大家都能看明白:已經去掉了大數階乘溢出的問題。

5函數

function HYPGEOMDIST(kkk,n,MM,NN) '超幾何分佈計算函數
for k=kkk to n
AA=1
BBA=1
BBB=1
lll=n
for i= 0 to k-1
BBA=BBA*(MM-i)/(NN-i)
next
for j= k to n
BBB=BBB*(NN-MM-j+k)/(NN-j)
next
BBs=BBB*BBA
if lll-k>k then
x=K
Else x=lll-k
end if
for i=1 to x
lll=lll-1
next
HYPGEOMDIST=HYPGEOMDIST+BBS
next
end function
response.write HYPGEOMDIST(200,2200,1000,17000)
%>

相關評論

同義詞:暫無同義詞