標籤: 暫無標籤

1建立假設

統計檢驗是將抽樣結果和抽樣分佈相對照而作出判斷的工作。取得抽樣結果,依據描述性統計的方法就足夠了。抽樣分佈則不然,它無法從資料中得到,非利用概率論不可。而不對待概括的總體和使用的抽樣程序做某種必要的假設,這項工作將無法進行。

2求抽樣分佈

在做了必要的假設之後,我們就能用數學推理過程來求抽樣分佈了。由於數學上已經取得的成果,實際上統計工作者要做的這項工作往往並不是真的去求抽樣分佈的數學形式,而是根據具體需要,確定特定問題的統計檢驗應該採用哪種分佈的數學用表。

3選擇顯著性水平和否定域

有了與問題相關的抽樣分佈,我們便可以把所有可能的結果分成兩類:一類是不大可能的結果;另一類人們預料這些結果很可能發生。既然如此,如果我們在一次實際抽樣中得到的結果恰好屬於第一類,我們就有理由對概率分佈的前提假設產生懷疑。在統計檢驗中,這些不大可能的結果稱為否定域。如果這類結果真的發生了,我們將否定假設;反之就不否定假設。概率分佈的具體形式是由假設決定的,假設肯定不止一個。在統計檢驗中,通常把被檢驗的那個假設稱為零假設(或稱原假設,用符號H0表示),並用它和其他備擇假設(用符號H1表示)相對比。值得注意的是,假設只能被檢驗,從來不能加以證明。統計檢驗可以幫助我們否定一個假設,卻不能幫助我們肯定一個假設。為了使檢驗更嚴格、更科學,還需要更多的東西。首先,我們必須確定冒犯第一類和第二類錯誤的風險的程度;其次,要確定否定域是否要包含抽樣分佈的兩端。第一類錯誤是,零假設H0實際上是正確的,卻被否定了。第二類錯誤則是,H0實際上是錯的,卻沒有被否定。第二類錯誤是,零假設H0實際上是錯誤的,卻沒有被否定。遺憾的是,不管我們如何選擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小。對任何一個給定的檢驗而言,第一類錯誤的危險越小,第二類錯誤的概率就越大;反之亦然。一般來講,不可能具體估計出第二類錯誤的概率值。第一類錯誤則不然,犯第一類錯誤的概率是否定域內各種結果的概率之和。由於犯第一類錯誤的危險和犯第二類錯誤的危險呈相背趨向,所以統計檢驗時,我們必須事先在冒多大第一類錯誤的風險和多大第二類錯誤的風險之間作出權衡。被我們事先選定的可以犯第一類錯誤的概率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。如果抽樣分佈是連續的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來(後面的正態檢驗就如此)。如果抽樣分佈是非連續的,就要用累計概率的方法找出一組構成否定域的結果。即在已知概率分佈表上,從兩端可能性最小的概率開始向中心累計,直至概率之和略小於選定的顯著性水平為止。在許多場合,我們能預測偏差的方向,或只對一個方向的偏差感興趣。每當方向能被預測的時候,在同樣顯著性水平的條件下,單側檢驗比雙側檢驗更合適。因為否定域被集中到抽樣分佈更合適的一側,可以得到一個比較大的尾端。這樣做,可以在犯第一類錯誤的危險不變的情況下,減少了犯第二類錯誤的危險。

4計算檢驗統計量

完成了上述工作之後,接下來就是做一次與理想試驗盡量相同的實際抽樣(比如實際做一次重複拋擲硬幣的試驗),並從獲取的樣本資料算出檢驗統計量。檢驗統計量是關於樣本的一個綜合指標,但與第九章參數估計中將要討論的統計量有所不同,它不用作估測,而只用作檢驗。

5判定

假設檢驗系指拒絕或保留零假設的判斷,又稱顯著性檢定。在選擇否定域並計算檢驗統計量之後,完成最後一道手續,即根據試驗或樣本結果決定假設的取與舍。如果結果落在否定域內,將在已知犯第一類錯誤概率的條件下,否定零假設。反之,如果結果落在否定域外,則不否定零假設,與此同時,就有了犯第二類錯誤的危險。
上一篇[clueso]    下一篇 [CLICK-B]

相關評論

同義詞:暫無同義詞