標籤: 暫無標籤

統計數據的一種。指反映事物類別的數據。如人按性別分為男、女兩類。 分類數據(categorical data)是離散數據(discrete data)。分類屬性具有有限個(但可能很多)不同值,值之間無序。例子包括地理位置、工作類別和商品類型。有很多方法產生分類數據的概念分層。

1詳解

由用戶或專家在模式級顯式地說明屬性的偏序:通常,分類屬性或維的概念分層涉及一組屬性。用戶或專家在模式級通過說明屬性的偏序或全序,可以很容易地定義概念分層。例如,關係資料庫或數據倉庫的維location可能包含如下屬性組:street, city, province_or_state 和country。可以在模式級說明這些屬性的全序,如street < city < province_or_state < country, 來定義分層結構。
通過顯式數據分組說明分層結構的一部分:這基本上是人工地定義概念分層結構的一部分。在大型資料庫中,通過顯式的值枚舉定義整個概念分層是不現實的。然而,對於一小部分中間層數據,我們可以很容易地顯式說明分組。例如,在模式級說明了province和country形成一個分層后,用戶可能人工地添加某些中間層。如「{Albert, Sakatchewan, Manitoba}. prairies_Canada」和「{British Columbia, prairies_Canada} . Western_Canada」。

2屬性集

含義分層
定屬性集中每個屬性不同值的個數自動地產生概念分層。具有最多不同值的屬性放在分層結構的最低層。一個屬性的不同值個數越少,它在所產生的概念分層結構中所處的層次越高。在許多情況下,這種啟髮式規則都很頂用。在考察了所產生的分層之後,如果必要,局部層次交換或調整可以由用戶或專家來做。
例二
例2-8 使用預先定義的語義關係產生概念分層。假定數據挖掘專家(作為管理者)已將五個屬性number, street, city, province_or_state和country捆綁在一起,因為它們關於location概念語義密切相關。如果用戶在定義location的分層結構時只說明了屬性city,系統可以自動地拖進以上五個語義相關的屬性,形成一個分層結構。用戶可以選擇去掉分層結構中的任何屬性,如number和street,讓city作為該分層結構的最低概念層。
上一篇[流程式控制制]    下一篇 [黑盒子]

相關評論

同義詞:暫無同義詞