標籤: 暫無標籤

知識工程這個術語最早由美國人工智慧專家E.A.費根鮑姆提出。由於在建立專家系統時所要處理的主要是專家的或書本上的知識,正像在數據處理中數據是處理對象一樣,所以它又稱知識處理學。其研究內容主要包括知識的獲取、知識的表示以及知識的運用和處理等三大方面。

1 知識工程 -概念

知識工程這個術語最早由美國人工智慧專家E.A.費根鮑姆提出。由於在建立專家系統時所要處理的主要是專家的或書本上的知識,正像在數據處理中數據是處理對象一樣,所以它又稱知識處理學。其研究內容主要包括知識的獲取、知識的表示以及知識的運用和處理等三大方面。

2 知識工程 -特點

①為了解決特定領域的一個具體問題,除了需要一些公共的知識,例如哲學思想、思維方法和一般的數學知識等之外,更需要應用大量與所解問題領域密切相關的知識,即所謂領域知識。②採用啟髮式的解題方法或稱試探性的解題方法。為了解一個問題,特別是一些問題本身就很難用嚴格的數學方法描述的問題,往往不可能藉助一種預先設計好的固定程式或演算法來解決它們,而必須採用一種不確定的試探性解題方法。③解題中除了運用演繹方法外,必須求助於歸納的方法和抽象的方法。因為只有運用歸納和抽象才能創立新概念,推出新知識,並使知識逐步深化。④必須處理問題的模糊性、不確定性和不完全性。因為現實世界就是充滿模糊性、不確定性和不完全性的,所以決定解決這些問題的方式和方法也必須是模糊的和不確定的,並應能處理不完全的知識。總之,人們在解題的過程中,首先運用已有的知識開始進行啟髮式的解題,並在解題中不斷修正舊知識,獲取新知識,從而豐富和深化已有的知識,然後再在一個更高的層次上運用這些知識求解問題,如此循環往複,螺旋式上升,直到把問題解決為止。由上面的分析可見,在這種解題的過程中,人們所運用和操作的對象主要是各種知識(當然也包括各種有關的數據),因此也就是一個知識處理的過程。

3 知識工程 -相關最基本的概念

數據 定義為客觀事物的屬性、數量、位置及其相互關係等的抽象表示。而且要特彆強調這些屬性、數量、位置及其相互關係等都可能是模糊的。如「20歲左右」、「大約20」、「很年輕」、「不太高」、「點A與點B靠得很近」等等詞語中雖包含著數量,但這些數量是模糊的。此外,因為任何一張圖(精確的或模糊的)都在某種意義上可認為是表示一些對象之間的某種關係,所以在知識處理中也可以把它認為是一種數據。由此可見在知識處理中數據的範圍是很廣的。但是,不管什麼樣的數據,它只表示一種數量及關係概念,具體涵義是沒有的。
信息 定義為「數據所表示的涵義(或稱數據的語義)」。因此也可以說信息是對數據的解釋,是載入在數據之上的涵義。所以反過來可稱「數據是信息的載體」。如「5」在一種具體場合可以解釋為「5個蘋果」,而在另一種特定場合又可以解釋成「5種思想」、「5個X」等。對模糊的數據也一樣,例如「20左右」這個模糊數,既可能代表年齡「20歲左右」,也可代表日期「20日前後」等。可見信息是帶具體涵義的數據。
知識 以各種方式把一個或多個信息關聯在一起的信息結構。如果把「不與任何其他信息關聯」也認為是一種特殊的關聯方式(不關聯),則單個的信息也可以認為是知識的特例,我們稱之為「原子事實」。例如「天很陰且閃電頻繁」,「天要下雨」等都是一些孤立的信息或「原子事實」。然而,如果把這兩個信息用「如果,則」這種因果關係聯繫起來就成了一條知識:如果「天很陰且閃電頻繁」則「天要下雨」(多半如此)。以上陳述中的「頻繁」、「多半如此」等都表示一些模糊概念。
 智力 指運用知識解決問題的能力。知識可以存儲在書本里,或計算機的磁碟和磁帶中等,它是一種靜止的死東西。它本身並不會再生知識。然而智力卻是一種動態概念。「智力」與「知識」有著密切的關係,但「知識」與「運用知識的能力」是兩個不同的概念。
智能 指知識的集合與智力的綜合(或總和),是靜態的知識和動態的智力綜合所體現的一種能力。
知識庫和知識處理器 知識庫是指經過分類組織存放在計算機中的「知識的一個集合」。知識處理器(俗稱推理機)是指智力在計算機上的一種具體實現機制。一般專家系統中都具有一個存放知識的知識庫和一個運用知識的推理機,因此按這種定義就可認為專家系統是一個具有某種智能的系統。
   

4 知識工程 -知識的屬性

人類大腦中存在的知識是人類在其漫長的生活和實踐中認識(客觀)世界和改造(客觀)世界的產物。勞動創造了世界,也創造了知識。因此我們在知識處理中討論的知識應該是現實中的知識,而不是抽象的定義。所以知識應具有以下具體的屬性:真理性、相對性、不完全性、模糊性與不精確性、可表示性、可存儲性(可記憶性)。所謂知識的模糊性與不精確性是指知識的真理性往往不總是非真即假,而可能處於某種中間狀態,即所謂有真與假之間的某個「真度」。例如在「人老了就可能糊塗」中,「老了」和「可能」都是模糊概念,至於「糊塗」本身當然更是一個模糊和不精確的描述。
   

5 知識工程 -知識的分類

按知識的涵義大體上可分為事實 、規則(或法則)、規律(或定律)、方法和理論等。方法又可分成推理、聯想與類比、綜合與分析、預測與外延、假設與驗證、直覺與靈感,以及解題方法或演算法等。而後者並不是知識工程所要研究的對象。
在知識處理中,更複雜的一類知識被稱為理論。理論是一種知識的體系,是由上述各種知識構成的更高一層的知識。理論也稱知識空間,形式上,它由一組概念,若干條公理(事實),若干條推理規則(法則)和一組解題方法和環境約束組成。因此,一個理論T,不妨用一個五元組來表示:T={C,A,R,M,E}。其中C,A,R,M和E分別表示一個概念的集合,一個公理的集合,一組推理規則,一組解題方法和一組環境約束。一般說,一個具體的理論總是面向一個特定領域的,因此,其中5個元素,特別是概念與解題方法,都應該反映該領域的特徵。
按知識的應用範圍,又可分為通用知識與專門知識(或領域知識)兩種範疇。通用知識指一般人們共有的知識,適用於所有領域。例如三段論演繹就屬於通用知識範疇,更高一層的哲學知識也屬於這一個範疇。專門知識指面向一個專門領域的知識,因而也稱領域知識。它又可分成兩大門類:即自然科學與社會科學(或人文科學)。哲學是自然科學與社會科學的更高一層的抽象。各種專門知識都不是知識工程所要研究的對象。
   

6 知識工程 -知識工程三要素

人工智慧與計算機技術的結合產生了所謂「知識處理」的新課題。即要用計算機來模擬人腦的部分功能,或解決各種問題,或回答各種詢問,或從已有的知識推出新知識等等。為了進行知識處理,當然首先必須獲取知識,並能把知識表示在計算機中,能運用它們來解題。因此,知識的獲取、知識的表示和知識的運用也就成了知識工程的三大要素或主要研究內容。
知識的獲取 在建立一個具體的專家系統時,人們往往要花很多人力和財力在知識獲取上,它被公認為是知識處理的一個「瓶頸」。知識獲取要研究的主要問題包括:對專家或書本知識的理解、認識、選擇、抽取、彙集、分類和組織的方法;從已有的知識和實例中產生新知識,包括從外界學習新知識的機理和方法;檢查或保持已獲取知識集合的一致性(或無矛盾性)和完全性約束的方法;盡量保證已獲取的知識集合無冗餘的方法。知識獲取分主動式或被動式兩大類。主動式知識獲取是知識處理系統根據領域專家給出的數據與資料利用諸如歸納程序之類軟體工具直接自動獲取或產生知識,並裝入知識庫中。所以也稱知識的直接獲取。而被動式知識獲取往往是間接通過一個中介人(知識工程師或用戶)並採用知識編輯器之類的工具,把知識傳授給知識處理系統,所以亦稱知識的間接獲取。按知識處理系統獲取知識的工作方式,可以分成互動式和自主式(或非互動式)兩種。互動式知識獲取在獲取過程中要不斷與人進行交互,或提供解釋,或要求輸入信息,或提問求答,或請求驗證等等。互動式的知識獲取,對用戶或知識工程師有較大的透明度和控制能力,比較適合於從專家大腦中獲取知識。自主式知識獲取則在獲取過程中完全由知識處理系統自主完成,例如輸入的是一段講話,一本書或資料,輸出的便是從中抽取出來的知識。這裡即便不考慮諸如語聲識別,文字識別,自然語言理解和認知科學等方面的許多難題,解決起來仍是十分困難的。按知識獲取的策略或機理,可分為:死記硬背式(或稱機械照搬式)獲取;條件反射式知識獲取;教學式(或傳授式)知識獲取;演繹式知識獲取;歸納式知識獲取;解釋式知識獲取;猜想證實式知識獲取;反饋修正式知識獲取;類比和聯想式知識獲取;外延式知識獲取等。
知識的表示 要以某種形式邏輯地表示出來,並最終編碼到計算機中去,這就是所謂的知識的表示問題。不同的知識需要用不同的形式和方法來表示。它既應能表示事物間結構關係的靜態知識,又應能表示如何對事物進行各種處理的動態知識;它既要能表示各種各樣的客觀存在著事實,又要能表示各種客觀規律和處理規則;它既要能表示各種精確的、確定的和完全的知識,還應能表示更加複雜的、模糊的、不確定的和不完全的知識。因此一個問題能否有合適的知識表示方法往往成為知識處理(解題)成敗的關鍵。而且知識表示的好壞對知識處理的效率和應用範圍影響很大,對知識獲取和學習機制的研究也有直接的影響。知識表示的方法很多,例如,謂詞邏輯表示,關係表示(或稱特性表表示),框架表示,產生式表示,規則表示,語義網表示,與或圖表示,過程表示,Petri網表示,H網表示,面向對象表示,以及包含以上多種方法的混合或集成表示等。這些表示方法各適用於表示各種不同的知識,從而被用於各種應用領域。對於「知識面」很窄的專家系統一類的應用,往往可以根據領域知識的特點,從中選擇一種或若干種表示方法就可以解決問題。但是為了開發具有較寬領域知識的系統,例如多專家系統的聚合系統(或稱協同式專家系統)和分散式多功能知識處理系統等,僅用互不相干的知識表示方法便難以適應要求。
知識的運用和處理 為了讓已有的知識產生各種效益(包括社會、經濟、政治、軍事和科學等方面的效益),使它對外部世界產生影響和作用,必須研究如何運用知識的問題。運用知識來設計機器、建造水壩、推斷未來、探索未知、管理社會,乃至運用知識來作曲、繪畫或寫文章等都是用知識來解決問題和改造世界的活動。顯然,知識處理學不能研究這些具體運用知識的過程或方法,而是要研究在上述各種具體的知識運用中都可能用到的一些方法(或模式)。它們主要包括推理、搜索、知識的管理及維護、匹配和識別。推理指各種推理的方法與模式的研究。研究前提與結論之間的各種邏輯關係及真度或置信度的傳遞規則等。搜索指各種搜索方式與方法的研究。研究如何從一個浩翰的對象(包括知識本身)空間中搜索(或探索)滿足給定條件或要求的特定對象。知識的管理及維護包括對知識庫的各種操作(如檢索、增加、修改或刪除),以保證知識庫中知識的一致性和完整性約束等的方法和技術。匹配和識別指在資料庫或其他對象集合中,找出一個或多個與給定「模板」匹配的數據或對象的各種原理和方法,以及在僅有不完全的信息或知識的環境下,識別各種對象的原理與方法。
上一篇[計算機輔助設計]    下一篇 [Jimi Hendrix]

相關評論

同義詞:暫無同義詞