標籤:可用性測試

可用性測試是指,讓一群有代表性的用戶嘗試對產品進行典型操作,同時觀察員和開發人員在一旁觀察,聆聽,做記錄。該產品可能是一個網站,軟體,或者其他任何產品,它可能尚未成型。測試可以是早期的紙上原型測試,也可以是後期成品的測試。

1起源

可用性最早來源於人因工程(human factors)。人因工程又稱工效學(ergonomics),起源於二戰時期,設計人員研發新式武器時研究如何使用機器、人的能力限度和特性,從而誕生了工效學,這是一門涉及多個領域的學科,包括心理學、人體測量學、環境醫學、工程學、統計學、工業設計、計算機等。

2歷史發展

第一次有記錄的可用性測試出現在1981年。當時施樂公司下屬的帕羅奧多研究中心的一個員工記錄了該公司在Xerox Star工作站(Xerox 8010 Information System)的開發過程中引入了可用性測試的經過。不過由於一共只有大約25,000套左右的銷售成績,Xerox Star系統被認為是一個典型的商業失敗案例。
1984年,美國財務軟體公司Intuit Inc.在其個人財務管理軟體Quicken的開發過程中引入了可用性測試的環節。Suzanne E. Taylor在其2003年的業界暢銷書《Inside Intuit》中提到「在第一次可用性測試實例中,該做法後來已成為行業慣例,LeFevre從街上召集了一些人來同時試用Quicken進行測試,每次測試之後程序設計師都能夠對軟體加以改進。」Intuit Inc.公司的創立者之一的Scott Cook也曾經表示「我們在1984年做了可用性測試,比其他的人早了5年的時間。進行可用性測試和在已售人群中進行可用性測試是不大一樣的,而且例行公事的去進行和把它作為核心設計流程中的一環也是很不一樣的」。
經過二十多年的發展和應用,可用性測試已經成為產品(服務)設計開發和改進維護各個階段必不可少的重要環節。它的價值在於初期及早的發現產品(服務)中可能會存在的問題,在開發或投產之前提供改進方案,從而節約設計開發成本。而在產品(服務)的銷售疲軟或是使用過程中出現問題卻無法及時精確的找到問題關鍵時,可用性測試可以在很大程度上的提高解決問題的效率。通過可用性測試不但可以獲知用戶對產品(服務)的認可程度,還可以獲知一些隱含的用戶行為規律。

3國際標準ISO

ISO/IEC 9126-1將可用性定義為「在特定使用情景下,軟體產品能夠被用戶理解、學習、使用、能夠吸引用戶的能力」 【ISO/IEC 9126-1. Software engineering – Product quality – Part 1: Quality model[S]. International Standards Organization,2001.】。 ISO/IEC 9126-1闡述了在產品開發過程中軟體質量的六個方面(見下圖),依次為功能性(functionality)、可靠性(reliability)、可用性(usability)、有效性(efficiency)、維護性(maintainability)、移植性(portability)。ISO/IEC 9126-1將「使用質量(Quality in use)」作為廣義的目標:滿足目標用戶和支持用戶的使用質量,功能性、可靠性、有效性和可用性決定著目標用戶在特定情景中的使用質量,支持用戶則關心維護性和移植性方面的質量。目前ISO/IEC 9126-1有兩個作用,首先是作為具體軟體設計活動的一部分(可用性定義),其次是提供軟體滿足用戶需求的最終目標。
國際標準ISO 9241-11將可用性定義為「特定的用戶在特定的使用情景下,有效、有效率、滿意的使用產品達到特定的目標」【ISO9241-11. Ergonomic requirements for office work with visual display terminals (VDT's) – Part 11: Guidance on usability[S]. International Standards Organization,1998.】。ISO 9241-11將可用性概括為三方面:有效性(effectiveness),用戶使用系統完成各種任務所達到的精度(accuracy)和完整性(completeness);效率(efficiency),用戶按照精度和完整度完成任務所耗費的資源,資源包括智力、體力、時間、材料或經濟資源;滿意度(satisfaction),用戶使用該系統的主觀反應,描述了使用產品的舒適度和認可程度。
Nielsen(1994)認為實用性(utility)和可用性(usability)構成了系統能否用來達到特定目標的因素,稱為有用性(usefulness)【Nielsen J.可用性工程[M].劉正捷等譯.北京:機械工業出版社,2004:16-24.】。可用性定義為「用戶能否很好地使用系統的功能」,分為五個因素:可學習性(learnability),用戶可以在短時間內使用系統完成相關任務;效率(efficiency),用戶學會使用系統后,能夠高效率地使用系統;可記憶性(memorability),用戶在一段時間沒有使用系統后,仍然能夠使用系統;出錯(errors),用戶使用系統時能夠少出錯,系統必須防止災難性錯誤發生;滿意度(satisfaction),用戶使用系統主觀上感到滿意。
Shackel(1991)將可用性定義為「按照人的功能特性,系統很容易、有效地被特定用戶群使用,經過特定培訓和用戶支持,在特定的環境情景中,完成特定範圍的任務」,並將可用性分為四個因素:有效性(effectiveness)、可學性(learnability)、靈活性(flexibility)、態度(attitude)。

4測試的方法

所謂可用性評估,即是對軟體「可用性」進行評估,檢驗其是否達到可用性標準。目前的可用性評估方法超過20種,按照參與可用性評估的人員劃分,可以分為專家評估和用戶評估;按照評估所處於的軟體開發階段,可以將可用性評估劃分為形成性評估和總結性評估。形成性評估是指在軟體開發或改進過程中,請用戶對產品或原型進行測試,通過測試后收集的數據來改進產品或設計直至達到所要求的可用性目標。形成性評估的目標是發現儘可能多的可用性問題,通過修復可用性問題實現軟體可用性的提高,總結性評估的目的是橫向評估多個版本或者多個產品,輸出評估數據進行對比。網站可用性測試包含的步驟有:定義明確的目標和目的,安裝測試環境,選擇合適的受眾,進行測試和報告結果。

5評估方法

啟髮式評估
(Heuristic Evaluation)由Nielsen和Molich(1990)提出,由多位評價人(通常4至6人)根據可用性原則反覆瀏覽系統各個界面,獨立評估系統,允許各位評價人在獨立完成評估之後討論各自的發現,共同找出可用性問題。該方法的優點在於專家決斷比較快、使用資源少,能夠提供綜合評價,評價機動性好,但是也存在不足之處:一是會受到專家的主觀影響,二是沒有規定任務,會造成專家評估的不一致,三是評價後期階段由於評價人的原因造成信度降低,四是專家評估與用戶的期待存在差距,所發現的問題僅能代表專家的意思。
可用性測試的地點
使用下述任何一種設置,你都可以進行有效的可用性測試:
* 兩室或三室的固定實驗室,配備視聽設備
* 會議室,用戶的家或工作室,配備攜帶型錄音設備
* 會議室,用戶的家或工作室,沒有錄音設備也可以用人眼觀察和筆記來代替
* 當用戶在不同地點可以遠程控制
因此,即使你沒有或沒法找到一個固定的實驗室,你也應該進行可用性測試。不要說,「因為我們沒有一個可用性實驗室,所以我們沒法做可用性測試。" 只要去做!在任何空間你都可以完成。
可用性測試的預算
應該考慮這些因素:
* 計劃所用的時間:確定測試的主要問題,需要測試的用戶類型,招聘的用戶的篩選問卷以及測試場景。
* 招聘的花費:公司人員的時間,給招聘公司(通常是一個很好的選擇)的花費,可用性專家需要花時間熟悉網站及其製作團隊,設計相應的測試場景,如果你需要錄製測試過程,還需要花費實驗室或攜帶型攝錄設備的租金。
* 團隊觀察用戶(進行測試)花費的時間
* 付給測試參與者的報酬或禮物
* 分析視聽資料,查找存在的問題以及推薦解決辦法所用的時間
* 和開發人員討論變動和修改方案,撰寫調查結果和建議報告所用的時間。
記住,預算分析要包含多個可用性測試。打造一個網站(或產品)的可用性是一個反覆迭代的過程。你會發現,用在在開發過程中幾個小測試的預算比起在項目末期只做一個大型測試要有價值的多。網站可用性測試是為了實現跨形式的視覺一致性,包括測試屏幕解析度改變時的顯示,邊距和列布局,表單的顏色和大小,標籤使用的字體,按鈕的大小,所使用的熱踺或快捷鍵,使用的動畫/圖形,按鈕等控制項的標籤,同一欄位的文本框的長度,日期和時間欄位的格式。
上一篇[柯西積分定理]    下一篇 [材料科學]

相關評論

同義詞:暫無同義詞