1簡介

文本文件是一種由若干行字元構成的計算機文件。文本文件存在於計算機文件系統中。通常,通過在文本文件最後一行後放置文件結束標誌來指明文件的結束。
文本文件是指一種容器,而純文本是指一種內容。文本文件可以包含純文本。
一般來說,計算機文件可以分為兩類:文本文件和二進位文件。

2數據存儲

由於結構簡單,文本文件被廣泛用於記錄信息。它能夠避免其它文件格式遇到的一些問題。此外,當文本文件中的部分信息出現錯誤時,往往能夠比較容易的從錯誤中恢復出來,並繼續處理其餘的內容。文本文件的一個缺點是,它的熵往往較低,也就是說,可以用較小的存儲空間記錄這些信息。

3格式

MIME
文本文件在MIME標準中的類型為「text/plain」,此外,它通常還附加編碼的信息。在Mac OS X出現前,當Resource fork指定某一個文件的類型為「TEXT」時,Mac OS就認為這個文件是文本文件。在Windows中,當一個文件的擴展名為「txt」時,系統就認為它是一個文本文件。此外,處於特殊的目的,有些文本文件使用其它的擴展名。例如,計算機的源代碼也是文本文件,它們的後綴是用來指明它的程序語言的。
Windows的.txt文件
微軟的MS-DOS和Windows採用了相同的文本文件格式,它們都使用CR和LF兩個字元作為換行符,這兩個字元對應的ASCII碼分別為13和10。通常,最後一行文本並不以換行符(CR-LF標誌)結尾,包括記事本在內的很多文本編輯器也不在文件的最後添加換行符。
大多數Windows文本文件使用ANSI、OEM或者Unicode編碼。Windows所指的ANSI編碼通常是1位元組的ISO-8859編碼,不過對於像中文、日文、朝鮮文這樣的環境,需要使用2位元組字符集。在過渡至Unicode前,Windows一直用ANSI作為系統默認的編碼。而OEM編碼,也是通常所說的MS-DOS代碼頁,是IBM為早期IBM個人電腦的文本模式顯示系統定義的。在全屏的MS-DOS程序中同時使用了圖形的和按行繪製的字元。新版本的Windows可以使用UTF-16LE和UTF-8之類的Unicode編碼。

4展現

用文本編輯器打開一個文本文件后,用戶可以看到可讀的純文本內容。控制字元有時被編輯器當做文字指令,有時被當做像純文本那樣可編輯的轉義字元。儘管文本文件裡面有純文本信息,但是通過特殊方法,文件內的控制字元(尤其是文件結束字元)可以讓純文本不可見。

相關評論

同義詞:暫無同義詞