電腦詞典/壓縮技術 Compression Techniques
【名稱】:壓縮技術 Compression Techniques
【解釋】: 隨著多媒體、視頻圖像、文檔映象等技術的出現,數據壓縮成了網路管理員的一個重要課題。數據壓縮基本上是擠壓數據使得它佔用更少的磁盤存儲空間和更短的傳輸時間。壓縮的依據是數字數據中包含大量的重複,它將這些重複信息用佔用空間較少的符號或代碼來代替。基本的壓縮技術有:
空格壓縮(Null Compression) 將一串空格用一個壓縮碼代替,壓縮碼後面的數值代表空格的個數。
遊長壓縮(Run-Length Compression)它是空格壓縮技術的擴充,壓縮任何4個或更多的重複字符的串。該字符串被一個壓縮碼、一個重複字符和一個代表重複字符個數的值所取代。
關鍵字編碼(Key-word encoding)創建一張由表示普通字符集的值所組成的表。頻繁出現的單詞如for、the或字符對如sh、th,被表示為一些標記(token),用來保存或傳送這些字符。
哈夫曼統計方法(Huffman statistical method)這種壓縮技術假定數據中的字符有一個變化分佈,換句話說,有些字符的出現次數比其餘的多。字符出現越頻繁,用於編碼的位數就越少。這種編碼方案保存在一張表中,在數據傳輸時,它能被傳送到接收方調制解調器使其知道如何譯碼字符。
因為壓縮算法是基於軟件的,所以實時環境中,存在著額外開銷,會引起不少問題。而檔案備份、歸檔過程中的壓縮不會有什麼問題。使用高性能的系統有助於消除大部分的額外開銷和性能問題。另外,壓縮消除了檔案的可移植性,除非解壓縮軟件也與檔案一起傳送。
注意,有些檔案已經被壓縮,進一步的外部壓縮不會有任何好處,一些圖形檔案格式,如標簽映象檔案格式(TIFF),就已經包含了壓縮。
Storage System Compression存儲系統壓縮
在討論檔案存儲的壓縮算法之前,應該明確檔案壓縮不同於磁盤編碼。磁盤編碼通常由磁盤驅動器把更多的數字1和0寫到磁盤的物理表面上。檔案壓縮把檔案中的字符和位串擠壓到更小的尺寸。它在檔案信息傳送到硬盤驅動器的寫頭之前由軟件完成。現代的使用編碼的硬盤驅動器只是從CPU接收1和o的位流,並且把它們壓擠到比沒有使用編碼小得多的空間中。磁盤編碼簡單討論到這兒,下面將著重討論檔案壓縮。
磁盤記錄系統如硬盤驅動器通過改變磁盤表面的磁場來記錄信息。兩種可能狀態間的磁場變化稱為磁通翻轉(flux transition)。簡單地說,磁通翻轉代表數字1,磁通不翻轉代表數字0。編碼提供了一種方法使每個磁通翻轉代表更多數字信息。改進調頻制MFM(Modified frequency modulation)將一個磁通翻轉表示多個1,將磁通不翻轉表示多個o。編碼技術包括下述幾種。
遊長受限碼(Run Length limited(RLU))把位組合格式表示為代碼,可以用較少的磁通翻轉來存儲。與MFM相比,存儲容量提高了5o%。
改進的遊長受限碼(Advanced run length limited(ARLL) 通過把位組合格式轉換成能用四倍密度磁通翻轉來存儲的代碼,從而把MFM的記錄密度翻了一倍。
因為磁盤編碼是由硬盤驅動器在硬件級自動處理的,這裏沒有必要進一步討論。當你購買一個硬盤驅動器,它使用一種編碼方案而獲得一定的容量,但是只要驅動器的容量滿足你的要求,購買後,就不必關心它的編碼方案了。
檔案壓縮技術
檔案壓縮的實現有幾種方式,提供的各種工具使你能每次壓縮一個檔案,或壓縮一組檔案。一組檔案能壓縮成單個檔案,更易於傳送到其它用戶,解壓縮工具把檔案解開。一個流行的共享檔案壓縮工具稱為PKZIP(威斯康辛州Glendale的PKWARE公司),用於CompuServe和其它公告牌軟件上壓縮檔案,可以從大多數公告牌服務上卸下PKZIP。
大多數操作系統,包括DOS、NetWare、Windows NT等現在都包含壓縮軟件。在NetWare 4.x中,能自動壓縮指定檔案或整卷上的或指定目錄中的所有檔案。指定檔案屬性能被設置以標記你希望系統在它們不用時自動壓縮的檔案。啟動自動壓縮系統時要小心,一些應用程式由於檔案處在壓縮狀態而不能正常工作。
檔案壓縮裏兩個重要概念是無失真(lossless)和有失真(lossy):
無失真壓縮(Lossless Compression)無失真壓縮系統假定從已壓縮檔案中返回所有信息,檔案中每一位都是重要的,所以壓縮算法精確地壓縮和解壓檔案。
有失真壓縮(Lossy Compression)有失真系統假定在壓縮和解壓過程中允許一定的信息損失。許多高清晰度的圖形檔案包含的信息如果在壓縮階段丟失了也不會引起變化。例如,如果你以高分辨率掃描彩色圖畫,但是你的顯示器不能顯示這種清晰度,你就可以使用有失真壓縮方案,因為不會遺漏細節。聲音和圖像檔案也適於用有失真壓縮,因為信息損失引起的變化很小,解壓播放時可能覺察不出來。
雖然無失真壓縮中沒有信息損失,但壓縮比通常只有2∶1,有失真壓縮根據被壓縮信息的類型提供的壓縮比從100∶1至200∶1,聲音和圖像信息能很好地壓縮,因為它通常包含大量冗餘信息。
Grraphics Video and Voice Compression圖形、視頻和聲音壓縮
隨著多媒體和電視會議的出現,高效的壓縮系統變得重要起來,根據視頻圖像分辨率,一幅典型的彩色圖形圖像需佔用2MB或更多的磁盤空間,1秒鐘未壓縮的全運動視頻圖像所需磁盤空間約10MB。網路管理員關心多媒體檔案的大小是因為將它們拷貝到服務器或其他用戶時會佔用網路帶寬。
幸運的是,大多數多媒體圖像能使用前面討論過的有失真壓縮技術。在視頻圖像壓縮中,每幀必須是通過刪除冗餘信息進行精簡的象素陣列,視頻圖像壓縮通常使用特殊的集成電路來處理,而不是使用軟件,因為軟件操作太慢。標準視頻圖像一般約為30幀/秒,但有些研究發現對許多觀眾來說16幀/秒也可接受,所以幀刪除方法提供了另一種壓縮方式。
處理多媒體信息的幾個壓縮標準描述如下:
聯合圖像專家組(JPEG)壓縮(Joint Photographic Experts Group(JPEG)compression)JPEG使用普通算法壓縮靜態圖像。三維彩色和坐標圖像信息首先被轉換成更適於壓縮的格式。顏色信息也被編碼,如果系統不能使用的話,則刪掉一部分。壓縮值是用戶可選的,取決於能容忍的圖像降級的程度。一旦這些初始設置被確定,就可使用無失真或有失真壓縮技術來壓縮檔案。JPEG不是為處理視頻圖像而專門設計的,但通過壓縮幀並減小幀的尺寸與頻率,它在一定程度上做到了這一點。
片段壓縮(Fractal Compression)在Iterated Systems公司開發的片段壓縮技術中,隨著壓縮啟動程式(一種專用板)使用一種以各種方式操作片段的數學變換來尋找圖像中的匹配模式時,圖像被分成越來越小的片段。重複的模式被保存起來以重建原始圖,不匹配的數據被認為是不重要的並被刪掉。用戶可選擇處理運行的時間量,它決定了對數據的壓縮量。
音頻-視頻交替(AVI)(Audio-Video Interleave(AVI))AVI由Microsoft開發,作為一種在CD-ROM盤上存儲活動視頻圖像的方法。讀取信息時使用軟件解壓。這種技術結合了無失真技術和一種快速但並非有效的特殊壓縮算法。AVI圖像減少了每秒的幀數,從而產生令人不滿意的圖像。然而,對某些應用來說,這種技術是可以接受的。
數字視頻交互(DVI)(Digital Video Interactive(DVI))DVI是由Intel開發的活動視頻圖像壓縮方案,被認為是事實上的標準。與AVI相似,它最初用於CDROM應用,並成功地把視頻圖像以這種格式帶到了臺式系統。
Indeo視頻圖像(Indeo Video)Indeo視頻是一種數字視頻圖像記錄格式和壓縮軟件技術,它能夠將視頻圖像檔案壓縮到未壓縮前的1/5至1/1o。例如,Indeo能將一個5oMB的檔案減小到9MB。Indeo類似的產品有Microsoft Video for Windows、OS/2操作系統和Apple Quicktime for Macintosh and Windows。播放根據提供的硬件類型而優化,所以較快系統上的幀播放率會有所提高。視頻圖像的記錄使用Intel i750視頻圖像處理器來優化,因為視頻圖像在接收時就被壓縮,而不是先存儲再壓縮。它使用了多種壓縮技術,包括有失真和無失真技術。
運動圖像專家組(MPEG)(Motion Picture Experts Group(MPEG))MPEG正在開發若干視頻壓縮標準,該標準定義國際通用格式、數據速率和壓縮技術。MPEG-1規範定義了音頻和視頻以及如何以1.5Mbps至2Mbps的速率從盤上訪問全運動視頻圖像。MPEG-2致力於提供質量超過NTSC、PAI和SECAM廣播系統的全運動視頻圖像。
其它壓縮方法正處於研究階段,現有的方法也正被重新修訂,CCITT委員會正在從事可視電話和綜合業務數字網(ISDN)上的電視會議以及其它一些服務的標準的制訂。
Compression for Datoo Communication數據通信壓縮
壓縮可以提高廣域鏈路中的吞吐量。在你需要決定鏈路是使用由調制解調器連接的較便宜的電話線還是使用較昂貴的專用連接時,若你要選擇較便宜的方案,一個擁有數據壓縮功能的調制解調器會提供額外的吞吐量。
如果需要全時(full-time)連接,數據壓縮也會幫助你充分利用這些連接。然而,也會有限制,如果傳輸速率超過了64Kbps,在廣域網的連接點上就不能自動地完成數據壓縮,因為壓縮跟不上線路的速度。解決的辦法是在發送之前使用PKZIP之類的壓縮工具把檔案手工壓縮到較小的長度,檔案壓縮後被傳送到接收方,由接收方將其解壓縮。
調制解調器製造商使用了許多前面提及的數據壓縮技術,但隨著CCITT V.42bis數據壓縮標準的採納和在大多數調制解調器中的具體實現,Lempel-Ziv技術逐漸流行起來。Motorola Codex已經實現了數據速率超過100kbps的測試,雖然目前的限度是28.8Kbps.
在Lempel-Ziv數據壓縮算法中,所有單字符串佔據了整個表。當新字符串出現時,就建立一種類似於圖C-25所示的樹型結構,該圖顯示了樹的“T”分支。注意沿著樹的任何一個分支,可演繹出一個三字符的詞。樹的每個分支由一個碼字來標識,在所有的傳輸中傳送的都是碼字。如果出現新字符串,就在樹的適當分支上增加節點,並生成一個新的碼字來代表它。
還有其它壓縮方法如Microcom聯網協議(MNP)類型5和類型7系列。但是近幾年V.42標準是大多數調制解調器廠商使用的壓縮方法。
相關條目:Modems調制解調器;Videoconferencing and Desktop Video電視會議與臺式(桌面)視頻系統。
【序號】:98