無損壓縮鼻祖去世了,享年 86 歲。
他就是 Abraham Lempel,來自以色列的科學家。
正是因為他和同事發明的 LZ77 / LZ78 壓縮演算法,才有了 Zip、GIF、PNG、TIFF、MP3、PDF 等直到今天還在流行的檔案格式。
他生前曾就職的的以色列理工學院評價他為“學院成立 100 年來最偉大的研究員之一”,並稱很少有科學家“像他一樣在技術發展以及我們的日常生活領域中都產生了如此大的影響”。
無數網友為他的離世哀悼。有人還表示:我的研究生論文主題是 HTML 壓縮,裡面都還寫有他的名字呢。
共同發明 LZ77 / LZ78,徹底改寫資料壓縮領域
Lempel 教授於 1936 年出生於波蘭。
23 歲的時候他進入以色列理工學院,經過八年的學習,拿到博士學位。
就在畢業十年之際,41 歲的他成為母校的全職教授,負責電氣工程和電腦科學專業的教學(隨後又擔任了三年電腦學院院長)。
這一年,正是他和同事 Jacob Ziv 發明 LZ77 演算法的那一年,也就是 1977 年(下圖左為 Ziv,右為 Lempel)。
正如其名,“LZ77”中的“L”代表 Lempel 教授,“Z”代表他的同事 Ziv 教授,“77”則是發明年份。
如果你是電腦專業的學生,LZ77 演算法一定出現過你的課本之上。
它的特點包括簡單、易於實現,可以針對任何資料格式進行無失真壓縮,完全區別於此前已經誕生的各種失真壓縮演算法。
它主要採用的是基於字典的方式進行壓縮。
簡單來說,就是把資料中可以組成“短語”的一串字元加入“字典”,然後再有匹配的字元出現就採用標記來代替,由此就能實現壓縮的目的。
在具體操作中,該演算法會將資料分為“滑動窗口”和“資料緩衝區”。
每次處理資料的時候,先把一部分資料預載入緩衝區,然後依次載入滑動窗口區(有長度限制)。
如果後進入的字元在滑動窗口里面出現匹配的時候,就記進當前的短語字典中。
隨著滑動窗口的不斷向前,字典會不斷變化,不停地滑動字元向前,尋找到更多與字典中的短語匹配的選項,然後用帶有含義的標記符進行標記,最終就可以得到一段壓縮好的表示結果。
例子如下圖所示,粉色為滑動窗口區,藍色為緩衝區。
從上面的原理我們可以看出,LZ77 的壓縮比比較高,但由於要不停地找匹配選項,壓縮過程有一些耗時,但又由於解壓速度又非常快(標記會說明匹配項的明確位置),總體還是算得上非常高效的。
兩位教授就以論文的形式將他們這一成果公佈了出來。
很快,在 1978 年,他們又對 77 演算法進行了更新,誕生了同樣著名的 LZ78,也就是 LZ77 的第二個版本。
不管後來大家如何“修修補補”,衍生出更加高效和完善的 LZSS、LZW、LZH 等新演算法,它們的原理都和 Lempel 教授和 Ziv 教授提出的技術沒有什麼差別。
因此,在這些演算法上誕生的 TIFF、PNG、ZIP、MP3 等廣為流傳的壓縮檔案格式,都得感謝這兩位老爺子的貢獻。
這不,2004 年,IEEE 就宣佈 LZ77 和 LZ78 演算法成為電氣和電子工程的“歷史里程碑”。
Lempel 教授也因為所作貢獻,拿了不少獎項,包括 IEEE 資訊理論學會技術創新金禧獎和 2007 年的 IEEE Richard W. Hamming 獎章,後者主要表彰他在“資料壓縮方面的開創性工作”。
57 歲被惠普聘用,貢獻了 8 項專利
在改寫資料壓縮領域之後,Lempel 教授並沒有“閒著”。
1993 年,已經 57 歲的他被惠普公司聘用。
僅過了一年,他就出來創立了惠普以色列實驗室(HP Labs Israel),並擔任其董事長直到 71 歲。在此期間,惠普以 Lempel 教授的名義註冊了 8 項專利。
如今,Lempel 教授已於上週日(2 月 5 日)辭世,離 87 歲生日就還差一週時間。
訃告地址:https://www.technion.ac.il/en/2023/02/technion-mourns-prof-abraham-lempel/
參考連結:
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!