ADVERTISEMENT
沒有他的發明,我們連嘲笑微軟IE 瀏覽器的機會都沒有;沒有他的發明,Google、Amazon、臉書都不會存在;沒有他的發明,你蘋果手機上的Siri 可能比現在還要蠢。
是提姆·柏內茲-李(Tim Berners-Lee),一位英國電腦科學家,他的發明叫全球資訊網(World Wid Web)。
柏內茲-李不是一個「賈伯斯」般如雷貫耳的名字,但關於他最有噱頭的段子又極具10 萬+ 標題的潛力:
ADVERTISEMENT
「網際網路之父」本可碾壓比爾·蓋茲成為世界首富,但他竟沒有為發明申請專利!
假如申請發明專利,世界首富不是蓋茲而是他!如果他願意,二十年前就能成為世界首富!
事實上,沒有人是真正的「網際網路之父」,因為網際網路並不是一個單獨的發明,說柏內茲-李是「全球資訊網之父」比較準確。柏內茲-李沒有申請專利,不是因為他沒有意識到這個發明的價值,而是出於推廣全球資訊網的考慮。
很多人分不清網際網路(Internet)和全球資訊網(World Wid Web)的區別,簡單理解網際網路就是一個全球性的網路,而全球資訊網是我們使用網際網路最常用的入口。做一個不太恰當但容易理解的比喻吧:
ADVERTISEMENT
如果把網際網路當成圍城裡的寶石,想要擁有它必須從城牆門口進入。你有很多個門可以選擇:HTTP之門、FTP之門、SMTP之門......你不用弄懂這些神符一樣的英文代表了什麼,只需要知道代表了全球資訊網的「HTTP之門」,是門檻最低的那道門,而這道門的鑰匙就是瀏覽器。
在全球資訊網沒有被發明前,網際網路已經存在了很多年,但上網並不是一件輕鬆愉快的事。那時人們透過撥打伺服器號碼上網,入口不是瀏覽器,沒有網頁、沒有圖片、更沒有影片,只有像下面這樣的一行行文字訊息。
ADVERTISEMENT
毫無疑問,全球資訊網是柏內茲-李最重要的發明,但他這一輩子做的事情還有很多,比如成立全球資訊網聯盟、提出語意網、呼籲資料公開、成立社群鍵連資料平台,但都緊緊圍繞同一個主題:打破「訊息、資料之牆」,促進開放互聯。
誕生WWW的福地,是一個看似和電腦沒什麼關係的地方
柏內茲-李從小是一個電腦迷。他父母都曾經參與了世界上第一台商業電腦「曼徹斯特·馬克一號」(Manchester Mark I)的設計研發,這讓他從小就對電腦知識耳濡目染。
ADVERTISEMENT
1973 年-1976 年,他在牛津大學女王學院學習物理專業。大學期間,由於違反規定被禁止使用學校的電腦,他自己動手用一台電視、一個摩托羅拉舊的微處理器(Motorola 6800)、一根焊接棒,拼出了一台電腦。
1976年大學畢業後,柏內茲-李在不同公司擔任程式設計師,但每一份工作都持續不了很長時間。1980年6月-12月,柏內茲-李以諮詢顧問的身份,為歐洲核子研究組織從事軟體工程方面的工作。歐洲核子研究組織是物理界一個著名的研究所,也是發現「上帝粒子」(希格斯玻色子)的地方。
1980 年的歐洲核子研究組織,是一個訊息需要高頻交換、但又充滿了各種「訊息圍牆」的地方:一萬人在這裡來來往往,其中只有3000 名左右是這間研究所的員工,其餘都是來自世界各地的研究院。他們用著不同的電腦、不同的網路、不同的資料格式、不同的檔案系統。
作為一個軟體工程師,柏內茲-李需要幫助這些研究人員連接上不同的電腦,執行不同的軟體程式,在不同格式的檔案中找到有關的訊息,這個過程「讓人充滿了挫敗感」。
為了改變這種局面,柏內茲-李打造了一個,可以幫研究人員在不同的電腦中迅速找到訊息,儘管它還只是一個單機程式、有很大的局限性。
Enquire 的底層技術「超文本」,最早於1963 年被提出,於1976 年被發明出來投入使用。超文本如今在網際網路上隨處可見,我們可以為文字加上連結,點擊後便可跳轉到相應的網頁、文件或檔案的某一處。某種意義上,基於超文本的Enquire 就是全球資訊網的原型。
柏內茲-李很快又離開了歐洲核子研究組織,加入了一家電腦公司,參與遠端網路呼叫設計,因而獲得了網路設計經驗。1984 年,他以研究員的身份重返歐洲核子研究組織工作。
為什麼柏內茲-李沒有為「全球資訊網」的發明申請專利?
回到歐洲核子研究組織的柏內茲-李,已經具備了開發全球資訊網的條件:超文本和網路設計經驗、超強的動手能力、開放的思維方式,再加上歐洲核子原子中心這樣一個天然的實驗場。
外部環境也已經成熟:TCP/IP 協議、網域名稱系統等底層技術逐漸完善,降低普通人上網門檻的需求也越來越強烈。
1989 年3 月,柏內茲-李萌生了將超文本系統和網路結合在一起、創造一個全球性超文本連結網路的想法:
全球資訊網需要的技術,例如超文本系統、網際網路和多種字體的文字檔案,都已經被設計出來了。我只需要把他們結合在一起......把現在的檔案系統都想像成大型虛擬檔案系統的一部分。
柏內茲-李撰寫了一個提案交給自己的主管邁克·森道爾(Mike Sendall),後者當時並沒有非常感興趣,只在提案的封面上寫下一欄簡短的評語:不太明確,但令人激動......(Vague, but exciting...)。18個月後,邁克才允許柏內茲-李兼職實現這個提案,但只是抱著試試看的心態。
柏內茲-李很快開始動手編碼,到1990 年聖誕,他基本上定義了Web 的基本概念:HTTP(超文本傳輸協定)、HTML(超文本標示語言)、URL(統一資源定位符,俗稱網頁地址,網址)。你不用了解這三個名詞的技術實現,只需要知道:
- HTTP 超文本傳輸協定:負責傳輸訊息
- HTML 超文本標示語言:負責在網頁上顯示訊息
- URL 劃一資源定位器:負責給每一個網頁一個地址,方便你找到它
這三樣東西結合起來,塑造了我們今天習以為常的上網方式:在地址欄輸入網頁的地址,便能跳轉到相應的網頁;如果該文本上有超連結,還能點擊它進行跳轉。相互關聯的訊息透過「點擊-跳轉」聯繫了起來。
1991年8月,柏內茲-李將他發明的第一個網頁瀏覽器開放給了公眾,並且上線了世界上第一個網頁:。
這個網頁非常簡單,抬頭三個大字:World Wide Web。正文介紹了全球資訊網是什麼、所用的技術、參與項目的人、項目的歷史等。
值得一提的是,全球資訊網項目參與者中,有一位名為羅伯特·卡里奧(Robert Cailliau)的訊息工程師,他長期使用著Hypercard,這是一個蘋果1987 年發布、2004 年關停的超文本系統,透過卡里奧間接影響了全球資訊網的設計。
全球資訊網發明出來後,柏內茲-李並沒有申請專利,因為他自己清楚得很,「開放」是全球資訊網普及的前提,「你不能計劃著做一個宇宙一樣大的空間,同時保持控制」。
全球資訊網開放給公眾的1991 年,同時誕生的還有明尼蘇達大學的Gopher。Gopher 在後來和全球資訊網的競爭中落敗,部分原因就是收費策略。
事實上,柏內茲-李確實曾經考慮過為自己的發明申請專利,但不是全球資訊網而是瀏覽器。最後,他還是因為自己「開放互聯」的價值觀放棄了這個做法。
「幾百萬人突然發現全球資訊網可能比性愛還要棒」
誕生頭兩年,全球資訊網其實並沒有多少人用。不管柏內茲-李怎麼努力推廣,每天只有10-100 次點擊率,就連技術社群也不接納全球資訊網。
他將全球資訊網相關論文提交給了一個超文本社群Hypertext'91,但被拒絕了。全球資訊網在他們看來太簡單了,並且違背了社群規則。
當時,超文本社群的信仰是,連結不應該指向不存在或已刪除的文件,因此當時其他一些超文本系統都被約束在一個單獨、孤立的資料庫裡。
而全球資訊網是一個全球性的開放系統,如果某個伺服器壞了或某個文本(網頁)被刪除了,連結就成了壞鏈。全球資訊網的開放性在超文本社群看來,反而成了對信仰的褻瀆。
改變出現在1993 年,這一年Mosaic 瀏覽器面世。Mosaic 瀏覽器是第一個可以在文字中插入圖片,而不是在單獨網頁中顯示圖片的瀏覽器。它支持全球資訊網、Gopher 等多個網路標準,並且擁有友好的使用者介面、簡易的安裝步驟、可靠的性能。
Mosaic 瀏覽器發布之時,市面上有好幾個競爭者如Erwise、ViolaWWW、MidasWWW 和tkWWW,但種種特性使它脫穎而出、大受歡迎,並帶動了全球資訊網的流行,「幾百萬人突然發現全球資訊網可能比性愛還要棒」。
全球資訊網真正使得網際網路由少數菁英使用的訊息傳輸管道,變成了供全世界共用的訊息共享平台。1993 年後,越來越多的公司開始在全球資訊網的基礎上提供服務、做生意,全球資訊網重塑世界經濟的故事不必再述。
全球資訊網影響力逐步加大的同時,柏內茲-李也獲得了相應的肯定:2004 年獲得大英帝國爵級司令勳章、2017 年獲得電腦科學領域的最負盛名的獎項——圖靈獎。
對於任何一個人來說,取得如此成就已經可以躺在功勞簿上睡大覺,但柏內茲-李真是閒不下來,他對網際網路的貢獻遠不止全球資訊網這個發明。
蘋果手機上的Siri,也得益於柏內茲-李的工作
在柏內茲-李1989 年的提案中,全球資訊網「不僅是一個文本文檔的互連網路,也是一個知識的互連網路」。
全球資訊網首先透過超文本連結實現了文檔(網頁)的互聯,到1998 年,柏內茲-李正式將「知識互連網路」的構想命名為語意網(Semantic Web),並將自己的工作重心放在推廣語意網上。
語意網是全球資訊網的變革和延伸,它的目的是讓電腦也能像人類一樣了解網頁上的內容。
比如,人們看到網頁上的天氣預報,會知道哪個數字是溫度,哪個是濕度。語意網的目的就要透過隱藏的編碼,告訴電腦哪個數字代表溫度,哪個數字代表濕度,並且說明「溫度」 和「濕度」的含義。
2006年,語意網發展到了一個瓶頸,需要大量結構化的公開資料,柏內茲-李提出了鍵連資料(Linked Data)的概念,還在2009年的TED大會上呼籲政府和機構公開原始資料( Raw Data)。同年,白宮成立了一個網站Data.gov,要求所有的部門都要有公開資料。
大量資料公開後,有機構把它們進行了結構化,這些結構化的鍵連資料庫默默影響著人工智慧的發展。
2011 年,IBM 的人工智慧華生(Watson)在美國電視智力競賽節目《危險邊緣》(Jeopardy!)中擊敗人類選手,獲得百萬美元大獎,就是採用了DBpedia(維基百科的結構化資料庫)、 YAGO(整合Wikipedia、WordNet 和GeoNames 三個來源的資料庫)等成果。
2012 年,Google 收購了一家做結構化資料的公司Metaweb,在後者資料庫Freebase 的基礎上發起了知識圖譜(Knowledge Graph)項目。蘋果的Siri,也是脫胎於一個基於語意網的項目CALO(Cognitive Assistant that Learns and Organizes)。
一個帳號登上所有應用服務、不怕服務倒閉的新平台
儘管柏內茲-李一直推動網路往開放互聯的方向發展,但「資料圍牆」的現像還是以另一種形式重現了:科技公司借助免費服務將使用者控制在自己的應用服務內,使用者的資料分散在各個平台,更無力保護自己的隱私。
矛盾在最近幾年集中爆發了,標誌性事件莫過於今年Facebook 被曝出2016 年時保護隱私不力,讓劍橋分析公司得以未經授權造訪5000 萬使用者資料。社會開始出現一股批評科技公司、將資料還給使用者的思潮。
在這樣的時間節點,柏內茲-李的新項目恰逢其時。2018年9月29日,他發布了一篇名為《網際網路的一小步......》的文章,對外宣布成立一家基於Solid平台的初創公司Inrupt。
2015 年,柏內茲-李就在麻省理工啟動了Solid 項目。Solid 全稱社群鍵連資料(Social Linked Data),是一個去中心化的社群平台,基於2006 年提出的鍵連資料(Linked Data)的技術和規範。
現在我們使用社群平台的現狀是,臉書有個帳號、Twitter有個帳號、部落格有個帳號,此外還有Line、IG等。每個帳號的資料都獨立保存在營運方自己的伺服器裡,互不打通。
這樣有兩個顯而易見的弊端:1.使用者資料掌握在營運方手裡,有被濫用的可能;2.如果營運方經營不善或者關停服務,那使用者在這個社群平台的資料也將付諸東流。Path和Google+的關停,就是最好的例子。
Solid 的解決方案把使用者資料和服務分開來,讓使用者把自己的資料都集中在一起,稱之為「個人線上資料」(Personal Online Data,簡稱POD)。然後,將POD 儲存在自己建的伺服器,或者受信任的個人線上資料商(Personal Online Data Stores,簡稱PODS)。
使用者會有一個WebID,可以登陸所有基於Solid 平台的應用服務,使用者能自己控制給哪個服務多少訊息。
目前,Solid平台還處於原型階段,主要面向開發者。柏內茲-李用Solid平台的技術打造了一款自己使用的服務,國外一家媒體看過後評價道:
這款應用程式,使用了Solid的去中心化技術,允許柏內茲-李無縫造訪他的所有資料——他的日曆、音樂庫、影片、聊天記錄、研究。它就像Google Drive,Microsoft Outlook,Slack,Spotify和WhatsApp的混合體。
至於Inrupt,是幫助Solid 平台成長的一個初創公司。Inrupt 之於Solid,好比Mosaic 瀏覽器之於全球資訊網,是一個領路人的角色。柏內茲-李希望Inrupt 能夠為Solid 帶來一個「生態系統」,其中的市場機會包括Solid APP 和Solid 資料儲存等。
柏內茲-李本人已經向麻省理工學院請了長假,專心在開發者群體中推廣Solid 和Inrupt。這是他又一次轉變工作重心。過去,柏內茲-李一直在致力於透過全球資訊網、語意網互聯公開訊息,現在他嘗試透過Solid 來互聯個人訊息、解決科技大公司壟斷使用者資料的問題。
這必定不是一個短期內可以看到成效的項目:社群巨頭和網際網路公司不會將使用者帳號資料拱手相讓,讓使用者個體自發遷移也需要極大的教育成本。但正如全球資訊網剛誕生時缺少關注,誰也不知道Solid 會不會成為下一顆參天大樹。
ADVERTISEMENT