「本有機會成為世界首富」的WWW之父，想幫你把資料從科技公司手中奪回來

沒有他的發明，我們連嘲笑微軟IE 瀏覽器的機會都沒有；沒有他的發明，Google、Amazon、臉書都不會存在；沒有他的發明，你蘋果手機上的Siri 可能比現在還要蠢。

是提姆·柏內茲-李（Tim Berners-Lee），一位英國電腦科學家，他的發明叫全球資訊網（World Wid Web）。

柏內茲-李不是一個「賈伯斯」般如雷貫耳的名字，但關於他最有噱頭的段子又極具10 萬+ 標題的潛力：

「網際網路之父」本可碾壓比爾·蓋茲成為世界首富，但他竟沒有為發明申請專利！
假如申請發明專利，世界首富不是蓋茲而是他！如果他願意，二十年前就能成為世界首富！

▲ 這個就是本文的主人翁：柏內茲-李

事實上，沒有人是真正的「網際網路之父」，因為網際網路並不是一個單獨的發明，說柏內茲-李是「全球資訊網之父」比較準確。柏內茲-李沒有申請專利，不是因為他沒有意識到這個發明的價值，而是出於推廣全球資訊網的考慮。

很多人分不清網際網路（Internet）和全球資訊網（World Wid Web）的區別，簡單理解網際網路就是一個全球性的網路，而全球資訊網是我們使用網際網路最常用的入口。做一個不太恰當但容易理解的比喻吧：

如果把網際網路當成圍城裡的寶石，想要擁有它必須從城牆門口進入。你有很多個門可以選擇：HTTP之門、FTP之門、SMTP之門......你不用弄懂這些神符一樣的英文代表了什麼，只需要知道代表了全球資訊網的「HTTP之門」，是門檻最低的那道門，而這道門的鑰匙就是瀏覽器。

在全球資訊網沒有被發明前，網際網路已經存在了很多年，但上網並不是一件輕鬆愉快的事。那時人們透過撥打伺服器號碼上網，入口不是瀏覽器，沒有網頁、沒有圖片、更沒有影片，只有像下面這樣的一行行文字訊息。

毫無疑問，全球資訊網是柏內茲-李最重要的發明，但他這一輩子做的事情還有很多，比如成立全球資訊網聯盟、提出語意網、呼籲資料公開、成立社群鍵連資料平台，但都緊緊圍繞同一個主題：打破「訊息、資料之牆」，促進開放互聯。

誕生WWW的福地，是一個看似和電腦沒什麼關係的地方

柏內茲-李從小是一個電腦迷。他父母都曾經參與了世界上第一台商業電腦「曼徹斯特·馬克一號」（Manchester Mark I）的設計研發，這讓他從小就對電腦知識耳濡目染。

1973 年-1976 年，他在牛津大學女王學院學習物理專業。大學期間，由於違反規定被禁止使用學校的電腦，他自己動手用一台電視、一個摩托羅拉舊的微處理器（Motorola 6800）、一根焊接棒，拼出了一台電腦。

1976年大學畢業後，柏內茲-李在不同公司擔任程式設計師，但每一份工作都持續不了很長時間。1980年6月-12月，柏內茲-李以諮詢顧問的身份，為歐洲核子研究組織從事軟體工程方面的工作。歐洲核子研究組織是物理界一個著名的研究所，也是發現「上帝粒子」（希格斯玻色子）的地方。

1980 年的歐洲核子研究組織，是一個訊息需要高頻交換、但又充滿了各種「訊息圍牆」的地方：一萬人在這裡來來往往，其中只有3000 名左右是這間研究所的員工，其餘都是來自世界各地的研究院。他們用著不同的電腦、不同的網路、不同的資料格式、不同的檔案系統。

作為一個軟體工程師，柏內茲-李需要幫助這些研究人員連接上不同的電腦，執行不同的軟體程式，在不同格式的檔案中找到有關的訊息，這個過程「讓人充滿了挫敗感」。

為了改變這種局面，柏內茲-李打造了一個，可以幫研究人員在不同的電腦中迅速找到訊息，儘管它還只是一個單機程式、有很大的局限性。

Enquire 的底層技術「超文本」，最早於1963 年被提出，於1976 年被發明出來投入使用。超文本如今在網際網路上隨處可見，我們可以為文字加上連結，點擊後便可跳轉到相應的網頁、文件或檔案的某一處。某種意義上，基於超文本的Enquire 就是全球資訊網的原型。

柏內茲-李很快又離開了歐洲核子研究組織，加入了一家電腦公司，參與遠端網路呼叫設計，因而獲得了網路設計經驗。1984 年，他以研究員的身份重返歐洲核子研究組織工作。

為什麼柏內茲-李沒有為「全球資訊網」的發明申請專利？

回到歐洲核子研究組織的柏內茲-李，已經具備了開發全球資訊網的條件：超文本和網路設計經驗、超強的動手能力、開放的思維方式，再加上歐洲核子原子中心這樣一個天然的實驗場。

外部環境也已經成熟：TCP/IP 協議、網域名稱系統等底層技術逐漸完善，降低普通人上網門檻的需求也越來越強烈。

1989 年3 月，柏內茲-李萌生了將超文本系統和網路結合在一起、創造一個全球性超文本連結網路的想法：

全球資訊網需要的技術，例如超文本系統、網際網路和多種字體的文字檔案，都已經被設計出來了。我只需要把他們結合在一起......把現在的檔案系統都想像成大型虛擬檔案系統的一部分。

柏內茲-李撰寫了一個提案交給自己的主管邁克·森道爾（Mike Sendall），後者當時並沒有非常感興趣，只在提案的封面上寫下一欄簡短的評語：不太明確，但令人激動......（Vague, but exciting...）。18個月後，邁克才允許柏內茲-李兼職實現這個提案，但只是抱著試試看的心態。

▲ 柏內茲·李提案的封面，右上角寫有當時主管的評價

柏內茲-李很快開始動手編碼，到1990 年聖誕，他基本上定義了Web 的基本概念：HTTP（超文本傳輸協定）、HTML（超文本標示語言）、URL（統一資源定位符，俗稱網頁地址，網址）。你不用了解這三個名詞的技術實現，只需要知道：

HTTP 超文本傳輸協定：負責傳輸訊息
HTML 超文本標示語言：負責在網頁上顯示訊息
URL 劃一資源定位器：負責給每一個網頁一個地址，方便你找到它

這三樣東西結合起來，塑造了我們今天習以為常的上網方式：在地址欄輸入網頁的地址，便能跳轉到相應的網頁；如果該文本上有超連結，還能點擊它進行跳轉。相互關聯的訊息透過「點擊-跳轉」聯繫了起來。

1991年8月，柏內茲-李將他發明的第一個網頁瀏覽器開放給了公眾，並且上線了世界上第一個網頁：。

這個網頁非常簡單，抬頭三個大字：World Wide Web。正文介紹了全球資訊網是什麼、所用的技術、參與項目的人、項目的歷史等。

▲ 世界上第一個網頁

值得一提的是，全球資訊網項目參與者中，有一位名為羅伯特·卡里奧（Robert Cailliau）的訊息工程師，他長期使用著Hypercard，這是一個蘋果1987 年發布、2004 年關停的超文本系統，透過卡里奧間接影響了全球資訊網的設計。

▲ 蘋果電腦以前的超文本系統Hypercard

全球資訊網發明出來後，柏內茲-李並沒有申請專利，因為他自己清楚得很，「開放」是全球資訊網普及的前提，「你不能計劃著做一個宇宙一樣大的空間，同時保持控制」。

全球資訊網開放給公眾的1991 年，同時誕生的還有明尼蘇達大學的Gopher。Gopher 在後來和全球資訊網的競爭中落敗，部分原因就是收費策略。

事實上，柏內茲-李確實曾經考慮過為自己的發明申請專利，但不是全球資訊網而是瀏覽器。最後，他還是因為自己「開放互聯」的價值觀放棄了這個做法。

「幾百萬人突然發現全球資訊網可能比性愛還要棒」

誕生頭兩年，全球資訊網其實並沒有多少人用。不管柏內茲-李怎麼努力推廣，每天只有10-100 次點擊率，就連技術社群也不接納全球資訊網。

他將全球資訊網相關論文提交給了一個超文本社群Hypertext'91，但被拒絕了。全球資訊網在他們看來太簡單了，並且違背了社群規則。

當時，超文本社群的信仰是，連結不應該指向不存在或已刪除的文件，因此當時其他一些超文本系統都被約束在一個單獨、孤立的資料庫裡。

而全球資訊網是一個全球性的開放系統，如果某個伺服器壞了或某個文本（網頁）被刪除了，連結就成了壞鏈。全球資訊網的開放性在超文本社群看來，反而成了對信仰的褻瀆。

改變出現在1993 年，這一年Mosaic 瀏覽器面世。Mosaic 瀏覽器是第一個可以在文字中插入圖片，而不是在單獨網頁中顯示圖片的瀏覽器。它支持全球資訊網、Gopher 等多個網路標準，並且擁有友好的使用者介面、簡易的安裝步驟、可靠的性能。

▲ Mosaic 瀏覽器

Mosaic 瀏覽器發布之時，市面上有好幾個競爭者如Erwise、ViolaWWW、MidasWWW 和tkWWW，但種種特性使它脫穎而出、大受歡迎，並帶動了全球資訊網的流行，「幾百萬人突然發現全球資訊網可能比性愛還要棒」。

全球資訊網真正使得網際網路由少數菁英使用的訊息傳輸管道，變成了供全世界共用的訊息共享平台。1993 年後，越來越多的公司開始在全球資訊網的基礎上提供服務、做生意，全球資訊網重塑世界經濟的故事不必再述。

全球資訊網影響力逐步加大的同時，柏內茲-李也獲得了相應的肯定：2004 年獲得大英帝國爵級司令勳章、2017 年獲得電腦科學領域的最負盛名的獎項——圖靈獎。

對於任何一個人來說，取得如此成就已經可以躺在功勞簿上睡大覺，但柏內茲-李真是閒不下來，他對網際網路的貢獻遠不止全球資訊網這個發明。

蘋果手機上的Siri，也得益於柏內茲-李的工作

在柏內茲-李1989 年的提案中，全球資訊網「不僅是一個文本文檔的互連網路，也是一個知識的互連網路」。

全球資訊網首先透過超文本連結實現了文檔（網頁）的互聯，到1998 年，柏內茲-李正式將「知識互連網路」的構想命名為語意網（Semantic Web），並將自己的工作重心放在推廣語意網上。

語意網是全球資訊網的變革和延伸，它的目的是讓電腦也能像人類一樣了解網頁上的內容。

比如，人們看到網頁上的天氣預報，會知道哪個數字是溫度，哪個是濕度。語意網的目的就要透過隱藏的編碼，告訴電腦哪個數字代表溫度，哪個數字代表濕度，並且說明「溫度」和「濕度」的含義。

2006年，語意網發展到了一個瓶頸，需要大量結構化的公開資料，柏內茲-李提出了鍵連資料（Linked Data）的概念，還在2009年的TED大會上呼籲政府和機構公開原始資料（ Raw Data）。同年，白宮成立了一個網站Data.gov，要求所有的部門都要有公開資料。

大量資料公開後，有機構把它們進行了結構化，這些結構化的鍵連資料庫默默影響著人工智慧的發展。

2011 年，IBM 的人工智慧華生（Watson）在美國電視智力競賽節目《危險邊緣》（Jeopardy!）中擊敗人類選手，獲得百萬美元大獎，就是採用了DBpedia（維基百科的結構化資料庫）、 YAGO（整合Wikipedia、WordNet 和GeoNames 三個來源的資料庫）等成果。

2012 年，Google 收購了一家做結構化資料的公司Metaweb，在後者資料庫Freebase 的基礎上發起了知識圖譜（Knowledge Graph）項目。蘋果的Siri，也是脫胎於一個基於語意網的項目CALO（Cognitive Assistant that Learns and Organizes）。

一個帳號登上所有應用服務、不怕服務倒閉的新平台

儘管柏內茲-李一直推動網路往開放互聯的方向發展，但「資料圍牆」的現像還是以另一種形式重現了：科技公司借助免費服務將使用者控制在自己的應用服務內，使用者的資料分散在各個平台，更無力保護自己的隱私。

矛盾在最近幾年集中爆發了，標誌性事件莫過於今年Facebook 被曝出2016 年時保護隱私不力，讓劍橋分析公司得以未經授權造訪5000 萬使用者資料。社會開始出現一股批評科技公司、將資料還給使用者的思潮。

在這樣的時間節點，柏內茲-李的新項目恰逢其時。2018年9月29日，他發布了一篇名為《網際網路的一小步......》的文章，對外宣布成立一家基於Solid平台的初創公司Inrupt。

2015 年，柏內茲-李就在麻省理工啟動了Solid 項目。Solid 全稱社群鍵連資料（Social Linked Data），是一個去中心化的社群平台，基於2006 年提出的鍵連資料（Linked Data）的技術和規範。

現在我們使用社群平台的現狀是，臉書有個帳號、Twitter有個帳號、部落格有個帳號，此外還有Line、IG等。每個帳號的資料都獨立保存在營運方自己的伺服器裡，互不打通。

這樣有兩個顯而易見的弊端：1.使用者資料掌握在營運方手裡，有被濫用的可能；2.如果營運方經營不善或者關停服務，那使用者在這個社群平台的資料也將付諸東流。Path和Google+的關停，就是最好的例子。

Solid 的解決方案把使用者資料和服務分開來，讓使用者把自己的資料都集中在一起，稱之為「個人線上資料」（Personal Online Data，簡稱POD）。然後，將POD 儲存在自己建的伺服器，或者受信任的個人線上資料商（Personal Online Data Stores，簡稱PODS）。

使用者會有一個WebID，可以登陸所有基於Solid 平台的應用服務，使用者能自己控制給哪個服務多少訊息。

目前，Solid平台還處於原型階段，主要面向開發者。柏內茲-李用Solid平台的技術打造了一款自己使用的服務，國外一家媒體看過後評價道：

這款應用程式，使用了Solid的去中心化技術，允許柏內茲-李無縫造訪他的所有資料——他的日曆、音樂庫、影片、聊天記錄、研究。它就像Google Drive，Microsoft Outlook，Slack，Spotify和WhatsApp的混合體。

至於Inrupt，是幫助Solid 平台成長的一個初創公司。Inrupt 之於Solid，好比Mosaic 瀏覽器之於全球資訊網，是一個領路人的角色。柏內茲-李希望Inrupt 能夠為Solid 帶來一個「生態系統」，其中的市場機會包括Solid APP 和Solid 資料儲存等。

柏內茲-李本人已經向麻省理工學院請了長假，專心在開發者群體中推廣Solid 和Inrupt。這是他又一次轉變工作重心。過去，柏內茲-李一直在致力於透過全球資訊網、語意網互聯公開訊息，現在他嘗試透過Solid 來互聯個人訊息、解決科技大公司壟斷使用者資料的問題。

這必定不是一個短期內可以看到成效的項目：社群巨頭和網際網路公司不會將使用者帳號資料拱手相讓，讓使用者個體自發遷移也需要極大的教育成本。但正如全球資訊網剛誕生時缺少關注，誰也不知道Solid 會不會成為下一顆參天大樹。