「驗證碼」CAPTCHA是他創造的,20歲就被蓋茲親自挖去微軟的數學家Luis Von Ahn

「驗證碼」CAPTCHA是他創造的,20歲就被蓋茲親自挖去微軟的數學家Luis Von Ahn

路易斯·馮·安(Luis Von Ahn)是一位才華橫溢的數學教授,我們登錄新網站或APP時經常用到的驗證碼(CAPTCHA),還有一款語言學習軟體「多鄰國」(Duolingo),都是他創建的。就連比爾‧蓋茲都花了45分鐘才說服當時年僅20多歲的瓜地馬拉數學教授路易斯去微軟工作。

顯然,路易斯和微軟是一個爆炸性的組合,驗證碼正是路易斯的創意。而這個創意誕生一週後由Yahoo!實施,幾年後被Google收購。路易斯的第二個孩子「多鄰國」(Duolingo)則在推出兩年後估值達到2000萬美元,現今已達到15億美元。

對我們這些普通人來說,只是花幾秒時間填寫一下驗證碼(單詞類),卻不曾想到我們每年竟然能在無形當中完成230萬本圖書的數位化。對我們來說,Duolingo也是一個學習語言的平台,沒想到原來使用者在學習過程中就幫助Duolingo賺了錢,因為憑藉大家的力量,幾週內就可以將CNN和紐約時報多年以來的全部內容翻譯成其他語言,然後向這些新聞機構要翻譯費。

看,這些都是路易斯想出來的。

驗證碼可不是白填的,使用者每年竟在無形當中完成230萬本書的數位化

有一天,一位Yahoo!的頂尖研究人員兼人才偵察員來到路易斯·馮·安的學校,做了一場題為「Yahoo!最難解決的十個問題」的演講。他們的問題之一,是垃圾郵件發送者會使用自動軟體創建數以百萬計的假電子郵件地址,然後將廣告一堆堆地發送出去。Yahoo!相當於是本世紀初的Google,以技術為導向的年輕路易斯立刻開始著手解決這項工作。

其實解決方案很簡單。路易斯的一位博士同學告訴他,電腦很難看懂手寫或者列印出的文本。一個人或多或少能讀懂一張模糊圖片裡潦草的手寫筆跡,但軟體永遠無法與之匹敵。因此,只有非常專注的人,才可以通過驗證碼的考驗。

CAPTCHAYahoo!一週內就完成了這項功能,路易斯完全可以憑此接受一聲「謝謝」。

但路易斯是一個對自己要求極高的人,他無法接受讓人類每天浪費50萬小時來填寫驗證碼。畢竟每天50萬小時是一大筆時間,應當好好利用。

很快,一個契機出現了。archive.orgs和Google圖書花了大量時間將舊書、文章和文檔掃瞄轉換成數位化的電子版本。書籍是由單詞組成的,單詞又是由字母組成的,驗證碼也是如此。

簡單來說,之前的驗證碼版本是模糊的數字和字母組合,新版本則是讓使用者辨別兩個單詞,這兩個詞都出自那些已經掃瞄過的文檔或書籍。

reCAPTCHA第一個單詞出自公司透過掃瞄已經確定下來的那部分詞彙,它是用來測試使用者是否是人類的。而第二個單詞是從他們還不確定的那部分詞彙裡選出,一旦有10個使用者輸入了某個相同的單詞,他們就知道這是正確答案。

透過這種方式,reCAPTCHAs每年可以將230萬本舊書數位化成可編輯、可搜索的網路文件。後來,Google買下了這家公司,這筆收購的錢足以讓路易斯這輩子都不用工作了,而他唯一要做的就是在Google待上3年。但是他沒有。

Duolingo最初的盈利方式妙不可言:他讓使用者一邊上課,一邊為他賺錢

對於一個出生在平均月薪只有200美元的國家的人來說,教育是一個令人痛苦的話題。雖然學習平台本來應該為公民提供平等的機會,但往往反而會讓貧富差距變得更大。因為學習平台把人分成了兩類,一類是有500美元可以花在英語課程上的人,另一類是根本沒有500美元的人。

路易斯說,人們在學習了英語之後,收入往往會翻倍。僅在中國就有4億人學習英語——這幾乎是美國和英國人數的總和。除了那些顯而易見的工作原因,還有更多潛在的力量在起作用。

網路上的大部分內容都是英文的,這意味著只有懂英語的人才能接受教育。Youtube上的耶魯課程、解說型影片、亞馬遜圖書、新聞網站、部落格——我們可以停下來想想,真正被翻譯成我們自己語言的東西是多麼的少。比如,世界上有4.37億人說西班牙語,但維基百科中的西班牙語只有英文版的20%左右。

所以當路易斯決定用他的智慧為此做些事情時,他與一個叫Severin Hacker的人合作了。他們旨在為世界上大多數人創造一個免費學習語言的途徑,為所有可以上網的人提供一個大眾化的學習平台。

路易斯已經成為一位經驗豐富的企業家,他知道這個免費的應用程式需要有一個賺錢的方式,畢竟他的資金不能永遠為新公司提供支撐。這個軟體必須從一開始就自給自足。路易斯僱用了那些熟練使用驗證碼的技術人員。他一邊讓使用者上課,一邊讓使用者為他賺錢。

在Duolingo學習任何一種語言時都不會隨機分配單詞。有時候,是隨機分配一個句子來翻譯;還有些時候,句子不是隨機的,而是節選自Duolingo眾多客戶的某篇文章——比如CNN和紐約時報。

學習外語的同時也在翻譯新聞顯然,一個語言學習者絕對不是合格的翻譯。為了確保翻譯結果是正確的,Duolingo會用類似驗證碼的幕後技術來「點石成金」,將10個業餘翻譯變成一個專業翻譯,最終的結果甚至可以和一個訓練有素的翻譯翻出的結果沒有區別。

除了最初的技術成本,Duolingo可以說是「免費」的翻譯。如果《紐約時報》為每個字的翻譯支付0.10美元,同時還必須花費人力資源來管理翻譯過程,那麼路易斯就能以每字0.05美元的價格提供翻譯。只要有足夠多的使用者訂閱Duolingo,它甚至可以在幾天內翻譯出一年的作品——這將為路易斯和他的合作夥伴帶來42000美元的收入。

Duolingo正在把大學搬到智慧型手機上

路易斯表示,翻譯是一個棘手的行業,世界上總會有一個翻譯願意以半價接手你的工作。此外,Duolingo本身也開始變得更像一家翻譯公司,而不是教育公司。基於這些原因,Duolingo現在正在走傳統的訂閱路線。

雖然路易斯並不喜歡談論他是如何在市場行銷方面發展Duolingo的,但是,就像其他偉大的創始人一樣,他在獨特的核心機制上確實花了很多心思。

課堂上,學生更像是必須認真聽課的「人質」。而app卻還要與Instagram或Facebook這些終極對手爭奪學生的注意力。為此,路易斯和他的合作夥伴花了10年時間來完善每一個彈出視窗、每一個通知、每一種字體和每一種聲音,只是為了捕捉使用者的專注力。

作者表示,他第一次用Duolingo練習中文時,正坐在一家他從來沒有去過的咖啡館,但他一杯咖啡都沒有喝。即使有時間可以消磨,他仍然專注於Duolingo的學習。

一週後,他發現自己在同樣的時間路過了這家咖啡館。Duolingo讓他開始主動地去學幾個新單詞。後來他才意識到這正是他第一次用Duolingo進行學習的地方。

Duolingo的決策者們對更加廣泛的教育領域也充滿了雄心壯志。對於發展中國家的聰明學生來說,雅思或托福這樣的認證考試是一個特別痛苦的障礙。不僅學習和考試要花錢,還常常要花好幾個小時才能趕到考試場所。為此,Duolingo正在悄悄地制定他們自己的標準化考試,並被一個又一個的學習機構所接受。

Duolingo主要宣傳的點是:他們比教室更好。雖然我們對這些數字半信半疑,但路易斯說,一個學生在Duolingo上用32小時就能學會普通學生在校一個學期的語言。他用A/B測試來解釋這一現象:老師們經常為了讓學生掌握副詞而不斷練習,Duolingo則積極測試不同的學習方法,看看哪一種效果最好——比如應該先學習複數還是代詞。

但路易斯關注的不只是語言。對他來說,每一個能夠大規模移植到數位世界的學習過程都是值得追求的,而任何方式——包括透過電影字幕學習——都是可行的選擇。

 

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則