ChatGPT太「白」?黑人創業者用AI說出自己的故事,挑戰AI種族偏見!

ChatGPT太「白」?黑人創業者用AI說出自己的故事,挑戰AI種族偏見!

ADVERTISEMENT

起初,約翰·帕斯莫(John Pasmore)對ChatGPT感到興奮。

這位連續創業者自2008年以來就一直涉足人工智慧領域。他回想起專家們宣稱要花幾十年時間才能看到類似ChatGPT的東西的日子。快進到現在,這一天已經到來了。

但是有一個問題。

ChatGPT是世界上最強大的人工智慧工具之一,但在文化細微差別方面卻存在困難。對於像帕斯莫這樣的黑人來說,這相當惱人。事實上,這種疏忽引起了許多黑人的憤怒,他們認為自己在未來有可能拯救世界的演算法中沒有得到恰當的體現。當前的ChatGPT對迎合特定社群的特定問題提供過於籠統的答案,因為它的訓練在偏見上似乎是以歐洲為中心和西方為主的。這並非獨特的現象,大多數人工智慧模型在構建時都沒有考慮到有色人種。但許多黑人創業者堅決不願被拋在後面。

過去一年中,湧現出許多黑人的聊天機器人和 ChatGPT 版本,專門服務於黑人和棕色人種社群,因為像 帕斯莫 這樣的黑人創業者正試圖利用OpenAI的文化失誤來獲取機會。

帕斯莫談到ChatGPT時說:「如果你問這個模型,我們文化中最重要的一些藝術家是誰,它會告訴你是達文西和米開朗基羅。」 「它不會說任何關於印度、中國、非洲,甚至是非裔美國人的事情,因為它有偏見,只關注歐洲的歷史軌跡。」

因此,帕斯莫推出了Latimer.AI,這是一種語言模型,可以提供量身客製的答案,以反映黑人和棕色人種的經歷。艾琳·雷迪克(Erin Reddick)創辦了ChatBlackGPT,這是一款同樣以黑人和棕色人種社群為中心的聊天機器人。在全球範圍內,還有總部位於加拿大的Spark Plug,它是ChatGPT的替代品,面向黑人和棕色人種學生。非洲在這個領域也看到了巨大的創新,語言模型的湧現迎合了非洲大陸上使用的2000多種語言和方言,而西方人工智慧模型仍然忽視了這些語言和方言。

Spark Plug創始人Tamar Huggins告訴TechCrunch:「我們是自己故事和經歷的守護者。」 「我們需要創建我們擁有和控制的系統和基礎設施,以確保我們的數據仍然是我們的。」

個性化AI時代來臨

通用AI模型無法輕易捕捉到非裔美國人的體驗,因為該文化的許多方面都沒有上網。當前的演算法會抓取網際網路上的數據,但非裔美國人文化中的許多傳統和方言都是通過口頭或親身體驗傳承下來的,這使得人工智慧模型對該社群的理解與實際情況之間存在差距。

這就是帕斯莫在構建Latimer.AI時嘗試使用阿姆斯特丹新聞(美國歷史最悠久的黑人報紙之一)等來源的原因之一,他注重的是準確性,而不是對從網際網路上抓取的由使用者產生的資料進行訓練。這樣做,他開始看到他的模型和ChatGPT之間的差異。

他回憶起人們曾經向ChatGPT詢問地下鐵路的情況,這是被奴役的黑人美國人逃離奴隸制前往北方各州的通道。ChatGPT的模型會提到逃跑的奴隸,而Latimer.AI則調整了措辭,稱他們為「被奴役的」或「尋求自由的人」,這更符合在討論以前被奴役的人時所形成的更社會化的語調。

帕斯莫說:「由於訓練資料的原因,模型使用的語言存在一些細微的差異,而且模型本身只考慮黑人和棕色人種。」

同時,艾琳·雷迪克的ChatBlackGPT仍處於測試階段,計劃在六月中句推出。她的產品就像聽起來那樣:一個聊天機器人,人們可以在這裡提出問題並收到關於黑人文化的量身客製的回應。「我們所做的核心是真正的社群驅動,」她說。

圖片來源: ChatBlackGPT 與 Stefan Youngblood

她正在建設這個工具的過程中,詢問使用者希望它看起來像什麼,以及他們希望它如何運作。她還與歷史悠久的黑人大學(HBCUs)等教育機構合作,與學生一起教他們並讓他們幫助訓練她的演算法。她說她希望「為黑人和棕色人種創造一個全面的學習機會,讓他們有一個安全的空間來探索人工智慧。」

她告訴TechCrunch:「該演算法優先考慮黑人訊息來源,因此它可以談論比你的平均經驗更直接相關的知識體系,」她補充說,像帕斯莫的產品一樣,從技術上來說任何人都可以使用它。

塔瑪·哈金斯(Tamar Huggins)創建了Spark Plug,也為黑人和棕色人種社群提供更量身客製的體驗。她的平台將教育資料翻譯成非裔美國人白話英語(AAVE),這是一種與美國黑人社群相關的民族方言。這種方言傳統上是透過口頭和親身體驗傳承的,而不是像標準英語那樣透過學習和書寫來傳承的,這意味著僅從網際網路上學習它的AI模型(或人)的準確性會在精確度上有所下降。準確捕捉AAVE非常重要,這不僅是為了讓聊天機器人用它來回應,還為了讓學生更容易寫出能讓 AI 返回他們需要的結果的提示。

ChatGPT太「白」?黑人創業者用AI說出自己的故事,挑戰AI種族偏見!

哈金斯說:「透過創建能引起黑人學生共鳴的內容,我們確保他們在教育中看到自己,這對提高參與度和學業成功至關重要。」 「如果有機會,大型科技公司幾乎總是會優先考慮利潤而不是人。因此,我們在人工智慧領域創建了自己的道路。」

哈金斯用哈林文藝復興時期黑人作家、教育領域黑人作家,甚至她十几歲的女兒的措辭來訓練她的演算法,以捕捉AAVE的精髓。哈金斯還與教育工作者、語言學家和文化專家合作,審查和驗證Spark Plug的產出。她的產品也不是建立在ChatGPT之上的。它是自己的模型,這意味著使用者可以控制他們的數據。

帕斯莫也計劃為他的Latimer.AI建立一個單獨的基礎模型。目前,隨著越來越多的學生每天都在尋求ChatGPT來完成他們的作業,他正致力於將他的公司擴展到學校,尤其是HBCUs。

「對於黑人和棕色孩子要做的很多工作,這是一個更好的AI夥伴,」他說。

團結移民社群

非洲在當前的人工智慧運動中被忽視了。例如,根據2023年人工智慧指數報告,全球人工智慧期刊中只有0.77%來自撒哈拉以南非洲地區,而東亞和北美分別為47.1%和11.6%。從人口上看,與北美相比,非洲約佔世界人口的17%,而北美僅佔7%。當需要獲取有關人工智慧的訊息和專家時,使用撒哈拉以南地區研究的可能性很低,這可能會影響全球人工智慧工具的開發。

雖然非洲在創建更具包容性的語言模型方面取得了很大進展,這些模型可以更好地服務於黑人移民社群,但目前,從ChatGPT到Gemini的當前人工智慧模型無法完全支援非洲2000多種語言。

因卡·伊伊諾拉坎(Yinka Iyinolakan_創建了CDIAL.AI來解決這個問題。CDIAL.AI是一款能夠說和理解幾乎所有非洲語言和方言的聊天機器人,特別注重語音模式而不是文字。

伊伊諾拉坎向TechCrunch表達了與許多美國黑人一樣的觀點——基礎人工智慧模型主要是從網際網路數據和最常用的語言中抓取的。與其非裔美國人後裔文化一樣,許多非洲語言和傳統在網際網路上是缺失的,因為它是一種歷史上透過口頭交流而不是書面形式交流的文化。這意味著人工智慧模型沒有足夠的關於非洲文化的訊息來訓練自己,進而留下了知識空白。

ChatGPT太「白」?黑人創業者用AI說出自己的故事,挑戰AI種族偏見!

對於CDIAL.AI,伊伊諾拉坎召集了非洲各地1200多名母語人士和語言學家,收集知識和見解,以構建他所稱的「世界上第一個多語言語音優先的大型語言模型」。該公司計劃在未來12個月內擴展到更多的語言,並建立一個支援文字、語音和圖像的模型。

他並不孤單。谷歌最近向肯亞的Jacaranda Health提供了140萬美元的撥款,以擴展其機器學習服務,使其能夠在更多的非洲語言中工作,而Intron Health最近也籌集了數百萬美元,以擴大其對非洲200多種口音的臨床語音辨識。

伊伊諾拉坎說:「矽谷想讓人們相信,它是人工智慧的一切。」 「但要『獲得』人工智慧,這是所有公司的終極目標,他們需要包括世界三分之一的知識。」 

取得進展

黑人創業者們不僅僅在AI聊天機器人領域有所創新。

史蒂夫·瓊斯(Steve Jones)和迪尚·布朗(DeSean Brown)創立了pocstock公司,目的是為了創建有色人種的圖片庫,因為幾十年來,圖片庫中少數族裔的代表一直不足。這也是為什麼現今的模型在被要求生成從醫生到流行歌手等各種圖片時,主要給出白人形象的原因之一。

瓊斯告訴TechCrunch:「所有平台和工具都應該從完整、種族包容和文化準確的數據中進行訓練,否則我們將[延續]我們更大社會目前面臨的偏見問題。」為了解決這個問題,pocstock在過去五年裡一直在收集多元化數據,並創建了自己的視覺標記系統,為企業用來幫助訓練AI模型的數據庫做出貢獻,以便其能產生更具包容性的圖像。

然而,一些改進正在發生。瓊斯表示,他注意到為AI公司提供來源的較大圖片庫公司,在增加內容的多樣性方面取得了更大的進展。帕斯莫也看到了光明的未來,他說個性化AI是未來的趨勢,AI模型與使用者互動越多,就越能理解特定人的需求和需求,「我認為這消除了很多偏見。」

未來甚至可能會有更多針對特定文化的AI模型的空間,特別是隨著越來越多黑人擁有的替代方案不斷湧現。畢竟,世界是廣闊而細微的,試圖將其納入一個黑盒子是沒有意義的。

「我希望更多的有色人種創業者盡早參與到下一次經濟繁榮中,開發自己的AI平台或創造新的AI相關工作。」瓊斯說。「AI將創造萬億富翁,我很樂意看到有色人種成為生產者,而不僅僅是消費者。」

netizen
作者

一個老派的科技媒體工作者,對於最新科技動態、最新科技訊息的觀察報告。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則