百度今日下午於北京總部召開新聞發佈會。發佈會上,百度正式推出大型語言模型文心一言,並展示了文心一言在多個使用場景中的綜合能力。
從現場展示來看,文心一言某種程度上具有了對人類意圖的理解能力。但百度CEO李彥宏也多次提及,這類大型語言模型還遠未到發展完善的階段,進步空間很大。
百度同時公佈了文心一言的邀請測試方案。3 月 16 日起,首批使用者即可通過邀請測試碼,在文心一言官網體驗產品,後續將陸續開放給更多使用者。此外,百度智慧雲即將面向企業客戶開放文心一言 API 介面呼叫服務。3 月 16 日起正式開放預約,搜尋“百度智慧雲”進入官網,可申請加入文心一言雲服務測試。
發佈會現場,百度創始人、董事長兼首席執行長李彥宏展示了文心一言在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。
在文學創作場景中,文心一言根據對話問題將知名科幻小說《三體》的核心內容進行了總結,並提出了五個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。此外,文心一言精準回答了《三體》作者、電視劇角色扮演者等事實性問題。面對“於和偉和張魯一有哪些共同點”、“於和偉和張魯一誰更高”這類問題,文心一言也基於推理能力得出了答案。
在商業文案創作場景中,文心一言順利完成了給公司起名、寫 Slogan、寫新聞稿的創作任務。IT之家從百度獲悉,文心一言大型語言模型的訓練封包括兆級網頁資料、數十億的搜尋資料和圖片資料、百億級的語音日均呼叫資料,以及 5500 億事實的知識圖譜等。
據百度介紹,文心一言還具備了一定的思維能力,能夠學會數學推演及邏輯推理等相對複雜任務。面對“雞兔同籠”這類鍛鍊人類邏輯思維的經典題,文心一言能理解題意,並有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。
在此基礎上,文心一言還表現出中文理解及多模態生成能力。現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。
多模態生成方面,李彥宏現場展示了文心一言生成文字、圖片、音訊和視訊的能力。值得一提的是,文心一言甚至能夠生成四川話等方言語音;文心一言的視訊生成能力則因成本較高,現階段還未對所有使用者開放,未來會逐步接入。
自 2 月份百度宣佈“文心一言”以來,已有超過 650 家中國企業宣佈接入文心一言生態。百度首席技術長王海峰表示,文心一言,是新一代知識增強大型語言模型,是在 ERNIE 及 PLATO 系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大型語言模型都會採用的技術,ERNIE 和 PLATO 中也已經有應用和積累,在文心一言中又有了進一步強化;後三項則是百度已有技術優勢的再創新。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!