2024.10.01 14:30

Google Notebook LM怎麼用,為什麼AI大神狂讚說它「可能是下一個ChatGPT」?

ADVERTISEMENT

最近來自Google的實驗性AI產品,Notebook LM吸引相當多人的注意,這個背後由Google現在最強大的模型Gemini 1.5 Pro提供支援的服務,甚至獲得AI大神Andrej Karpathy強烈推薦,甚至預言這個AI服務,有可能開啟和ChatGPT一樣大的機會。

文章目錄

最近這服務要多火就有多火,全因上線了一項新功能——上傳檔案(文字、音訊、影片),AI不僅能幫忙用文字提煉要點,還可以通過音訊概述(Audio Overview)功能,把檔案轉換成AI生成的對話,根據文件內容進行討論。

ADVERTISEMENT

2個AI,用真人般的語音和口吻,圍繞檔案內容激情討論,最後總結陳詞。就是一個完全由AI生成的Podcast。

這真的很酷!

而且不是Karpathy一個人在誇。逛了下網路上幾大平台,網友們對Notebook LM普遍都是好評。AI界的KOL@elvis也在Karpathy評論留言:

ADVERTISEMENT

「卡神稱這“讓人想起ChatGPT時刻”,絕對不是誇大其詞!

真正讓多種模型聯合工作,會解鎖Notebook LM這樣獨特的內容格式和使用者體驗。」

ADVERTISEMENT

Notebook LM怎麼玩?

玩法很簡單,打開官方頁面,登入Google帳號後,拖曳上傳需要處理的檔案就好了。

檔案可以是Google文件,可以是網站和視訊連結,甚至乾脆貼上一大段文字都可以。支援上傳50個檔案,每個檔案內容上限500000個單詞。

ADVERTISEMENT

這裡我們上傳了OpenAI o1的System Card文件,接下來就可以選擇需要建立的內容。

內建支援問答、小測驗、目錄、時間線、摘要等文字版功能,以及兩個主持人的深度對話音訊內容。

如果有更個性化的需求也可以自己敲prompt。

我們嘗試用中文提問,結果AI是可以理解的。很可惜的是Notebook LM不支援用中文回答,即使刻意要求也不行。

選擇建立音訊的話,視文件長度需要等待幾分鐘到十幾分鐘。

NotebookLM的背景

NotebookLM由Gemini 1.5 Pro來支援,也就是Google家目前旗艦級大型語言模型。

Gemini 1.5 Pro支援超長128k上下文,這是能解讀長文件的基礎。

在最近的一次升級中,Gemini 1.5 Pro數學和推理能力還反超OpenAI o1預覽版。

好了,剛才生成的音訊也處理完畢,英語好的朋友可以來聽聽看。

英語沒那麼好的朋友,也可以看看套上AI轉寫、翻譯出來的AI文字版,感受一下。

單純的上傳文件,生成內容,還只是Notebook的實用玩法之一。

還有人介紹了學生上課錄音,回家用AI整理重點的玩法,也廣受好評。

(不是自己不聽課了的意思)

具體來說,可以遵循以下步驟:

  • 上課時用手機錄音;
  • 上課期間不需要用電腦,只需(紙筆)記下簡短的重點;
  • (下課後)把錄音和筆記掃描上傳到NotebookLM,讓它根據錄音細節擴寫筆記。
  • 另外,還可以每週建立一份對所學內容重點的複習音訊。

與單純「聊天」不同的AI互動範式

其實,NotebookLM並不是出道即爆火。

早在去年5月的Google I/O大會上它就已經出現了,不過那個時候,作為AI筆記計畫的它還叫Project Tailwind。到了去年7月,NotebookLM它才改成現在的名字。

起初,只支援美國局部地區的使用者使用;功能也還是圍繞著基礎的Chat模式展開。

到了這個月11號,NotebookLM突然宣佈面向全球玩家開放,並且新增了重磅功能,音訊概述

Google給的官方介紹是這樣的:

「新的音訊概述功能,可以一鍵將文件、幻燈片、圖表等轉化為引人入勝的討論。」

因為互動形式很新、AI語音逼真、討論起來真的很像真人Podcast播客,大家一下就玩嗨了。

到這兩天,Notebook LM不僅已經能夠把Youtube視訊作為輸入,還已經支援超100種語言。現在,AI大神的公開稱讚,更為Notebook LM的熱度「火上加油」。

如Karpathy所說,Notebook LM爆火最主要的原因,是它提供了一種與單純Chat不同的互動範式。Notebook LM消除了大型語言模型的兩大享受障礙:

第一點,聊天其實挺難的。

有些人在日常生活中跟人交流都費盡心力,更別提要和Chatbot聊天,還得不停提問、追問。

NotebookLM好就好在,生成的Podcast對話中,其中有一方就會處於提問、引導角色。我們把文件、音視訊放進去,等待生成,聽AI根據檔案閒聊是了。

第二點,閱讀不是件容易的事。

資訊爆炸的碎片化時代,挑個舒服的姿勢,或者開車時候聽別人討論我需要的東西,比自己費勁吧啦擱那兒看容易得多。——哪怕看的是AI已經幫我們總結出來的凝練版本。

目前Notebook LM的兩大缺點

本著精益求精的精神,也有網友表示了對Notebook LM更上一層樓的期待。

Hyperbolic Labs的聯創兼CTO Yuchen Jin試玩過後,總結了兩個侷限性:

一個是它「看不到」,也就是沒法處理文件內的圖片資訊。不過背後的Gemini是多模態的嘛,相比Notebook LM長眼睛不會太晚。

另一個是使用者無法引導AI Podcast的內容

Yuchen Jin餵給它兩條推文,它就生成了近13分鐘的音訊內容,但它預設聽眾是一般受眾,所以講了很多很基本的概念。如果能指定生成播客的目標群體,或者談論主題、方向、角度,那真的是棒上加棒。

One More Thing

說時遲那時快,也有開發者搞出開源版的NotebookLM了!

不過暫時只能給它PDF檔案。

 

參考連結:

[1]https://notebooklm.google/

[2]https://x.com/karpathy/status/1840112692910272898

[3]https://x.com/omarsar0/status/1840145774874898506

[4]https://x.com/Yuchenj_UW/status/1840203324571943403

[5]https://github.com/gabrielchua/open-notebooklm

ADVERTISEMENT