Google Notebook LM怎麼用，為什麼AI大神狂讚說它「可能是下一個ChatGPT」？

最近來自Google的實驗性AI產品，Notebook LM吸引相當多人的注意，這個背後由Google現在最強大的模型Gemini 1.5 Pro提供支援的服務，甚至獲得AI大神Andrej Karpathy強烈推薦，甚至預言這個AI服務，有可能開啟和ChatGPT一樣大的機會。

文章目錄

1. Notebook LM怎麼玩？
2. NotebookLM的背景
3. 與單純「聊天」不同的AI互動範式
4. 目前Notebook LM的兩大缺點
5. One More Thing

最近這服務要多火就有多火，全因上線了一項新功能——上傳檔案（文字、音訊、影片），AI不僅能幫忙用文字提煉要點，還可以通過音訊概述（Audio Overview）功能，把檔案轉換成AI生成的對話，根據文件內容進行討論。

2個AI，用真人般的語音和口吻，圍繞檔案內容激情討論，最後總結陳詞。就是一個完全由AI生成的Podcast。

這真的很酷！

而且不是Karpathy一個人在誇。逛了下網路上幾大平台，網友們對Notebook LM普遍都是好評。AI界的KOL@elvis也在Karpathy評論留言：

「卡神稱這“讓人想起ChatGPT時刻”，絕對不是誇大其詞！

真正讓多種模型聯合工作，會解鎖Notebook LM這樣獨特的內容格式和使用者體驗。」

Notebook LM怎麼玩？

玩法很簡單，打開官方頁面，登入Google帳號後，拖曳上傳需要處理的檔案就好了。

檔案可以是Google文件，可以是網站和視訊連結，甚至乾脆貼上一大段文字都可以。支援上傳50個檔案，每個檔案內容上限500000個單詞。

這裡我們上傳了OpenAI o1的System Card文件，接下來就可以選擇需要建立的內容。

內建支援問答、小測驗、目錄、時間線、摘要等文字版功能，以及兩個主持人的深度對話音訊內容。

如果有更個性化的需求也可以自己敲prompt。

我們嘗試用中文提問，結果AI是可以理解的。很可惜的是Notebook LM不支援用中文回答，即使刻意要求也不行。

選擇建立音訊的話，視文件長度需要等待幾分鐘到十幾分鐘。

NotebookLM的背景

NotebookLM由Gemini 1.5 Pro來支援，也就是Google家目前旗艦級大型語言模型。

Gemini 1.5 Pro支援超長128k上下文，這是能解讀長文件的基礎。

在最近的一次升級中，Gemini 1.5 Pro數學和推理能力還反超OpenAI o1預覽版。

好了，剛才生成的音訊也處理完畢，英語好的朋友可以來聽聽看。

英語沒那麼好的朋友，也可以看看套上AI轉寫、翻譯出來的AI文字版，感受一下。

單純的上傳文件，生成內容，還只是Notebook的實用玩法之一。

還有人介紹了學生上課錄音，回家用AI整理重點的玩法，也廣受好評。

（不是自己不聽課了的意思）

具體來說，可以遵循以下步驟：

上課時用手機錄音；
上課期間不需要用電腦，只需（紙筆）記下簡短的重點；
（下課後）把錄音和筆記掃描上傳到NotebookLM，讓它根據錄音細節擴寫筆記。
另外，還可以每週建立一份對所學內容重點的複習音訊。

與單純「聊天」不同的AI互動範式

其實，NotebookLM並不是出道即爆火。

早在去年5月的Google I/O大會上它就已經出現了，不過那個時候，作為AI筆記計畫的它還叫Project Tailwind。到了去年7月，NotebookLM它才改成現在的名字。

起初，只支援美國局部地區的使用者使用；功能也還是圍繞著基礎的Chat模式展開。

▲ NotebookLM自動生成文件指南（來自Google官網）

到了這個月11號，NotebookLM突然宣佈面向全球玩家開放，並且新增了重磅功能，音訊概述。

Google給的官方介紹是這樣的：

「新的音訊概述功能，可以一鍵將文件、幻燈片、圖表等轉化為引人入勝的討論。」

因為互動形式很新、AI語音逼真、討論起來真的很像真人Podcast播客，大家一下就玩嗨了。

到這兩天，Notebook LM不僅已經能夠把Youtube視訊作為輸入，還已經支援超100種語言。現在，AI大神的公開稱讚，更為Notebook LM的熱度「火上加油」。

如Karpathy所說，Notebook LM爆火最主要的原因，是它提供了一種與單純Chat不同的互動範式。Notebook LM消除了大型語言模型的兩大享受障礙：

第一點，聊天其實挺難的。

有些人在日常生活中跟人交流都費盡心力，更別提要和Chatbot聊天，還得不停提問、追問。

NotebookLM好就好在，生成的Podcast對話中，其中有一方就會處於提問、引導角色。我們把文件、音視訊放進去，等待生成，聽AI根據檔案閒聊是了。

第二點，閱讀不是件容易的事。

資訊爆炸的碎片化時代，挑個舒服的姿勢，或者開車時候聽別人討論我需要的東西，比自己費勁吧啦擱那兒看容易得多。——哪怕看的是AI已經幫我們總結出來的凝練版本。

目前Notebook LM的兩大缺點

本著精益求精的精神，也有網友表示了對Notebook LM更上一層樓的期待。

Hyperbolic Labs的聯創兼CTO Yuchen Jin試玩過後，總結了兩個侷限性：

一個是它「看不到」，也就是沒法處理文件內的圖片資訊。不過背後的Gemini是多模態的嘛，相比Notebook LM長眼睛不會太晚。

另一個是使用者無法引導AI Podcast的內容。

Yuchen Jin餵給它兩條推文，它就生成了近13分鐘的音訊內容，但它預設聽眾是一般受眾，所以講了很多很基本的概念。如果能指定生成播客的目標群體，或者談論主題、方向、角度，那真的是棒上加棒。

One More Thing

說時遲那時快，也有開發者搞出開源版的NotebookLM了！

不過暫時只能給它PDF檔案。

參考連結：

[1]https://notebooklm.google/

[2]https://x.com/karpathy/status/1840112692910272898

[3]https://x.com/omarsar0/status/1840145774874898506

[4]https://x.com/Yuchenj_UW/status/1840203324571943403

[5]https://github.com/gabrielchua/open-notebooklm

FB 建議貼文