Jetson Orin Nano Super開發套件動手玩,單板電腦也能跑AI聊天機器人

Jetson Orin Nano Super開發套件動手玩,單板電腦也能跑AI聊天機器人

ADVERTISEMENT

NVIDIA先前推出AI運算效能大幅提升的Jetson Orin Nano Super開發套件,強調能將AI應用程式導入邊緣運算的能力,我們就來動手架設AI聊天機器人。

升級Super版解放20 W TDP

NVIDIA在2024年聖誕節前夕推出Jetson Orin Nano Super開發套件,除了將價格砍半之外,規格部分將原本TDP上限的15 W提高至20 W,處理器(CPU)、繪圖處理器(GPU)的時脈分別由1.5 GHz、625 MHz提高至1.7 GHz、1020 MHz,記憶體頻寬也由68 GB/s提高至102 GB/s,讓系統最高AI運算能力由原本的40 TOPS提高至67 TOPS,成長幅度超過50%。

延伸閱讀:
NVIDIA推出加強版的Jetson Orin Nano Super:性能達 67 TOPS,價格約台幣8200元
Jetson Orin Nano開發套件動手玩(一):規格介紹與開箱
Jetson Orin Nano開發套件動手玩(二):效能實測

根據NVIDIA官方提供的資料,「Super版」Jetson Orin Nano Super開發套件在多款AI模型推論運算的效能表現,比原始版本高出28% ~ 104%不等,雖然TDP有所提升,但20 W的功耗仍相當低,適合應用於小型邊緣運算裝置,並在這些裝置本機執行AI應用程式,能夠賦予智慧音箱、機器人、自走車等裝置更多元的AI功能。

如果讀者手上有原始版本Jetson Orin Nano開發套件,則可參考NVIDIA官方網站的說明,安裝JetPack 6.1作業系統並透過指令開啟「MAXN電源模式」,解放20 W TDP並獲得更高的效能。

相關連結:Jetson Orin Nano開發套件升級為「Super版」之官方說明

Jetson Orin Nano Super開發套件基本上與先前推出的原始版本硬體相同,原始版本也可以透過軟體、韌體更新升級至「Super版」。

原始版與「Super版」(右)Jetson Orin Nano開發套件之規格對照。

「Super版」在執行大型語言模型AI推論運算的效能為原始版本的1.28~1.63倍

執行視覺語言模型AI推論運算的效能則達1.36~2.04倍。

執行視覺變換模型(Vision Transformer)AI推論運算的效能則達1.43~1.69倍。

▲youjiang yu YouTube頻道所進行的大型語言模型AI推論運算展示,可以看到不同TDP設定下,生成文字的速度差異。

實戰聊天機器人

筆者這次收到的測試樣品為「Super版」Jetson Orin Nano Super開發套件,透過OllamaOpen-webui執行Llama 3.2B大型語言模型,並搭配我自己寫的文章作為RAG(Retrieval Augmented Generation,檢索增強生成)之參考之資料。

RAG的好處在於能夠快速客製化聊天機器人的「大腦」,而不需要花費大量運算效能與時間重新訓練大型語言模型。使用者只需將參考資料、文件等檔案輸入RAG資料庫,就能讓模型在AI推論運算過程中參閱,並利用這些資料做出更準確的回應,適合將最新的資訊或企業、專屬應用情境的補充資料導入聊天機器人,而不需在使用過程中仰賴雲端服務,對邊緣裝置來說相當重要。

從下方的展示也可以看出,Jetson Orin Nano Super開發套件能在消費20 W電力的情況下,提供流暢的聊天機器人體驗,很適合應用於小型裝置的開發。開發者可以先利用開發套件打造試作機,並在實際製作正式版本或量產時改為使用Orin Nano Super或Orin NX Super等運算模組(SoM),以利縮小裝置的尺寸。

在開始之前,先確認已切換至TDP為20 W的「MAXN電源模式」。

Ollama搭配Open-webui能夠在Jetson Orin Nano Super開發套件架設AI聊天機器人,並透過網頁介面輕鬆操作。

我們可以直接在Open-webui介面中下載Llama 3.2B大型語言模型。

如果詢問比較舊的問題,而大型語言模型的訓練資料有包含相關資訊,它就能做出回應。

▲透過影片看到Llama 3.2B的運作相當流暢,但……也不是所有問題都能答對。

接下來看到在沒有使用RAG的情況下,詢問Llama 3.2B所得到的回應就會是訓練當時比較舊的資訊。

筆者透過RAG功能將最新的資訊導入Ollama的資料庫。

並在執行環境將模型設定為Llama 3.2B加上PCADV資料庫。

如此一來就能將最新資訊快速整合至既有模型,並提高回答的準確度。

Jetson Orin Nano開發套件原本就有不錯的「繪圖效能」,在「Super版」解放系統TDP限制之後,GPU的時脈也獲得顯著提升,這也意味著……,它執行遊戲的能力也跟著獲得改善,讓人不禁想要試試它的潛力如何。

筆者預計會找時間試試在Jetson Orin Nano Super開發套件上跑些有趣的程式,如果有進展的話,日後再來與各位讀者分享成果。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則