HP Z8 Fury G5 王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現

HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現

HP Z8 G4 工作站在 2017 年發表時,憑藉優異的造型設計與效能表現,被譽為「世界上最強大的工作站」,因此擄獲了不少設計領域使用者。在時隔 6 年後超越自我,推出支援最新 CPU 與 GPU 的 HP Z8 G5 Workstation,功能與效能都大幅提升,不但沿用絕美經典造型外觀,型號 HP Z8 Fury G5 更是破天荒的,竟然在緊緻機體中達成,支援四張 NVIDIA RTX A6000 的驚人之舉,這高超的工藝技術,就跟飾演鋼鐵人(Tony Stark) 而紅遍全球的知名演員小勞勃道尼,在 Discovery 新節目《小勞勃道尼打造夢幻車》中,將經典老爺車改造成電動車,保留絕美經典外型,但是整個動力與操控性大幅提升,展現超凡工藝與技術能力,讓開經典老車兼顧效能與環保,有著異曲同工之妙。HP 的工程師們到底施展了什麼魔法,打造出媲美大型伺服器運算能力的 HP Z8 Fury G5,就讓小編帶您一探究竟。

打開 HP Z8 Fury G5 的側板,看到的依然是經典合金護蓋設計,簡單而俐落,打開上下護蓋之後,可以看到原本雙 CPU 設計改成了單 CPU,最高可支援到 56 核心 112 執行緒的 Intel® Xeon® W9 處理器。透過移動記憶體位置,將 CPU 上方空間改造成,可容納一張 NVIDIA RTX A6000 大小,加上將 CPU 下方原本匯流排空間最大化,打造出完整三張 NVIDIA RTX A6000 空間,並在原本電源供應器位置修改設計,放入了兩個 1125W 能源效率 90% 主動式 PFC 電源供應器,能提供高達 2250W 電力來支撐運算所需能量。除了縮減 CPU 數量外,其餘該有的功能一項都沒減少,16 個記憶體插槽可支援最大 2TB 記憶體容量,儲存空間除了上方兩個專屬 M.2 SSD 模組插槽,前方面板還可以安裝四合一 SSD 托架,或是兩個 3.5 吋硬碟托架,最大儲存容量可以上看 100TB 以上。前方面板可選擇標準版 4 個 USB-A 3.2 Gen 1 或是高級版 2 個 USB-A 3.2 Gen 1 和 2 個 USB-C Gen 2×2 (20Gbps),兩種版本都有耳機插孔與選配 SD 讀卡機。後方配置了 6 個 USB-A 3.2 Gen 1 與兩個 1Gb 乙太網路埠,若不是要最大化 GPU 算力(4 個 GPU),還可以額外加裝 10Gb 乙太網路卡與 SSD 擴充卡。另外值得一提的是,CPU 與記憶體具有獨立的散熱系統,搭載了 20 個溫度偵測器與 28 種風扇散熱模式,確保硬體能夠維持在最佳工作溫度,並且保有安靜的工作環境(小編測試過許多其他品牌工作站,運算滿載時所發出的噪音,都像是飛機要起飛一樣)。

HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現

 

HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現

AI 時代來臨、GPU 算力為王

自從 ChatGPT 在 2023 年爆紅之後,等於宣告生成式 AI 時代正式降臨,各行各業都瘋狂投入生成式 AI 相關應用開發,NVIDIA 的股價飆漲了將近 5 倍,可見 GPU 運算能力對於 AI 發展有著密不可分的關連性。動畫與設計業界在時間上相對較早接觸 GPU 運算,2012 年就已經有 GPU 渲染技術投入業界,隨著 NVIDIA RTX 技術上市,GPU 渲染已漸漸成為市場主流,原因就在於「速度」。GPU 渲染應用,早期僅侷限在「預覽」,但是現在品質已經跟 CPU 渲染平起平坐,然而 GPU 渲染速度與同價位 CPU 可以快上數十倍。隨著生成式 AI 崛起,GPU 除了運算能力之外,記憶體也變成決定勝負的關鍵因素。傳統製作流程都需要經過 3D 建模、材質、燈光與渲染這些流程,而生成式 AI 可以在概念設計期間,就提供接近渲染成品的圖像,能夠大幅減少溝通時間,但輸出尺寸若要夠大,就必須擁有更多 GPU 專屬記憶體容量,所以 NVIDIA RTX A6000 擁有 48GB VRAM 就很有優勢,而 HP Z8 Fury G5 可以同時支援 4 張 A6000 進行運算,等同於把機房中大型運算伺服器,濃縮在工作站中,使用者若想要擁有大量 GPU 算力,但不想購買伺服器與管理機房,HP Z8 Fury G5 是不二之選。

HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現

實機測試

這次評測會使用四款軟體來進行測試,都是使用本地端運算資源,生成式 AI 有兩款系統,生成圖像的 Stable Diffousion WebUI 與自建 ChatGPT 的 Text Gen WebUI。繪圖方面有 3ds Max 2024 與 Lumion 2023,都是大家耳熟能詳的老牌製作軟體。評測重點會針對運算時間、記憶體用量、畫面品質與長時間大量運算進行全面性檢驗。小編手上借到的 HP Z8 Fury G5 詳細規格如下表:

處理器 Intel Xeon w7-3455
記憶體 64GB
硬碟 1TB SSD
顯示卡 NVIDIA A6000 48GB
電源供應器 2250W

Stable Diffusion

首先是 Stable Diffusion WebUI 的圖像生成測試,目前有 SD 與 SDXL 兩種圖像模型格式,SDXL 模型原生訓練使用較大圖片,精細度表現上會比較好,測試過程會中透過二次生成來放大原有圖像達到 2.5 倍畫質,檢視所需生成時間與記憶體用量。測試三種場景包含:室外景、室內景與人物。SD 模型生成 1024*576 的圖片時間約在 9 秒左右,放大到 2560*1440 需要 1 分 12 秒,所需記憶體最大為 27.3 GB。

SDXL 模型生成 1536*864 的圖片時間約在 12 秒左右,放大到 3840*2160 需要 3 分 08 秒,所需記憶體為 45.5GB。

目前 Stable Diffusion 經過測試發現,2560*1440 大小圖像需要耗費的記憶體(顯示卡記憶體用完後會用到系統的共用記憶體)大約是 42GB,提高到 3840*2160時會上漲到約 61.3GB,若要直接輸出 4096*4096 大小的圖像,記憶體用量測試時顯示需要到 122GB,這已經超出了一般使用者能提供的硬體規格,但若使用HP Z8 Fury G5 串接兩張 NVIDIA A6000,再加上系統共享記憶體 64GB(主機記憶體 128GB),理論上就能達成需求來完成運算。但是這樣的硬體規格踏過嚴苛,所以 Stable Diffusionu 有其他的放大替代方案,雖然會損失一些效能與細節,但能夠使用一般規格來完成工作。

 HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現     

Text Gen

第二項測試為使用 Text Gen WebUI 建立 ChatGPT 服務,目前有許多企業都在希望能自行建立企業內部 ChatGPT,隨著 OpenAI 與 Meta 都釋出了大型語言模型,讓許多企業用戶都紛紛投入建置。想要擁有 ChatGPT 平台其實並不難,只要安裝好 Text Gen WebUI 並且去 Hugging Face 下載語言模型,就能開始使用。這次測試是使用 TheBloke/WizardLM-33B-V1.0-Uncensored-GPTQ 這個語言模型進行建置,33B 指的是 330 億個參數,若想要做到像是 OpenAI ChatGPT 那樣豐富,模型需要達到 176B 以上規模才行,專用繪圖記憶體要求更是高達 126GB 以上,以 176B 為例就需要使用兩張 H100 或是三張 A6000 才能順利運行。但一般企業針對性資訊較多,使用小一點的模型加 上Lora 理論上就足夠應付需求了。

首先測試 Text Gen WebUI 掛載模型速度與回答問題的反應能力,TheBloke/WizardLM-33B-V1.0-Uncensored-GPTQ 檔案大小為 15.7GB,載入時間為 15.18秒,平均回答反應時間為 2 秒,以這樣的反應速度來看算是相當快速,有使用過 ChatGTP 3 的讀者們,應該能感受到明顯差異(平均回答反應時間約 5~6 秒)。載入後使用 GPU 專屬記憶體為 16.7GB,測試過程順暢無錯誤。接著測試圖文生成效果,同時啟用 Stable Diffusion,讓 Text Gen WebUI 可以直接呼叫,將文字傳送到 SD 後再把圖片回傳,這功能 ChatGPT 也是近期才提供的功能。載入後使用 GPU 專屬記憶體為 22.6GB,圖片大小為 640*512,平均回應時間 5 秒,圖像無明顯錯誤,畫質優良,可見自建具有圖文生成功能,企業私有 ChatGPT 技術已經有明顯突破。

 HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現  

3ds Max 2024

第三項測試使用 3ds Max 2024 搭配 V-Ray 6 來進行渲染測試,由於 AI Denoise 技術已經相當成熟,渲染工作已經不需要像過去一樣,CPU 渲染一張 4K 效果圖,都需要運算 10~20 個小時,若使用 GPU 運算加上 AI Denoise 技術,則一張 4K 效果圖運算時間可以縮短到幾十分鐘以內,透過 AI 技術輔助確實可以更快得到設計師想要的結果。

這次使用的場景檔案為 Evermotion 所購買的室內場景,測試渲染 3840*2160 大小圖像,使用 GPU 渲染並搭配 NVIDIA AI Denoise 技術,渲染運算時間設定為5 分鐘,實際完成時間為 10 分鐘 42 秒 (加上 AI 運算的最終時間),從圖像上可以看到畫質相當精細,沒有明顯錯誤與矂點,完全可以取代 CPU 渲染,運算期間 GPU 專屬記憶體用量為 34.6GB,使用 GPU 運算時,若要維持產生 4K 圖像渲染運算速度,記憶體大小是無法逃避的一個門檻。

 HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現

AI Denoise 4K 原圖

Lumion 2023

Lumion 2023 這個版本也順應市場潮流,加入了硬體 RTX 技術,讓呈現效果更上層樓,同時也搭載了 Denoise 功能,可以有效減少取樣次數,以更快速度達到所需圖像品質,對於室內設計師們來說,光線與陰影效果更精準真實,才能將最美的設計呈現給客戶觀看。在安裝 Lumion 時發現一個有趣的狀況,Lumion 下載的安裝檔大小為 27.8GB,安裝後檔案大小達到 62.5GB,原廠為了讓安裝過程更快速完成,解壓縮時特地善用了 GPU 運算能力,雖然檔案量很大,也可以在很短時間內完成安裝。安裝後執行 Lumion 2023 硬體效能測試,借測的這台 HP Z8 Fury G5,所有項目都拿到了滿分評價。

HP Z8 Fury G5  王者歸來 - 一窺生成式 AI、室內設計 GPU 加速彩現 

所使用的測試場景與第三項相同,但場景材質重新使用 Lumion 內建材質指定,確保成像畫質能夠最佳化。 場景資料量顯示為 17.4 百萬個,算是中型場景,一般室內設計場景大概都會落在 12~24 百萬這範圍內。測試渲染 3840*2160 圖像所需時間,採樣 64 次不使用 RTX 功能,所需計算時間為 16 秒,開啟 RTX 功能後上升為 42 秒,以下是圖像比較。

雖然開啟 RTX 功能後計算時間增加了 26 秒,但是光影效果變得更加柔和與真實,相較於其他渲染軟體都是以分鐘為單位起算,使用了 RTX 功能還是非常有價值。

為什麼值得推薦 HP Z8 Fury G5

NVIDIA CEO 黃仁勳經常在演講時提到一句口號「買越多省越多」,每次台下聽眾都會被逗笑了,但這真的不是一句玩笑話,以現在 CPU 與 GPU 運算能力相比,GPU 真的是買越多省越多。但買越多就需要越多工作站或伺服器環境,才有辦法驅動這龐大算力,加上現在軟體授權費用也水漲船高,許多常用軟體工具都採取租賃方式,每年每一台工作站都需要不斷付費,而 HP Z8 Fury G5 以一台工作站大小,就能提供四張 NVIDIA A6000 (註:目前最高可搭載NVIDIAR RTX 6000 Ada) 良好工作環境,對於想要一次到位頂級運算效能,或是預留為來擴充 GPU 運算能量,同時還能節省軟體授權費用,HP Z8 Fury G5 都是市面上絕無僅有的存在,想要在後疫情時代脫穎而出嗎? 那就絕對不能錯過,這款年度最佳、外觀、效能與性價比三冠王的 HP Z8 Fury G5。

如有興趣了解更多有關HP Z系列工作站及解決方案,請洽HP工作站台灣代理商-精技電腦:

分公司據點:https://bit.ly/3DWuQRH

產品洽詢EMAIL:95e6@unitech.com.tw

Techtion科技行動派
作者

Techtion科技行動派,關注從硬體到軟體各種科技領域,給你不同的開箱、教學、評測內容。也會帶來最新的活動資訊、產業動態,隨時補充科技原力!

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則