甲骨文宣布,Oracle MySQL HeatWave 除了支援交易處理和分析之外,現在也支援資料庫機器學習 (ML)。這是目前唯一提供此功能的 MySQL雲端資料庫服務。HeatWave ML 可完全自動化ML生命週期,並將所有經過訓練的模型儲存在 MySQL 資料庫中,無須將資料或模型移轉至ML工具或服務。消除擷取、變換及載入 (ETL) 流程可降低應用程式的複雜性及成本,並提升資料和模型的安全性。
HeatWave ML 包含在所有 37個 Oracle Cloud Infrastructure (OCI) 區域的 MySQL HeatWave 資料庫雲端服務中。相較於其他雲端資料庫服務,HeatWave ML 提供以下功能:全自動化模型訓練、 模型和推論解釋、超參數調整、演算法選擇、智慧資料抽樣,以及功能選擇。
目前為止,為 MySQL 應用程式添加機器學習功能對於許多開發人員來說非常困難且耗時。首先,需要將資料從資料庫擷取到另一個系統,以建立與部署ML模型。透過此方式,將機器學習應用於應用程式資料時會建立多個孤島,並隨著資料移動而出現延遲。同時也導致資料庫中資料的擴散,使其安全性更容易受到威脅,並增加了開發人員在多個環境中編程的複雜性。其次,現有服務期望開發人員為指導 ML模型訓練過程的專家,否則模型是次佳的,並會降低預測的準確性。最後,大多數現有的 ML解決方案不包含解釋功能,説明開發人員建置的模型為何能提供特定預測。
MySQL HeatWave ML 透過在 MySQL 資料庫中原生整合機器學習功能來解決這些問題,無須要將資料擷取、變換及載入到另一個服務。HeatWave ML 可完全自動化訓練過程,並為指定資料集和特定作業建立具有最佳演算法、最佳功能以及最佳超參數的模型。同時,HeatWave ML 產生的所有模型都可以提供模型和預測說明。
甲骨文發布的 ML 基準是針對眾多公開存取的機器學習分類與迴歸資料集 (例如 Numerai、Nomao 及 Bank Marketing等) 執行。在較大的 HeatWave 叢集上進行訓練時,更能顯現 HeatWave ML 相較於Redshift ML在性能上的優勢。訓練是一個耗時的過程,由於使用 MySQL HeatWave 可以非常高效和快速地完成,客戶現在可以更頻繁地重新訓練模型,並且隨時掌握資料的變更。這樣一來,模型可保持在最新狀態,並提升預測的準確性。
除了機器學習功能之外,甲骨文還為 MySQL HeatWave 服務推出了更多創新功能。即時彈性功能可讓客戶將 HeatWave 叢集擴展或縮小至任意數目的節點,無須任何停機時間或唯讀時間,也無須手動重新平衡叢集;資料壓縮功能可讓客戶在每個節點多處理 2 倍的資料量,並降低近 50% 的成本,同時保持相同的性價比;而新增的暫停與恢復功能則可讓客戶暫停 HeatWave,以節省成本。恢復時,MySQL Autopilot 所需的資料和統計資料都會自動重新載入 HeatWave 中。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!