亞馬遜宣佈推出Nova多模態AI模型系列

亞馬遜的雲端運算部門亞馬遜網路服務（AWS）在其 re:Invent 2024 大會上宣佈了一個名為 Nova 的新的生成式人工智慧多模態模型系列。該系列共有四種以文字為重點的模型（可接收文字、圖像或影片並輸出文字的模型）：Micro、Lite、Pro 和 Premier。

亞馬遜首席執行長安迪-賈西（Andy Jassy）在台上說，Micro、Lite 和 Pro 目前已面向 AWS 客戶提供，而 Premiere 將於 2025 年第一季度推出。

除此之外，還有一個圖像生成模型 Nova Canas 和一個影片生成模型 Nova Reel。這兩個模型目前都可以公開使用。

賈西說：「我們正在繼續研究我們自己的進階模型，在過去的四五個月裡，這些模型取得了巨大進步。我們認為，如果我們發現了它們的價值，你們也可能會發現它們的價值。」

基於文字的 Nova 模型主要根據其功能和大小來區分。

Amazon Nova Micro - 純文字模型，具有最低的延遲響應，上下文長度為 128K 標記。它還支援微調和模型提煉，以提高精準性。目前已全面上線。
Amazon Nova Lite - 一種成本極低的多模態模型，可處理圖像、影片和文字輸入，並生成文字輸出。它支援長度達 300K 標記的輸入，可在單次請求中分析圖像或長達 30 分鐘的影片。它還支援微調和模型提煉，以提高精準性。目前已全面上線。
Amazon Nova Pro - 高性能多模態模型，可處理多達 30 萬個輸入詞元。這款新模型在關鍵基準上實現了最先進的性能。它支援 30 萬個代幣的輸入上下文，可作為教師模型，用於提煉亞馬遜 Nova Micro 和 Lite 的自訂變體。目前已全面上線。
Amazon Nova Premier - 亞馬遜即將推出的用於複雜推理任務的能力最強的多模態模型，目前仍在培訓中。預計將於 2025 年初全面上線。
Amazon Nova Canvas - 一種圖像生成模型，可根據提示中提供的文字或圖像建立圖像。它還支援使用文字輸入和用於調整配色方案和佈局的控制項編輯圖像。目前已全面上線。
Amazon Nova Reel - 一種全新的先進影片生成模型，可根據文字和圖像建立高品質的 6 秒影片。亞馬遜將在 2025 年支援 2 分鐘的影片。亞馬遜 Nova Reel 將支援控制視覺風格和節奏的功能，包括使用文字提示控制攝影機運動。它已於今日全面上線。

Jassy 說：「亞馬遜正在開發語音到語音模型和"任意到任意"模型，應該會在 2025 年年中左右推出。您可以輸入文字、語音、圖像或視訊，也可以輸出文字、語音、圖像和影片。」