OpenAI不是只有ChatGPT這個產品：九大產品繁雜難以管理、使用者眼花繚亂，還有經費問題要解決

據Supervised報導，雖然OpenAI的最新模型o1在性能上有了顯著提升，但它也給該公司帶來了一個潛在的新挑戰：產品組合繁雜。

OpenAI的最新產品o1和o1-mini，實際上讓使用者和客戶在性能和成本之間做出了權衡：你可以選擇等待更長時間，並暫時支付更多費用，但輸出結果應該會好得多。它不是那種可以插入呼叫中心的應用程式介面（API），但它確實為這家已經覆蓋了一系列細分市場（除了沒有“一個幾乎無所不能的產品”）的公司填補了一種新的細分市場。

o1的應用情境基本上是“你需要稍微思考一下”的問題。美國雲服務管理平台Box CEO亞倫·列維（Aaron Levie）給出了一個極好的企業應用情境，即需要找到合同中一個非常具體的參數——例如，合同的最終簽署日期，也就是合同實際生效的日期。這是一個真正“需要稍微思考一下”的問題，在一個原本簡單的問題上增加了一層複雜性，人們可能在不同的日子簽署了合同。

這對於OpenAI來說也是一種相對較新的應用情境。在過去，OpenAI可能需要呼叫一系列很長的API，並請求模型以提示調整或檢索增強生成（RAG）的形式完成所需任務。相反，整個過程可能會被壓縮成一兩次呼叫，從而簡化某些架構。OpenAI已經經歷了一種“SaaS化”的過程，在這一過程中，OpenAI逐漸成熟，成為一家真正的企業。

OpenAI產品組合日益複雜

隨著OpenAI逐漸發展成為一個真正的企業，其產品組合（或稱為模型組合）日益複雜，OpenAI正面臨著公司產品組合繁雜的挑戰。產品組合越龐大，管理難度就越大，處於這一階段的公司面臨的最大挑戰就是如何避免產品組合變得繁雜，難以向使用者傳達價值。而且隨著模型品質的不斷提高，任何微小的分心都可能導致OpenAI被其他前沿模型公司超越。

Supervised總結了OpenAI現在非常龐大的API組合，共有9個產品:

1、GPT-4o：一個多模態、昂貴（雖然也沒能倖免於降價影響）的模型，應該是通用型的好產品。

2、GPT-4o mini：GPT-4o的削弱版本，旨在作為其主力模型GPT-3.5 Turbo的繼任者，以滿足大量更簡單的應用情境。

上述模型的微調版本，可滿足企業的特定需求，儘管它們通過API提供，這可能會讓一些更注重安全性的公司望而卻步。

3、o1：一個以速度和價格為代價換取品質的模型，允許它有更多時間對答案進行“推理”。基本上就是需要“停下來想一想”的問題。

4、o1-mini：就像4o mini一樣，是o1的削弱版本，設計用於……同樣的“停下來想一想”的問題，但我們可以假設它確實能解決一系列問題。

5、Whisper：可以說是市場上最好的語音轉文字模型，可以肯定的是，它是為生成OpenAI所需的訓練資料而建構的。

6、文字嵌入：算不上最好的嵌入產品，但其優勢通常在於它與其他OpenAI產品一起提供，從而減少了採購的麻煩。

7、文字轉語音：假設延遲正常，你可以將其應用到類似呼叫中心里的API。它有普通和高解析兩個版本的API。

8、高級語音助手：一個技術奇蹟般的產品，它可以讓你在ChatGPT內進行主動對話，儘管其應用情境仍然不太明確。

9、ChatGPT：OpenAI將上述所有內容“產品化”，集合到一個前端企業友好型的包裝中。

在此期間，Meta開始顯示出更多的混亂，它在幾乎每一個類別中都發佈了更新的模型。不過Meta這些模型是開放原始碼的，並為一系列非常不同的產品提供支援，儘管它們存在於同一個“桶”中。通過o1，OpenAI本質上是在再次嘗試建立新的類別，但同時也冒著產品組合繁雜的風險。

OpenAI和其競爭對手的產品定價

下面對比了OpenAI和其競爭對手的產品定價：

OpenAl的產品在價格和用途上存在差異（圖源：X）

這些費用可能遠未達到o1發佈一段時間後的水平。OpenAI已經開始逐步增加速率限制，最近o1-preview從每週30個增加到50個，o1-mini從每週50個增加到每天50個。

OpenAI在社群平台X上分享道，將逐步增加o1-preview和o1-mini的速率限制（圖源：Supervised）

雖然OpenAI的吸引力一直在於便利、價格和性能之間的某個最佳平衡點，但其繁雜的產品組合無疑既是挑戰也是機遇。該文章作者馬修·林利（Matthew Lynley）嚴重懷疑價格不會一直這麼高，因為其下一個GPT模型遲早會準備好。但就目前而言，它至少在試圖籌集巨額資金的時候，開發者擁有了一些價格較高的產品當作談判籌碼。

然而，這裡的挑戰與任何成熟企業隨時間開始面臨的挑戰相同：產品繁雜。雖然OpenAI在技術上以API和ChatGPT的形式擁有“兩個”產品，但這些產品都有大量的分支，服務於非常廣泛的應用情境。這些API也遠遠超出了聊天補全和文字生成的範圍，包括了各種各樣的模態。而它的語音產品看似是ChatGPT“驚豔”的部分，其實可能是其產品組合中最尷尬的部分。

從初創公司走向企業的必經之路

產品繁雜在創業領域是一個公認的問題，如果你還能稱OpenAI為一家初創公司的話。隨著初創公司的成熟，其使用者和客戶群的不斷擴大，它必須有方向性地發展，更少的產品滿足更多客戶的需求，而不是為每個人建構一切。或者更簡潔地說，做幾件事，但都要做好。

提供如此廣泛的應用情境，讓OpenAI能夠將使用者引導到某種穩定狀態，在這種狀態下，它不一定賺錢，但至少不會虧本。

在API方面，傳統的做法是將使用者推向其主力模型（特別是微調版本），但對於ChatGPT而言，這一點就不太清楚了。

雖然新模型在ChatGPT中是有速率限制的，但這也是OpenAI除了API之外極其重要的業務部分。據The Information報導，OpenAI COO布拉德·萊特卡普（Brad Lightcap）告訴員工，OpenAI擁有超過1000萬名ChatGPT的付費訂閱使用者，另外還有100萬名企業訂閱使用者。（彭博社此前曾報導，OpenAI有100萬名ChatGPT的企業訂閱使用者。）

當然，我們可以做很多粗略的計算，但都會得出相同的結論：除了API之外，ChatGPT的企業業務現在和將來都會是OpenAI業務的重要組成部分。

但ChatGPT帶來的收入並不會像API那樣，直接隨著o1的使用而增長。無論是通過API還是ChatGPT內部運行o1，實際運行它的成本可能會隨著預訓練計算資源轉向推理而發生變化。

幸運的是，OpenAI在這一領域已經有了很多進展。業內人士目前額外關注的一種方法是蒙特卡洛樹搜尋（Monte Carlo Tree Search），它可以減少生成高品質結果所需的計算量。蒸餾（distillation）是另一種“縮小”大模型的方法，隨著人們的興趣轉向管理高性能模型的推理成本，蒸餾法也獲得了很大的發展。（蒸餾是一種機器學習模型壓縮方法，它用於將大型模型的知識遷移到較小的模型中。）

“這就是甜點，將傳統預測性機器學習的策略與現代技術相結合。”模型開發商和平台h2o的聯合創始人兼CEO斯里·安巴蒂（Sri Ambati）告訴馬修，“樹狀搜尋是一個絕對的天才技巧，它是一種非常容易實現的目標，與大語言模型的卓越性相結合。”

在與專家和知情人士交談的交談中，最常提到的另一點是諾姆·布朗（Noam Brown）在OpenAI的工作。布朗被廣泛認為是博弈論領域的頂尖專家，許多人都想知道他的工作將如何應用到OpenAI的產品中。布朗還是一篇論文的共同作者，該論文部分研究了蒙特卡洛樹搜尋在開發類人代理中的應用。