DeepMind 推出 LATM 框架，可讓 GPT-4 自己產生軟體工具處理任務

DeepMind、普林斯頓大學和史丹佛大學的研究人員近日提出了一項名為 LATM（LLMs As Tool Makers）的創新框架，該框架可以將像 GPT-4 這樣的大型語言模型轉變為工具製造者（即讓模型自己產生軟體工具來處理新任務）。

▲ 圖片來源：Arxiv

LATM 的創新之處在於它為語言模型引入了工具製造和使用的概念，使得模型能夠自主建立適用於不同任務的工具。這一框架不僅能夠提高模型的靈活性和適應性，還能夠為生成式 AI 提供更加高效和經濟的解決方案。該框架主要包含以下兩個關鍵部分：

工具製造：作為工具製造者，LLM 專門為特定任務設計軟體工具，這些工具以 Python 函數的形式實現。
工具使用：另一個 LLM 作為工具使用者，可以呼叫這些軟體工具來處理新的請求。

這種設計可以讓 LATM 能夠將任務分配給最適合的 LLM，將需要具備高強度算力才能實現的工具製造過程可以分配給功能強大、資源密集型的模型，例如 GPT-4；而將相對簡單的使用工具過程分配給輕量級、經濟高效的模型，例如 GPT-3.5 Turbo。這種方法不僅增強了 LLM 解決問題的能力，而且可以顯著降低處理一系列任務的平均運算成本，以最大程度提升框架效率。

▲ 圖片來源：Arxiv