🟡 LLMs使用工具

MRKL系统¹ (Modular Reasoning, Knowledge and Language, pronounced "miracle") 是一种神经符号结构，结合了LLMs（神经计算）和像计算器（符号计算）这样的外部工具，用于解决复杂问题。

MRKL系统由一组模块（例如计算器、天气API、数据库等）和一个路由器组成，决定如何将自然语言查询“路由”到适当的模块。

一个简单的MRKL系统示例是一个可以使用计算器应用程序的LLM。这是一个单模块系统，其中LLM是路由器。当被问到100*100是多少？时，LLM可以选择从提示中提取数字，然后告诉MRKL系统使用计算器应用程序计算结果。这可能如下所示：

100*100是多少？
CALCULATOR [100*100]

MRKL系统将看到单词CALCULATOR，并将100*100插入计算器应用程序中。这个简单的想法可以很容易地扩展到各种符号计算工具。

考虑以下其他应用示例：

一个聊天机器人，能够从用户的文本中提取信息，形成SQL查询，回答有关金融数据库的问题。

苹果公司股票现在的价格是多少？
当前价格为DATABASE[SELECT price FROM stock WHERE company = "Apple" AND time = "now"]。

一个聊天机器人，能够从提示中提取信息，使用天气API检索信息回答有关天气的问题。

纽约的天气怎么样？
天气是WEATHER_API[New York]。

或者更复杂的依赖多个数据源的任务，例如下面这个例子：

示例MRKL系统(AI21)

示例

我使用Dust.tt复现了原始论文中的一个示例MRKL系统，链接在这里。该系统可以读取数学问题（例如20乘以5^6等于多少？），提取数字和运算符号，并将其格式化为计算器应用(例如 20 * 5^6）。然后它将重新格式化的方程式发送给Google的计算器应用程序，并返回结果。请注意，原始论文对路由器（LLM）进行了提示调整，但是我在这个例子中没有进行提示调整。让我们来看看这是如何工作的：

首先，我在Dust的数据集选项卡中制作了一个简单的数据集。