深入探讨Function Calling:实现外部函数调用的工作原理
引言
Function Calling
是一个允许大型语言模型(如 GPT
)在生成文本的过程中调用外部函数或服务的功能。
Function Calling
允许我们以 JSON
格式向 LLM
模型描述函数,并使用模型的固有推理能力来决定在生成响应之前是否调用该函数。模型本身不执行函数,而是生成包含函数名称和执行函数所需的参数的 JSON
。
function calling 执行原理
现在我们定义提示词像大语言模型问一下当前北京的天气?
因为
LLM
大语言模型缺乏实时数据,所以无法回答实时数据这种场景。
我们用SK
来测试一下
Console.WriteLine("===>没有设置function calling=<===");
{
var kernel = Kernel.CreateBuilder().AddAzureOpenAIChatCompletion(config.ModelId,
endpoint: config.Endpoint,
apiKey: config.ApiKey).Build();
var template = "当前北京的天气?";
Console.WriteLine($"User: {template}");
var function = kernel.CreateFunctionFromPrompt(template);
var functionResult = await function.InvokeAsync(kernel);
Console.WriteLine($"Assistant:{functionResult}");
}
输出:
User: 当前北京的天气?
Assistant:对不起,作为一个AI,我无法为你提供实时信息。你可以查看可信的天气应用或网站来获取当前北京的天气。
这时候就需要用到
LLM
的Function Calling
功能来帮助回答用户的问题
使用 OpenAI API function calling
OpenAI
的 function calling
的核心是我们将Prompts
提示词和可用函数
列表一起发送给LLM
。
OpenAI Chat Completions 接口
{
"tool_choice": "auto",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "我想知道现在北京的天气状况"
}
],
"tools": [
{
"type": "function",
"function": {
"name": "Get_Weather_For_City",
"description": "获取指定城市的天气",
"parameters": {
"type": "object",
"properties": {
"cityName": {
"type": "string",
"description": "城市名"
}
}
}
}
}
]
}
核心参数解释
tool_choice:
这个参数决定了模型是否应该自动选择是否调用函数。值为 "auto"
表示模型将根据情况自动决定是否调用函数。 默认情况下,如果请求中不存在任何函数,则将其设置为“none”
,则设置为“auto”
。
tools
在 tools
部分定义了一个函数,这个函数可以被 OpenAI 的模型调用。以下是 tools
部分参数的简单解释:
type: 指定了这个工具的类型,这里是
"function"
,表示这是一个函数调用。function: 包含函数的详细信息,是一个对象。
name: 函数的名称,这里是
"Get_Weather_For_City"
,这是调用时使用的函数名。description: 函数的描述,这里是
"获取指定城市的天气"
,用于说明这个函数的作用。parameters: 定义了函数调用时需要的参数,是一个对象。
type: 参数对象的类型,这里是
"object"
,表示参数是一个对象类型。properties: 包含具体的参数定义,是一个对象,每个属性对应一个参数。
- cityName: 这是一个参数的名称,表示城市名称。
- type: 此参数的类型,这里是
"string"
,表示参数应该是一个字符串。 - description: 参数的描述,这里是
"城市名"
,用于解释这个参数的意义。
- type: 此参数的类型,这里是
- cityName: 这是一个参数的名称,表示城市名称。
这个 tools
部分定义了一个名为 Get_Weather_For_City
的函数,它需要一个名为 cityName
的字符串参数,用于指定想要查询天气的城市。当模型需要调用这个函数时,它将使用这个参数来获取相应的天气信息。
function calling 输出
{
"id": "chatcmpl-9TOuIqnuMirU3BUDluCrHMTlsjz97",
"object": "chat.completion",
"created": 1716794282,
"model": "gpt-4",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": null,
"tool_calls": [
{
"id": "call_DQU6OKHWyv3HVLyWVjSRqvwZ",
"type": "function",
"function": {
"name": "Get_Weather_For_City",
"arguments": "{\n \"cityName\": \"北京\"\n}"
}
}
]
},
"logprobs": null,
"finish_reason": "tool_calls"
}
],
"usage": {
"prompt_tokens": 83,
"completion_tokens": 20,
"total_tokens": 103
},
"system_fingerprint": null
}
最核心的方法是tool_calls
回参里面返回了我们需要的方法名和一个 json
参数 比如"{\n \"cityName\": \"北京\"\n}"
包含了我们的参数和值。
返回函数结果上下文
{
"max_tokens": 3000,
"tool_choice": "auto",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "我想知道北京的天气状况"
},
{
"role": "assistant",
"function_call": {
"name": "Get_Weather_For_City",
"arguments": "{\n \"cityName\": \"北京\"\n}"
}
},
{
"role": "function",
"name": "Get_Weather_For_City",
"content": "27度,晴朗"
}
],
"tools": [
{
"type": "function",
"function": {
"name": "Get_Weather_For_City",
"description": "获取指定城市的天气",
"parameters": {
"type": "object",
"properties": {
"cityName": {
"type": "string",
"description": "城市名"
}
}
}
}
},
{
需要把上下文信息和function calling
的result
回答的信息传给LLM
ToolCall
上下文信息
{
"role": "assistant",
"function_call": {
"name": "Get_Weather_For_City",
"arguments": "{\n \"cityName\": \"北京\"\n}"
}
}
ToolCallResponse
{
"role": "function",
"name": "Get_Weather_For_City",
"content": "27度,晴朗"
}
LLM 输出
{
"id": "chatcmpl-9TRZBqCcRMBYIojuZimio6GOpsTi4",
"object": "chat.completion",
"created": 1716804505,
"model": "gpt-4",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "北京的天气状况是27度,晴朗。"
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 133,
"completion_tokens": 19,
"total_tokens": 152
},
"system_fingerprint": null
}
到现在为止简单的function calling
的简单调用已经完成了
具体的流程可以总结为
可以看到function calling
跟大预言模型至少有两次交互的的过程
总结
根据文档中的描述,OpenAI
的函数调用(function calling
)过程可以简化为以下几个步骤,并且可以用一个流程图来表示:
- 用户提出问题。
- 系统接收到问题,并检查是否有可用的函数可以调用。
- 如果有,系统会生成一个工具调用请求(ToolCall),并发送给应用程序。
- 应用程序执行请求的函数,并返回结果。
- 系统将函数的响应(ToolCallResponse)发送回 LLM 模型。
- LLM 模型使用这个响应来生成最终的用户响应。
下面是一个简化的流程图,描述了上述过程:
在这个流程图中:
- A 代表用户。
- B 是用户提出的问题。
- C 是
LLM
模型,它检查是否有函数可以调用。 - D 是生成工具调用(
ToolCall
)的步骤。 - E 是应用程序,它接收
ToolCall
并执行相应的函数。 - F 是应用程序返回的
ToolCallResponse
,即函数执行的结果。 - G 是 LLM 模型,它使用
ToolCallResponse
来生成用户响应。 - H 是最终接收到用户响应的用户。
这个流程图是基于文档内容的简化表示,实际的系统可能包含更多的细节和步骤。
最后
本章的主要了解function calling
及其工作原理的简单介绍。在下一篇博客中,我们 x 学习在Semantic kernel
下使用使用function calling
。
参考资料
深入探讨Function Calling:实现外部函数调用的工作原理的更多相关文章
- function calling convention
这是2013年写的一篇旧文,放在gegahost.net上面 http://raison.gegahost.net/?p=31 February 19, 2013 function calling c ...
- How Javascript works (Javascript工作原理) (一) 引擎,运行时,函数调用栈
个人总结:该系列文章对JS底层的工作原理进行了介绍. 这篇文章讲了 运行时:js其实是和AJAX.DOM.Settimeout等WebAPI独立分离开的 调用栈:JavaScript的堆内存管理 和 ...
- 【深度探索c++对象模型】Function语义学之成员函数调用方式
非静态成员函数 c++的设计准则之一就是:非静态成员函数至少和一般的非成员函数有相同的效率.编译器内部已将member函数实体转换为对等的nonmember函数实体. 转化步骤: 1.改写函数原型以安 ...
- PatentTips – Java native function calling
BACKGROUND OF INVENTION This invention relates to a system and method for providing a native functio ...
- [转]ARM64 Function Calling Conventions
from apple In general, iOS adheres to the generic ABI specified by ARM for the ARM64 architecture. H ...
- JavaScript外部函数调用AngularJS的函数、$scope
x 场景: 需要在用FusionCharts画的柱状图中添加点击事件,But弹出框是Angularjs搞的,我想的是直接跳到弹出框的那个路由里,然后在弹出框的控制器中绑定数据即可: /* 点击事件 * ...
- V-rep学习笔记:外部函数调用方式
The remote API functions are interacting with V-REP via socket communication in a way that reduces l ...
- Python 外部函数调用库ctypes简介
Table of Contents 1. 参考资料 2. ctypes简介 2.1. 数据类型 2.2. 调用.so/.dll 2.2.1. 加载动态链接库 2.2.2. 调用加载的函数 2.2.3. ...
- java8学习之Lambda表达式继续探讨&Function接口详解
对于上次[http://www.cnblogs.com/webor2006/p/8186039.html]已经初步引入的Java8中Stream流的概念,其中使用了map的操作,它需要接受一个Func ...
- Java HashMap工作原理深入探讨
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...
随机推荐
- mysql 必知必会整理—sql 计算函数[六]
前言 简单整理一下sql的计算函数. 正文 函数没有SQL的可移植性强 能运行在多个系统上的代码称为可移植的(portable).相对来说,多数SQL语句是可移植的,在SQL实现之间有差异时,这些差异 ...
- 重学c#系列——索引器(十)
前言 对于索引器,我们肯定不会陌生.为什么会有索引器这个东西呢?我们发现这东西很像是属性,只是通过索引方式去调用,那就慢慢揭开他的面纱吧. 正文 假设我们要对外暴露一个数组,为了体现其封装性,我们使用 ...
- pytorch两种模型保存方式
只保存模型参数 # 保存 torch.save(model.state_dict(), '\parameter.pkl') # 加载 model = TheModelClass(...) model. ...
- vue+mockjs模拟用户登录接口(高仿书旗)
项目demo:http://39.103.131.74:8888/shuqi
- NIFI简介
NIFI简介 首先是官网地址:Apache NiFi,不过会百度的估计都能搜到 因为后面的工作一定会用到,所以大致的听了一下讲解操作之类的 大概感觉就是NIFI是个web端的一种控制数据走向的工具?可 ...
- watch对比computed
总结: computed和watch之间的区别: 1.computed能完成的功能,Watch都可以实现 2.watch能完成的功能,comp ...
- 力扣532(java&python)-数组中的 k-diff 数对(中等)
题目: 给你一个整数数组 nums 和一个整数 k,请你在数组中找出 不同的 k-diff 数对,并返回不同的 k-diff 数对 的数目. k-diff 数对定义为一个整数对 (nums[i], n ...
- 力扣165(java)-比较版本号(中等)
题目: 给你两个版本号 version1 和 version2 ,请你比较它们. 版本号由一个或多个修订号组成,各修订号由一个 '.' 连接.每个修订号由 多位数字 组成,可能包含 前导零 .每个版本 ...
- 阿里云荣获可信云容器安全能力先进级认证, ACK/ACR为企业级安全护航
阿里云关注企业级用户的Kubernetes生产落地痛点,结合企业生产环境的大量实践,全面帮助企业真正落地云原生架构.安全侧问题,是众多大中型或金融领域企业的核心关注点. 端到端云原生安全架构 早在20 ...
- [FAQ] 前端 点击事件或链接 如何打开两个外部窗口
点击链接支持 blank,但无法打开多个,考虑使用绑定 click 事件的方式. window.open 的采用需要有主动点击的情况,否则浏览器可能拦截. 如果是外部窗口,在点击时,优先使用 wind ...