最近在研究AI Agent如何调用三方API,整理了一篇文章,分享给大家。
调用三方 API(Function Calling)不是通过提示词(Prompt)来实现的,而是通过函数调用机制(Function Calling),具体流程如下:
1. 模型识别调用需求
大模型在解析用户输入时,会判断是否需要调用某个 API。如果需要,它不会直接生成文本回复,而是调用一个已注册的函数(Function)。
2. API 方法注册
开发者需要在调用API 时,预先定义可用的 API 函数,并提供:
- 函数名称(如 get_weather)
- 参数定义(使用 JSON Schema 描述参数结构)
- 描述信息(帮助大模型理解函数用途)
- {
- "name": "get_weather",
- "description": "获取某个城市的天气信息",
- "parameters": {
- "type": "object",
- "properties": {
- "city": {
- "type": "string",
- "description": "城市名称"
- }
- },
- "required": ["city"]
- }
- }
复制代码 3. 大模型生成函数调用请求
当用户输入类似:
"北京今天的天气怎么样?"
大模型会解析出:- {
- "name": "get_weather",
- "arguments": {
- "city": "北京"
- }
- }
复制代码
4. AI Agent/程序调用三方 API 并返回结果
AI Agent/程序中,可以:
- 调用实际的 API(如天气服务 API)
- 获取数据
- 将数据附加到Prompt中返回给大模型继续处理
示例:- {
- "temperature": "15°C",
- "weather": "晴天"
- }
复制代码 5. 大模型解析结果并返回最终文本
大模型处理 API 返回的数据,并生成自然语言回复给用户:
"北京今天是晴天,气温 15°C。"
总结
- 不是通过提示词(Prompt)来调用 API,而是通过函数调用机制
- 开发者需要预先注册 API 函数
- 大模型识别需求后,自动构造 API 调用参数
- 开发者负责执行 API 请求,并将结果返回 GPT
- 大模型解析 API 结果并生成最终用户可读的回复
周国庆
2025/03/16
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |