AI开发-python-langchain框架（1-9 返回字符串列表-格式解析器）

墨淳雅 · 4 小时前

大模型输出结果通常都是文本信息，如何让他按照你期望的格式输出？
这段代码演示了如何使用LangChain将大语言模型的自由文本输出转换为结构化的字符串列表。核心目标是让模型返回逗号分隔的多个值，并通过专用解析器自动拆分为Python列表。
CommaSeparatedListOutputParser专用于解析逗号分隔的文本，自动处理空格、引号等边界字符，输出类型为List[str]。与StrOutputParser返回纯字符串不同，它强制将响应拆分为离散元素，适用于多值提取场景。提示词设计必须显式约束输出格式。通过partial_variables注入格式指令（如"内容1, 内容2, 内容3"），引导模型生成符合解析器要求的纯列表文本。若缺少格式约束，模型可能返回自然语言描述，导致解析器机械分割产生语义错误。代码如下：

from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
import os
#输出-字符串列表
output_parser = CommaSeparatedListOutputParser()
#这里指定分隔符
format_instructions = "您的响应应该是csv格式的逗号分隔值的列表，例如：'内容1, 内容2, 内容3'"
#构建提示词-给出样例，提高返回的准确率
prompt = PromptTemplate(
template="{format_instructions}\n请列出五个 {subject}.",
input_variables=["subject"],
partial_variables={"format_instructions": format_instructions},
)
#输出提示词
print('#######################')
print(prompt.invoke({"subject": "宠物狗的品种"}).text)
print('#######################')
llm = ChatOpenAI(
api_key=os.getenv("DEEPSEEK_API_KEY"),
base_url=os.getenv("BASE_URL"), # Deepseek 的 API 基础地址
model="deepseek-v3:671b", # Deepseek 对话模型（可选：deepseek-chat-pro 等高级模型）
temperature=0.7, # 温度参数（0-1，越低越稳定）
max_tokens=1024 # 最大生成 tokens
)
chain = prompt | llm | output_parser
result = chain.invoke({"subject": "宠物狗的品种"})
print(result)

复制代码

输出结果如下：
#######################
您的响应应该是csv格式的逗号分隔值的列表，例如：'内容1, 内容2, 内容3'
请列出五个宠物狗的品种.
#######################
["'拉布拉多", '金毛寻回犬', '德国牧羊犬', '贵宾犬', "比格犬'"]

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

账号		自动登录	找回密码
密码			立即注册

AI开发-python-langchain框架（1-9 返回字符串列表-格式解析器）

相关帖子

签约作者

AI开发-python-langchain框架（1-9 返回字符串列表-格式解析器）

相关帖子

相关推荐

签约作者