LangChain框架入门08：全方位解析记忆组件

炀餮氢 发表于 2025-8-6 09:20:42

在前面的章节中，我们学习了如何使用LangChain构建基本的对话应用，不过在和大语言模型对话时，你可能会注意到大语言模型很快就会失忆，后面聊天提问前面聊过的内容，大语言模型仿佛完全“忘记”了。
为了解决这个问题，LangChain提供了强大的记忆组件（Memory），能够让AI“记住”上下文对话信息。
文中所有示例代码：https://github.com/wzycoding/langchain-study
一、为什么需要记忆组件

大语言模型本质上是经过大量数据训练出来的自然语言模型，用户给出输入信息，大语言模型会根据训练的数据进行预测给出指定的结果，大语言模型本身是“无状态的”，因此大语言模型是没有记忆能力的。
当我们和大语言模型聊天时，会出现如下的情况：
Human:我叫大志，请问你是？
AI：你好，大志，我是OpenAI开发的聊天机器人。
Human:你知道我是谁吗？
AI：我不知道，请你告诉我的名字。我们刚刚在前一轮对话告诉大语言模型的信息，下一轮就被“遗忘了”。当我在ChatGPT官网和ChatGPT聊天时，它能记住多轮对话中的内容，这ChatGPT网页版实现了历史记忆功能。

二、记忆组件实现原理

一个记忆组件要实现的三个最基本功能：

[*]读取记忆组件保存的历史对话信息
[*]写入历史对话信息到记忆组件
[*]存储历史对话消息
在LangChain中，给大语言模型添加记忆功能的方法：

[*]在链执行前，将历史消息从记忆组件读取出来，和用户输入一起添加到提示词中，传递给大语言模型。
[*]在链执行完毕后，将用户的输入和大语言模型输出，一起写入到记忆组件中
[*]下一次调用大语言模型时，重复这个过程
这样大语言模型就拥有了“记忆”功能，上述实现记忆功能的流程图如下：

三、记忆组件介绍

3.1 常见记忆组件

LangChain中的记忆组件继承关系图如下，所有常用的记忆组件都继承自BaseChatMemory类，如果我们自己想实现一个自定义的记忆组件也可以继承BaseChatMemory。

下面是LangChain中常用记忆组件以及它们的特性。
组件名称特性ConversationBufferMemory保存所有的历史对话信息ConversationBufferWindowMemory保存最近N轮对话内容ConversationSummaryMemory压缩历史对话为摘要信息ConversationSummaryBufferMemory结合缓存和摘要信息ConversationTokenBufferMemory基于token限制的历史对话信息3.2 BaseChatMemory简介

下面对BaseChatMemory的核心属性与方法进行分析：
1、属性：
chat_memory: BaseChatMessageHistory类的的对象，BaseChatMessageHistory是真正实现保存历史对话信息功能的类，这里BaseChatMemory并没有在自身去实现聊天消息的保存，而是抽象出BaseChatMessageHistory类，保持各个类遵循单一职责原则，这样做更利于项目的扩展和解耦。
chat_memory: BaseChatMessageHistory = Field(
default_factory=InMemoryChatMessageHistory
)2、方法
save_context()：同步保存历史消息
load_memory_variables()：加载历史记忆信息
clear()：同步清空历史记忆信息
3.3 BaseChatMessageHistory简介

BaseChatMessageHistory是用来保存聊天消息历史的抽象基类，下面对BaseChatMessageHistory的核心属性与方法进行分析：
1.属性：
messages: List：用来接收和读取历史消息的只读属性
2.方法：
add_messages：批量添加消息，默认实现是每个消息都去调用一次add_message
add_message：单独添加消息，实现类必须重写这个方法，否则会抛出异常
clear()：清空所有消息，实现类必须重写这个方法
BaseChatMessageHistory常见实现类如下：

下面是LangChain中常用的消息历史组件以及它们的特性，其中InMemoryChatMessageHistory是BaseChatMemory默认使用的聊天消息历史组件。
组件名称特性InMemoryChatMessageHistory基于内存存储的聊天消息历史组件FileChatMessageHistory基于文件存储的聊天消息历史组件RedisChatMessageHistory基于Redis存储的聊天消息历史组件ElasticsearchChatMessageHistory基于ES存储的聊天消息历史组件四、记忆组件使用方法

下面以最典型的ConversationBufferWindowMemory类和ConversationSummaryBufferMemory类作为示例，来演示记忆组件的使用方法。
4.1 ConversationBufferWindowMemory用法

ConversationBufferMemory是LangChain中最简单的记忆组件，它只是简单将所有的历史对话信息进行缓存，而ConversationBufferWindowMemory与ConversationBufferMemory的主要区别在于：ConversationBufferWindowMemory增加了一个限制，ConversationBufferWindowMemory只返回最近K轮对话的历史记忆，这样做的目的是为了在实现历史记忆和大语言模型token消耗之间寻找一个平衡，如果每次携带的历史消息太长，那么每次消耗的token数量都会非常多。
ConversationBufferWindowMemory使用示例如下，创建ConversationBufferWindowMemory指定return_messages为True，表示加载历史消息时返回消息列表而非字符串，指定k为2，表示最多返回两轮对话的历史记忆。
在链的第一个可运行组件位置，调用了memory组件，并读取了历史记忆，向输入参数列表中添加了一个history参数，它的值就是历史记忆信息，继续传递到下一个可运行组件，在渲染提示词模板时即可使用历史记忆信息，历史记忆信息就和用户提问一起传递给了大语言模型，大语言模型就拥有了历史记忆。
from operator import itemgetter

import dotenv
from langchain.memory import ConversationBufferWindowMemory
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_openai import ChatOpenAI

# 读取env配置
dotenv.load_dotenv()

# 1.创建提示词模板
prompt = ChatPromptTemplate.from_messages([
MessagesPlaceholder("chat_history"),
("human", "{question}"),
])

# 2.构建GPT-3.5模型
llm = ChatOpenAI(model="gpt-3.5-turbo")

# 3.创建输出解析器
parser = StrOutputParser()

memory = ConversationBufferWindowMemory(return_messages=True, k=2)

# 4.执行链
chain = RunnablePassthrough.assign(
chat_history=(RunnableLambda(memory.load_memory_variables) | itemgetter("history"))
) | prompt | llm | parser

while True:
question = input("Human：")
response = chain.invoke({"question": question})
print(f"AI：{response}")
memory.save_context({"human": question}, {"ai": response})执行结果如下，第一轮对话中，Human告诉AI，他叫大志，随后的一轮对话，显然AI已经记住了Human的名字，但是由于我们设置的k值是2，在超过两轮对话之后大语言模型就又进入失忆状态了。
Human：我是大志，你是
AI：你好，大志！我是ChatGPT，很高兴认识你。你今天怎么样？
Human：我是谁
AI：你是大志呀！不过如果你是想探索一下“我是谁”这个哲学问题，那就挺有意思的。你觉得自己是谁？
Human：冰泉冷涩弦凝绝
AI：哦，这句出自唐代词人李清照的《如梦令》。整句是：
**冰泉冷涩弦凝绝，凝绝不通声暂歇。**

Human：别有忧愁暗恨生
AI：这句出自李清照的《如梦令·常记溪亭日暮》：

**“别有忧愁暗恨生。”**

她在这句词中表达的是深深的内心愁绪和无法言说的遗憾。(省略。。。)
Human：我是谁
AI：这个问题有点哲学意味了！你是在问自我认知吗？还是在想“我是谁”这个更深层次的存在意义？每个人对“我是谁”的答案都不一样，这也许是一个可以不断探索、变化的过程。你是想聊聊这个话题吗？
Human：我的名字是什么
AI：嗯，我并不知道你的名字哦！但如果你愿意告诉我，我会很高兴记住的。你喜欢什么名字呢？或者，你对名字有什么特别的想法吗？
Human：4.2 ConversationSummaryBufferMemory用法

ConversationSummaryBufferMemory的用法和上面的ConversationBufferWindowMemory基本一致，区别是ConversationSummaryBufferMemory是一个缓冲摘要混合记忆组件，ConversationSummaryBufferMemory支持当历史记忆超过指定的token数量就会使用指定的llm进行摘要的提取，也就是对原本的对话内容进行概括，再存储到记忆组件，这样就起到了节省token的作用。
代码示例如下，为了演示ConversationSummaryBufferMemory的实际效果，max_token_limit指定为200，并且为llm参数传入一个基于gpt-3.5-turbo大语言模型对象。
from operator import itemgetter

import dotenv
from langchain.memory import ConversationSummaryBufferMemory
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_openai import ChatOpenAI

# 读取env配置
dotenv.load_dotenv()

# 1.创建提示词模板
prompt = ChatPromptTemplate.from_messages([
MessagesPlaceholder("chat_history"),
("human", "{question}"),
])

# 2.构建GPT-3.5模型
llm = ChatOpenAI(model="gpt-3.5-turbo")

# 3.创建输出解析器
parser = StrOutputParser()

memory = ConversationSummaryBufferMemory(return_messages=True,
                                    max_token_limit=200,
                                    llm=ChatOpenAI(model="gpt-3.5-turbo")
                                    )

# 4.执行链
chain = RunnablePassthrough.assign(
chat_history=(RunnableLambda(memory.load_memory_variables) | itemgetter("history"))
) | prompt | llm | parser

while True:
print("========================")
question = input("Human：")
response = chain.invoke({"question": question})
print(f"AI：{response}")
memory.save_context({"human": question}, {"ai": response})
print("========================")
print(f"对话历史信息：{memory.load_memory_variables({})}")执行结果，首先Human提问详细介绍LangChain框架用法，AI回复的内容非常多，肯定超过了200个token，再次读取聊天历史消息，可以看到，多了一条系统消息，并且是用英文描述的。
这段英文描述就是对之前对话内容的摘要，之所以内容是英文的，因为生成摘要的提示词是LangChian内置的，本身就是英文的，在中文场景下使用需要对提示词进行汉化，可以指定prompt属性为自定义的提示词。
========================
Human：详细的介绍一下LangChain框架的用法
AI：**LangChain** 是一个用于构建基于大语言模型（LLM）的应用程序的框架。它提供了强大的功能来处理语言模型与外部数据的交互、自动化任务和多种数据源的处理，帮助开发者更高效地构建应用。

(中间内容省略)

如果你想开始使用 LangChain，可以从基本的 LLM 调用和简单的链式操作入手，逐渐扩展到更复杂的应用场景。
========================
对话历史信息：{'history': }
========================
Human：4.3 历史消息的存储

在前两个示例中，程序重启之后，大语言模型的历史记忆就会丢失，因为在BaseChatMemory内部默认使用的聊天消息历史组件是基于内存存储的InMemoryChatMessageHistory对象，接下来我们将以FileChatMessageHistory为例，将历史消息持久化到当前目录的chat_history.txt文件中，示例代码如下：
from operator import itemgetter

import dotenv
from langchain.memory import ConversationBufferMemory
from langchain_community.chat_message_histories import FileChatMessageHistory
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_openai import ChatOpenAI

# 读取env配置
dotenv.load_dotenv()

# 1.创建提示词模板
prompt = ChatPromptTemplate.from_messages([
MessagesPlaceholder("chat_history"),
("human", "{question}"),
])

# 2.构建GPT-3.5模型
llm = ChatOpenAI(model="gpt-3.5-turbo")

# 3.创建输出解析器
parser = StrOutputParser()

memory = ConversationBufferMemory(
return_messages=True,
chat_memory=FileChatMessageHistory("chat_history.txt")
)

# 4.执行链
chain = RunnablePassthrough.assign(
chat_history=(RunnableLambda(memory.load_memory_variables) | itemgetter("history"))
) | prompt | llm | parser

while True:
question = input("Human：")
response = chain.invoke({"question": question})
print(f"AI：{response}")
memory.save_context({"human": question}, {"ai": response})执行上面的程序，进行对话
Human：你好，我是大志，你是
AI：你好，大志！我是ChatGPT，很高兴认识你。你今天怎么样？
Human：我的名字是
AI：哦，你的名字是大志！刚才我理解错了。那你平时喜欢做什么？
Human：执行了两轮对话后，在当前目录就会生成保存了聊天历史消息的chat_history.txt文件。

chat_history.txt 文件内容
[{"type": "human", "data": {"content": "\u4f60\u597d\uff0c\u6211\u662f\u5927\u5fd7\uff0c\u4f60\u662f", "additional_kwargs": {}, "response_metadata": {}, "type": "human", "name": null, "id": null, "example": false}}, {"type": "ai", "data": {"content": "\u4f60\u597d\uff0c\u5927\u5fd7\uff01\u6211\u662fChatGPT\uff0c\u5f88\u9ad8\u5174\u8ba4\u8bc6\u4f60\u3002\u4f60\u4eca\u5929\u600e\u4e48\u6837\uff1f", "additional_kwargs": {}, "response_metadata": {}, "type": "ai", "name": null, "id": null, "example": false, "tool_calls": [], "invalid_tool_calls": [], "usage_metadata": null}}, {"type": "human", "data": {"content": "\u6211\u7684\u540d\u5b57\u662f", "additional_kwargs": {}, "response_metadata": {}, "type": "human", "name": null, "id": null, "example": false}}, {"type": "ai", "data": {"content": "\u54e6\uff0c\u4f60\u7684\u540d\u5b57\u662f\u5927\u5fd7\uff01\u521a\u624d\u6211\u7406\u89e3\u9519\u4e86\u3002\u90a3\u4f60\u5e73\u65f6\u559c\u6b22\u505a\u4ec0\u4e48\uff1f", "additional_kwargs": {}, "response_metadata": {}, "type": "ai", "name": null, "id": null, "example": false, "tool_calls": [], "invalid_tool_calls": [], "usage_metadata": null}}]关闭程序，重新启动程序，大语言模型依然记得用户的名字。
Human：我的名字是什么AI：你的名字是大志！
来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

页: [1]

程序园's Archiver

LangChain框架入门08：全方位解析记忆组件