找回密码
 立即注册
首页 业界区 业界 Spring AI与DeepSeek实战三:打造企业知识库 ...

Spring AI与DeepSeek实战三:打造企业知识库

利怡悦 2025-6-2 00:33:59
1.png

一、概述

企业应用集成大语言模型(LLM)落地的两大痛点:

  • 知识局限性:LLM依赖静态训练数据,无法覆盖实时更新或垂直领域的知识;
  • 幻觉:当LLM遇到训练数据外的提问时,可能生成看似合理但错误的内容。
用最低的成本解决以上问题,需要使用 RAG 技术,它是一种结合信息检索技术与 LLM 的框架,通过从外部 知识库 动态检索相关上下文信息,并将其作为 Prompt 融入生成过程,从而提升模型回答的准确性;
本文将以AI智能搜索为场景,基于 Spring AI 与 RAG 技术结合,通过构建实时知识库增强大语言模型能力,实现企业级智能搜索场景与个性化推荐,攻克 LLM 知识滞后与生成幻觉两大核心痛点。
关于 Spring AI 与 DeepSeek 的集成,以及 API-KEY 的申请等内容,可参考文章《Spring AI与DeepSeek实战一:快速打造智能对话应用》
 
二、RAG数据库选择

构建知识库的数据库一般有以下有两种选择:
维度向量数据库知识图谱数据结构非结构化数据(文本/图像向量)结构化关系网络(实体-关系-实体)查询类型语义相似度检索多跳关系推理典型场景文档模糊匹配、图像检索供应链追溯、金融风控性能指标QPS>5000复杂查询响应时间>2s开发成本低(API即用)高(需构建本体模型)
搜索推荐场景更适合选择 向量数据库
 
三、向量模型

向量模型是实现 RAG 的核心组件之一,用于将非结构化数据(如文本、图像、音频)转换为 高维向量(Embedding)的机器学习模型。这些向量能够捕捉数据的语义或结构信息,使计算机能通过数学运算处理复杂关系。
向量数据库是专门存储、索引和检索高维向量的数据库系统
2.png

spring-ai-alibaba-starter 默认的向量模型为 text-embedding-v1
可以通过 spring.ai.dashscope.embedding.options.model 进行修改。
 
四、核心代码

4.1. 构建向量数据

创建 resources/rag/data-resources.txt 文件,内容如下:
  1. 1. {"type":"api","name":"测试api服务01","topic":"综合政务","industry":"采矿业","remark":"获取采矿明细的API服务"}
  2. 2. {"type":"api","name":"新能源车类型","topic":"能源","industry":"制造业","remark":"获取新能源车类型的服务"}
  3. 3. {"type":"api","name":"罚款报告","topic":"交通","industry":"制造业","remark":"获取罚款报告的接口"}
  4. 4. {"type":"api","name":"光伏发电","topic":"能源","industry":"电力、热力、燃气及水生产和供应业","remark":"获取光伏发电的年度报告"}
  5. 5. {"type":"api","name":"收益明细2025","topic":"综合政务","industry":"信息传输、软件和信息技术服务业","remark":"2025年的收益明细信息表"}
复制代码
创建向量数据库的 Bean
  1. @Bean
  2. public VectorStore vectorStore(EmbeddingModel embeddingModel
  3.         , @Value("classpath:rag/data-resources.txt") Resource docs) {
  4.     VectorStore vectorStore = SimpleVectorStore.builder(embeddingModel).build();
  5.     vectorStore.write(new TokenTextSplitter().transform(new TextReader(docs).read()));
  6.     return vectorStore;
  7. }
复制代码

  • SimpleVectorStore 是 Spring AI 提供的一个基于内存的向量数据库;
  • 使用 TokenTextSplitter 来切分文档。
4.2. 创建ChatClient
  1. private final ChatClient chatClient;
  2. public RagController(ChatClient.Builder builder, VectorStore vectorStore) {
  3.     String sysPrompt = """
  4.             您是一个数据产品的智能搜索引擎,负责根据用户输入的内容进行精准匹配、模糊匹配和近义词匹配,以搜索相关的数据记录。
  5.             您只能搜索指定的内容,不能回复其他内容或添加解释。
  6.             您可以通过[search_content]标识符来表示需要搜索的具体内容。要求您返回匹配内容的完整记录,以JSON数组格式呈现。
  7.             如果搜索不到内容,请返回[no_data]。
  8.             """;
  9.     this.chatClient = builder
  10.             .defaultSystem(sysPrompt)
  11.             .defaultAdvisors(
  12.                     new QuestionAnswerAdvisor(vectorStore, new SearchRequest())
  13.             )
  14.             .defaultOptions(
  15.                     DashScopeChatOptions.builder()
  16.                             .withModel("deepseek-r1")
  17.                             .build()
  18.             )
  19.             .build();
  20. }
复制代码

  • 通过系统 Prompt 来指定智能体的能力;
  • 通过 QuestionAnswerAdvisor 绑定向量数据库。
4.3. 搜索接口
  1. @GetMapping(value = "/search")
  2. public List<SearchVo> search(@RequestParam String search, HttpServletResponse response) {
  3.     response.setCharacterEncoding("UTF-8");
  4.     PromptTemplate promptTemplate = new PromptTemplate("[search_content]: {search}");
  5.     Prompt prompt = promptTemplate.create(Map.of("search", search));
  6.     return chatClient.prompt(prompt)
  7.             .call()
  8.             .entity(new ParameterizedTypeReference<List<SearchVo>>() {});
  9. }
复制代码
这里通过 entity 方法来实现搜索结果以结构化的方式返回。
4.4. 测试接口

4.4.1. 搜索新能源

3.png

除了模糊匹配了新能源车之外,还匹配了和新能源相关的光伏数据。
4.4.21. 搜索收入

4.png

匹配同义词的收益数据。
 
五、总结

本文以智能搜索引擎场景,通过 RAG 技术,实现了全文搜索、模糊搜索、同义词推荐等功能,并以结构化的方式返回搜索结果。需要注意的是,在企业应用中,要把 SimpleVectorStore 改为成熟的第三方向量数据库,例如 milvus、elasticsearch、redis 等。
 
六、完整代码


  • Gitee地址:
https://gitee.com/zlt2000/zlt-spring-ai-app

  • Github地址:
https://github.com/zlt2000/zlt-spring-ai-app

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册