登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
签到
每天签到奖励2-10圆
导读
排行榜
TG频道
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
VIP申请
VIP网盘
网盘
联系我们
发帖说明
每日签到
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
RAG系统
RAG系统
[ 复制链接 ]
鞠古香
2025-5-31 23:39:01
在数据准备阶段,系统对多种格式(如PDF、TXT)的文档进行多模解析,转换为统一的文本对象,同时附加元数据(如标题、创建时间),以便于检索和过滤。接着,系统构建正向和倒排索引,为检索提供高效的数据支持。
检索过程分为两个阶段。第一阶段采用BM25算法,利用倒排索引基于词频(TF)和逆文档频率(IDF)快速匹配包含查询关键词的候选文档,初步筛选出相关内容。第二阶段通过BGE-M3模型将查询和候选文档转化为768维嵌入向量,利用FAISS索引执行最近邻搜索,通过余弦相似度计算进行语义排序,进一步提升文档的相关性。
随后,系统使用bge-reranker-v2-m3模型对检索结果进行重排序。该模型将查询与每个候选文档拼接后输入Transformer,重新计算更精确的相似度分数,解决嵌入模型可能因信息压缩导致的精度损失,最终筛选出Top-K最相关文档。
最后,Qwen2模型以重排序后的Top-K文档为上下文,结合用户原始查询生成最终答案并输出给用户。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
RAG
系统
相关帖子
集成移动端推送功能的系统通知公告数据库设计
为什么传统 Bug 追踪系统正在被抛弃?
关键词SEO相关搜索下拉框优化系统按天扣费系统全开源
WPF应用最小化到系统托盘
AI 智能体 RAG 入门教程
集成移动端推送功能的系统通知公告数据库设计
Cloudreve网盘系统程序
多cms养站系统【AI原创】程序
Windows系统下Visual Studio Code (VSCode)中C++的环境配置
4.布局系统
vip免费申请,1年只需15美金$
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
集成移动端推送功能的系统通知公告数据库设计
0
86
步雪卉
2025-10-07
安全
为什么传统 Bug 追踪系统正在被抛弃?
0
591
益竹月
2025-10-07
程序
关键词SEO相关搜索下拉框优化系统按天扣费系统全开源
1
15
新程序
2025-10-08
业界
WPF应用最小化到系统托盘
0
451
癖艺泣
2025-10-09
业界
AI 智能体 RAG 入门教程
0
748
全叶农
2025-10-09
安全
集成移动端推送功能的系统通知公告数据库设计
0
298
楞粳
2025-10-09
程序
Cloudreve网盘系统程序
0
6
新程序
2025-10-10
程序
多cms养站系统【AI原创】程序
0
11
新程序
2025-10-10
安全
Windows系统下Visual Studio Code (VSCode)中C++的环境配置
0
150
吉娅寿
2025-10-10
业界
4.布局系统
0
360
拍棹
2025-10-11
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
科技
签约作者
程序园优秀签约作者
发帖
鞠古香
2025-5-31 23:39:01
关注
0
粉丝关注
27
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9998888
dage888
999994
富账慕
10007
4
匝抽
9986
5
孙淼淼
9992
6
柴古香
9993
7
筒濂
9982
8
凌彦慧
9988
9
崔瑜然
9984
10
慢秤
9979
查看更多