登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
签到
每天签到奖励2-10圆
导读
排行榜
TG频道
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
VIP申请
VIP网盘
网盘
联系我们
发帖说明
每日签到
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
科技
›
"When Large Language Models Confront Repository-Leve ...
"When Large Language Models Confront Repository-Level Automatic
[ 复制链接 ]
甄婉丽
2025-10-3 11:50:03
介绍
(1) 发表:ICSE'24
(2) 背景
APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文,从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的,例如 Quixbugs,要么无法准确恢复存储库级错误的方案,例如 Defects4J。本文研究了流行 LLM 在处理存储库级维修任务中的性能
(3) 贡献
介绍了
Repobugs
,这是一种新的基准测试,包括来自开源存储库中的 124 个典型的存储库级错误
提出了一个简单而通用的存储库级上下文提取方法
RLCE
,旨在为存储库级的代码修复任务提供更精确的上下文
数据集构建
数据来自 Github 开源项目的 11 个 Python 库,在数据集构建过程中,Repobugs 的错误是具有丰富编程经验的专家人工制定的
NRV:
上下文函数与主函数之间的返回值数量的不一致
NP:
主函数和上下文功能之间的输入参数数量不一致
ORV:
主函数和上下文功能之间的返回参数顺序不一致
OP:
主函数和上下文功能之间的输入参数顺序不一致
CRV:
从上下文功能返回的值与主函数的要求不一致
CP:
主函数和上下文功能要求之间的输入参数不一致
方法
(1) 构建项目结构树
项目结构树源自根节点,其子节点包含子目录和文件,并在存储库的根目录下。文件实体的子节点包括全球定义的变量,类和功能。项目结构树的叶节点仅限于函数节点或变量节点,包括定义函数或变量的代码
(2) 检索代码段
在检索之前,上下文检索工具需要分析和提取错误位置中调用的函数和全局变量,我们将其称为错误的错误函数
(EIF)
。然后定义了四种类型的上下文源,以确定 Retriver 应在何处从项目结构树中提取代码段:
EIF:
检索包含在存储库范围内提取的错误访问函数的定义的代码段
Caller of EIF:
搜索存储库中遇到错误函数的其他出现(不包括错误位置)以获取包含其调用位置的代码段
EF:
包含错误位置的函数
Caller of EF:
检查错误函数是否在存储库中的其他位置调用,如果是,则检索包含调用位置的代码段
(3) Prompt 构建
验证实验
为了确保评估结果的准确性,我们最终采用了手动评估方法,并由两位在 Python 编程方面拥有超过 5 年经验的专家提供了评估结果,使用了四个不同的指标:Related reply,Correct format,Correct repair,Correct explanation
主要还是说明这些 LLM 在 Repobugs 上的修复率与在现有数据集上是不一样的
总结
第一个构建 Reposity-level 的 APR benchmark 的工作
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
When
Large
Language
Models
Confront
相关帖子
【调研】Vision Language Model Safety
monaco-editor 的 Language Services
综述论文解读:Editing Large Language Models
Solon Expression Language (SnEL):轻量高效的Java表达式引擎
Can Language Models Resolve Real-World GitHub Issues
vip免费申请,1年只需15美金$
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
【调研】Vision Language Model Safety
0
1025
锟及
2025-06-03
业界
monaco-editor 的 Language Services
0
61
染悄
2025-06-06
业界
综述论文解读:Editing Large Language Models
0
167
辖瑁地
2025-06-07
业界
Solon Expression Language (SnEL):轻量高效的Java表达式引擎
0
454
账暴
2025-06-23
科技
Can Language Models Resolve Real-World GitHub Issues
0
718
后仲舒
2025-10-03
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
安全
代码
程序
签约作者
程序园优秀签约作者
发帖
甄婉丽
2025-10-3 11:50:03
关注
0
粉丝关注
18
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9999501
dage888
999994
富账慕
10007
4
匝抽
9986
5
孙淼淼
9992
6
柴古香
9993
7
筒濂
9982
8
凌彦慧
9991
9
崔瑜然
9984
10
慢秤
9979
查看更多