登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
【技巧帖】 DolphinScheduler 任务数据清理与备份策略, ...
【技巧帖】 DolphinScheduler 任务数据清理与备份策略,确保页面不卡顿
[ 复制链接 ]
炀餮氢
2025-6-10 23:44:42
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
问题描述
由于 Apache DolphinScheduler 长期运行,任务数量不断增加,相关任务数据主要存储在数据库中的 t_ds_task_instance 和 t_ds_process_instance 两张表中。
随着这两张表数据量的持续增长,导致系统页面出现卡顿现象。
解决方案
为解决上述问题,采取的措施是定期清理数据库中 t_ds_process_instance 和 t_ds_task_instance 两张表中一个月之前的数据。
数据备份
在进行数据清理之前,首先备份原表数据,以确保数据安全。
use dolphinscheduler;
-- 创建备份表 t_ds_process_instance_backup20241120 和 t_ds_task_instance_backup20241120
CREATE TABLE t_ds_process_instance_backup20241120 LIKE t_ds_process_instance;
CREATE TABLE t_ds_task_instance_backup20241120 LIKE t_ds_task_instance;
-- 将原表数据备份到相应的备份表中
INSERT INTO t_ds_process_instance_backup20241120
SELECT * FROM t_ds_process_instance;
INSERT INTO t_ds_task_instance_backup20241120
SELECT * FROM t_ds_task_instance;
复制代码
检查备份情况
为了确保备份操作成功,可以检查备份表和原表的数据行数。
-- 检查备份表的数据行数
SELECT COUNT(*) FROM t_ds_process_instance_backup20241120;
SELECT COUNT(*) FROM t_ds_task_instance_backup20241120;
-- 检查原表的数据行数
SELECT COUNT(*) FROM t_ds_process_instance;
SELECT COUNT(*) FROM t_ds_task_instance;
复制代码
数据清理
在备份完成并确认无误后,执行清理操作,删除 2024年10月19日 23:59:59 之前 的数据。
-- 删除 t_ds_task_instance 表中 2024年10月19日 23:59:59 之前的数据
DELETE FROM t_ds_task_instance
WHERE submit_time < '2024-10-19 23:59:59';
-- 删除 t_ds_process_instance 表中 2024年10月19日 23:59:59 之前的数据
DELETE FROM t_ds_process_instance
WHERE end_time < '2024-10-19 23:59:59';
复制代码
参考:https://blog.csdn.net/weixin_40255084/article/details/141442462
本文由 白鲸开源 提供发布支持!
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
技巧
DolphinScheduler
任务
数据
清理
相关帖子
AlmaLinux下mysql 8安装与数据迁移
详解 MicroPython 驱动中数据与业务逻辑的分离设计
像Git一样管理数据:深入解析数据库并发控制MVCC的实现
Hadoop大数据在2025-2026年和AI智能问数平台的规划与实践
Quartz定时任务持久化(服务重启后自动恢复)
从海量数据到 AI 决策的落地方法
期货数据对接指南,用于获取黄金、白银、原油等大宗商品的数据。
期货数据对接指南,用于获取黄金、白银、原油等大宗商品的数据。
大疆不同任务类型执行逻辑,上云API源码分析
一种可落地的任务令牌锁机制:设计原理、实战经验与容器化演进
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
AlmaLinux下mysql 8安装与数据迁移
1
329
菅舛
2025-12-07
安全
详解 MicroPython 驱动中数据与业务逻辑的分离设计
0
298
那虻
2025-12-07
业界
像Git一样管理数据:深入解析数据库并发控制MVCC的实现
0
71
虾氲叱
2025-12-08
业界
Hadoop大数据在2025-2026年和AI智能问数平台的规划与实践
0
685
挚魉
2025-12-09
安全
Quartz定时任务持久化(服务重启后自动恢复)
1
688
讲怔
2025-12-09
业界
从海量数据到 AI 决策的落地方法
0
761
梁宁
2025-12-09
安全
期货数据对接指南,用于获取黄金、白银、原油等大宗商品的数据。
0
801
府扔影
2025-12-11
安全
期货数据对接指南,用于获取黄金、白银、原油等大宗商品的数据。
0
15
赏勿
2025-12-11
业界
大疆不同任务类型执行逻辑,上云API源码分析
0
49
迭婵椟
2025-12-12
安全
一种可落地的任务令牌锁机制:设计原理、实战经验与容器化演进
0
1003
哈梨尔
2025-12-12
回复
(4)
庞悦
2025-11-20 09:51:44
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
欧阳梓蓓
2025-11-30 01:05:01
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
东西不错很实用谢谢分享
寨亳
4 天前
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
收藏一下 不知道什么时候能用到
凳舒
半小时前
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
这个有用。
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
炀餮氢
半小时前
关注
0
粉丝关注
12
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994893
kk14977
6845356
3934307807
991123
4
xiangqian
638210
5
宋子
9984
6
韶又彤
9998
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
675
JVM内存、GC与JConsole实战全解析
741
SQLServer 2019 标准版在虚拟机上无法充分
961
永别了,控制台!
837
开源项目分享 : Gitee热榜项目 2025-12-13
806
postgreSQL 中的自定义操作符
684
ROS2核心概念之通信接口
477
拿着顶级服务器跑慢查询,就像开着法拉利送
20
一文打通软件测试中pytest框架
949
vscode远程调试python程序,基于debugpy库
320
正点原子HP20智能加热台,重新定义精密加热
718
K8S 中使用 YAML 安装 ECK
1003
一种可落地的任务令牌锁机制:设计原理、实
151
Flink学习笔记:状态类型和应用
582
Oracle19c impdp失败报ORA-20000案例
206
Markdown写作常用组件
715
fs1.6-fs1.10代码移植方案
49
大疆不同任务类型执行逻辑,上云API源码分
548
对标MinIO!全新一代分布式文件系统诞生!
247
上海房屋漏水反复修不好?芮生建设提供免费
927
2025 年度西安网站制作公司推荐:定制开发