找回密码
 立即注册

推荐主题

第三十七讲:都说InnoDB好,那还要不要使用Memory引擎?
第三十七讲:都说InnoDB好,那还要不要使用Memory引擎? 简概 引言 ​ 我在上一篇文章末尾留给你的问题是:两个 group by 语句都用了 order by null,为什么使用内存临时表得到的语句结果里,0 这个值在最后一行;而使用磁盘临时表得 ...
莘度 2025-6-10 19:16
665 0 0
Paimon Deletion Vector
deletion vector 是通过一组向量, 维护一个文件中被删除的行, 可以理解为一种索引. 这种方式可以以 Merge On Write 的方式, 来避免 Merge On Read 的过程, 从而以写入性能换取读取性能. 对于写少读多, 或者对读取性能有更高要求的场景会 ...
赖珊 2025-6-10 19:14
919 0 0
读数据质量管理:数据可靠性与数据质量问题解决之道14普及数据质量
1. 普及数据质量 1.1. 随着企业摄取越来越多的数据,数据分析也逐渐成为企业战略的重要组成部分,对高质量数据的需求只会不断增加,这给数据工程师、分析工程师,甚至数据分析师都带来了压力,要求他们承担起这个重要但富有挑战性的 ...
荪俗 2025-6-10 19:13
46 0 0
Redis究竟为什么这么快?
Redis为什么这么快? [*]完全基于内存,数据存在内存中,绝大部分请求是纯粹的内存操作,非常快速,跟传统的磁盘文件数据存储相比,避免了通过磁盘IO读取到内存这部分的开销。 [*]数据结构简单,对数据操作也简单。【Redis中的数据结构 ...
当贵 2025-6-10 19:12
403 0 0
读数据质量管理:数据可靠性与数据质量问题解决之道07异常检测
1. 监控和异常检测 1.1. 在数据方面,所有明面上的测试和数据质量检查都不能完全保护你免受数据宕机的影响 [*]1.1.1. 宕机可能由于各种原因而出现在管道内部和外部的各个阶段 [*]1.1.2. 这些原因通常与数据本身无关 1.2. 要了解 ...
凤患更 2025-6-10 19:12
48 0 0
DolphinScheduler心脏:Quartz的定时任务调度框架深度解析
Quartz是一个开源的Java作业调度框架,它提供了强大的定时任务调度功能。在DolphinScheduler中,Quartz用于实现定时任务的调度和管理。DolphinScheduler通过QuartzExecutorImpl类与Quartz集成,将工作流及其定时管理操作与Quartz调度框架 ...
搁胱 2025-6-10 19:11
966 0 0
高效处理日均5000亿+数据:58集团基于Apache SeaTunnel的数据集成平台架构优化
视频链接:58集团大数据平台基于Apache SeaTunnel的架构演进 https://www.bilibili.com/video/BV19GUPYcEgB/?vd_source=e139ecc995ab936267a7991b9de55f6c 引言 在数字化时代,数据已成为企业最宝贵的资产之一。58集团作为中国领先的生 ...
疝镜泛 2025-6-10 19:11
313 0 0
Apache Dolphinscheduler数据质量源码分析
Apache DolphinScheduler 是一个分布式、易扩展的可视化数据工作流任务调度系统,广泛应用于数据调度和处理领域。 在大规模数据工程项目中,数据质量的管理至关重要,而 DolphinScheduler 也提供了数据质量检查的计算能力。本文将对 Apac ...
擒揭 2025-6-10 19:11
141 0 0
Pgloader极简教程
目录 [*]简介 [*]安装 [*]安装概述 [*]CentOS编译安装 [*]使用 [*]命令行 [*]配置文件迁移 [*]可能遇到的错误 [*]更多配置参考 [*]总结 [*]引用 简介 pgloader是一个数据同步工具,用来将数据从其它地方迁移到postgresql中,支持 ...
煅圆吧 2025-6-10 19:10
109 0 0
读数据质量管理:数据可靠性与数据质量问题解决之道04收集与清洗
1.       收集数据 1.1.         数据收集和清洗是生产管道中的第一步 [*]1.1.1.           数据转换和测试则在生产管道中解决数据质量问题 1.2.         在收集数据时,管道的任何地方可能都没有入 ...
柴古香 2025-6-10 19:08
51 0 0
5.7 与 8.0 对相同文件的 LOAD DATA 语句结果不同
5.7 与 8.0 对相同文件的 LOAD DATA 语句结果不同 问题描述 某客户现场支持,由MySQL 5.7.21升级MySQL 8.0.25后,通过LOAD DATA导入文件,当同一会话连续导入不同的编码(UTF8/GB18030)文件时会出现乱码。数据库版本未升级之前,相同 ...
斜素欣 2025-6-10 19:08
342 0 0
使用 Infinispan 缓存功能支持多个 Redis 数据库
使用 Infinispan 缓存功能支持多个 Redis 数据库      在 Infinispan 15 中,我们提供了大量命令,可以在不更改代码的情况下将 Redis 服务器替换为 Infinispan。在本教程中,您将了解 Infinispan 缓存别名如何帮助您将多个 Redis ...
瞿佳悦 2025-6-10 19:08
678 0 0
最受欢迎数据库客户端-Navicat Premium最新版(17.1.5) MacOS版免费下载 | 2025年
该版本为MacOS专用,最新稳定版,相比旧版本,性能更高、资源占用更小、修复了频繁崩溃的bug。 navicat最新破解版本都需要关闭SIP,如何关闭可参考这篇文章 Navicat Premium 是一款非常强大的数据库管理工具,允许您在一个应用程序中同时 ...
注思 2025-6-10 19:08
480 0 0
【全面解读】Apache SeaTunnel常见问题全攻略
使用SeaTunnel需要安装Spark或者Flink这样的引擎么? 不需要,SeaTunnel 支持 Zeta、Spark 和 Flink 作为同步引擎的选择,您可以选择之一就行,社区尤其推荐使用 Zeta 这种专为同步场景打造的新一代超高性能同步引擎。Zeta 被社区用户 ...
艺轫 2025-6-10 19:07
759 0 0
【GreatSQL优化器-02】索引和Sargable谓词
【GreatSQL优化器-02】索引和Sargable谓词 一、Sargable谓词介绍 GreatSQL的优化器在有过滤条件的时候,需要先把条件按照是否有索引来进行区分,可以用索引来加速查询的条件称为Sargable,其中 arge 来源于 Search Argument(搜索参数 ...
枢覆引 2025-6-10 19:07
272 0 0
【GreatSQL优化器-03】查询开销估算
【GreatSQL优化器-03】查询开销估算 一、cost和read_time介绍 GreatSQL的优化器在创建执行计划的时候是根据每张表的行数和数据分布以及读数据硬盘消耗等信息来判断先查询哪张表后查询哪张表,要不要使用索引,这些表资源信息就被称为co ...
僻嘶 2025-6-10 19:07
174 0 0
Windows直接解压的方式安装redis
首先下载 redis 安装包:https://github.com/MSOpenTech/redis/releases解压安装包到相应文件夹,任何盘符都行,例如D:\ide\redis3.0.504 使用命令行启动 Redis 服务运行 cmd,cd 进入对应目录D:\ide\redis3.0.504,执行:redis-server. ...
昝琳怡 2025-6-10 19:07
351 0 0
7、listener监听
启动远程图形界面登录的工具 监听 监听的启动 判断监听是否启动 -- LISTEN:表示监听已经启动 -- 1440:监听对应的进程编号 -- ::: 表示所有的IP地址都启动1521端口 查看监听状态 查看监听进程 监听表现为一个进程,默认端口号:1521 ...
汤流婉 2025-6-10 19:06
892 0 0
某大型商超客户采购数据分析(Spark实战)
写了一些使用sparksql以及spark机器学习来进行数据分析的东西,希望能给大家做一些参考 项目需求:对某大型商超客户采购数据集进行数据分析 数据来源:https://www.heywhale.com/mw/dataset/656069b19a74cc18269207c4/content 首先使用 ...
鞣谘坡 2025-6-10 19:06
693 0 0
DBeaver如何设置自动刷新数据库表的数据,彻底解放双手!
前言大家好,我是小徐啊。DBeaver是一款常用的数据库连接工具,它的优点是免费使用,而且支持的数据库类型超级多,甚至可以直接安装数据库对应的驱动jar包来连接数据库。比如达梦数据库,之前版本是可以通过jar包方式设置驱动来连接达梦 ...
替攀浮 2025-6-10 19:06
286 0 0

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则