CSDN热搜
“在按需实例的基础上,我们实现了 40% 的年度成本下降,这主要得益于 Karpenter 能够灵活调度多种实例类型,以及我们广泛采用 Spot 实例,” DasSarma 表示,“而且整个过程中,我们完全不需要对 Cluster Autoscaler 进行任何调优。” “Cluster Autoscaler 经常会卡在各种问题上,而 Karpenter 不会。它始终保持敏捷。”
“我们用 Karpenter 来为 Dask 和 Spark 的工作负载调度 Spot 类型的 EC2 实例。”
“这些任务全都运行在 EKS 里。”
“我们其实不怎么用 PV,因为我们发现直接使用 S3 的性能就已经足够了。”
“过去我们使用 Cluster Autoscaler,会为特定的 Spark 作业预定义一组固定的 R5 实例。可问题是,我们经常会遇到容量不足,或者资源配比(CPU/内存比例)不合适的情况。”
“而现在有了 Karpenter,我们可以直接表达工作负载对资源的需求,比如更高 CPU 比例、更大内存等,而不用手动去挑选具体的实例类型。”
“和完全使用 On-Demand 实例相比,我们实现了 40% 的年度成本下降,这得益于 Karpenter 对实例类型的灵活选择能力,以及我们更广泛地使用了 Spot 实例。” “这过程中完全不需要对 Cluster Autoscaler进行手动调优,Cluster Autoscaler 经常在各种地方卡住。Karpenter 就不会这样,它一直很‘灵敏’。”
使用道具 举报
本版积分规则 回帖并转播 回帖后跳转到最后一页
程序园优秀签约作者
0
粉丝关注
17
主题发布