V1.15 Aslan CPU 给多少用多少,CPU 100%打满,控制台点任何界面很慢,无法使用

历史原因,有些可能无法升级到 v1.16 。。。v1.15 前阵子跑的还算好,周六迁了一个新的集群进去 。。现在出现 aslan 只要一运行 CPU 100% 跑满的情况,要怎么排查 ? 看了一下 aslan 的日志,没有碰到什么明显的的触发的任务

有明显错误的只看到这个,手工 curl 是有输出的

2023-06-19T12:30:29.770+0800 WARN service/bundle/resource_bundle.go:129 Failed to get Environment bundle, err: Get “http://aslan:25000/api/environment/bundle-resources”: context deadline exceeded (Client.Timeout exceeded while awaiting headers)

建议从集群角度入手排查

可以确认下这个集群内Pod是否可以通过ServiceName访问自己
如果不可以的话,可以参考这篇文章解决下 【分享】从1.13版本升级到1.14版本出现403的问题以及解决方案