记一次kubernetes Evicted的处理[通俗易懂]

记一次kubernetes Evicted的处理[通俗易懂]背景:事情这样的:kubernetes1.21.3集群。容器运行时containerd。除了K8s-node-06节点。保留这个docker节点有很多原因。比如当时没有想好用什么打包镜像。默认让jenkins打包镜像。还有就是我的gitlab10.8.7版本contarinerd运行时下无法启动。就保留了这个节点运行gitlabpod。当然了也把这个节点设置为了不可调度。不相其他应用调度到这个节点上来!最近一段时间gitlab应用频繁出现Evicted的问题:这样就陷入了一个死循环:我的k8s-

大家好,又见面了,我是你们的朋友全栈君。

背景:

事情这样的:kubernetes1.21.3集群。容器运行时containerd。除了K8s-node-06节点。
image.png保留这个docker节点有很多原因。比如当时没有想好用什么打包镜像。默认让jenkins打包镜像。还有就是我的gitlab 10.8.7版本contarinerd运行时下无法启动。就保留了这个节点运行gitlab pod。当然了也把这个节点设置为了不可调度。不相其他应用调度到这个节点上来!最近一段时间gitlab应用频繁出现Evicted的问题:
origin_img_v2_19dc7774-0bdc-48dc-a868-7332339fe78g.png
这样就陷入了一个死循环:我的k8s-node-06设置为了不可调度,然后gitlab pod异常了 重新调度也调度不到节点上来…收到报错然后上线查找问题

处理问题过程:

1. 首先将k8s-node-06节点设置为可调度使gitlab pod正常运行

image.png

[root@k8s-master-01 ~]# kubectl uncordon k8s-node-06
node/k8s-node-06 uncordoned

image.png
等待gitlab pod running 后 将k8s-node-06节点恢复不可调度

[root@k8s-master-01 ~]# kubectl get pods -n kube-ops
[root@k8s-master-01 ~]# kubectl cordon k8s-node-06
node/k8s-node-06 cordoned
[root@k8s-master-01 ~]# kubectl get nodes

image.png

2. describe Evicted pod 定位解决

[root@k8s-master-01 ~]# kubectl describe pods gitlab-84d4998c96-b6z2j -n kube-ops

注: pod名词不一致 忽略。只是举个例子
origin_img_v2_21e090c3-65a2-46ea-8173-aa937652621g.png
目测存储资源不够了?百度搜索关键词:The node was low on resource: ephemeral-storage。参照:https://blog.csdn.net/u013355826/article/details/101020231。可以确定是存储资源不足了。登陆k8s-node-06节点经过查找文件发现Anchore Enine安装后,扫描后后数据文件太大造成的。就删除了anchore Engine
中的扫描记录文件!观察一段事件后目测是正常了…

3. 如何批量删除Evicted pod?

然后pod 列表中还有好多Evicted pod 看着恨不顺眼,怎么批量删除呢?如下:

kubectl get pods --all-namespaces -o json | jq '.items[] | select(.status.reason!=null) | select(.status.reason | contains("Evicted")) | "kubectl delete pods \(.metadata.name) -n \(.metadata.namespace)"' | xargs -n 1 bash -c

总结:

  1. 做好资源的监控
  2. kubectl命令的熟练掌握,高效运用
  3. 当然了最重要的还是处理问题的思路。先查看日志去定位问题!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/145513.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ipynb可以用pycharm_pycharm运行jupyter

    ipynb可以用pycharm_pycharm运行jupyter背景我的Pycharm下面有很多Project,每个Project一个Anaconda环境,昨天新开了一个Project叫CLRS_Code,Anaconda环境名也叫CLRS_Code然后我之前没有在Pycharm里面用过Jupyter,突然想试试这个功能,然后就新建一个.ipynb文件,Pycharm提示我没有装JupyterPackages,然后我就在Pycharm里面装了,装完之后,搜索…

    2022年8月27日
    2
  • Idea激活码永久有效Idea2021.2激活码教程-持续更新,一步到位

    Idea激活码永久有效Idea2021.2激活码教程-持续更新,一步到位Idea激活码永久有效2021.2激活码教程-Windows版永久激活-持续更新,Idea激活码2021.2成功激活

    2022年6月17日
    72
  • CreateMutex互斥量

    CreateMutex互斥量C++API CreateMutex找出当前系统是否已经存在指定进程的实例。如果没有则创建一个互斥体。CreateMutex()函数可用来创建一个有名或无名的互斥量对象。HANDLECreateMutex(  LPSECURITY_ATTRIBUTES lpMutexAttributes,//指向安全属性的指针  BOOL bInitialOwner,//

    2022年10月4日
    0
  • vue怎么和后端对接_vue搭配什么后端

    vue怎么和后端对接_vue搭配什么后端简单分享一下jeeplus框架部署liunx服务器跨域问题 ,因为我这个是前后端服务器分离所以配置了俩份java后端配置1.跨域后端配置nginx(图-1)上配置 server { listen 80; server_name xxx.xx.xxx; #后端服务域名 #charset koi8-r; #access_log logs/host.access.log main; locatio

    2022年8月19日
    5
  • CACL联赛第一赛季第一轮比赛排名公布!

    CACL联赛第一赛季第一轮比赛排名公布!亲爱的同学们,CACL联赛第一赛季第一轮,“波士顿房价预测”比赛结束啦!本轮比赛共计31支队伍提交了有效结果。一、比赛结果第一名:浙江大学AI俱乐部第二名:中国海洋大学智能数据分析俱乐部第三名:重庆邮电大学人工智能协会恭喜同学们获得好名次,也非常感谢同学们的热情参与。排名前五的结果代码已在T-CCP社区公布。点击查看>>>另外排名前五的战队会颁发获奖证书,第六名及以后…

    2025年6月26日
    0
  • AVX2整数向量运算「建议收藏」

    AVX2整数向量运算「建议收藏」在C/C++程序中,使用AVX2指令有很多种方法。嵌入汇编是一般的方法,但是对于不熟悉汇编语言的人来说,有点勉为其难。gcc编译支持AVX2指令的编程。程序中需要使用头文件和,这样通过调用其中定义的一些函数,达到使用AVX2指令的目的,即用C/C++调用SIMD指令(单指令多数据)。这里给出的样例程序是有关浮点向量运算的例子。其中函数_mm_add_epi32()实现的是整数向量(

    2022年5月25日
    29

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号