- 博客(18)
- 收藏
- 关注
原创 【 Kubernetes 集群】CLB Ingress 创建报错排障处理
Nginx Ingress 社区1.0.0之前的版本,不支持 networking.k8s.io/v1 类型资源的 Validating Webhook 回调。上述步骤解决的是存量 Nginx Ingress 实例资源验证的问题,要避免新增实例出现类似的问题,需要升级 Nginx Ingress 扩展组件。上述步骤解决的是存量 Nginx Ingress 实例资源验证的问题,要避免新增实例出现类似的问题,需要升级 Nginx Ingress 扩展组件。在“集群管理”列表中,单击集群名称,进入集群详情页。
2024-12-05 07:30:00
609
3
原创 【 Kubernetes 集群】Pod 网络无法访问排查处理
本文档介绍 TKE 集群中多场景下可能发生的常见网络问题,并给出对应的排查思路。当遇到此类问题时,建议您首先按照下文中的检查建议进行排查,若确认检查项无误后仍不能正常访问,请您寻求帮助。
2024-12-05 07:30:00
1328
1
原创 【 Kubernetes 集群】Service&Ingress 常见报错和处理
Kubernetes 通过声明式的方式管理资源,声明式 API 只需要声明一个期望的状态,系统就会自行调节以满足该状态。但声明式 API 也引入新的问题:无法感知资源当前状态信息,对任务的流程把握不够清晰。为了保证负载均衡实例配置信息的一致性,整个 Service/Ingress 是作为一个资源整体进行同步的。若 CLB 类型的 Service/Ingress 有任何监听器级别的配置错误问题,会导致整个负载均衡同步失败,并以 Event 的形式反馈问题让用户进行处理。
2024-12-04 07:30:00
1274
原创 【 Kubernetes 集群】Nginx Ingress 偶现 Connection Refused
的能力,当 Pod 需要被删除时,Pod 能够处理完已接受到的请求,此时入流量关闭,但出流量仍能走通。在 kube-system 命名空间下名为 ****-ingress-nginx-controller 的 Deployment 里的 wait-shutdown 前面加一段时间的 sleep。在 kube-system 命名空间下名为 ****-ingress-nginx-controller 的 Service 里使用 Annotation 标明使用优雅停机。生效,请检查您的集群是否支持直连模式。
2024-12-04 07:15:00
808
原创 【 Kubernetes 集群】Service&Ingress 网络无法访问排障处理
访问集群内 Ingress 的故障现象大多为几秒延时,原因是7层 CLB 如果请求 RS 后端超时(大概4s),会重试下一个 RS,所以如果 Client 设置的超时时间较长,出现回环问题的现象就是请求响应慢,有几秒的延时。使用公网 Ingress 和 LoadBalancer 类型公网 Service 不存在回环问题,主要是公网 CLB 收到的报文源 IP 是子机的出口公网 IP,而子机内部无法感知自己的公网 IP,当报文转发回子机时,不认为公网源 IP 是本机 IP,也就不存在回环。
2024-12-03 07:45:00
1469
原创 【 Kubernetes 集群】集群 Kube-Proxy 异常排障处理
在使用 TKE 集群服务的过程中,某些场景下,可能会出现服务访问不通的问题,如果确认后端 Pod 访问正常,则可能是由于 kube-proxy 组件版本较低,导致节点上的 iptables 或 ipvs 服务转发规则下发失败。本文档整理了低版本 kube-proxy 存在的若干问题,并给出相应的修复指引。
2024-12-03 06:30:00
2890
原创 【 Kubernetes 集群】集群 DNS 解析异常排障处理
容器的 DNS 请求都发往本地的 DNS 缓存服务(dnsmasq,nscd 等),不需要走 DNAT,也不会发生 conntrack 冲突。glibc,musl(Alpine Linux 的 libc 库)都使用 “parallel query”,即并发发出多个查询请求,因此易碰到这样的冲突,造成查询请求被丢弃。节点防火墙没放开集群网段,导致如果 Pod 跟集群 DNS 的 Pod 不在同一个节点就无法通信,DNS 请求也就无法被收到。检查节点的安全组设置,需要放开集群的容器网段。
2024-12-02 08:00:00
836
原创 【 Kubernetes 集群】集群 API Server 网络无法访问排障处理
该 Service 会自动绑定一个公网类型的 CLB,默认不会为该 CLB 绑定安全组(即全放通),且 EXTERNAL-IP 字段显示即为此 CLB 的 VIP。开启内网访问时,您已通过控制台设置了 VPC 子网网段,请检查集群中 Master 节点是否正确放通该 VPC 子网网段。检查集群中 Master 节点的安全组是否正确放通 Master 节点所在的 VPC 网段或 VPC 子网网段。检查集群中 Master 节点的安全组是否正确放通 Master 节点所在的 VPC 网段或 VPC 子网网段。
2024-12-02 07:15:00
546
原创 【 Kubernetes 集群】节点内存碎片化排障处理
本文档介绍如何判断 TKE 集群中存在问题是否由内存碎片化引起,并给出解决方法,请按照以下步骤进行排查并解决。
2024-12-01 08:15:00
1103
原创 【 Kubernetes 集群】节点高负载排障处理
本文档介绍如何在 TKE 集群中,通过工具定位异常是否由高负载造成,请按照以下步骤进行问题排查。
2024-12-01 07:45:00
1129
原创 【 Kubernetes 集群】节点磁盘爆满排障处理
本文档介绍 TKE 集群中多场景下可能发生的磁盘爆满问题,并给出对应的排查思路及解决方案,请按照下文中的步骤进行排查并解决。
2024-11-30 08:15:00
1247
原创 【 Kubernetes 集群】CBS-CSI 常见报错和处理
业务负载中指定了 fsGroup 参数,导致 kubelet 在完成 cbs 挂载后,会把挂载目录下所有文件进行一次权限修改,修改为 fsGroup 指定权限。WaitForFirstConsumer 挂载模式依赖调度器触发云硬盘创建,而指定了 nodeName 参数会导致 Pod 在调度时跳过调度器,从而无法通知插件进行云硬盘创建。使用 nodeSelector 方式替换 nodeName 参数,或在 sc 中直接指定 Immediate 的挂载模式,如有需要也可以在 sc 参数中指定可用区。
2024-11-30 07:45:00
929
原创 【 Kubernetes 集群】节点常见报错与处理
当使用 TKE 集群服务的节点检查能力时,可能会检查出节点异常,包含建议您进一步排查的关键字,本文档总结了节点检查中出现的关键字、异常现象及对应的检查方式(通过正则表达式匹配内核 / dev / dmesg 日志进行检查),您可以根据本文档登录节点进一步排查异常原因。网络设备泄露,如存在没有注册的网络设备。PCI Card 错误,如虚拟设备。Buffer 写入设备阻塞。Buffer 写入设备阻塞。conntrack 表满。文件系统只读,无法写入。Socket 太多引发。打开文件超过系统上限。
2024-11-29 08:41:22
1286
原创 【Kubernetes 集群】如何创建 RBAC 权限策略
本文档介绍账号如何在 Kubernetes 集群中如何根据无权限信息创建 RBAC 权限策略,在特定集群中创建权限集合并绑定对应子账号,绑定后子账号将能管理集群下的资源。
2024-11-29 08:39:33
1262
原创 【钉钉】管理员如何转移员工数据及操作离职
在系统内,待离职员工可通过提交“离职交接”审批单,确认交接给谁及交接明细。(注:在“办理离职并删除”的弹窗中,选项“该离职员工不计入人事统计”,是指对于测试数据删除等场景,不在人事统计中显示。在“离职管理”节点中,“查看最近离职的人”可关联至人事异动中离职记录,【已离职员工】按钮可关联至花名册的离职员工列表。3)选择离职人员的预计离职日期、离职原因后,点击「确认离职并删除」审批离职:发起离职审批、离职和交接单审批、离职交接审批。3.离职当天,HR进行离职确认,员工退出组织。
2024-11-27 17:29:04
3794
证券研究报告:春风动力(603129)业绩超预期,四轮车增长前景广阔
2024-12-11
纺织及服饰领域2024Q3安踏体育财报分析:消费环境影响销售,期待Q4恢复
2024-12-11
2024年东南亚电商市场洞察与发展趋势分析
2024-11-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人