#案例分享 生产环境逐步迁移至k8s集群 - pod注册到consul

#项目背景

  • 多套业务系统, 所有节点注册到consul集群,方便统一管理
  • 使用consul的dns功能, 所有节点hostname能ping通
  • 使用consul健康检查功能, 健康检查通过才添加到service
  • 部分服务之前调用直接使用consul的server地址即:

    service-name.service.datacenter.consul
  • prometheus监控使用consul-templates自动添加节点
  • 运行环境是阿里云, k8s集群容器IP和云主机IP互通

#1.1 需要解决的问题

  • 部分服务迁移k8s集群后, k8s集群外的服务需要直连pod的ip访问

#1.2 解决办法

  • pod添加consul-agent容器注册到consul集群

#2.1 pod注册到consul产生的新问题

  • pod退出或删除时, consul集群应删除pod
  • prometheus监控模板consul-templates需要排除pod

#2.2 解决办法

  • consul容器使用preStop钩子, 退出前执行consul leave主动离开consul集群
  • consul-templates排除pod
    • pod注册到consul集群时添加前缀如k8s-
    • consul-templates使用regexMatch正则匹配忽略k8s-开头的节点

#演示demo如下

---
apiVersion: v1
kind: ConfigMap
metadata:
name: consul-demo-config
namespace: default
data:
consul.json: |- {
"datacenter": "qa",
"acl_datacenter": "qa",
"data_dir": "/tmp/consul",
"bind_addr": "0.0.0.0",
"client_addr": "0.0.0.0",
"start_join": ["10.10.100.100"],
"retry_join": ["10.10.100.100"],
"retry_interval": "5s",
"disable_host_node_id": true,
"enable_script_checks": true,
"disable_update_check": true,
"leave_on_terminate": true,
"log_level": "WARN",
"server": false,
"service": {
"name": "qa-consul-demo",
"port" : 80,
"tags": ["k8s", "qa", "consul-demo"],
"checks": [
{
"id": "consul-demo-HealthCheck",
"name": "Health Check",
"notes": "Health Check",
"args": [ "sh", "-c", "[ $(curl -s 127.0.0.1 -I |grep 'nginx' |wc -l) -eq 1 ] && { echo 'Health check successful'; exit 0 ; } || { echo 'check error' ; exit 2 ; }" ],
"interval": "10s"
}
]
}
} --- apiVersion: apps/v1
kind: Deployment
metadata:
name: consul-demo
namespace: default
spec:
selector:
matchLabels:
app: consul-demo
replicas: 2
template:
metadata:
labels:
app: consul-demo
spec: imagePullSecrets:
- name: docker-image-key containers:
- name: consul-agent
image: consul:1.0.8
imagePullPolicy: IfNotPresent
command:
- sh
- -c
- |
consul agent -config-dir=/opt/consul -node=k8s-qa-$HOSTNAME -rejoin
lifecycle:
preStop:
exec:
command:
- sh
- -c
- |
consul leave
volumeMounts:
- mountPath: "/etc/consul"
name: consul-conf
resources:
requests:
cpu: 10m
memory: 16Mi
limits:
cpu: 50m
memory: 32Mi
readinessProbe:
tcpSocket:
port: 8500
livenessProbe:
tcpSocket:
port: 8500
volumeMounts:
- name: consul-config
mountPath: "/opt/consul" - name: nginx-node
image: alivv/nginx:node
imagePullPolicy: IfNotPresent volumes:
- name: consul-config
configMap:
name: consul-demo-config
items:
- key: consul.json
path: consul.json

监控模板consul-templates如下

  - job_name: 'node'
static_configs:
{{range nodes}}
- targets: ['{{.Node}}:9100']
labels:
instance: {{.Node}}{{end}}

修改后如下, 使用regexMatch正则匹配排除k8s-开头的节点名称

  - job_name: 'node'
static_configs:
{{range nodes}}{{if .Node | regexMatch "^k8s-.*" }}{{else}}
- targets: ['{{.Node}}:9100']
labels:
instance: {{.Node}}{{end}}{{end}}

案例分享 生产环境逐步迁移至k8s集群 - pod注册到consul的更多相关文章

  1. 生产环境上,哨兵模式集群Redis版本升级应用实战

    背景: 由于生产环境上所使用的Redis版本并不一致,好久也没有更新,为了避免版本不同对Redis集群造成影响,从而升级为统一Redis版本! 1.集群架构 一主两从三哨兵: 2.升级方案 (1)升级 ...

  2. 生产环境的redis高可用集群搭建

    这里只是总结一下安装步骤 如果要了解redis集群高可用的原理,推荐仔细看一遍配置文件示例http://download.redis.io/redis-stable/redis.conf,源码包里也有 ...

  3. 解决项目迁移至Kubernetes集群中的代理问题

    解决项目迁移至Kubernetes集群中的代理问题 随着Kubernetes技术的日益成熟,越来越多的企业选择用Kubernetes集群来管理项目.新项目还好,可以选择合适的集群规模从零开始构建项目: ...

  4. 企业运维实践-还不会部署高可用的kubernetes集群?使用kubeadm方式安装高可用k8s集群v1.23.7

    关注「WeiyiGeek」公众号 设为「特别关注」每天带你玩转网络安全运维.应用开发.物联网IOT学习! 希望各位看友[关注.点赞.评论.收藏.投币],助力每一个梦想. 文章目录: 0x00 前言简述 ...

  5. K8S集群组件

    master节点主要由apiserver.controller-manager和scheduler三个组件,以及一个用于集群状态存储的etcd存储服务组成,而每个node节点则主要包含kubelet. ...

  6. k8s集群介绍

    Kubernetes集群组件 一个典型的Kubernetes集群由多个工作节点和一个集群控制节点,以及一个集群状态存储系统etcd组成.其中Master节点负责整个集群管理工作,为集群提供管理接口,并 ...

  7. 在windows环境中单机搭建rabbitmq集群

    建议单机版集群仅作为学习使用,生产环境最好使用多服务器集群来避免单点故障带来的服务不可用,必竟单机版的集是伪集群. 1:准备基础文件.环境变量 设置环境变量: 变量名:RABBITMQ_BASE 变量 ...

  8. 大规模 K8s 集群管理经验分享 · 上篇

    11 月 23 日,Erda 与 OSCHINA 社区联手发起了[高手问答第 271 期 -- 聊聊大规模 K8s 集群管理],目前问答活动已持续一周,由 Erda SRE 团队负责人骆冰利为大家解答 ...

  9. K8s集群安装和检查(经验分享)

    一.组件方式检查 1. Master节点: root>> kubectl get cs 2. Node 节点: 无  二.服务方式检查 1. Master 节点: root>> ...

随机推荐

  1. 揭开服务网格~Istio Service Mesh神秘的面纱

    目录 一.写在前面 二.微服务与K8S 三.服务网格与K8S 四.常见的产品 五.Istio架构 六.Istio的核心资源介绍 6.1.VirtualService 6.2.Destination R ...

  2. docker容器管理操作

    Docker容器的四种状态: 运行 已暂停 重新启动 已退出 1.容器的创建 容器创建:就是将镜像加载到容器的过程. 创建容器时如果没有指定容器名称,系统会自动创建一个名称. 新创建的容器默认处于停止 ...

  3. 【每天学一点-04】使用脚手架搭建 React+TypeScript+umi.js+Antd 项目

    一.使用脚手架搭建项目框架 1.首先使用脚手架搭建React项目(React+TypeScript+Umi.js) 在控制台输入命令:yarn create @umijs/umi-app 2.引入An ...

  4. [BJDCTF2020]Cookie is so stable-1|SSTI注入

    1.打开之后在各个界面查看源代码,未发现很明显的有用信息,仅发现了提示,结果如下: 2.尝试输入数据,结果就是输入什么就回显什么,也未进行过滤,尝试进行sql注入失败,结果如下: 3.那就根据提示抓包 ...

  5. 小白之Python基础(一)

    一.数字类型: 1.整形 十进制:默认为十进制:(如:99,100.......) 十六进制: 0x,0X开头的表示16进制数 二进制:0b,0B开头的表示2进制数 八进制: 0o,0O开头的表示8进 ...

  6. v-model原理问题

    v-model的原理 很多同学在理解Vue的时候都把Vue的数据响应原理理解为双向绑定,但实际上这是不准确的,我们之前提到的数据响应,都是通过数据的改变去驱动DOM重新的变化,而双向绑定已有数据驱动D ...

  7. 抖音web端 s_v_web_id 参数生成分析与实现

    本文所有教程及源码.软件仅为技术研究.不涉及计算机信息系统功能的删除.修改.增加.干扰,更不会影响计算机信息系统的正常运行.不得将代码用于非法用途,如侵立删! 抖音web端 s_v_web_id 参数 ...

  8. 文件上传接入阿里云OSS

    目的:将文件交给阿里云进行管理,可避免文件对本地服务器资源的占用,阿里云OSS还可根据读写偏好选择合适的文件存储类型服务器,文件异地备份等 一.阿里云OSS基础了解(前提) 1.存储空间(Bucket ...

  9. Qt+ECharts开发笔记(四):ECharts的饼图介绍、基础使用和Qt封装百分比图Demo

    前言   前一篇介绍了横向柱图图.本篇将介绍基础饼图使用,并将其封装一层Qt.  本篇的demo使用隐藏js代码的方式,实现了一个饼图的基本交互方式,并预留了Qt模块对外的基础接口.   Demo演示 ...

  10. 使用 Vue.js 框架后的感想

    前言 用 Vue 已经有段时间了,把自己的所想所悟写下来,每一个想法都是非常宝贵的,记录成为生活,记录成为习惯. 简化开发 Vue 是可以辅助前端工程师开发 Web App 的一种框架,它节省很多时间 ...