华为云云原生之多云管理利器Karmada从0到1的实操【与云原生的故事】-伙伴云

华为云云原生之多云管理利器Karmada从0到1的实操【与云原生的故事】

网友投稿 1877 2022-05-30

一、Karmada的概念

1.Karmada是什么

Karmada(Kubernetes Armada)是一个Kubernetes管理系统，使您能够跨多个Kubernetes集群和云运行云原生应用程序，而无需更改您的应用程序。通过使用Kubernetes原生API并提供高级调度功能，Karmada实现了真正开放的多云Kubernetes。

Karmada旨在为多云和混合云场景中的多集群应用程序管理提供自动化功能，具有集中式多云管理，高可用性，故障恢复和流量调度等关键功能。

官方网站：https://karmada.io/

代码地址：https://github.com/karmada-io/karmada

2.Karmada的诞生背景

Karmada项目由华为云、工商银行、小红书、中国一汽等8家企业联合发起，沉淀了各企业在多云管理领域的丰富积累，于2021年4月25日在华为开发者大会2021(HDC.Cloud)上正式宣布开源。同年9月，Karmada项目正式捐赠给云原生计算基金会CNCF，成为CNCF首个多云容器编排项目。Karmada项目的加入，也将CNCF的云原生版图进一步扩展至分布式云领域。

CNCF总经理Priyanka Sharma对此表示：“华为一直是云原生社区与开发者生态的重要参与者，Karmada对所有企业构建多云业务架构至关重要，希望未来CNCF与华为云继续密切合作，持续帮助广大云原生开发者。”

Karmada自开源以来受到了广泛的关注和支持，目前在代码托管平台上已有超过30家大型企业/机构/高校参与社区开发及贡献。

3.Karmada的优势

Karmada结合了华为云容器平台MCP以及Kubernetes Federation核心实践，并融入了众多新技术：包括Kubernetes原生API支持、多层级高可用部署、多集群自动故障迁移、多集群应用自动伸缩、多集群服务发现等，并且提供原生Kubernetes平滑演进路径，让基于Karmada的多云方案无缝融入云原生技术生态，为企业提供从单集群到多云架构的平滑演进方案。Karmada的优势主要有以下几点：

1、K8s原生API兼容

既有应用配置及基础设施无需改造，由单集群架构平滑升级到多集群(多云)架构。

无缝集成Kubernetes现有工具链生态。

2、开箱即用

面向多场景的内置策略集，包括两地三中心、同城双活、异地容灾等。

支持应用的跨集群上的自动伸缩、故障迁移和负载均衡。

3、避免供应商锁定

与主流云提供商集成。

自动分配，跨集群迁移。

不受专有供应商编排的约束。

4、集中管理

与位置无关的群集管理。

支持公有云、本地或边缘的集群。

5、富有成效的多集群调度策略

多集群亲和性调度、应用跨集群拆分、资源重新平衡。

多维度多层次的高可用部署：区域/可用区/集群/供应商等。

6、开放和中立

由互联网、金融、制造、电信、云提供商等共同发起。

使用CNCF实现开放式治理的目标。

二、Karmada的架构

1.Karmada控制平面的组成

Karmada控制平面由以下组件组成：

Karmada API Server

Karmada Controller Manager

Karmada Scheduler

Karmada Controller Manager运行各种控制器，控制器监视karmada对象，然后与底层集群的API服务器通信以创建常规的Kubernetes资源。

2.Karmada的Controller详解

Controller(控制器)在Kubernetes中是逻辑能力的主要体现所在，根据资源对象的状态来完成调和工作，让资源对象逐步接近期待的状态，这个就是Kubernetes的申明式特性。

在Karmada中，同样需要对Karmada自己的资源对象，实现对应的申明式特性，这就需要实现对应的Controller。在Karmada中目前的版本中有11个Controllers，接下来就从每一个控制器所负责的资源对象，以及原理来分析一下，在Karmada中是怎样完成多云能力的。

11种控制器结构图如下：

2.1 Cluster Controller

cluster controller主要就是处理Cluster资源对象的逻辑，负责处理Cluster对应需要的关联资源。

2.2 Cluster status controller

cluster status controller主要就是处理cluster status资源对象的逻辑，用来收集Cluster的状态，保存到Cluster的status字段中，同步上报到Karmada的控制平面中。

2.3 namespace sync controller

namespace sync controller主要就是处理namespace资源对象的逻辑，负责将Karmada控制平面创建的namespace在集群中同步创建出来。

2.4 Resourse Template controller

detector模块中包含了通用controller负责resource template的Kubernetes资源对象的调和处理逻辑，以及匹配PropagationPolicy。主要就是处理PropagationPolicy资源对象的逻辑，来派生出资源对象对应的ResourceBinding对象。

2.5 Binding controller

binding controller主要就是处理ResourceBinding资源对象的增删改逻辑，ResourceBinding的调和能力是派生出work对象，work对象是和特定集群关联的。一个work只能属于一个集群，代表一个集群的资源对象的模型封装。

2.6 execution controller

execution controller主要就是处理Work资源对象的增删改逻辑，用于处理Work，将Work负责的Kubernetes资源对象在对应的集群上创建出来。

2.7 work status controller

work status controller主要就是处理Work资源对象的状态逻辑，负责收集Work的状态，也就是Work对应的资源对象的状态，只是这个状态是保存在Work的status字段里的。

2.8 serviceexport controller

serviceexport controller主要就是处理serviceexport资源对象的状态逻辑，将需要被其它集群发现的服务暴露出来。

2.9 endpointslice controller

endpointslice controller主要根据serviceexport资源对象对应到处的Service，Service对应的endpointslice上报到Karmada的控制面。

2.10 serviceimport controller

serviceimport controller主要负责根据ServiceExport暴露出来的Service，在自己负责的集群中创建对应的service，注意service的名称不是完全一样的，同时在自己负责的集群中也创建对应的EndpointSlice，这个EndpointSlice的数据就是来源于EndpointSlice controller中上报到karmada控制平面的EndpointSlice对象，具体是通过在karmada-webhook中给ServiceImport的PropagationPolicy中增加了EndpointSlice的下发能力。

2.11 hpa controller

hpa controller主要负责将Karmada控制面中创建的HPA对象通过创建Work的方式下发到对应的集群中。

三、karmada安装

1.安装Docker

Docker的相关文档网站如下：

Docker官网：https://hub.docker.com/search?type=edition&offering=community

Ubuntu安装Docker文档：https://docs.docker.com/engine/install/ubuntu/

1.1 Docker的架构

Docker的架构设计分为三个组件：一个客户端，一个REST API和一个服务器(守护进程)：

Client：与REST API交互。主要目的是允许用户连接守护进程。

REST API：充当客户端和服务器之间的接口，实现通信。

守护进程：负责实际管理容器-启动，停止等。守护进程监听来自docker客户端的API请求。

1.2 系统环境

本人使用的是ubuntu22.04 LTS版本，查看系统版本命令如下

lsb_release -a cat /proc/version

1.3 使用仓库安装

如果以前有安装需要先卸载旧版Docker，docker，docker.io，docker-engine。

卸载旧版本的命令如下：

sudo apt-get remove docker docker-engine docker.io containerd runc

更新apt-get

sudo apt-get update

安装包使得apt可以使用https

sudo apt-get install apt-transport-https ca-certificates software-properties-common curl

添加清华GPG密钥

curl -fsSL https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/gpg | sudo apt-key add -

或者添加阿里云GPG密钥

curl -fsSL https://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -

添加清华Docker-ce软件源

sudo add-apt-repository "deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu $(lsb_release -cs) stable"

或者添加阿里云Docker-ce 软件源

sudo add-apt-repository "deb [arch=amd64] https://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"

如果出现错误可以用以下命令删除重新执行命令

#注意：添加错了可以用以下命令删除 #查询keyid，下图 sudo apt-key list #keyid 就是90那一串 sudo apt-key del #加参数-r可以移除 sudo add-apt-repository -r "deb [arch=amd64] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu $(lsb_release -cs) stable"

再次更新系统

sudo apt-get update

安装docker-ce软件

sudo apt-get install docker-ce docker-ce-cli containerd.io -y

查看是否启动

ps aux|grep docker

测试运行容器

sudo docker run hello-world

1.4 配置国内镜像源

{ "registry-mirrors":[ "http://hub-mirror.c.163.com"， "https://docker.mirrors.ustc.edu.cn"， "https://registry.docker-cn.com" ]， "dns":[ "114.114.114.114"， "8.8.8.8" ] }

1.5 添加当前用户到 docker 用户组，可以不用 sudo 运行 docker

将当前用户添加到docker组

sudo gpasswd -a ${USER} docker

重新登录或者用以下命令切换到docker组

newgrp - docker

重启docker服务

sudo service docker restart

不加sudo直接执行docker命令检查效果

docker ps

2.安装GO

2.1 下载并安装GO

sudo apt-get install golang-go

2.2 测试GO是否安装成功

go version

2.3 设置go环境为国内源

go env -w GOPROXY=goproxy.cn #设置go环境为国内源

3.安装k8s

3.1 前置条件

K8S官网：https://kubernetes.io/docs/setup/

最新版高可用安装：https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/high-availability/

这个swap其实可以类比成windows上的虚拟内存，它可以让服务器在内存吃满的情况下可以保持低效运行，而不是直接卡死。但是k8s的较新版本都要求关闭swap。所以咱们直接动手，修改/etc/fstab文件：

sudo gedit /etc/fstab

ubuntu 查看防火墙命令，ufw status可查看状态，ubuntu22.04默认全部关闭，无需设置。

设置命令如下：

sudo ufw status #查看防火墙状态 sudo ufw disable sudo swapoff -a #临时禁止

systemctl start chrony systemctl enable chrony chronyc sources #看连接状态 chronyc tracking #看同步状态，时间差 chronyc -a makestep #立即同步时间

非必须，但是为了直观方便管理，建议设置。

在宿主机分别设置主机名：k8s-master01，k8s-node01

hostnamectl set-hostname k8s-master01

hosts设置

sudo gedit /etc/hosts #配置host如下 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 192.168.16.133 k8s-master01.ilinux.io k8s-master01 k8s-api.ilinux.io 192.168.16.134 k8s-node01.ilinux.io k8s-node01 199.232.96.133 raw.githubusercontent.com

3.2 安装组件

为防止初始化出现一系列的错误，请检查docker和kubectl驱动是否一致，否则kubectl没法启动造成报错。版本不一样，docker有些为cgroupfs，而kubectl默认驱动为systemd，所以需要更改docker驱动。

可查看自己docker驱动命令：

sudo docker info|grep Driver

如果不是systemd需要执行以下命令：

#编辑创建文件 sudo gedit /etc/docker/daemon.json #添加内容 { "registry-mirrors":[ "http://hub-mirror.c.163.com"， "https://docker.mirrors.ustc.edu.cn"， "https://registry.docker-cn.com" ]， "exec-opts":["native.cgroupdriver=systemd"]， "dns":[ "114.114.114.114"， "8.8.8.8" ] }

重启docker

sudo systemctl restart docker.service

modprobe br_netfilter cat /etc/profile cat /etc/sysctl.d/k8s.conf net.bridge.bridge-nf-call-ip6tables = 1 net.bridge.bridge-nf-call-iptables = 1 net.ipv4.ip_forward = 1 sudo sysctl -p /etc/sysctl.d/k8s.conf #执行同步参数

sudo apt-get install openssh-server ssh-keygen -t rsa

此时会在/home/ubuntu/.ssh目录下生成密钥对

ll .ssh

上传公钥到对应服务器

ssh-copy-id 192.168.16.133 ssh-copy-id 192.168.16.134

3.3 更新源

sudo apt-get update

3.4 下载公开签名秘钥、并添加k8s库

国外：下载 Google Cloud 公开签名秘钥：

curl -s https://packages.cloud.google.com/apt/doc/apt-key.gpg | sudo apt-key add sudo apt-add-repository "deb http://apt.kubernetes.io/ kubernetes-xenial main"

国内：可以用阿里源即可：

curl -s https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg | sudo apt-key add - sudo tee /etc/apt/sources.list.d/kubernetes.list <

3.5 更新 apt 包索引

sudo apt-get update

3.6 安装 kubelet、kubeadm 和 kubectl，并锁定其版本

sudo apt-get install -y kubectl kubelet kubeadm sudo apt-mark hold kubelet kubeadm kubectl

kubeadm：用来初始化集群的指令。

kubelet：在集群中的每个节点上用来启动Pod和容器等。

kubectl：用来与集群通信的命令行工具。

3.7 配置kubectl开机启动

systemctl daemon-reload systemctl enable kubelet

3.8 测试kubectl是否安装成功

kubelet --version kubectl version --client kubeadm version

3.9 初始化主节点master

拉取相关包

kubeadm config images pull --image-repository registry.aliyuncs.com/google_containers

初始化主节点master

kubeadm init \ --apiserver-advertise-address=192.168.16.133 \ --image-repository registry.aliyuncs.com/google_containers \ --pod-network-cidr=10.244.0.0/16

异常情况分析：

错误提示1：

[kubelet-check] It seems like the kubelet isn't running or healthy. [kubelet-check] The HTTP call equal to 'curl -sSL http://localhost:10248/healthz' failed with error: Get "http://localhost:10248/healthz": dial tcp 127.0.0.1:10248: connect: connection refused.

原因：kubectl没法启动，journalctl -xe查看启动错误信息。

journalctl -xe #信息显示docker和kubectel驱动不一致 kubelet cgroup driver: \"systemd\" is different from docker cgroup driver: \"cgroupfs\""

解决方案：k8s建议systemd驱动，所以更改docker驱动即可，编辑/etc/docker/daemon.json(没有就新建一个)，添加如下启动项参数即可：

#编辑创建文件 sudo vim /etc/docker/daemon.json #添加内容 { "exec-opts":["native.cgroupdriver=systemd"] }

重启docker和kubectl

#重启docker sudo systemctl restart docker.service #重载kubectl sudo systemctl daemon-reload #重启kubectl sudo systemctl restart kubelet.service #查看kubectl服务状态恢复正常 sudo systemctl status kubelet.service

错误提示2：

error execution phase preflight: [preflight] Some fatal errors occurred: [ERROR FileAvailable--etc-kubernetes-manifests-kube-apiserver.yaml]: /etc/kubernetes/manifests/kube-apiserver.yaml already exists [ERROR FileAvailable--etc-kubernetes-manifests-kube-controller-manager.yaml]: /etc/kubernetes/manifests/kube-controller-manager.yaml already exists [ERROR FileAvailable--etc-kubernetes-manifests-kube-scheduler.yaml]: /etc/kubernetes/manifests/kube-scheduler.yaml already exists [ERROR FileAvailable--etc-kubernetes-manifests-etcd.yaml]: /etc/kubernetes/manifests/etcd.yaml already exists [preflight] If you know what you are doing， you can make a check non-fatal with `--ignore-preflight-errors=...`

华为云云原生之多云管理利器Karmada从0到1的实操【与云原生的故事】

原因：初始化生产的文件，重新初始化，需要删除即可

rm -fr /etc/kubernetes/manifests/*

错误提示3：

error execution phase preflight: [preflight] Some fatal errors occurred: [ERROR Port-10250]: Port 10250 is in use

解决方法：重置配置

sudo kubeadm reset

3.10 配置kubernetes-admin来运行

echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> /etc/profile source /etc/profile

3.11 集群部署网络插件

安装cni插件：

mkdir -p go/src/github.com/containernetworking/ cd go/src/github.com/containernetworking/ git clone https://github.com/containernetworking/plugins.git git clone https://github.com/containernetworking/cni.git cd plugins ./build_linux.sh cd ../cni/cnitool go build cnitool.go

部署网络插件命令如下：

kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

4.安装简易k8s开发集群管理工具：kind

Kind是Kubernetes In Docker的缩写，顾名思义是使用Docker容器作为Node并将Kubernetes部署至其中的一个工具。官方文档中也把Kind作为一种本地集群搭建的工具进行推荐。

4.1 安装kind

GOPROXY=goproxy.cn go install sigs.k8s.io/kind@v0.12.0

4.2 环境变量配置

sudo cp $(go env GOPATH)/bin/kind /usr/local/bin

kind使用一个容器来模拟一个node，在容器内部使用systemd托管kubelet和containerd(不是docker)，然后通过被托管的kubelet启动其他k8s组件，比如kube-apiserver、etcd、CNI等跑起来。

由于kind使用containerd而非docker作为容器运行时，要查看kind启动的k8s节点内部容器运行情况，需要使用containerd的cli客户端ctr。可以通过下面这条命令查看后续步骤中karmada调用kind启动的单节点k8s集群内部容器的运行情况：

docker exec karmada-host-control-plane ctr --namespace k8s.io containers ls

注意点：ctr的flag --namespace不是k8s里的namespace，也不是linux内核支持的namespace，感兴趣的同学可以查看containerd的namespace相关概念

4.3 测试kind是否安装成功

kind --version

5.安装karmada控制面

karmada项目地址：https://gitcode.net/mirrors/karmada-io/karmada?utm_source=csdn_github_accelerator

5.1 先行条件

安装karmada需要先安装以下工具：

make

gcc

kubectl

kind

git

5.2 安装karmada

git clone https://github.com/karmada-io/karmada.git karmada-io/karmada cd karmada-io/karmada

因为安装中会无法安装k8s.gcr.io相关软件，把替源码中的k8s.gcr.io换成registry.cn-hangzhou.aliyuncs.com/google_containers就可以部署

执行安装命令如下：

hack/local-up-karmada.sh

安装步骤详解：

检查go、kind等工具是否已经存在

调用kind创建host k8s集群，集群版本默认为1.23.4，与karmada重用的k8s组件(kube-apiserver、kube-controllermanager)版本一致

build karmada控制面可执行文件及容器镜像，build结束后本地可以找到如下镜像：karmada-agent、karmada-webhook、karmada-scheduler、karmada-controller-manager

部署karmada控制面组件到host集群

创建CRD，也就是karmada自定义的多云工作负载API资源，包含：propgation policy，override policy，work，resource binding等

创建webhook

部署完成后，形成kubeconfig文件$HOME/kube/karmada.config，包含karmada-host和karmada-apiserver两个context，分别对应支撑karmada控制面运行的host集群，以及karmada控制面本身

安装成功后会出现如下信息：

Local Karmada is running. To start using your karmada， run: export KUBECONFIG="$HOME/.kube/karmada.config" Please use 'kubectl config use-context karmada-host/karmada-apiserver' to switch the host and control plane cluster. To manage your member clusters， run: export KUBECONFIG="$HOME/.kube/members.config" Please use 'kubectl config use-context member1/member2/member3' to switch to the different member cluster.

5.3 查看karmada控制面组成

使用karmada管理的多云环境包含两类集群：

host集群：即由karmada控制面构成的集群，接受用户提交的工作负载部署需求，将之同步到member集群，并从member集群同步工作负载后续的运行状况。

member集群：由一个或多个k8s集群构成，负责运行用户提交的工作负载

kubectl config use-context karmada-host #切换到karmada-host控制面

kubectl get po --all-namespaces

集群加入karmada步骤如下：

执行hack/create-cluster.sh member1 $HOME/.kube/karmada.config创建新的集群member1

执行kubectl config use-context karmada-apiserver切换到karmada控制面

执行karmadactl join member1 --cluster-kubeconfig=$HOME/.kube/karmada.config以push的方式把member1加入karmada集群

三、karmada实战案例

相关视频链接：https://live.csdn.net/v/202945?spm=1001.2014.3001.5501

实操步骤：

1、执行kubectl config use-context karmada-apiserver切换到karmada控制面。

2、执行kubectl create -f samples/nginx/deployment.yaml创建deployment资源，如前面所述，由于kamada控制面没有部署deployment controller，nginx不会在karmada控制面所在集群跑起来，而是仅仅保存在etcd里，这时候如果去member1集群查看pod资源的情况，可以发现nginx也没有在member1集群中运行起来。

3、执行kubectl create -f samples/nginx/propagationpolicy.yaml，定义如下的propgation policy：

apiVersion: policy.karmada.io/v1alpha1 kind: PropagationPolicy metadata: name: nginx-propagation spec: resourceSelectors: - apiVersion: apps/v1 kind: Deployment name: nginx placement: clusterAffinity: clusterNames: - member1

这个progation policy将之前部署的nginx deployment资源(由resourceSelectors指定)同步到member1集群(由placement指定)中。

这时不用切换到member1 context，对karmada控制面执行kubectl get deploy可以看到名叫nginx的deployment已经正常运行：

NAME READY UP-TO-DATE AVAILABLE AGE nginx 1/1 1 1 21m

上述结果说明karmada有能力从member集群同步工作负载状态到host集群。作为验证，我们可以切换到member1集群，执行kubectl get po可以看到deployment对应的nginx pod已经在member1集群内正常运行：

NAME READY STATUS RESTARTS AGE nginx-6799fc88d8-7tgmb 1/1 Running 0 8m27s

总结

Karmada 的架构在很多方面类似于单个Kubernetes集群。它们都有一个控制平面、一个API服务器、一个调度程序和一组控制器。而且Karmada完全兼容K8S原生API操作，便于各种k8s集群的接入，为多云和混合云架构保驾护航。

【与云原生的故事】有奖征文火热进行中：https://bbs.huaweicloud.com/blogs/345260

云原生云端实践

四大云原生行业解决方案之数字政府【我们都是华为云专家】（产业云华为政府）

1877 2022-05-30

华为云云 原生之多云管理利器Karmada从0到1的实操【与云原生的故事】

云原生之下，视频云业务的10大实践经验分享（谈谈使用云服务的经验）

云原生时代必须具备的核心技能之Docker高级篇(Docker网络详解)

四大云原生行业解决方案之数字政府【我们都是华为云专家】（产业云华为政府）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

定制订单管理系统（为特定需求定制的订单管理系统）

什么是在线文档？怎么发在线文档

友情链接

华为云云原生之多云管理利器Karmada从0到1的实操【与云原生的故事】

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接