技术分享｜基于 Cluster API 的 Kubernetes 集群生命周期管理

作者：SmartX SKS 产品研发工程师杨海剑

背景

容器的发展催生了容器编排技术，而容器编排技术反过来又推动了容器的发展。容器编排领域则一度出现了 Swarm、Mesos 和 Kubernetes 等百家争鸣的局面。但随着 Kubernetes 脱颖而出，Kubernetes 成为了容器编排领域的事实标准。

带来的问题

Kubernetes 提升了软件自动化运维的效率，为破解降本增效难题带来了新的思路。但同时 Kubernetes 的复杂性也带来了新的挑战。

认知复杂

Borg 是 Google 多年大规模应用容器技术的经验积累产物，而 Kubernetes 则是 Borg 的开源升华。Kubernetes 本身是一个复杂的分布式系统，涉及较多的复杂技术和概念，需要一定的学习成本和经验才能驾驭。

运维复杂

我们需要负责 Kubernetes 的创建、更新、高可用等运维工作。只有保证 Kubernetes 的稳定性，基于 Kubernetes 的云原生平台才有高可用的可能性。

我们可能有不同环境（测试、生产等）、不同产品线、不同团队需要独立环境的需求，这样就带来了 Kubernetes 多集群管理的复杂度。

基于成本或高可用等因素的考虑，我们可能会选择混合和多云架构。我们需要在自己的私有云管理 Kubernetes 集群，同时也需要使用公有云的 Kubernetes 集群。而不同云平台的 Kubernetes 集群的管理往往是相互独立的，这样就带来了跨云的集群管理复杂度。

Kubernetes 进阶之路

一般我们对 Kubernetes 的使用大致分为三个阶段：

探索阶段
推广阶段
平台化阶段

探索阶段

当前 Kubernetes 还处于不断发展演进的阶段，拥有 Kubernetes 丰富经验的工程师并不多。在引入 Kubernetes 的初始阶段，我们可能会先选择个别项目进行容器化试验探索。这样的好处是可以验证 Kubernetes 落地的可行性，以及积累相关经验。

普及阶段

在经过探索阶段的验证后，我们认识到了 Kubernetes 的价值，开始在内部推广 Kubernetes，更多的项目开始进行容器化改造。Kubernetes 应用到更多的场景（AI、大数据、物联网等），也许还需要对 Kubernetes 进行一些定制化或者生态扩展。

平台化阶段

在经历了普及阶段之后，随着 Kubernetes 更多、更深入的使用，各种相关的功能和需求（多租户、微服务等）整合之后，逐渐演进成一个云原生平台。

如果有一个合适的云原生平台方案，可以灵活满足不同阶段对于 Kubernetes 的需求，可以一定程度降低使用成本和提高效率。

Kubernetes LCM

云原生的核心之一是 Kubernetes，而 Kubernetes 的核心之一是集群生命周期管理（LCM）。解决了 LCM 的问题，可以一定程度上降低 Kubernetes 的使用成本。本文将主要探讨 LCM 相关问题。

LCM 包括但不局限于：

集群创建。
集群删除。
集群扩缩容，增加或减少节点数。
集群升级，集群从低版本升级到更高的版本。
集群故障恢复，集群出现故障。例如某节点故障，修复节点故障集群恢复正常工作。

Kubernetes LCM 现状

社区目前常用 kubeadm、kOps、kubespray、RKE、kubekey 等工具创建、扩容和升级集群。公有云和私有云则有自己的 Kubernetes 服务，但这些服务一般仅限本平台，对跨平台支持不友好。此外还有 Rancher、KubeSphere 等开源或商业化的容器平台，但它们没有通用的多平台支持，LCM 功能不丰富或是不够自动化。

以上 LCM 方案可能存在的问题：

需要掌握一定的 Kubernetes 相关知识和经验。
不够自动化，需要手工管理，使用命令行工具或没有 UI，效率低，容易出错。
没有统一的技术标准，各自有自己的技术方案，可扩展性不强。
跨平台支持不够。

Cluster API

Cluster API（CAPI）是一个 Kubernetes 声明式 API 风格的多 Kubernetes 集群生命周期管理项目。CAPI 的目标是简化 Kubernetes LCM，使得 LCM 自动化，并支持不同的 IaaS（AWS EC2、VMware vSphere 等）。

SMTX Kubernetes 服务（SMTX Kubernetes Service，简称 “SKS”）是 SmartX 企业云基础设施提供的 Kubernetes 服务。SKS 集成了 Cluster API，基于 SmartX 虚拟化、分布式存储、网络与安全等产品组件，可自动创建多台虚拟机以构建高可用的 Kubernetes 集群。

声明式 API

Kubernetes 声明式 API 通过 Resource + Controller 的模式实现。Resource 包括 Kubernetes 原生资源（Pod 等）和自定义资源（CRD）。每个资源对象包含 Spec 表示资源对象预期是什么样的，Status 表示预期资源对象当前的实际状态，Controller 则负责把资源达到预期的 Spec 状态。

在此基础上，Kubernetes 社区发展出了 Operator 模式，用来管理应用和基础设施资源（例如 prometheus-operator）。

Kubernetes 声明式 API 具有组合的特点，不同的 API 可以组合使用，达到功能扩展的目的。例如 Deployment + ReplicaSet + Pod 组合实现多版本应用部署管理。

声明式 Cluster API

目前常见通过声明式的方式管理分布式系统，而 Kubernetes 本身也是分布式系统，所以通过声明式管理 Kubernetes 集群是合适的。

CAPI 属于 Kubernetes Cluster Lifecycle 生态中的子项目，使用 Kubernetes 声明式风格也是比较天然的（K8s-on-K8s）。可以借用 Kubernetes 生态的优势，同时社区用户也更容易理解和使用。

声明式可以带来以下好处：

使用配置文件描述最终状态，不需要考虑流程和目标环境的细节。
重复操作不会产生不一致的效果。
天然符合不可变基础设施的理念。
声明式自愈保证高可用。

工作原理

根据 Kubernetes 声明式 API 的特点，当我们需要一个 Kubernetes 集群的时候，可以通过一个 CRD 定义并描述我们的需求。CAPI 定义了 Cluster 用来描述 Kubernetes 集群。

apiVersion:   cluster.x-k8s.io/v1beta1 kind:   Cluster metadata:    name:   mycluster    namespace:   defaultspec:   # 集群的规格status:   # 集群的当前状态

CAPI controllers 根据 Cluster 创建并管理集群。

CAPI 部署所在的 Kubernetes 集群称为管控集群（Management Cluster），基于 CAPI 创建的 Kubernetes 集群称为工作负载集群（Workload Cluster）。

管控集群主要由 CAPI 和 CAPI Providers 组成。

图片来源：https://cluster-api.sigs.k8s.io/images/management-cluster.svg

CAPI：集群的基础管理工作、Worker 节点的生命周期管理、协调 Providers 完成集群 LCM 工作。
Infrastructure Provider：管理集群所需要的基础设施资源。
ControlPlane Provider：Control Plane 节点的生命周期管理。
Bootstrap Provider：部署 Kubernetes 节点。

进一步，我们还需要确定集群有几个节点。Kubernetes 使用 Node 表示节点，CAPI 则使用 Machine 表示管理的 Kubernetes 节点，每个 Machine 关联一个节点。

apiVersion: cluster.x-k8s.io/v1beta1kind: Machine metadata:  name: mymachine  namespace: default spec:  clusterName: mycluster # Machine 所属的集群  providerID: elf://508ef880-dbdf-4327-ae58-aa034a450beb    version: v1.22.13 # Kubernetes 版本 status:    nodeInfo: # 节点信息    nodeRef: # 关联的节点

节点是集群的核心，节点的管理也是集群管理的重要部分。节点分为 Control Plane 和 Worker 节点，两者的角色和功能不一样，管理起来也有差异。

一个 Worker 节点包含多个 Kubernetes 组件程序（kubelet 等），集群升级过程会有多个版本的节点同时存在的情况。这些特点和 Pod 有些相似之处，因此 CAPI 借鉴了 Deployment 的设计理念：MachineDeployment (MD) + MachineSet (MS) + Machine (Pod) 组合，每个 MachineSet 管理同一个版本的节点。

kind: MachineDeploymentmetadata:  name: mycluster-workergroup  namespace: default  ownerReferences:  - apiVersion: cluster.x-k8s.io/v1beta1    kind: Cluster    name: myclusterspec:  clusterName: mycluster  replicas: 3 # 预期的 Worker 节点数  strategy: # 滚动更新策略    rollingUpdate:      maxSurge: 35%      maxUnavailable: 0    type: RollingUpdate  template:    spec:      bootstrap:        configRef:          apiVersion: bootstrap.cluster.x-k8s.io/v1beta1          kind: KubeadmConfigTemplate          name: mycluster-workergroup      clusterName: mycluster      infrastructureRef:        apiVersion: infrastructure.cluster.x-k8s.io/v1beta1        kind: ElfMachineTemplate        name: mycluster-workergroup      version: v1.23.14 # Kubernetes 版本status:  phase: Running  replicas: 3 # 当前实际的 Worker 节点数  unavailableReplicas: 0  updatedReplicas: 3apiVersion: cluster.x-k8s.io/v1beta1kind: MachineSetmetadata:  name: mycluster-workergroup-6f4c5dcc74  namespace: default  ownerReferences:  - apiVersion: cluster.x-k8s.io/v1beta1    blockOwnerDeletion: true    controller: true    kind: MachineDeployment    name: mycluster-workergroupspec:  clusterName: mycluster  deletePolicy: Random  replicas: 3 # 预期的 Worker 节点数  template:    spec:      bootstrap:        configRef:          apiVersion: bootstrap.cluster.x-k8s.io/v1beta1          kind: KubeadmConfigTemplate          name: mycluster-workergroup      clusterName: mycluster      infrastructureRef:        apiVersion: infrastructure.cluster.x-k8s.io/v1beta1        kind: ElfMachineTemplate        name: mycluster-workergroup      version: v1.23.14 # Kubernetes 版本status:  replicas: 3 # 当前实际的 Worker 节点数

Control Plane 节点是集群的控制面，业务逻辑和 Worker 节点不一样，除了有 kubelet 还有 APIServer、Etcd 等不同的组件。

Control Plane 节点目前常见以下几种管理方式：

集群自身管理，例如 kubeadm 通过 static pods 运行 Control Plane 节点。
额外的 Kubernetes 集群部署，使用 Deployment 和 StatefulSet 的形式部署 Control Plane 节点。
第三方托管，例如 GKE、AKS、EKS 等。

CAPI 提供了 ControlPlane Provider 的概念，我们可以根据不同的 Control Plane 节点管理方式而选择不同的 Provider。CAPI 默认提供了 KubeadmControlPlane（KCP）管理 Control Plane 节点。

apiVersion: controlplane.cluster.x-k8s.io/v1beta1kind: KubeadmControlPlanemetadata:  name: mycluster-controlplane  namespace: default  ownerReferences:  - apiVersion: cluster.x-k8s.io/v1beta1    blockOwnerDeletion: true    controller: true    kind: Cluster    name: myclusterspec:  kubeadmConfigSpec: # kubeadm 相关配置    clusterConfiguration:    format: cloud-config    initConfiguration:    joinConfiguration:    preKubeadmCommands:  machineTemplate:    infrastructureRef:      apiVersion: infrastructure.cluster.x-k8s.io/v1beta1      kind: ElfMachineTemplate      name: mycluster-controlplane      namespace: default  replicas: 3 # 预期的 Control Plane 节点数  rolloutStrategy: # 滚动更新策略    rollingUpdate:      maxSurge: 1    type: RollingUpdate  version: v1.23.14 # 预期的 kubernetes 版本status:  initialized: true  ready: true  readyReplicas: 3  replicas: 3 # 当前实际的 Control Plane 节点数  selector: cluster.x-k8s.io/cluster-name=mycluster,cluster.x-k8s.io/control-plane  unavailableReplicas: 0  updatedReplicas: 3  version: v1.23.14 # 当前实际的 kubernetes 版本

多平台

前面提到我们可能会有多 IaaS 的 Kubernetes 集群需求，不同的 IaaS 管理 Kubernetes 集群会有差异。CAPI 封装了每个 IaaS 通用的 LCM 数据和逻辑，每个 IaaS 只需要处理自己特有的相关逻辑。为此 CAPI 提出了 Infrastructure Provider 的概念，每个 IaaS 按照规范实现即可（参考 Provider Implementers，见附录参考文章）。Provider 体现了 CAPI 利用 Kubernetes 声明式 API 抽象和组合的作用，带来了可以支持不同 IaaS 集群管理的可扩展性。

例如 Cluster API Provider vSphere（CAPV）和 Cluster API Provider AWS（CAPA）分别用来在 vSphere 和 AWS 进行 Kubernetes 集群 LCM（更多请参考 CAPI Provider List，见参考文章）。为了方便，本文我们以 Kubernetes Cluster API Provider ELF (CAPE) 作为 Infrastructure Provider 参考。SMTX OS 是构建超融合平台的核心软件，内建服务器虚拟化、分布式存储组件等。CAPE 用于在 SMTX OS 内置的原生虚拟化服务 ELF 构建并管理 Kubernetes 集群。

Cluster + InfraCluster 组合表示基于某 IaaS 的 Kubernetes 集群。集群构建于基础设施之上，创建集群需要的基础设施资源（计算资源、存储资源、网络资源等）由 InfraCluster 管理。

apiVersion: cluster.x-k8s.io/v1beta1kind: Clustermetadata:  name: mycluster  namespace: defaultspec: # 集群的规格status: # 集群的当前状态        apiVersion: infrastructure.cluster.x-k8s.io/v1beta1kind: ElfClustermetadata:  name: mycluster  namespace: defaultspec:  cluster: dd1f408f-7715-48c1-a817-13c3568f1d93 # ELF 集群 ID  tower: # CloudTower 是 SmartX ELF 虚拟化系统的管控平台    server: api.cloudtower.com    username: root    password: 123456  controlPlaneEndpoint:    host: 192.168.160.1 # 集群 VIP    port: 6443status:  ready: true # True 表示集群所需要的基础设施资源已经创建好

Machine + InfraMachine 表示基于某 IaaS 的 Kubernetes 集群节点。节点需要的 IaaS 资源由 ElfMachine 管理。

apiVersion: infrastructure.cluster.x-k8s.io/v1beta1kind: ElfMachinemetadata:  name: mycluster-controlplane-v5rwf  namespace: defaultspec:  cloneMode: FastClone # 虚拟机克隆模式  ha: true # 虚拟机开启高可用模式  diskGiB: 60 # 虚拟机磁盘  memoryMiB: 8192 # 虚拟机内存  network: # 虚拟机网络配置    devices:    - networkType: IPV4_DHCP      vlan: dd1f408f-7715-48c1-a817-13c3568f1d93_4cd00407-63ca-440b-80b7-ceacfccb8d08    nameservers: []  numCPUS: 4 # 虚拟机 CPU  providerID: elf://508ef880-dbdf-4327-ae58-aa034a450beb # 节点的 providerID  template: clb6rdohnixp30958owkuy2pp # 虚拟机模板，用来克隆虚拟机并在该虚拟机部署 kubernetes 节点status:  ready: true # True 表示虚拟机所需要的基础设施资源已经创建好  vmRef: 508ef880-dbdf-4327-ae58-aa034a450beb # 关联的 ELF 虚拟机 ID

创建一个 Kubernetes 节点大致分为以下三个步骤：

制备机器（虚拟机、裸金属等），操作系统、存储、网络等资源。
在机器部署 Node 节点，安装 Kubelet、kube-apiserver、kube-scheduler、kube-controller-manager、Etcd 等组件。
Kubernetes 节点加入集群。

第一部分工作由 Infrastructure Provider 负责。第二部分（2 和 3）目前常用 kOps、kubespray、kubeadm 等方式部署 Kubernetes 节点。CAPI 把部署节点的部分抽象成了 Bootstrap Provider (CABP)，用户可以根据自己的情况选择社区已有的 CABP 或者自己开发不同的 CABP。CAPI 提供了目前主流的 kubeadm (CABPK) 作为默认的 CABP。

CABPK 为每个 Machine 创建一个 KubeadmConfig，KubeadmConfig 记录了 Kubeadm 部署一个节点使用的配置。并把部署一个节点的配置生成可执行命令（默认 cloud-init 格式），保存在名为 kubeadmConfig.status.dataSecretName 的 Secret 中。

apiVersion: bootstrap.cluster.x-k8s.io/v1beta1kind: KubeadmConfigmetadata:  name: mycluster-controlplane-6rhfl  namespace: default  ownerReferences:  - apiVersion: cluster.x-k8s.io/v1beta1    blockOwnerDeletion: true    controller: true    kind: Machine    name: mycluster-controlplane-6xftwspec: # kubeadm 相关配置  clusterConfiguration:  format: cloud-config  initConfiguration:  preKubeadmCommands:status:  dataSecretName: mycluster-controlplane-6rhfl  ready: true# Kubeadm 配置复用，用于创建 KubeadmConfigapiVersion: bootstrap.cluster.x-k8s.io/v1beta1kind: KubeadmConfigTemplatemetadata:  name: mycluster-controlplane  namespace: defaultspec:  template: # 通用的 kubeadm 配置    spec:      clusterConfiguration:      joinConfiguration:      preKubeadmCommands:

节点组

在某些场景下，我们需要对集群节点进行分类管理。例如我们需要在集群部署不同类型的应用，有些节点运行 CPU 密集型应用，有些节点运行网络 I/O 密集型应用，有些节点运行 GPU 应用等。CAPI 提供了节点组的功能，可以把同类的节点归为一个节点组统一管理。集群默认只有一个 Control Plane 节点组，由 KCP 管理。每个集群可以有多个 Worker 节点组，每个 MachineDeployment 管理一组 Worker 节点。

扩缩容

当我们增加或者减少集群的节点，从声明式的角度来说，我们只需要告诉 CAPI 我们需要几个节点即可。

例如当前集群有 1 或 5 个 Control Plane 节点，我们想要集群拥有 3 个 Control Plane 节点，我们只需要设置 kcp.spec.replicas = 3，KCP 会自动使集群 Control Plane 节点维持在 3 个，如果当前 Control Plane 节点数多于 3 则缩容，反之则扩容。

apiVersion: controlplane.cluster.x-k8s.io/v1beta1kind: KubeadmControlPlanemetadata:  name: mycluster-controlplane  namespace: defaultspec:- replicas: 1+ replicas: 3 # 从 1 扩容到 3

更新

集群更新包括集群的版本更新以及节点相关配置更新等。CAPI 遵循云原生社区广泛应用的不可变基础设施理念，以 Machine 为不可变基础设施的一个基本单位。这意味着如果我们要更新集群，需要通过使用新节点替换旧节点的滚动更新方式。

我们可以通过配置 KCP 和 MD 的滚动更新策略控制滚动更新的过程。例如先删除旧的节点再创建新的节点，还是先创建新的节点再删除旧的节点。详细请参考 KCP RolloutStrategy 和 MD MachineDeploymentStrategy。

滚动更新的方式比较重，我们可以根据实际情况选择其他方式更新。例如有些 IaaS 支持动态修改虚拟机资源配置，我们可以通过虚拟机热更新技术直接修改集群节点所在虚拟机的相关配置，这样就可以避免节点替换更新。此外我们还可以选择不使用 CAPI 默认的滚动更新机制，通过自己实现或扩展 Provider 等方式实现节点的原地更新。

例如当我们需要更新集群版本的时候，通过给 KCP 和 MD 指定版本，KCP 和 MD 会自动完成节点的滚动更新。

apiVersion: controlplane.cluster.x-k8s.io/v1beta1kind: KubeadmControlPlanemetadata:  name: mycluster-controlplane  namespace: defaultspec:- version: v1.25.6+ version: v1.26.2 # 从 v1.25.6 升级到 v1.26.2  rolloutStrategy: # 滚动更新策略    rollingUpdate:      maxSurge: 1    type: RollingUpdate

通过给 MD 指定集群版本，MD 会自动完成 Worker 节点的滚动更新。

kind: MachineDeploymentmetadata:  name: mycluster-workergroup  namespace: defaultspec:- version: v1.25.6+ version: v1.26.2 # 从 v1.25.6 升级到 v1.26.2  strategy: # 滚动更新策略    rollingUpdate:      maxSurge: 35%      maxUnavailable: 0    type: RollingUpdate

拓扑

在多集群的场景下，可能存在多个相似集群的情况。例如测试环境和生产环境使用的集群配置一样，只是集群节点数不一样。按照前面介绍的集群管理方式，我们需要为每个集群单独创建相同的 CRD 对象，当集群的配置需要修改（例如升级）的时候又需要挨个修改集群的 CRD 对象。

为此 CAPI 提出了 ClusterClass 的概念，简化多个相似集群的管理。ClusterClass 相当于 Cluster 的抽象，将集群共有的属性抽象出来。通过多个 Cluster 引用 ClusterClass 从而实现创建并管理多个相似集群。

apiVersion: cluster.x-k8s.io/v1beta1kind: ClusterClassmetadata:  name: myclusterclass  namespace: defaultspec:  infrastructure: # Infrastructure 配置    ref:      apiVersion: infrastructure.cluster.x-k8s.io/v1beta1      kind:  ElfClusterTemplate      name: myelfcluster-template      namespace: default  controlPlane: # Control Plane 配置    machineInfrastructure:      ref:        apiVersion: infrastructure.cluster.x-k8s.io/v1beta1        kind: ElfMachineTemplate        name: myclusterclass-controlplane        namespace: default    ref:      apiVersion: controlplane.cluster.x-k8s.io/v1beta1      kind: KubeadmControlPlaneTemplate      name: myclusterclass-controlplane      namespace: default  workers: # Worker 配置    machineDeployments:    - class: myclusterclass-workergroup-0      template:        bootstrap:          ref:            apiVersion: bootstrap.cluster.x-k8s.io/v1beta1            kind: KubeadmConfigTemplate            name: myclusterclass-workergroup-0            namespace: default        infrastructure:          ref:            apiVersion: infrastructure.cluster.x-k8s.io/v1beta1            kind: ElfMachineTemplate            name: myclusterclass-workergroup-0            namespace: default  variables: # 定义 Patches 使用的变量  - name: imageRepository # 自定义镜像仓库    required: true    schema:      openAPIV3Schema:        type: string        description: ImageRepository is the container registry to pull images from.        default: registry.capi.io  patches: # 通过 patches 实现 ClusterClass 默认配置参数的定制化  - name: imageRepository    definitions:    - selector:        apiVersion: controlplane.cluster.x-k8s.io/v1beta1        kind: KubeadmControlPlaneTemplate        matchResources:          controlPlane: true      jsonPatches:      - op: add        path: /spec/template/spec/kubeadmConfigSpec/clusterConfiguration/imageRepository        valueFrom:          variable: imageRepository# 同类集群的默认 ElfCluster 配置apiVersion: infrastructure.cluster.x-k8s.io/v1beta1kind: ElfClusterTemplatemetadata:  name: myelfcluster-template  namespace: defaultspec:  template:    spec:      tower: {}

ClusterClass 一般只会配置多个相似集群共同的属性和默认参数，实际上每个集群还会有自己个性化需求的部分。ClusterClass.sepc.patches 为每个 Cluster 提供了个性化定制的能力，只需要在 Cluster.spec.topology.variables 提供个性化的参数即可。

apiVersion: cluster.x-k8s.io/v1beta1kind: Clustermetadata:  name: mycluster  namespace: defaultspec:  topology: # 拓扑配置    class: myclusterclass # 引用 ClusterClass    version: v1.25.6 # kubernetes 版本    controlPlane:      replicas: 3 # 预期的 Control Plane 节点数    workers:      machineDeployments:      - class: myclusterclass-workergroup-0        name: mycluster-workergroup-0        replicas: 3 # 预期的 Worker 节点数    variables: # 覆盖 ClusterClass 默认配置，提供个性化参数    - name: imageRepository      value: dev.registry.capi.io # 指定特定的镜像仓库

使用 ClusterClass 之后，单个 Cluster 的 LCM 操作也变得更简单（更多请参考 Operating a managed Cluster，见参考文章）。

不使用 ClusterClass 对集群的 LCM 操作一般需要修改 KCP.spec. 和 MD.spec。使用 ClusterClass 之后只需要直接修改 Cluster.spec.topology 的相关属性即可，这样更简单直观。

apiVersion: cluster.x-k8s.io/v1beta1kind: Clustermetadata:  name: mycluster  namespace: defaultspec:  topology:    class: myclusterclass  - version: v1.25.6  + version: v1.26.2 # 从 v1.25.6 升级到 v1.26.2    controlPlane:    - replicas: 3    + replicas: 5 # Control Plane 节点从 3 扩容到 5    workers:      machineDeployments:      - class: myclusterclass-workergroup-0        name: mycluster-workergroup-0       - replicas: 3       + replicas: 6 # Worker 节点从 3 扩容到 6

ClusterClass 被多个 Cluster 引用，如果 ClusterClass 发生了变化，可能会间接影响到这些相似的 Cluster。我们可以利用这个特性实现对多集群进行批量管理，详细请参考 Changing a ClusterClass（见参考文章）。

高可用

影响 Kubernetes 高可用的因素可大概分为两类：集群依赖的环境稳定性，这里主要指 IaaS；Kubernetes 集群自身的高可用设计。

IaaS 的基础设施自身也会提供高可用的保证。例如部署 Kubernetes 节点的虚拟机，一般会提供高可用特性，当虚拟机所在的主机遇到故障的时候会在其他主机启动和运行（可参考 vSphere High Availability，见参考文章）。

Kubernetes 集群高可用可分为两部分：高可用部署和故障自愈。Kubernetes 是声明式自愈系统，例如当节点所在的机器重启后，节点可以自动恢复工作。高可用部署一般通过部署多个 Control Plane 节点实现，每个 Control Plane 节点部署在不同的物理机器。根据对高可用的需求程度，可以部署在不同的机架、不同的机房等。

在实际生产环境，Kubernetes 集群可能会遇到各种故障，例如网络故障、存储损坏等。有些故障是临时的，通过 IaaS 或者 Kubernetes 自身就可以自动恢复。但有些故障是长久或者永久的，例如硬件故障等，IaaS 或者 Kubernetes 不能在预期内自动恢复甚至是不能恢复，需要外部的干预。对于这类场景，我们还需要确保在 Kubernetes 集群出现无法自动恢复故障的时候能进行自动恢复。

高可用部署

多 Control Plane 节点的集群一般通过负载均衡器（LB）分发集群的流量。

HAProxy

典型的 LB 使用 HAProxy + Keepalived 方案。但 HAProxy + Keepalived 本身也需要保证高可用，所以需要额外的机器部署 LB 集群。

kube-vip

kube-vip 是一个为 Kubernetes 集群内部和外部提供高可用和负载均衡的开源项目。

kube-vip 支持以静态 Pod 的形式运行在 Control Plane 节点上，这样就可以不需要部署 HAProxy + Keepalived 等传统的 LB 来保证高可用。

kube-vip 静态 Pod 通过 ARP 会话来识别每个节点上的其他主机，我们可以选择 BGP 或 ARP 来设置负载平衡器。在 ARP 模式下，会选出一个领导者，这个节点将继承虚拟 IP 并成为集群内负载均衡的 Leader。而在 BGP 模式下，所有节点都会通知 VIP 地址。

通过把 kube-vip 以静态 Pod 的形式配置到 Control Plane 节点机器上的 /etc/kubernetes/manifests/kube-vip.yaml 文件中。kubeadm 部署 Control Plane 节点的过程，在启动静态 Pod 的阶段，就会启动 kube-vip 服务。

详细请参考 CAPE cluster-template.yaml kube-vip 配置。

故障自动恢复

针对集群故障，CAPI 提出了 MachineHealthCheck（MHC）的概念，提供故障节点自动恢复的功能，也就是通过自动删除故障节点再创建新节点的方式。当然 MHC 也不是万能的，对于 MHC 不能覆盖的场景，最终还是需要人工介入。关于 MHC 的限制请参考 Kubeadm Based Control Plane Management - Remediation 和 Limitations and Caveats of a MachineHealthCheck（见参考文章）。

CAPI 通过 MHC 为集群判断节点故障，并由 KCP 和 MD/MS 配合完成故障节点的替换工作。

apiVersion: cluster.x-k8s.io/v1beta1kind: MachineHealthCheckmetadata:  name: mycluster-mhcspec:  clusterName: mycluster # 应用到的工作负载集群  maxUnhealthy: 60% # 最大故障 Machine 比例，默认 100%，可以填百分比或者数字  UnhealthyRange: [3-5] # 故障 Machine 数量在一定范围会启动节点替换  nodeStartupTimeout: 10m # 节点加入集群的最长等待时间，也就是创建节点的超时时间  selector: # 纳管的 Machine，根据标签选择    matchLabels:      cluster.x-k8s.io/control-plane: "" # 该标签表示监控所有 Control Plane 节点  unhealthyConditions: # 自定义节点故障  - type: Ready # 可配置 kubernetes Node 原生的 condition    status: Unknown    timeout: 100s  - type: Ready    status: "False"    timeout: 200s  - type: my-custom-condition # 可自定义 condition    status: "False"    timeout: 300s

通过 MHC 配置需要监控哪个集群 (clusterName) 的哪些节点 (selector)，自定义故障节点的标准(nodeStartupTimeout 和 unhealthyConditions）。
MHC controller 根据配置监控集群的节点。当发现节点符合自定义的故障标准，MHC 标记对应的 Machine 为故障，并由 KCP 或 MD/MS 先删除故障节点再创建新的节点（更多细节 Kubeadm Based Control Plane Management Remediation）。

云原生平台

云原生可划分为容器与容器编排、应用开发与部署、服务治理、可观测性等领域，每个领域一般有多种实现方案，云原生平台可以理解为是多个领域的有机整合。与此相似，Kubernetes 也可划分多个领域，网络、存储、容器，每个领域都有标准（CNI、CSI、CRI 等）和不同的实现方案。CAPI 有多种 Provider，每种 Provider 可以有多种实现。这其实就是云原生社区常用的抽象和组合模式，不同的功能通过搭积木的方式组合使用。

我们可以基于 CAPI 构建云原生平台的 Kubernetes 管理模块，CAPI 有以下优势：

CAPI 是 Kubernetes SIG 发起的项目，社区活跃度较高。
CAPI 目前已经被众多的主流公/私有云使用，社区的主要贡献者也来自这些公司。
CAPI 基于 Kubernetes 声明式 API 风格，设计简洁，使用简单。
CAPI 功能完善稳定，涵盖了创建/删除/升级/扩缩容/故障恢复等，且还在不断迭代演进。
CAPI 可扩展性高，除了开箱即用的社区现有 Provider，还可以自定义 Provider 满足个性化需求，通过 Provider 组合可实现跨平台。同时也可以和云原生社区的其他项目组合使用，例如 Autoscaler。

更多 Kubernetes 运维、选型与管理知识，欢迎点击阅读电子书《IT 基础架构团队的 Kubernetes 管理：从入门到评估》。

附录

概念

CAPI Concepts：详见 https://cluster-api.sigs.k8s.io/user/concepts.html
IaaS：基础设施平台，包括公有云和私有云。
SMTX OS：SmartX 自主研发的构建超融合平台的核心软件，内建服务器虚拟化、分布式存储组件，可选配双活、异步复制、备份与恢复、网络与安全等高级功能。
ELF：SMTX OS 内置的原生虚拟化服务。
SKS：SmartX 企业云基础设施提供的 Kubernetes 服务。

CRDs

Providers

参考文档：

1. Kubernetes Cluster API

https://cluster-api.sigs.k8s.io

2. Cluster API docs

https://github.com/kubernetes-sigs/cluster-api/tree/main/docs

3. CNCF Operator White Paper - Review Version

https://github.com/cncf/tag-app-delivery/blob/eece8f7307f2970f46f100f51932db106db46968/operator-wg/whitepaper/Operator-WhitePaper_v1-0.md

4. Introducing Operators: Putting Operational Knowledge into Software

https://web.archive.org/web/20170129131616/https://coreos.com/blog/introducing-operators.html

5. Best practices for building Kubernetes Operators and stateful apps

https://cloud.google.com/blog/products/containers-kubernetes/best-practices-for-building-kubernetes-operators-and-stateful-apps

6. Cluster API and Declarative Kubernetes Management

https://learning.oreilly.com/library/view/cluster-api-and/9781098126865

7. Cluster API Deep Dive - Jason DeTiberus, Equinix Metal & Marcel Mue, Giant Swarm

https://www.youtube.com/watch?v=ZT1PXt87qSs

8. Webinar: Cluster API (CAPI) - A Kubernetes subproject to simplify cluster lifecycle management : https://www.youtube.com/watch?v=A2BBuKx1Yhk

9. Cluster API Intro and Deep Dive - Yuvaraj Balaji Rao Kakaraparthi & Vince Prignano, VMware

https://www.youtube.com/watch?v=9H8flXm_lKk

10. Kubernetes Cluster Management with Cluster API

https://www.youtube.com/watch?v=pctQWicYQu0

11. Build Your Own Cluster API Provider the Easy Way - Anusha Hegde, VMware & Richard Case, Weaveworks

https://www.youtube.com/watch?v=HSdgmcAAXa8

12. Deep Dive: Cluster Lifecycle SIG (Cluster API) - Jason DeTiberus, VMware & Hardik Dodiya, SAP

https://www.youtube.com/watch?v=Mtg8jygK3Hs

13. The What and the Why of the Cluster API

https://tanzu.vmware.com/content/blog/the-what-and-the-why-of-the-cluster-api

14. Declarative Management of Kubernetes Objects Using Configuration Files

https://kubernetes.io/docs/tasks/manage-kubernetes-objects/declarative-config

15. Declarative application management in Kubernetes

https://github.com/kubernetes/design-proposals-archive/blob/main/architecture/declarative-application-management.md

16. Fundamentals of Declarative Application Management in Kubernetes

https://www.alibabacloud.com/blog/fundamentals-of-declarative-application-management-in-kubernetes_596265

17.在Cluster API中引入ClusterClass和托管拓扑

https://mp.weixin.qq.com/s/FUGBNlNiamJMY36VIXXlSA

18.容器技术之发展简史

https://mp.weixin.qq.com/s/ccFkJJz97KcuXdO3r5zdXA

19.声明式自愈系统——高可用分布式系统的设计之道 [slide]

https://www.infoq.cn/video/wwlttw9l3lrs65ynpodb

20. CAPI - Provider Implementers

https://cluster-api.sigs.k8s.io/developer/providers/implementers.html

21. CAPI - Provider List

https://cluster-api.sigs.k8s.io/reference/providers.html#infrastructure

22. CAPI - Operating a managed Cluster

https://cluster-api.sigs.k8s.io/tasks/experimental-features/cluster-class/operate-cluster.html

23. CAPI - Changing a ClusterClass

https://cluster-api.sigs.k8s.io/tasks/experimental-features/cluster-class/change-clusterclass.html

24. vSphere High Availability

https://www.vmware.com/cn/products/vsphere/high-availability.html

25. CAPE cluster-template.yaml

https://github.com/smartxworks/cluster-api-provider-elf/blob/master/templates/cluster-template.yaml

26. Kubeadm Based Control Plane Management - Remediation

https://github.com/kubernetes-sigs/cluster-api/blob/main/docs/proposals/20191017-kubeadm-based-control-plane.md#remediation-using-delete-and-recreate

27. CAPI - Limitations and Caveats of a MachineHealthCheck

https://cluster-api.sigs.k8s.io/tasks/automated-machine-management/healthchecking#limitations-and-caveats-of-a-machinehealthcheck

你可能感兴趣的:(kubernetes,超融合,云原生)

使用 BPF 监控 Kubernetes 集群(k8s BPF 工具 kubectl-trace认知山河已无恙 K8s&kubelct 插件 BPF kubernetes 容器云原生
写在前面学习中遇到，整理分享，博文内容涉及：kubectl-trace安装，在节点，容器中如何使用需要注意的问题：job闪完成，一直Pending状态解决理解不足小伙伴帮忙指正不必太纠结于当下，也不必太忧虑未来，当你经历过一些事情的时候，眼前的风景已经和从前不一样了。——村上春树kubectl-trace安装┌──[[email protected]]-[~/ansi
云原生周刊：Istio 加入 Phippy 家族｜ 2024.3.18 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
开源项目推荐ko"ko"是一个用于构建和部署Go应用程序的简单、快速的容器镜像构建工具。它适用于那些镜像中只包含单个Go应用程序且没有或很少依赖于操作系统基础镜像的情况（例如没有cgo，没有操作系统软件包依赖）。"ko"在本地机器上通过执行"gobuild"的方式构建镜像，因此不需要安装Docker。这使得它非常适合轻量级的CI/CD场景。"ko"支持简单的YAML模板化，并且支持跨平台构建，还默
云原生部署手册01：构建k8s集群并配置持久化存储吴智深云原生 kubernetes 容器
写在前面：k8s弃用docker的影响其实没那么大k8s通过dockershim对docker的支持从1.20版本后就已经移除，仅支持符合ContainerRuntimeInterface(CRI)的容器运行环境，比如containerd。containerd本身就是docker底层的容器运行环境，只不过docker在containerd的基础上增加了符合人类操作的接口。docker构建的镜像并不
kubernetes解决nginx跨域问题滴流乱转的小胖子
官方文档出处：https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/#enable-cors%20%E4%BD%9C%E8%80%85%EF%BC%9AKaliArch%20%E9%93%BE%E6%8E%A5%EF%BC%9Ahttps://www.imooc.com/artic
让数据在业务间高效流转，镜舟科技与NineData完成产品兼容互认镜舟科技数据库云计算
近日，镜舟科技与NineData完成产品兼容测试。在经过联合测试后，镜舟科技旗下产品与NineData云原生智能数据管理平台完全兼容，整体运行高效稳定。镜舟科技致力于帮助中国企业构建卓越的数据分析系统，打造独具竞争力的“数据护城河”，其基于全球领先的开源项目StarRocks研发了两款企业级软件——镜舟分析型数据库和镜舟湖仓加速引擎，在用户画像分析、指标平台建设、固定报表加速、实时数据查询分析等领
关于k8s中 storageclass 的 is-default-sc 默认存储设置网络飞鸥 Kubernetes kubernetes 容器云原生
为什么要改变默认存储类？取决于安装模式，你的Kubernetes集群可能和一个被标记为默认的已有StorageClass一起部署。这个默认的StorageClass以后将被用于动态的为没有特定存储类需求的PersistentVolumeClaims配置存储。更多细节请查看PersistentVolumeClaim文档。如果准入控制器插件被启用，则管理员可以设置一个默认的StorageClass。所
k8s之DashBoard 蓝桉释槐 kubernetes 容器云原生
一，详述：基于web的用户界面二，部署：1），下载yaml并运行wgethttps://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0/aio/deploy/recommended.yaml2），修改kubernetes-dashboard的Service类型apiVersion:v1kind:Namespacemetadata:name
k8s安全控制、授权管理介绍树下一少年 Kubernetes kubernetes 权限云原生 RBAC k8s安全控制
目录一.Kubernetes安全控制介绍1.客户端认证操作2.访问对象资源依次流程二.授权管理介绍1.AlwaysDeny2.AlwaysAllow3.ABAC4.Webhook5.Node6.RBAC三.Role解释1.Role和ClusterRole2.Rolebinding和ClusterBinding3.Rolebinding和ClusterRole四.准入控制1.命令格式2.可配置控制器
云原生周刊：Helm Charts 深入探究｜ 2024.3.11 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
开源项目推荐GlasskubeGlasskube提供了一个用于Kubernetes的缺失的包管理器。它具有图形用户界面(GUI)和命令行界面(CLI)。Glasskube包是具备依赖感知、GitOps准备和可以通过中央公共包仓库自动更新的特性。imgpkgimgpkg（发音为："imagepackage"）是一个工具，允许用户将一组任意文件存储为OCI镜像。其中一个主要用例是将Kubernetes
【AI】如何创建自己的自定义ChatGPT 小涵 AI ChatGPT ai chatgpt openai llama langchain python 语言模型
如何创建自己的自定义ChatGPT目录如何创建自己的自定义ChatGPT大型语言模型（LLM）GPT模型ChatGPTOpenAIAPILlamaIndexLangChain参考推荐超级课程：Docker快速入门到精通Kubernetes入门到大师通关课本文将记录如何使用OpenAIGPT-3.5模型、LlamaIndex和LangChain创建自己的自定义ChatGPT.大型语言模型（LLM）大
Kubernetes API 安全详解与最佳实践 ivwdcwso 安全 kubernetes 安全容器
在Kubernetes集群中，保护API的安全性至关重要，因为它是集群中各个组件进行通信和交互的核心。通过一系列详细的操作和最佳实践，我们可以加强KubernetesAPI的安全性，防范潜在的安全风险。1.证书和身份验证1.1颁发证书使用cert-manager进行证书颁发，确保集群的各个组件、用户和服务都使用有效的证书。#示例cert-managerCertificate资源apiVersion
Mac OS 安装 CGO 交叉编译环境 x86_64-linux-gnu-gcc shida_csdn 疑难杂症 linux gnu 运维
在MacOS平台编译kubelet遇到如下错误：#makeWHAT=cmd/kubeletKUBE_BUILD_PLATFORMS=linux/amd64+++[022214:39:32]Buildinggotargetsforlinux/amd64k8s.io/kubernetes/cmd/kubelet(non-static)#runtime/cgocgo:Ccompiler"x86_64-l
Java云计算k8s weixin_51551879 java
云计算k8sk8s简介容器技术的发展使用kubeadm安装k8skubectlKubernetes架构k8s节点节点与控制面之间的通信控制器k8skubectl命令详解k8s容器Kubernetes对象Kubernetes对象管理Kubernetes对象管理指令式命令Kubernetes对象管理指令式对象配置k8s对象管理声明式对象配置使用Kustomize对Kubernetes对象进行声明式管理
云原生周刊：CNCF 宣布 Falco 毕业｜2024.3.4 云计算
开源项目推荐ldap-operator用于部署和管理LDAP目录的KubernetesOperator。UpdatecliUpdatecli是一个用于应用文件更新策略的工具。每个应用程序“运行”时都设计为可在任何地方使用，它会检测是否需要使用自定义策略更新值，然后根据该策略应用更改。AlazAlaz是一个开源DdosifyeBPF代理，可以检查和收集Kubernetes(K8s)服务流量，无需代码
3、云原生安全之falco的部署划水的小白白云原生安全云原生安全
文章目录1、helm安装2、拉去镜像失败与解决3、安装faclo4、安装nfs服务器，配置k8s的持久卷4.1、创建nfs服务器，4.2、部署master节点（nsf服务的客户端）4.3、pv与pvc4.4、假设pv和pvc的配置文件出错了5、安装falcosidekick可视化（建议跳过，直接使用6）6、安装faclo与falcosidekick7、创建自定义检测规则7.1、检测定时任务的查询与
使用 kind 集群安装运行极狐GitLab Runner【上】极小狐 kind gitlab 云原生 runner
GitLab是一个全球知名的一体化DevOps平台，很多人都通过私有化部署GitLab来进行源代码托管。极狐GitLab是GitLab在中国的发行版，专门为中国程序员服务。可以一键式部署极狐GitLab。关于kindkind是一个用来运行本地Kubernetes机群的工具，主要使用Docker容器来做为“nodes”。kind的主要设计目的是为了测试Kubernetes本身，但是也可以在本地研发或
【k8s】K8S中的cordon、uncordon和drain 冻结节点、驱离pod 云川之下 kubernetes docker 容器 cordon uncordon
Kubernetes(K8s)中使用Kubectl命令行工具管理Kubernetes集群。kubectl在$HOME/.kube目录中查找一个名为config的配置文件。可以通过设置KUBECONFIG环境变量或设置--kubeconfig参数来指定其它kubeconfig文件。本文主要介绍Kubernetes(K8s)中kubectlcordon,drain,uncordon常用命令。1、Kub
如何在Linux搭建MinIO服务并实现无公网ip远程访问内网管理界面学编程的小程 linux tcp/ip 运维
文章目录前言1.Docker部署MinIO2.本地访问MinIO3.Linux安装Cpolar4.配置MinIO公网地址5.远程访问MinIO管理界面6.固定MinIO公网地址前言MinIO是一个开源的对象存储服务器，可以在各种环境中运行，例如本地、Docker容器、Kubernetes集群等。它兼容AmazonS3API，因此可以与现有的S3工具和库无缝集成。MinIO的设计目标是高性能、高可用
XGB-12:在 Kubernetes 上进行分布式 XGBoost 训练 uncle_ll #XGBoost kubernetes 分布式 xgb xgboost Python
通过KubeflowXGBoostTrainingOperator支持在Kubernetes上进行分布式XGBoost训练和批量预测。操作步骤为在Kubernetes集群上运行XGBoost作业，执行以下步骤：在Kubernetes集群上安装XGBoostOperator。XGBoostOperator旨在管理XGBoost作业的调度和监控。按照安装指南安装XGBoostOperator。编写由X
hive学习笔记之九：基础UDF 程序员欣宸
欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容：所有原创文章分类汇总及配套源码，涉及Java、Docker、Kubernetes、DevOPS等；《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF用户自定义聚合函数(UDAF)UDTF本篇概览本文是《hive学习笔记》的第九篇
CNCF之毕业Projects简介鬓戈云原生云原生
CNCF组织管理着大量的云原生基础设施软件系统，如著名的k8s，不同的系统解决不同的技术点，也有一些系统是解决同一个问题的，形成一个自由竞争的关系，互相促进彼此创新进步，同时也给我们做技术选型带来了多样性和小小选择难点，我们有必要做一个简单的表格统计，方便我们从不同维度了解CNCF工程。1.工程总表序号工程状态工程数量1Graduated-毕业252Incubating-孵化373SANDBOX-
什么是云原生步尔斯特
一、开篇浅谈云原生的概念一直以来都很模糊，虽然云原生计算基金会（CNCF）给出了所谓的定义，但是并不能让大家很好的理解云原生的理念，为什么说是理念呢，因为云原生是一种思想，是一种解决方案，很抽象。随着云原生生态和边界不断的扩大，云原生自身的定义一直在变。不同的公司（Pivotal&CNCF）不同的人对它有不同的定义，同一家公司在不同的时间阶段定义也不一样。根据摩尔定律推断，未来对于云原生的定义还会
Kubernetes生态环境读书笔记金刚_30bf
Kubernetes来历由google的brog改造而来的开源软件，2014年发布，2015年捐赠给Linux基金会的云计算基础项目CNCF。自2015年7月发布以来，Kubernetes已经成为最受欢迎的容器编排引擎。四大公共云服务提供商中有三家——谷歌、IBM和微软——都提供了一个基于Kubernetes的服务平台(CaaS)平台。在2013年Docker出现以后，容器的采用率发生了爆炸式增长
【云原生之Docker实战】使用docker部署yesplaymusic个人音乐播放器江湖有缘 Docker部署项目实战合集 docker 云原生容器 yesplaymusic
【云原生之Docker实战】使用docker部署yesplaymusic个人音乐播放器一、yesplaymusic介绍1.yesplaymusic简介2.yesplaymusic的特性二、检查本地docker环境1.检查本地docker版本2.检查docker状态三、下载yesplaymusic镜像四、部署yesplaymusic应用1.创建yesplaymusic容器2.查看yesplaymus
清华架构师整理分布式系统文档：从实现原理到系统实现，收藏吧 java架构师联盟
微服务、云原生、Kubernetes、ServiceMesh是分布式领域的热点技术，它们并不是凭空出现的，一定继承了某些“前辈”的优点。我们不仅要了解这些技术，还要深入理解其发展脉络、原理等，才能游刃有余地将其用于现有的项目开发或老系统改造中。而这些技术有一个共同的特点，就是全网都在大谈分布式，其实主要就是因为数据量的爆发增长，我们的网站等应用承担了他本不应该承受的压力，这个时候，中国古人的训诫就
云原生明星创业公司 Weaveworks 倒闭了，GitOps 该何去何从？极小狐云原生
自从2009年DevOps面世以来，xOps的潘多拉魔盒就被打开了，AIOps、DataOps、DevSecOps、BizDevOps，当然还有最近几年比较火热的GitOps。但是很不幸的是，就在龙年新春前夕，GitOps理论提出者——Weaveworks倒下了。时间回到2月5日，就在大家期待春节长假的时候，一则Weaveworks公司即将倒闭的消息刷爆了云原生技术圈。Weaveworks公司的C
极狐GitLab 解决 docker connection refused 的问题极小狐 gitlab docker ci/cd
云原生时代，使用CI/CD来构建容器镜像并且推送到容器镜像仓库是非常常见的事情。在极狐GitLab中，使用下面的几行代码就能完成这个工作：build:image:docker:lateststage:buildservices:-docker:20.10.7-dindscript:-dockerlogin-u"$CI_REGISTRY_USER"-p"$CI_REGISTRY_PASSWORD"$
APISIX 可观测性最佳实践 apisix
APISIX介绍ApacheAPISIX是一个动态、实时、高性能的云原生API网关。它构建于NGINX+ngx_lua的技术基础之上，充分利用了LuaJIT所提供的强大性能。APISIX主要分为两个部分：APISIX核心：包括Lua插件、多语言插件运行时（PluginRunner）、Wasm插件运行时等；功能丰富的各种内置插件：包括可观测性、安全、流量控制等。APISIX在其核心中，提供了路由匹配
OCP的operator——（3）CRD 蓝黑2020 openshift openshift ocp crd operator
文章目录了解OperatorCRD使用customresourcedefinition（CRD）来扩展KubernetesAPICRD创建CRD为CRD创建集群角色通过文件创建CR检查CR管理CRD中的资源参考了解OperatorCRD使用customresourcedefinition（CRD）来扩展KubernetesAPIOperator使用Kubernetes扩展机制，CRD，这样一来，由
深度解读！阿里统一应用管理架构升级的教训与实践 CrisAppleYan 运维大数据编程语言人工智能 java
作者|李响、张磊责编|唐小引封图|CSDN下载自东方IC来源|CSDN（ID：CSDNnews）从2019年初开始，阿里巴巴云原生应用平台团队开始逐步在整个阿里经济体内，基于标准应用定义与交付模型进行应用管理产品与项目统一架构升级的技术工作。事实上，早在2018年末，当Kubernetes项目正式成为阿里巴巴的应用基础设施底盘之后，阿里内部以及阿里云产品线在应用管理领域的碎片化问题就开始日渐凸显出
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源