02. [실습] HPA 소개 및 Metrics Server 설치

HPA는 워크로드 리소스(Deployment, StatefulSet) 크기를 수요에 맞게 자동으로 스케일링한다.

scale out의 예시이다.

Threshold가 50%이고 requests가 200m라면 200m * 0.5(50%)로 100m라서 pod가 1개만 실행된다.

만약 cpu 사용률이 250%라면 200m * 2.5(250%)로 500m 라서 pod 5개가 실행된다.

여기서 cpu 사용률이 100%로 떨어지면 pod의 개수가 5개에서 2개로 scale in 된다.

Metrics Server는 pod autoscaling을 위해서 k8s에서 해당 객체에 대한 metrics를 수집하고 처리하기 위한 시스템이다.

HPA는 Metrics Server에 metrics를 얻기 위해 쿼리를 보내고

그 metrics을 기반으로 pod를 어떻게 scale 할지 replicas를 산정한 뒤 scaling 한다.

metrics-server.yaml 파일의 내용은 아래와 같다.

apiVersion: v1
kind: ServiceAccount
metadata:
  labels:
    k8s-app: metrics-server
  name: metrics-server
  namespace: kube-system
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  labels:
    k8s-app: metrics-server
    rbac.authorization.k8s.io/aggregate-to-admin: "true"
    rbac.authorization.k8s.io/aggregate-to-edit: "true"
    rbac.authorization.k8s.io/aggregate-to-view: "true"
  name: system:aggregated-metrics-reader
rules:
- apiGroups:
  - metrics.k8s.io
  resources:
  - pods
  - nodes
  verbs:
  - get
  - list
  - watch
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  labels:
    k8s-app: metrics-server
  name: system:metrics-server
rules:
- apiGroups:
  - ""
  resources:
  - nodes/metrics
  verbs:
  - get
- apiGroups:
  - ""
  resources:
  - pods
  - nodes
  verbs:
  - get
  - list
  - watch
---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  labels:
    k8s-app: metrics-server
  name: metrics-server-auth-reader
  namespace: kube-system
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: extension-apiserver-authentication-reader
subjects:
- kind: ServiceAccount
  name: metrics-server
  namespace: kube-system
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  labels:
    k8s-app: metrics-server
  name: metrics-server:system:auth-delegator
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: system:auth-delegator
subjects:
- kind: ServiceAccount
  name: metrics-server
  namespace: kube-system
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  labels:
    k8s-app: metrics-server
  name: system:metrics-server
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: system:metrics-server
subjects:
- kind: ServiceAccount
  name: metrics-server
  namespace: kube-system
---
apiVersion: v1
kind: Service
metadata:
  labels:
    k8s-app: metrics-server
  name: metrics-server
  namespace: kube-system
spec:
  ports:
  - name: https
    port: 443
    protocol: TCP
    targetPort: https
  selector:
    k8s-app: metrics-server
---
apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    k8s-app: metrics-server
  name: metrics-server
  namespace: kube-system
spec:
  selector:
    matchLabels:
      k8s-app: metrics-server
  strategy:
    rollingUpdate:
      maxUnavailable: 0
  template:
    metadata:
      labels:
        k8s-app: metrics-server
    spec:
      containers:
      - args:
        - --cert-dir=/tmp
        - --secure-port=4443
        - --kubelet-preferred-address-types=InternalIP,ExternalIP,Hostname
        - --kubelet-use-node-status-port
        - --metric-resolution=15s
        image: k8s.gcr.io/metrics-server/metrics-server:v0.6.1
        imagePullPolicy: IfNotPresent
        livenessProbe:
          failureThreshold: 3
          httpGet:
            path: /livez
            port: https
            scheme: HTTPS
          periodSeconds: 10
        name: metrics-server
        ports:
        - containerPort: 4443
          name: https
          protocol: TCP
        readinessProbe:
          failureThreshold: 3
          httpGet:
            path: /readyz
            port: https
            scheme: HTTPS
          initialDelaySeconds: 20
          periodSeconds: 10
        resources:
          requests:
            cpu: 100m
            memory: 200Mi
        securityContext:
          allowPrivilegeEscalation: false
          readOnlyRootFilesystem: true
          runAsNonRoot: true
          runAsUser: 1000
        volumeMounts:
        - mountPath: /tmp
          name: tmp-dir
      nodeSelector:
        kubernetes.io/os: linux
      priorityClassName: system-cluster-critical
      serviceAccountName: metrics-server
      volumes:
      - emptyDir: {}
        name: tmp-dir
---
apiVersion: apiregistration.k8s.io/v1
kind: APIService
metadata:
  labels:
    k8s-app: metrics-server
  name: v1beta1.metrics.k8s.io
spec:
  group: metrics.k8s.io
  groupPriorityMinimum: 100
  insecureSkipTLSVerify: true
  service:
    name: metrics-server
    namespace: kube-system
  version: v1beta1
  versionPriority: 100

kubectl apply -f metrics-server.yaml로 metrics-server를 생성하고

kubectl get pod -n kube-system로 확인할 수 있다.

Metrics-server 설치 중 오류

1. Readiness probe failed: HTTP probe failed with statuscode: 500

2.Error from server (ServiceUnavailable): the server is currently unable to

handle the request (get nodes.metrics.k8s.io)

https://potato-yong.tistory.com/150

'MSA > Part4. Ch.6 Kubernetes 안정성 강화 방법' 카테고리의 다른 글

03. [실습] HPA 및 오토스케일링 적용 (0)	2023.02.05
01. Kubernetes 안정성 강화 방법 소개 (0)	2023.01.30

Engineer-Lee

02. [실습] HPA 소개 및 Metrics Server 설치

Metrics-server 설치 중 오류

1. Readiness probe failed: HTTP probe failed with statuscode: 500

2.Error from server (ServiceUnavailable): the server is currently unable to

handle the request (get nodes.metrics.k8s.io)

'MSA > Part4. Ch.6 Kubernetes 안정성 강화 방법' 카테고리의 다른 글

티스토리툴바

02. [실습] HPA 소개 및 Metrics Server 설치

Metrics-server 설치 중 오류

1. Readiness probe failed: HTTP probe failed with statuscode: 500

2.Error from server (ServiceUnavailable): the server is currently unable to

handle the request (get nodes.metrics.k8s.io)

'MSA > Part4. Ch.6 Kubernetes 안정성 강화 방법' 카테고리의 다른 글

관련글

티스토리툴바