반응형 전체 글264 03. [실습] HPA 및 오토스케일링 적용 HPA를 적용할 파드를 생성해기 위해 파일을 작성했다. test-deploy.yaml 파일 내용은 아래와 같다. apiVersion: apps/v1 kind: Deployment metadata: name: test-deploy spec: selector: matchLabels: run: test-deploy replicas: 1 template: metadata: labels: run: test-deploy spec: containers: - name: test-deploy image: k8s.gcr.io/hpa-example ports: - containerPort: 80 resources: limits: cpu: 500m requests: cpu: 200m --- apiVersion: v1 kind.. 2023. 2. 5. 02. [실습] HPA 소개 및 Metrics Server 설치 HPA는 워크로드 리소스(Deployment, StatefulSet) 크기를 수요에 맞게 자동으로 스케일링한다. scale out의 예시이다. Threshold가 50%이고 requests가 200m라면 200m * 0.5(50%)로 100m라서 pod가 1개만 실행된다. 만약 cpu 사용률이 250%라면 200m * 2.5(250%)로 500m 라서 pod 5개가 실행된다. 여기서 cpu 사용률이 100%로 떨어지면 pod의 개수가 5개에서 2개로 scale in 된다. Metrics Server는 pod autoscaling을 위해서 k8s에서 해당 객체에 대한 metrics를 수집하고 처리하기 위한 시스템이다. HPA는 Metrics Server에 metrics를 얻기 위해 쿼리를 보내고 그 met.. 2023. 2. 1. 01. Kubernetes 안정성 강화 방법 소개 CA란 Cluster Autoscaler의 약자로 K8s 워커노드를 scaling 해준다. HPA란 Horizontal Pod Auto scaler의 약자로 pod를 수평적으로 scaling 해준다. HPA는 kube-controller-manager에 속하며 scaling을 할 수 있도록 Metrics Server를 배포하여 사용한다. HPA가 지정하는 threshold 기준을 넘어서면 scale out이 되고 threshold 기준 이하이면 scale in이 된다. HPA를 활용하는 경우로는 대규모의 트래픽이나 연산처리가 필요한 경우이다. 다양한 어플리케이션의 로그처리, publish subscript처럼 이벤트성의 처리를 할 때 자원이 부족한 경우 HPA를 이용해 scaling 할 수 있다. KED.. 2023. 1. 30. Ubuntu 22.04 Server SSH 포트 변경 1. sudo apt update 2. sudo apt install openssh-server 3. sudo vi /etc/ssh/sshd_config 4. 포트 번호 변경 5. sudo service sshd restart 6. 변경된 포트로 ssh 재접속 2023. 1. 15. 이전 1 2 3 4 5 6 7 8 ··· 66 다음 반응형