본문 바로가기
따배쿠

[따배쿠] 18-1 Kubernetes AutoScaling - 이론편

by Engineer-Lee 2022. 11. 21.
반응형

이번에는 쿠버네티스 오토스케일링과 HPA 오토스케일링에 대해 알아보자

 

쿠버네티스 오토스케일링은 크게 두 가지로 나눠진다.

클러스터 레벨의 오토스케일링의 예를 들어보자

만약 마스터노드 1대와 워커노드 1대(cpu 4core, memory 32GIB, 수 많은 파드가 동작중인 상태)가 있다고 생각해보자

파드(cpu 1core, memory 1GIB 필요) 하나를 실행해달라고 요청하면 마스터노드의 api가 현재 리소스들의 대한 상태정보를 etcd에서 찾아서 스케줄러에게 스케줄하도록 요청한다. 그러나 워커노드에 요청한 파드의 하드웨어 요구 만큼의 여유가 없다면 스케줄러는 파드를 pending 상태에 머무르게 한다.

그리고 pending 상태로 있는 파드가 있는지를 cluster level autoscale(CA) 가 점검한다. 

pending 상태의 파드가 있다면 CA는 새로운 워커노드를 생성시켜서 새 워커노드에 pending 상태의 파드가 배치되어 running 된다.

 

파드 레이어 오토스케일은 HPV와 VPA로 또 두가지로 나뉜다.

HPV는 파드에 클라우드 접속이 많아지면(metrics-server가 감지) 파드 개수를 늘려서(replicas, deployment) 접속처리를

원활하게 만든다.

VPA는 파드가 cpu 1core, memory 1GIB이라고 할때 여기에 클라우드 접속이 많아지게 되면(metrics-server가 감지)

파드의 용량을 키워서 접속처리를 원활하게 만든다.

 

 

 

 

 

 

 

반응형