반응형
운영 중인 시스템 재부팅
- 서비스 중단을 초래
- 근본적인 원인을 찾아야 함
예) 메모리 풀, 네트워크 소켓 수가 증가 등을 단순히 재부팅으로 해결하면 안됨 - 시작 스크립트를 수정하거나 중요한 설정을 변경한 후에는 재부팅 하여 검증 필요
-> 몇 주가 지난 후 변경된 설정으로 인해 문제가 발생하는 경우 원인을 찾기 힘듦
물리 호스트 종료
- halt, shutdown(로그인 된 사용자에게 알림), reboot (재시작)
- 예)
종료 : sudo shutdown -h now sudo halt -p 재부팅: sudo reboot
클라우드 가상 머신 종료
- halt, shutdown, reboot
- 웹 콘솔, API 이용 <- 권장하지 않음. 물리 호스트의 전원을 끄는 것과 유사.
- 인스턴스 종료(termination)는 인스턴스를 삭제 <- 복구가 안된다고 생각해야 함
-> 종료 방지 기능 사용
부팅 실패한 시스템 복구 방법
- 디버깅 하지 않고 백업에서부터 복구
-> 클라우드에서 많이 사용되는 방법 - 디버깅 모드로 시스템을 구동하여 복구
-> 단일 사용자 모드(single-user mode), 복구 모드(rescue mode), 긴급 모드(emergency mode)를 사용하여 복구
-> 네트워크가 사용 불가능하기 때문에, 콘솔에 물리적인 접근이 필요
* 최신 세대 EC2는 직렬 콘솔 접근을 제공하지만, 사전 조건들이 있음
-> 클라우드에서는 사용이 힘듦 - 복구 머신 이용하여 복구
-> 다른 시스템 이미지로 부팅 한 후 문제가 있는 시스템의 파일 시스템을 디버깅 서버에 마운트 하여 상황
-> 클라우드 환경에서 많이 사용
반응형
'리눅스 > Part3. Ch01. 부팅 및 시스템 관리 데몬의 이해' 카테고리의 다른 글
05. (실습) 시스템 부팅시 어플리케이션 자동실행 설정 (0) | 2022.07.16 |
---|---|
03. systemd 소개 (0) | 2022.07.16 |
02. 시작 서비스의 이해 (0) | 2022.07.16 |
01. 부팅 프로세스 이해 (0) | 2022.07.16 |