2023.06.01(Auto Scaling과 CloudWatch를 이용한 알림 서비스)

DevOps 부트캠프 기록일지

DevOps_04_김재환

홈

질문하기

전체글

검색

분류 전체보기 (137)

태그 클라우드

HTTP day2 Daily Coding python Day5 Day1 linux 데브옵스부트캠프 과제 terraform 9번째 과제 Daily Study Day4 day3 데브옵스 부트캠프 표준스트림 Day6 CI/CD 코드스테이츠 Day11 마이크로서비스 코플릿 5번째 과제 DevOps 4기 데브옵스 비전공자를 위한 이해할 수 있는 IT지식 부트캠프 Day7 쿠버네티스

즐겨찾기

2023.06.01(Auto Scaling과 CloudWatch를 이용한 알림 서비스)

2023.06.01(Auto Scaling과 CloudWatch를 이용한 알림 서비스)

2023. 6. 2. 09:18ㆍ부트캠프/DevOps (TIL)

목표

특징 메트릭이 임계치를 넣을 때, 수평 확장이 자동으로 진행되게 하는 것이 바람직함
Auto Scaling Group (ASG)의 원리를 파악하고 주요 메트릭의 임계치 달성 시점을 경보 형태로 제공해야 함
이를 SNS 및 람다를 통해 구현한다.

최소 요구 사항

EC2 서버를 ASG를 통해 구성
CloudWatch 알람을 통해 ASG의 스케일 인/아웃 진행
스케일 인/아웃 진행 시 디스코드 알람 전송
메트릭을 바탕으로 장애 발생 예상 시점에 디스코드 알람 전송
=> CPU 사용률 (CPUUtilization) 값이 특정 값 이상일 때 경보 발생

시작 템플릿 구성

그룹정보
- 원하는 용량 : 1
- 최소 용량 : 1
- 최대 용량 : 1
시작 템플릿 구성
- Ubuntu Server (LTS)
- t2.nano
- 기존 혹은 신규 키 페어를 사용함
- 보안그룹 : 인바운드 HTTP 및 SSH 허용
- 사용자 데이터

1 #!/bin/bash
2 echo "Hello, World" > index.html
3 sudo apt update
4 sudo apt install stress
5 nohup busybox httpd -f -p 80 &

CloudWatch와 조정 정책

CloudWatch를 통한 Auto Scaling 그룹 지표 수집 활성화 필요
Scale-in 조건 : CPU 40% 이하
Scale-out 조건 : CPU 50% 이상
(로드 밸런서 설정 X)

- 경보 생성 레퍼런스

https://docs.aws.amazon.com/ko_kr/AmazonCloudWatch/latest/monitoring/US_AlarmAtThresholdEC2.html

- 제공받은 Lambda를 활용한 람다 함수 생성 (Python 3.x 버전)

부하 테스트

$ stress -c 1

#1. Auto Scaling 그룹 생성

- 시작 템플릿 생성

=> ubuntu 20.04 LTS // t2.nano

- 키페어 및 보안그룹 선택 또는 생성

- 고급 세부 정보 -> 사용자 데이터 입력

- 이후 VPC & subnet 설정 + CloudWatch 그룹 지표 수집 활성화

- 그룹 크기 설정 및 생성 마무리

#2. 람다 함수 생성

- python 3.x 확인

- 람다 코드 수정 및 배포

- 구성 -> 환경변수 추가

#3. SNS 생성 및 구독 생성 (람다)

#4. CloudWatch 내 경보 생성

- 생성 -> 지표선택 -> EC2 -> 인스턴스별 지표

- EC2 찾기 + CPUUtilization 선택

- sacle-out, scale-in으로 총 2개 생성

- SNS 연결

- Scale-out, Scale-in 생성

#5. EC2 접속 및 CPU 사용량 증가 시키기

- scale-out 확인 후 stress 명령어 종료

- scale-in 확인

#.TROUBLESHOOTING

전부 맞춰 설정하고 EC2에 접속해서 스트레스만 주면 되는 상황이었는데 접속이 계속 안되는 현상이 발견됐다

내용을 보니 22번포트에 접속이 제한되 연결이 안되어 타임아웃이 된 상황이었는데 보안그룹에 인바운드 규칙도 ssh 22번포트도 허용한 상태여서 더 오리무중인 상황이었다. 알고보니 서울 리전에 있는 기본 VPC의 서브넷들을 삭제한 상황이어서 EC2가 생성되도 퍼블릭 IP나 DNS가 비어있는 상황이 발생한 거였다. 서울리전에 있는 VPC을 전부 삭제하고 다른리전으로 들어갔다가 다시 들어가면 생성탭에 기본 VPC 생성이 생겨 다시 복구가 가능했다.

저작자표시 (새창열림)

'부트캠프 > DevOps (TIL)' 카테고리의 다른 글

2023.06.07(병목 구간의 확인과 개선 기본 지식) (0)	2023.06.07
2023.06.07(가용성과 확장성 평가) (0)	2023.06.07
2023.05.19(Sprint - 새 버전이 망가졌어요) (0)	2023.05.19
2023.05.18(쿠버네티스 워크로드-서비스, 로드밸런싱, 네트워킹) (0)	2023.05.19
2023.05.18(쿠버네티스 워크로드-디플로이먼트 (Deployment)) (0)	2023.05.19

목표