🌳 고급 인프라
오토스케일링이 뭔가요?
쉽게 이해하기
식당에서 손님이 많으면 알바생을 더 부르고, 손님이 적으면 알바생을 보내는 것과 같아요. 서버도 이렇게 사용자가 많을 때는 서버를 늘리고, 적을 때는 줄여서 비용을 절약하고 안정적으로 서비스를 제공할 수 있어요.
핵심 정리
트래픽에 따라 서버를 자동으로 늘리거나 줄이는 기술이에요.
자세히 알아보기
오토스케일링(Auto Scaling)은 서비스의 트래픽이나 부하에 따라 서버 자원을 자동으로 늘리거나 줄이는 기술입니다. 예를 들어 평소에는 서버 2대로 충분하지만, 이벤트 기간에 사용자가 10배 늘어나면 자동으로 서버를 20대로 늘려서 대응하는 거예요.
실무에서는 클라우드 서비스(AWS, GCP, Azure)의 오토스케일링 기능을 많이 사용합니다. CPU 사용률이 70%를 넘으면 서버를 추가하고, 30% 이하로 내려가면 서버를 줄이는 식으로 규칙을 설정할 수 있어요. 이렇게 하면 갑작스러운 트래픽 증가에도 서비스가 다운되지 않고, 트래픽이 적을 때는 비용을 아낄 수 있습니다.
오토스케일링에는 수평적 확장(Scale Out)과 수직적 확장(Scale Up) 두 가지 방식이 있어요. 수평적 확장은 서버 대수를 늘리는 것이고, 수직적 확장은 한 대의 서버 성능을 높이는 거예요. 대부분의 오토스케일링은 수평적 확장 방식을 사용합니다.
오토스케일링이 중요한 이유는 비용 최적화와 안정성 때문이에요. 항상 최대 트래픽을 대비해서 서버를 많이 띄워두면 비용이 낭비되고, 반대로 서버가 부족하면 사용자가 접속 오류를 겪게 되죠. 오토스케일링을 사용하면 이 두 가지 문제를 모두 해결할 수 있습니다.