☁️ BÍ MẬT CÂN BẰNG TẢI & TỰ ĐỘNG MỞ RỘNG HỆ THỐNG TRÊN AWS
Hiểu sâu về Load Balancer, Auto Scaling và EBS – 3 trụ cột vàng giúp hệ thống luôn sẵn sàng!
Bạn đã bao giờ tự hỏi, làm sao các hệ thống lớn như Netflix, Shopee hay Amazon có thể phục vụ hàng triệu người dùng cùng lúc mà không bị sập?
Câu trả lời nằm ở 3 “trụ cột” quan trọng của hạ tầng AWS:
Load Balancer, Auto Scaling Group và EBS (Elastic Block Store).
Cùng VnPro tìm hiểu nhé 👇
⚙️ 1. Hiểu đúng về khả năng mở rộng (Scalability) và tính sẵn sàng cao (High Availability)
Scalability có nghĩa là hệ thống có thể đáp ứng tải lớn hơn bằng cách thích nghi linh hoạt – khi người dùng tăng, hệ thống tự động mở rộng để không bị nghẽn.
Có hai kiểu mở rộng chính: 🔸 Vertical Scalability (Mở rộng theo chiều dọc)
Là cách tăng sức mạnh cho một máy chủ duy nhất – ví dụ, thay vì EC2 t2.micro (1 vCPU, 1GB RAM), bạn nâng lên t2.large (2 vCPU, 8GB RAM).
Cách này phổ biến cho hệ thống đơn lẻ như cơ sở dữ liệu. Tuy nhiên, nó có giới hạn vật lý, không thể tăng mãi mãi. 🔸 Horizontal Scalability (Mở rộng theo chiều ngang)
Là cách tăng số lượng máy chủ EC2 để chia tải.
Ví dụ: khi có nhiều người truy cập website, bạn thêm nhiều EC2 để xử lý song song.
Đây là mô hình phổ biến trong hệ thống web hiện đại và dễ dàng thực hiện nhờ AWS.
🧱 2. High Availability – Giúp hệ thống luôn sẵn sàng 24/7
High Availability (HA) có nghĩa là hệ thống vẫn hoạt động ngay cả khi 1 trung tâm dữ liệu (AZ) gặp sự cố.
AWS cho phép bạn chạy ứng dụng trên nhiều Availability Zone (AZ) – mỗi AZ là một trung tâm dữ liệu độc lập.
Ví dụ:
HA thường đi kèm với Auto Scaling và Load Balancer – hai công cụ “thần thánh” giúp hệ thống sống sót dù tải tăng hay sự cố xảy ra.
⚖️ 3. Load Balancer – Cân bằng tải thông minh trên AWS
Load Balancer (LB) là máy chủ trung gian phân phối lưu lượng truy cập đến nhiều máy chủ EC2 phía sau.
Thay vì người dùng truy cập trực tiếp vào 1 EC2, họ sẽ kết nối tới LB – nơi quyết định “ai sẽ xử lý yêu cầu này”. 📌 Lợi ích của Load Balancer:
Là dịch vụ load balancer được AWS quản lý hoàn toàn – bạn không cần tự cấu hình máy chủ, bảo trì hay nâng cấp.
ELB tích hợp sẵn với EC2, Auto Scaling Group, ECS, CloudWatch, Route53, WAF và ACM (chứng chỉ SSL).
🩺 4. Health Check – “Bác sĩ” theo dõi tình trạng EC2
ELB liên tục kiểm tra sức khỏe EC2 bằng Health Check.
Khi một EC2 phản hồi sai (không trả mã 200 OK), ELB tự động ngưng gửi yêu cầu đến máy đó.
Nhờ vậy, người dùng luôn được chuyển đến máy chủ hoạt động tốt nhất.
🔄 5. Các loại Load Balancer trên AWS
AWS hiện cung cấp 4 loại Load Balancer, phù hợp cho từng mục đích khác nhau:
🍪 6. Sticky Sessions – Giữ người dùng ở cùng một máy chủ
Khi bạn cần duy trì trạng thái người dùng (ví dụ giỏ hàng hoặc đăng nhập), Load Balancer có thể dùng cookie để đảm bảo mỗi người dùng luôn được chuyển đến cùng một EC2 cũ.
Tuy nhiên, bật stickiness quá nhiều có thể khiến tải không được chia đều giữa các máy.
🌍 7. Cross-Zone Load Balancing – Cân bằng tải giữa các vùng (AZ)
Tính năng này giúp ELB chia tải đều giữa các máy ở tất cả các AZ, không chỉ trong 1 vùng.
🔒 8. SSL/TLS – Bảo mật dữ liệu truyền tải
ELB hỗ trợ mã hóa HTTPS thông qua chứng chỉ SSL/TLS.
Bạn có thể:
🕓 9. Connection Draining – Dừng kết nối an toàn
Khi EC2 sắp bị gỡ khỏi nhóm hoặc không còn khỏe, ELB sẽ ngừng nhận request mới và chờ các kết nối hiện tại hoàn tất trong một khoảng thời gian (mặc định 300 giây).
Điều này đảm bảo người dùng không bị mất dữ liệu khi máy ngừng hoạt động.
⚡ 10. Auto Scaling Group (ASG) – Tự động mở rộng thông minh
Trong thế giới thật, tải của ứng dụng luôn thay đổi.
Auto Scaling Group cho phép bạn tự động thêm hoặc giảm EC2 tùy theo tải thực tế.
ASG có thể:
ASG tích hợp sẵn với Load Balancer và CloudWatch, giúp bạn vận hành mà không cần can thiệp thủ công.
📈 11. Chính sách mở rộng tự động (Scaling Policies)
AWS hỗ trợ 3 loại chính:
Ngoài ra còn có Predictive Scaling – sử dụng AI để dự đoán tải trước và mở rộng sẵn.
🧠 12. Các chỉ số quan trọng cần theo dõi
Bộ ba Elastic Load Balancer – Auto Scaling Group – EBS là nền tảng giúp bạn xây dựng hệ thống tự động, linh hoạt, không downtime.
Đây chính là cốt lõi để trở thành Cloud Engineer hoặc DevOps chuyên nghiệp.
🔥 Muốn trực tiếp làm lab trên AWS, hiểu sâu cách cấu hình Auto Scaling, Load Balancer, và tối ưu EC2 thật?
👉 Hãy tham gia khóa “AWS ” tại VnPro – nơi bạn được học từ chuyên gia nhiều năm kinh nghiệm, thực hành 100% trên tài khoản AWS thật, và nắm chắc kiến trúc Cloud hiện đại.
🎓 Đăng ký ngay hôm nay để nhận ưu đãi học phí đặc biệt!
vnpro AWS cloud #LoadBalancer #AutoScaling #EBS #VnProTraining #CloudEngineer devops
Hiểu sâu về Load Balancer, Auto Scaling và EBS – 3 trụ cột vàng giúp hệ thống luôn sẵn sàng!
Bạn đã bao giờ tự hỏi, làm sao các hệ thống lớn như Netflix, Shopee hay Amazon có thể phục vụ hàng triệu người dùng cùng lúc mà không bị sập?
Câu trả lời nằm ở 3 “trụ cột” quan trọng của hạ tầng AWS:
Load Balancer, Auto Scaling Group và EBS (Elastic Block Store).
Cùng VnPro tìm hiểu nhé 👇
⚙️ 1. Hiểu đúng về khả năng mở rộng (Scalability) và tính sẵn sàng cao (High Availability)
Scalability có nghĩa là hệ thống có thể đáp ứng tải lớn hơn bằng cách thích nghi linh hoạt – khi người dùng tăng, hệ thống tự động mở rộng để không bị nghẽn.
Có hai kiểu mở rộng chính: 🔸 Vertical Scalability (Mở rộng theo chiều dọc)
Là cách tăng sức mạnh cho một máy chủ duy nhất – ví dụ, thay vì EC2 t2.micro (1 vCPU, 1GB RAM), bạn nâng lên t2.large (2 vCPU, 8GB RAM).
Cách này phổ biến cho hệ thống đơn lẻ như cơ sở dữ liệu. Tuy nhiên, nó có giới hạn vật lý, không thể tăng mãi mãi. 🔸 Horizontal Scalability (Mở rộng theo chiều ngang)
Là cách tăng số lượng máy chủ EC2 để chia tải.
Ví dụ: khi có nhiều người truy cập website, bạn thêm nhiều EC2 để xử lý song song.
Đây là mô hình phổ biến trong hệ thống web hiện đại và dễ dàng thực hiện nhờ AWS.
💡 Vertical scale là “tăng cơ bắp cho 1 người”, còn Horizontal scale là “tăng số người cùng làm việc”.
🧱 2. High Availability – Giúp hệ thống luôn sẵn sàng 24/7
High Availability (HA) có nghĩa là hệ thống vẫn hoạt động ngay cả khi 1 trung tâm dữ liệu (AZ) gặp sự cố.
AWS cho phép bạn chạy ứng dụng trên nhiều Availability Zone (AZ) – mỗi AZ là một trung tâm dữ liệu độc lập.
Ví dụ:
- Ứng dụng của bạn chạy ở New York và San Francisco.
- Nếu 1 nơi gặp sự cố, nơi còn lại vẫn phục vụ người dùng bình thường.
HA thường đi kèm với Auto Scaling và Load Balancer – hai công cụ “thần thánh” giúp hệ thống sống sót dù tải tăng hay sự cố xảy ra.
⚖️ 3. Load Balancer – Cân bằng tải thông minh trên AWS
Load Balancer (LB) là máy chủ trung gian phân phối lưu lượng truy cập đến nhiều máy chủ EC2 phía sau.
Thay vì người dùng truy cập trực tiếp vào 1 EC2, họ sẽ kết nối tới LB – nơi quyết định “ai sẽ xử lý yêu cầu này”. 📌 Lợi ích của Load Balancer:
- Phân phối đều tải cho nhiều EC2 → hệ thống chạy mượt hơn.
- Cung cấp một điểm truy cập duy nhất (DNS) cho toàn ứng dụng.
- Tự động kiểm tra tình trạng (health check) của từng EC2.
- Tự động bỏ qua EC2 lỗi và chuyển lưu lượng sang máy khỏe mạnh.
- Hỗ trợ HTTPS và SSL, giúp bảo mật dữ liệu truyền tải.
- Giúp hệ thống hoạt động đa vùng (multi-AZ) để tăng độ tin cậy.
Là dịch vụ load balancer được AWS quản lý hoàn toàn – bạn không cần tự cấu hình máy chủ, bảo trì hay nâng cấp.
ELB tích hợp sẵn với EC2, Auto Scaling Group, ECS, CloudWatch, Route53, WAF và ACM (chứng chỉ SSL).
🩺 4. Health Check – “Bác sĩ” theo dõi tình trạng EC2
ELB liên tục kiểm tra sức khỏe EC2 bằng Health Check.
Khi một EC2 phản hồi sai (không trả mã 200 OK), ELB tự động ngưng gửi yêu cầu đến máy đó.
Nhờ vậy, người dùng luôn được chuyển đến máy chủ hoạt động tốt nhất.
🔄 5. Các loại Load Balancer trên AWS
AWS hiện cung cấp 4 loại Load Balancer, phù hợp cho từng mục đích khác nhau:
- Classic Load Balancer (CLB) – thế hệ đầu tiên (2009).
Hỗ trợ TCP, HTTP, HTTPS – phù hợp cho ứng dụng cũ. - Application Load Balancer (ALB) – thế hệ mới (2016).
Hoạt động ở tầng 7 (HTTP), thông minh hơn, hỗ trợ: - Chuyển hướng HTTP → HTTPS
- Routing theo path, hostname hoặc tham số query string
- Là lựa chọn hoàn hảo cho microservice hoặc container (ECS, Docker).
- Network Load Balancer (NLB) – tốc độ cao, độ trễ cực thấp (~100 ms).
Xử lý hàng triệu request/giây, hỗ trợ TCP, UDP, TLS, có Elastic IP cố định.
Phù hợp cho hệ thống hiệu năng cao, thời gian thực, game hoặc giao dịch tài chính. - Gateway Load Balancer (GWLB) – chuyên dùng cho bảo mật mạng.
Cho phép triển khai firewall, IDS/IPS hoặc Deep Packet Inspection ở tầng mạng (Layer 3).
Dùng GENEVE protocol (port 6081) để định tuyến gói tin qua thiết bị bảo mật ảo.
🍪 6. Sticky Sessions – Giữ người dùng ở cùng một máy chủ
Khi bạn cần duy trì trạng thái người dùng (ví dụ giỏ hàng hoặc đăng nhập), Load Balancer có thể dùng cookie để đảm bảo mỗi người dùng luôn được chuyển đến cùng một EC2 cũ.
Tuy nhiên, bật stickiness quá nhiều có thể khiến tải không được chia đều giữa các máy.
🌍 7. Cross-Zone Load Balancing – Cân bằng tải giữa các vùng (AZ)
Tính năng này giúp ELB chia tải đều giữa các máy ở tất cả các AZ, không chỉ trong 1 vùng.
- ALB: Bật sẵn, miễn phí.
- NLB và GWLB: Có phí khi bật.
- CLB: Có thể bật thủ công.
🔒 8. SSL/TLS – Bảo mật dữ liệu truyền tải
ELB hỗ trợ mã hóa HTTPS thông qua chứng chỉ SSL/TLS.
Bạn có thể:
- Quản lý chứng chỉ bằng AWS Certificate Manager (ACM).
- Dùng Server Name Indication (SNI) để chạy nhiều tên miền, nhiều chứng chỉ SSL trên cùng 1 LB.
- Chỉ có ALB và NLB hỗ trợ SNI, CLB thì không.
🕓 9. Connection Draining – Dừng kết nối an toàn
Khi EC2 sắp bị gỡ khỏi nhóm hoặc không còn khỏe, ELB sẽ ngừng nhận request mới và chờ các kết nối hiện tại hoàn tất trong một khoảng thời gian (mặc định 300 giây).
Điều này đảm bảo người dùng không bị mất dữ liệu khi máy ngừng hoạt động.
⚡ 10. Auto Scaling Group (ASG) – Tự động mở rộng thông minh
Trong thế giới thật, tải của ứng dụng luôn thay đổi.
Auto Scaling Group cho phép bạn tự động thêm hoặc giảm EC2 tùy theo tải thực tế.
ASG có thể:
- Tăng số lượng EC2 khi tải cao (Scale Out)
- Giảm EC2 khi tải thấp (Scale In)
- Giữ tối thiểu – tối đa – số lượng mong muốn (desired capacity)
- Tự động thay thế EC2 lỗi bằng máy mới.
ASG tích hợp sẵn với Load Balancer và CloudWatch, giúp bạn vận hành mà không cần can thiệp thủ công.
📈 11. Chính sách mở rộng tự động (Scaling Policies)
AWS hỗ trợ 3 loại chính:
- Target Tracking:
Đặt mục tiêu, ví dụ “CPU trung bình = 40%”. ASG sẽ tự động điều chỉnh số lượng EC2 để duy trì mục tiêu đó. - Simple / Step Scaling:
Dựa trên ngưỡng cụ thể. Ví dụ: - Nếu CPU > 70% → thêm 2 EC2
- Nếu CPU < 30% → bớt 1 EC2
- Scheduled Scaling:
Lên lịch mở rộng trước, ví dụ: “Tăng EC2 vào 8h sáng, giảm sau 10h tối”.
Ngoài ra còn có Predictive Scaling – sử dụng AI để dự đoán tải trước và mở rộng sẵn.
🧠 12. Các chỉ số quan trọng cần theo dõi
- CPU Utilization – đo tải CPU trung bình.
- RequestCountPerTarget – số lượng request mỗi EC2.
- Network In/Out – băng thông sử dụng.
- Custom Metric – chỉ số do bạn tự định nghĩa (qua CloudWatch).
Bộ ba Elastic Load Balancer – Auto Scaling Group – EBS là nền tảng giúp bạn xây dựng hệ thống tự động, linh hoạt, không downtime.
Đây chính là cốt lõi để trở thành Cloud Engineer hoặc DevOps chuyên nghiệp.
🔥 Muốn trực tiếp làm lab trên AWS, hiểu sâu cách cấu hình Auto Scaling, Load Balancer, và tối ưu EC2 thật?
👉 Hãy tham gia khóa “AWS ” tại VnPro – nơi bạn được học từ chuyên gia nhiều năm kinh nghiệm, thực hành 100% trên tài khoản AWS thật, và nắm chắc kiến trúc Cloud hiện đại.
🎓 Đăng ký ngay hôm nay để nhận ưu đãi học phí đặc biệt!
vnpro AWS cloud #LoadBalancer #AutoScaling #EBS #VnProTraining #CloudEngineer devops