Hình trên mô tả hai mô hình dự phòng nguồn điện (Power Supply Redundancy) thường được sử dụng trên các thiết bị mạng doanh nghiệp và Data Center như Cisco Catalyst 9600, Nexus, UCS, Server hoặc hệ thống UPS: N+1 và N+N.
N là gì?
N (Need) là số lượng bộ nguồn tối thiểu cần thiết để cung cấp đủ điện năng cho hệ thống hoạt động ở tải tối đa.
Ví dụ:
Khi đó:
N = 6 bộ nguồn.
Dự phòng N+1 là gì?
N+1 có nghĩa:
Ví dụ:
Switch cần 6 bộ nguồn:
PS1 PS2 PS3 PS4 PS5 PS6 → Active
PS7 → Standby
Tổng cộng:
6 + 1 = 7 bộ nguồn
Nếu một bộ nguồn bất kỳ (PS1 đến PS6) bị hỏng:
PS7 → chuyển sang Active
Hệ thống vẫn hoạt động bình thường.
Ưu điểm
Nếu đồng thời mất từ hai bộ nguồn trở lên:
PS1 và PS2 cùng hỏng
thì một bộ dự phòng duy nhất không đủ thay thế, hệ thống có thể bị thiếu công suất.
Dự phòng N+N là gì?
N+N có nghĩa:
Có hai nhóm nguồn độc lập, mỗi nhóm đủ khả năng cấp điện cho toàn bộ hệ thống.
Ví dụ:
Switch cần:
N = 4 bộ nguồn
Cấu hình:
Nhóm A: PS1 PS2 PS3 PS4
Nhóm B: PS5 PS6 PS7 PS8
Tổng cộng:
4 + 4 = 8 bộ nguồn
Cả nhóm A hoặc cả nhóm B đều có thể cấp điện cho toàn bộ chassis.
Nếu toàn bộ nhóm A bị mất:
PS1 PS2 PS3 PS4 → OFF
thì:
PS5 PS6 PS7 PS8
vẫn đủ công suất để vận hành thiết bị.
Ngược lại, nếu nhóm B mất điện, nhóm A vẫn tiếp tục hoạt động.
Tại sao Data Center thích N+N?
N+N không chỉ dự phòng hỏng hóc của một bộ nguồn mà còn dự phòng:
Đây là yêu cầu phổ biến trong:
So sánh trực quan
N+1
[N Active] + [1 Standby]
Ví dụ:
6 Active + 1 Standby
Chịu được:
N+N
[N Active] + [N Standby]
Ví dụ:
4 Active + 4 Standby
Chịu được:
Liên hệ với hình minh họa
Trong hình:
Phần trên:
PS1–PS4 : Active
PS5–PS8 : Standby
Đây là chế độ N+N (4+4).
Phần dưới:
PS1–PS7 : Active
PS8 : Standby
Đây là chế độ N+1 (7+1).
Có thể thấy:
Trong các Data Center hiện đại, đặc biệt là các hệ thống AI Cluster sử dụng GPU H100/L40S với công suất rất lớn, kiến trúc N+N kết hợp Dual Power Feed A/B gần như đã trở thành tiêu chuẩn bắt buộc để đảm bảo hệ thống không bị gián đoạn khi xảy ra sự cố điện hoặc trong quá trình bảo trì.
N là gì?
N (Need) là số lượng bộ nguồn tối thiểu cần thiết để cung cấp đủ điện năng cho hệ thống hoạt động ở tải tối đa.
Ví dụ:
- Một switch cần 6.000W.
- Mỗi Power Supply (PS) cung cấp 1.000W.
Khi đó:
N = 6 bộ nguồn.
Dự phòng N+1 là gì?
N+1 có nghĩa:
- Có N bộ nguồn đang hoạt động (Active) để cung cấp đủ công suất.
- Có thêm 1 bộ nguồn dự phòng (Standby).
Ví dụ:
Switch cần 6 bộ nguồn:
PS1 PS2 PS3 PS4 PS5 PS6 → Active
PS7 → Standby
Tổng cộng:
6 + 1 = 7 bộ nguồn
Nếu một bộ nguồn bất kỳ (PS1 đến PS6) bị hỏng:
PS7 → chuyển sang Active
Hệ thống vẫn hoạt động bình thường.
Ưu điểm
- Tiết kiệm chi phí.
- Tận dụng công suất tốt.
- Phù hợp với Campus, Enterprise, Core Switch.
Nếu đồng thời mất từ hai bộ nguồn trở lên:
PS1 và PS2 cùng hỏng
thì một bộ dự phòng duy nhất không đủ thay thế, hệ thống có thể bị thiếu công suất.
Dự phòng N+N là gì?
N+N có nghĩa:
Có hai nhóm nguồn độc lập, mỗi nhóm đủ khả năng cấp điện cho toàn bộ hệ thống.
Ví dụ:
Switch cần:
N = 4 bộ nguồn
Cấu hình:
Nhóm A: PS1 PS2 PS3 PS4
Nhóm B: PS5 PS6 PS7 PS8
Tổng cộng:
4 + 4 = 8 bộ nguồn
Cả nhóm A hoặc cả nhóm B đều có thể cấp điện cho toàn bộ chassis.
Nếu toàn bộ nhóm A bị mất:
PS1 PS2 PS3 PS4 → OFF
thì:
PS5 PS6 PS7 PS8
vẫn đủ công suất để vận hành thiết bị.
Ngược lại, nếu nhóm B mất điện, nhóm A vẫn tiếp tục hoạt động.
Tại sao Data Center thích N+N?
N+N không chỉ dự phòng hỏng hóc của một bộ nguồn mà còn dự phòng:
- Mất toàn bộ một nhánh điện (Power Feed A hoặc Feed B)
- Hỏng một PDU
- Hỏng một UPS
- Bảo trì một hệ thống điện mà không cần shutdown thiết bị
Đây là yêu cầu phổ biến trong:
- Tier III Data Center
- Tier IV Data Center
- Hệ thống Core Banking
- Telco Carrier Network
- Cloud Provider và AI Data Center
So sánh trực quan
N+1
[N Active] + [1 Standby]
Ví dụ:
6 Active + 1 Standby
Chịu được:
- Hỏng 1 PSU.
N+N
[N Active] + [N Standby]
Ví dụ:
4 Active + 4 Standby
Chịu được:
- Hỏng toàn bộ một nhóm nguồn.
- Mất một nhánh điện AC hoàn chỉnh.
- Bảo trì nóng (hot maintenance).
Liên hệ với hình minh họa
Trong hình:
Phần trên:
PS1–PS4 : Active
PS5–PS8 : Standby
Đây là chế độ N+N (4+4).
Phần dưới:
PS1–PS7 : Active
PS8 : Standby
Đây là chế độ N+1 (7+1).
Có thể thấy:
- N+1 tối ưu chi phí và hiệu suất sử dụng nguồn.
- N+N tối đa hóa tính sẵn sàng (High Availability) và khả năng chịu lỗi, nhưng chi phí đầu tư cao hơn đáng kể.
Trong các Data Center hiện đại, đặc biệt là các hệ thống AI Cluster sử dụng GPU H100/L40S với công suất rất lớn, kiến trúc N+N kết hợp Dual Power Feed A/B gần như đã trở thành tiêu chuẩn bắt buộc để đảm bảo hệ thống không bị gián đoạn khi xảy ra sự cố điện hoặc trong quá trình bảo trì.