Anh em đã bao giờ trải qua cảm giác "toát mồ hôi hột" khi vừa tự tin đấu nối 4 sợi cáp từ Server ESXi vào con Switch Core, và chỉ vài giây sau... toàn bộ mạng LAN chớp đèn loạn xạ, ping time out hàng loạt, trang Web quản trị quay đều rồi sập hẳn chưa?
Đó chính là cơn ác mộng Loop mạng kinh điển khi triển khai tích hợp giữa hạ tầng mạng vật lý và môi trường ảo hóa. Quá trình cấu hình gộp cổng để tăng băng thông (EtherChannel / NIC Teaming) tuy cơ bản, nhưng chỉ cần hai đầu thiết bị "không hiểu ý nhau" là hệ thống sẽ trả giá đắt.
Hôm nay, mình xin đúc kết lại quy trình chuẩn và một vài kinh nghiệm xương máu để anh em tự tin "cân" mọi bài toán kết nối giữa Cisco Switch và VMware ESXi nhé!
1. Nguyên tắc cốt lõi: Cặp bài trùng "Mode ON" và "IP Hash"
Nguyên nhân lớn nhất gây sập mạng khi cắm cáp là do sự bất đồng bộ thuật toán. Môi trường vSwitch tiêu chuẩn của VMware ESXi không hỗ trợ các giao thức đàm phán động như LACP hay PAgP. Do đó, chúng ta bắt buộc phải sử dụng cấu hình tĩnh ở cả hai đầu.
Để cấu hình nhanh và tránh gõ sót, anh em luôn ưu tiên dùng lệnh interface range. Ngoài ra, nên bật tính năng cân bằng tải toàn cục của port-channel để Switch chia gói tin đều hơn ra các sợi cáp.
Plt-ip
Trường hợp cấu hình Trunking (chạy nhiều VLAN cho Server):
! Gom các cổng vật lý và ép chạy Mode ON
Switch(config)# interface range gi1/0/10 - 13
Switch(config-if-range)# description CONNECT_TO_ESXI_SERVER
Switch(config-if-range)# switchport mode trunk
Switch(config-if-range)# switchport trunk allowed vlan 10,20,30
Switch(config-if-range)# channel-group 10 mode on
Switch(config-if-range)# exit
! Tối ưu hóa thuật toán chia tải trên Switch
Switch(config)# port-channel load-balance src-dst-ip
3. Cấu hình phía VMware ESXi & "Mẹo 1-Dây" xương máu
Đây là bước quyết định. Nếu máy chủ ESXi đang trắng cấu hình mà anh em cắm luôn 4 sợi dây vào Switch, mạng sẽ loop ngay tức khắc khiến anh em không thể truy cập IP quản trị để đổi thuật toán.
Mẹo xử lý (Troubleshooting Trick):
Đứng trên Cisco, gõ lệnh show etherchannel summary. Nếu thấy các port hiển thị chữ (P) (Bundled in port-channel) và nhóm kênh báo (U) (In use) là hạ tầng mạng đã ghi nhận.
Đứng trên Server, test thử một lệnh ping liên tục ra ngoài IP của Gateway hoặc DNS (8.8.8.8), nếu kết nối mượt, không bị drop rớt thì xin chúc mừng anh em đã hạ gục thành công case này!
Hy vọng chút kinh nghiệm nhỏ này sẽ giúp anh em triển khai các dự án hạ tầng nhanh gọn và an toàn hơn. Anh em trong group có ai từng dính chưởng lỗi này hay có case thực tế nào khoai hơn thì cùng comment thảo luận bên dưới nhé! Chúc anh em cấu hình một phát ăn ngay!
Đó chính là cơn ác mộng Loop mạng kinh điển khi triển khai tích hợp giữa hạ tầng mạng vật lý và môi trường ảo hóa. Quá trình cấu hình gộp cổng để tăng băng thông (EtherChannel / NIC Teaming) tuy cơ bản, nhưng chỉ cần hai đầu thiết bị "không hiểu ý nhau" là hệ thống sẽ trả giá đắt.
Hôm nay, mình xin đúc kết lại quy trình chuẩn và một vài kinh nghiệm xương máu để anh em tự tin "cân" mọi bài toán kết nối giữa Cisco Switch và VMware ESXi nhé!
1. Nguyên tắc cốt lõi: Cặp bài trùng "Mode ON" và "IP Hash"
Nguyên nhân lớn nhất gây sập mạng khi cắm cáp là do sự bất đồng bộ thuật toán. Môi trường vSwitch tiêu chuẩn của VMware ESXi không hỗ trợ các giao thức đàm phán động như LACP hay PAgP. Do đó, chúng ta bắt buộc phải sử dụng cấu hình tĩnh ở cả hai đầu.
- Đầu Cisco Switch: Bắt buộc ép cổng chạy Static EtherChannel bằng lệnh mode on.
- Đầu VMware ESXi: Bắt buộc chuyển thuật toán Load Balancing sang Route based on IP hash. (Mặc định ESXi thường để Route based on originating port ID, nếu không đổi thì cắm dây vào là sập mạng ngay).
Để cấu hình nhanh và tránh gõ sót, anh em luôn ưu tiên dùng lệnh interface range. Ngoài ra, nên bật tính năng cân bằng tải toàn cục của port-channel để Switch chia gói tin đều hơn ra các sợi cáp.
Plt-ip
Trường hợp cấu hình Trunking (chạy nhiều VLAN cho Server):
! Gom các cổng vật lý và ép chạy Mode ON
Switch(config)# interface range gi1/0/10 - 13
Switch(config-if-range)# description CONNECT_TO_ESXI_SERVER
Switch(config-if-range)# switchport mode trunk
Switch(config-if-range)# switchport trunk allowed vlan 10,20,30
Switch(config-if-range)# channel-group 10 mode on
Switch(config-if-range)# exit
! Tối ưu hóa thuật toán chia tải trên Switch
Switch(config)# port-channel load-balance src-dst-ip
3. Cấu hình phía VMware ESXi & "Mẹo 1-Dây" xương máu
Đây là bước quyết định. Nếu máy chủ ESXi đang trắng cấu hình mà anh em cắm luôn 4 sợi dây vào Switch, mạng sẽ loop ngay tức khắc khiến anh em không thể truy cập IP quản trị để đổi thuật toán.
Mẹo xử lý (Troubleshooting Trick):
- Bước 1 (Cô lập): Rút 3 dây ra, chỉ cắm đúng 1 dây mạng kết nối từ Server tới Switch (hoặc cắm thẳng vào laptop để cấu hình nội bộ).
- Bước 2 (Truy cập): Đăng nhập vào Web UI của ESXi qua 1 dây đó. Vào Networking -> Virtual switches -> Chọn vSwitch (VD: vSwitch0) -> Edit settings.
- Bước 3 (Đổi thuật toán): Tại mục NIC teaming, chuyển Load balancing thành Route based on IP hash. Đảm bảo cả 4 uplink (vmnic) đều nằm ở trạng thái Active.
- Bước 4 (Đồng bộ Management Network): Đừng quên vào tab Port groups, chọn Management Network -> Edit settings và áp dụng chính xác thuật toán IP Hash này (chọn Inherit từ vSwitch hoặc set tay thủ công).
- Bước 5 (Hoàn thiện): Sau khi lưu cấu hình thành công, anh em tự tin cắm 3 dây còn lại vào. Hệ thống sẽ tự động bắt tay nhau trơn tru.
Đứng trên Cisco, gõ lệnh show etherchannel summary. Nếu thấy các port hiển thị chữ (P) (Bundled in port-channel) và nhóm kênh báo (U) (In use) là hạ tầng mạng đã ghi nhận.
Đứng trên Server, test thử một lệnh ping liên tục ra ngoài IP của Gateway hoặc DNS (8.8.8.8), nếu kết nối mượt, không bị drop rớt thì xin chúc mừng anh em đã hạ gục thành công case này!
Hy vọng chút kinh nghiệm nhỏ này sẽ giúp anh em triển khai các dự án hạ tầng nhanh gọn và an toàn hơn. Anh em trong group có ai từng dính chưởng lỗi này hay có case thực tế nào khoai hơn thì cùng comment thảo luận bên dưới nhé! Chúc anh em cấu hình một phát ăn ngay!