Bạn đã bao giờ rơi vào tình huống: bỗng nhiên cả văn phòng “bặt vô âm tín”, không ai truy cập được Internet, hoang mang không biết nguyên nhân từ đâu? Hay một ngày đẹp trời, băng thông bị nuốt sạch bởi một ứng dụng lạ? Với tư cách là CCIE Security, CCIE Enterprise Infrastructure và CISSP, mình sẽ cùng bạn khám phá những “vũ khí” giám sát cơ bản tích hợp sẵn trong Cisco IOS — để từ đó bạn có thể chủ động phát hiện và xử lý sự cố trước khi chúng trở thành thảm họa.
1. Lệnh show – “Cửa sổ” nhìn thấu vận hành thiết bị
Tại sao giám sát mạng là “chìa khóa vàng”?
Bắt đầu từ đâu?
1. Lệnh show – “Cửa sổ” nhìn thấu vận hành thiết bị
- Ý nghĩa: show như một bản báo cáo tức thì về mọi ngóc ngách của thiết bị: phiên bản IOS, trạng thái giao diện, cấu hình đang chạy…
- Ví dụ thực tế: Khi chi nhánh Hà Nội báo không vào được VLAN kế toán, bạn chỉ cần:
show interfaces GigabitEthernet0/1
để kiểm tra ngay xem cổng có bị lỗi CRC hay đứt dây không. Hay gõ
show ip route
để đảm bảo tuyến MPLS từ Data Center về campus vẫn còn “sống”.
- Chức năng: Gửi gói ICMP đến đích, đo độ trễ và tỷ lệ mất gói.
- Kịch bản áp dụng: Bạn muốn kiểm tra nhanh link VPN đến chi nhánh Hải Phòng:
ping 203.113.12.5 repeat 10
Nếu tỉ lệ reply dưới 90% hoặc độ trễ vọt lên >200 ms thì có vấn đề đường truyền hoặc cấu hình crypto.
- Công dụng: Hiển thị từng “hop” trên đường đi, cho biết router nào đang chậm hoặc rớt gói.
- Tình huống minh họa: Khi người dùng than phiền truy cập website chậm, bạn chạy:
traceroute 8.8.8.8
sẽ cho thấy ngay hop nào—ví dụ như ISP trung gian—đang mất nhiều thời gian phản hồi, để bạn phối hợp với bên đối tác.
- Cơ chế: Thiết bị gửi log (error, warning, config change…) đến server syslog.
- Ví dụ thực tế: Khi một module quang SFP trên switch core gặp lỗi, syslog ghi lại:
perl
Copy
%LINK-3-UPDOWN: Interface Gig1/0/24, changed state to down
kèm timestamp. Nhờ đó bạn dễ dàng tra cứu và cảnh báo tức thì.
- Khái niệm: Cho phép NMS (ví dụ SolarWinds, PRTG) thu thập số liệu như CPU, memory, traffic từ hàng trăm thiết bị.
- Áp dụng thực tế: Phần mềm PRTG hiển thị biểu đồ lưu lượng trên mỗi interface, giúp bạn nhanh chóng nhận diện port nào đang bị full-duplex collision hoặc băng thông nào sắp vượt ngưỡng cảnh báo.
- Chức năng: Thu thập thông tin về từng luồng (flow) — nguồn, đích, ứng dụng, bytes transferred…
- Tình huống minh hoạ: Trong giờ cao điểm, NetFlow báo rằng một máy chủ backup đang upload dữ liệu về cloud, chiếm 80% băng thông. Với thông tin này, bạn có thể điều chỉnh lịch backup vào thời điểm khác, hoặc ưu tiên QoS.
Tại sao giám sát mạng là “chìa khóa vàng”?
- Phát hiện sớm: Thay vì “đổ xô” khi sự cố đã xảy ra, bạn kịp thời khắc phục khi thiết bị mới có dấu hiệu bất thường.
- Tối ưu hiệu suất: Theo dõi liên tục giúp đảm bảo độ ổn định, tránh nghẽn cổ chai.
- Nâng cao bảo mật: Syslog và NetFlow có thể hé lộ hoạt động bất thường (quét port, tấn công DDoS…) để bạn vô hiệu hoá ngay.
- Lập kế hoạch mở rộng: Dữ liệu lưu lượng, CPU/memory trend là cơ sở để bạn quyết định nâng cấp hoặc cân bằng tải.
Bắt đầu từ đâu?
- Thực hành các lệnh cơ bản (show, ping, traceroute) trên thiết bị thật hoặc môi trường giả lập như Packet Tracer, VIRL.
- Cấu hình syslog: Định tuyến log về server tập trung, đặt mức cảnh báo hợp lý.
- Khai thác SNMP: Thiết lập community và cấu hình NMS cơ bản.
- Triển khai NetFlow: Bật tính năng export flow trên router core, phân tích bằng tool như ntop hoặc SolarWinds NetFlow Traffic Analyzer.