OSPF Troubleshooting: Duplicate Router IDs và Mismatched Network Types
Trong quá trình troubleshooting OSPF, khi đã loại trừ các nguyên nhân phổ biến như Area, Timer, Authentication và MTU, vẫn còn hai lỗi khá "khó chịu" có thể khiến OSPF không hình thành Neighbor hoặc không học được Route:
Đây là những lỗi xuất hiện không nhiều nhưng khi xảy ra lại rất khó phát hiện nếu không hiểu rõ cơ chế hoạt động của OSPF.
1. Duplicate Router IDs (Trùng Router ID)
Router ID quan trọng như thế nào?
Trong OSPF, Router ID (RID) là định danh duy nhất của mỗi router trong OSPF Domain.
Bạn có thể xem RID giống như:
CCCD của Router
Mọi hoạt động của OSPF đều dựa vào Router ID:
Do đó:
RID phải là duy nhất trong toàn bộ OSPF Domain.
Nếu có hai router sử dụng cùng một RID, OSPF sẽ không thể hoạt động chính xác.
Triệu chứng của Duplicate RID
Cisco sẽ sinh ra Syslog:
%OSPF-4-DUP_RTRID_NBR:
OSPF detected duplicate router-id 10.1.23.2
from 10.1.12.2 on interface GigabitEthernet1/0
Thông báo này gần như chỉ đích danh nguyên nhân:
Có hai router đang sử dụng cùng Router ID:
10.1.23.2
Kết quả:
Kiểm tra Router ID
Lệnh đơn giản nhất:
show ip protocols
Ví dụ:
Router ID 10.1.23.2
Thực tế, hầu như mọi lệnh OSPF đều hiển thị Router ID:
show ip ospf
show ip ospf neighbor
show ip ospf interface
show ip protocols
Nguyên nhân thường gặp
Sao chép cấu hình (Copy/Paste)
Ví dụ:
router ospf 1
router-id 10.255.255.1
Kỹ sư clone cấu hình sang router khác nhưng quên đổi Router ID.
Đây là nguyên nhân phổ biến nhất.
Restore từ Backup
Khi triển khai router mới:
Restore Config
↓
Router-ID cũ được giữ nguyên
↓
Duplicate RID
Triển khai Automation/IaC
Ansible, Terraform hoặc Template có thể vô tình đẩy cùng Router ID cho nhiều thiết bị.
Trong Data Center hoặc SD-WAN quy mô lớn, lỗi này không hiếm gặp.
Lưu ý khi thay đổi Router ID
Ví dụ:
router ospf 1
router-id 1.1.1.1
Thay đổi này chưa có hiệu lực ngay.
Bạn phải reset OSPF Process:
clear ip ospf process
hoặc:
Reload Router
Nếu không, router vẫn tiếp tục sử dụng Router ID cũ.
Góc nhìn thực chiến
Trong Enterprise, rất nhiều kỹ sư sử dụng Loopback làm RID:
interface Loopback0
ip address 10.255.255.X 255.255.255.255
hoặc:
router ospf 1
router-id X.X.X.X
Điều này giúp Router ID:
2. Mismatched Network Types
OSPF Network Type là gì?
OSPF hỗ trợ nhiều loại Network Type khác nhau.
Mỗi loại sẽ quyết định:
Nếu hai router sử dụng Network Type không tương thích, Neighbor sẽ không hình thành.
Các OSPF Network Type phổ biến
Broadcast
Mặc định trên Ethernet.
Đặc điểm:
Ví dụ:
Network Type BROADCAST
Non-Broadcast (NBMA)
Mặc định trên Frame Relay Multipoint.
Đặc điểm:
Point-to-Point
Mặc định trên Serial Point-to-Point.
Đặc điểm:
Point-to-Multipoint
Thường dùng trong Hub-and-Spoke.
Đặc điểm:
Point-to-Multipoint Nonbroadcast
Dùng trong môi trường không hỗ trợ Broadcast/Multicast.
Đặc điểm:
Kiểm tra Network Type
Lệnh:
show ip ospf interface gigabitEthernet1/0
Ví dụ:
Process ID 1
Router ID 10.1.12.1
Network Type BROADCAST
Tại sao Network Type Mismatch gây lỗi?
Ví dụ: Router R1
BROADCAST
Hello 10
Dead 40
DR/BDR Election Router R2
POINT-TO-MULTIPOINT
Hello 30
Dead 120
No DR/BDR
Hai router không đồng nhất:
Kết quả:
Neighbor không lên.
Tình huống thực chiến: Frame Relay Hub-and-Spoke
Đây là lỗi kinh điển của CCNP TSHOOT.
Hub:
ip ospf network broadcast
Spoke:
ip ospf network point-to-multipoint
Kết quả:
Neighbor có thể không hình thành hoặc hoạt động không ổn định.
Troubleshooting OSPF Routes – Vì sao Route bị mất?
Ngay cả khi Neighbor đã lên Full, route vẫn có thể bị thiếu.
Một số nguyên nhân phổ biến: Interface không tham gia OSPF
network statement sai
hoặc:
ip ospf process-id area area-id
không được cấu hình.
Kết quả:
Network không được quảng bá.
Có nguồn thông tin tốt hơn
Ví dụ:
Static Route AD=1
OSPF AD=110
Static sẽ được ưu tiên.
Route OSPF không được cài vào Routing Table.
Route Filtering
Ví dụ:
distribute-list
area filter-list
prefix-list
Có thể ngăn route xuất hiện trong RIB.
Stub Area cấu hình sai
Ví dụ:
Router nhận:
0.0.0.0/0
thay vì route chi tiết.
Kỹ sư thường nghĩ route bị mất nhưng thực tế đó là hành vi của Stub Area.
Interface bị Shutdown
OSPF chỉ quảng bá mạng khi interface:
up/up
Nếu interface:
administratively down
mạng sẽ không được quảng bá.
Sai Designated Router
Trong mô hình Hub-and-Spoke, nếu router không phù hợp trở thành DR:
Duplicate RID
Hai router có cùng Router ID:
Góc nhìn thực chiến CCNP/CCIE
Nếu OSPF Neighbor không lên:
DOWN
INIT
2WAY
→ Kiểm tra:
Nếu Neighbor đã Full nhưng Route bị mất:
→ Kiểm tra:
Đặc biệt trong môi trường Enterprise, Data Center hoặc SD-WAN có quy mô lớn, Duplicate Router ID thường xuất hiện do clone template hoặc automation, còn Network Type Mismatch thường xảy ra khi migration từ Frame Relay, DMVPN, MPLS hoặc khi thay đổi thiết kế Hub-and-Spoke. Đây là hai lỗi ít gặp nhưng một khi xuất hiện sẽ gây ra những hành vi rất khó dự đoán trong OSPF và là chủ đề xuất hiện thường xuyên trong các kỳ thi CCNP Enterprise và CCIE Enterprise Infrastructure.
Trong quá trình troubleshooting OSPF, khi đã loại trừ các nguyên nhân phổ biến như Area, Timer, Authentication và MTU, vẫn còn hai lỗi khá "khó chịu" có thể khiến OSPF không hình thành Neighbor hoặc không học được Route:
- Duplicate Router IDs (Trùng Router ID)
- Mismatched Network Types (Không đồng nhất OSPF Network Type)
Đây là những lỗi xuất hiện không nhiều nhưng khi xảy ra lại rất khó phát hiện nếu không hiểu rõ cơ chế hoạt động của OSPF.
1. Duplicate Router IDs (Trùng Router ID)
Router ID quan trọng như thế nào?
Trong OSPF, Router ID (RID) là định danh duy nhất của mỗi router trong OSPF Domain.
Bạn có thể xem RID giống như:
CCCD của Router
Mọi hoạt động của OSPF đều dựa vào Router ID:
- LSA Advertising Router
- DR/BDR Election
- SPF Calculation
- Neighbor Identification
- Link-State Database Synchronization
Do đó:
RID phải là duy nhất trong toàn bộ OSPF Domain.
Nếu có hai router sử dụng cùng một RID, OSPF sẽ không thể hoạt động chính xác.
Triệu chứng của Duplicate RID
Cisco sẽ sinh ra Syslog:
%OSPF-4-DUP_RTRID_NBR:
OSPF detected duplicate router-id 10.1.23.2
from 10.1.12.2 on interface GigabitEthernet1/0
Thông báo này gần như chỉ đích danh nguyên nhân:
Có hai router đang sử dụng cùng Router ID:
10.1.23.2
Kết quả:
- Neighbor có thể không hình thành
- Topology không ổn định
- Route bị mất
- SPF chạy liên tục
- DR/BDR Election bất thường
Kiểm tra Router ID
Lệnh đơn giản nhất:
show ip protocols
Ví dụ:
Router ID 10.1.23.2
Thực tế, hầu như mọi lệnh OSPF đều hiển thị Router ID:
show ip ospf
show ip ospf neighbor
show ip ospf interface
show ip protocols
Nguyên nhân thường gặp
Sao chép cấu hình (Copy/Paste)
Ví dụ:
router ospf 1
router-id 10.255.255.1
Kỹ sư clone cấu hình sang router khác nhưng quên đổi Router ID.
Đây là nguyên nhân phổ biến nhất.
Restore từ Backup
Khi triển khai router mới:
Restore Config
↓
Router-ID cũ được giữ nguyên
↓
Duplicate RID
Triển khai Automation/IaC
Ansible, Terraform hoặc Template có thể vô tình đẩy cùng Router ID cho nhiều thiết bị.
Trong Data Center hoặc SD-WAN quy mô lớn, lỗi này không hiếm gặp.
Lưu ý khi thay đổi Router ID
Ví dụ:
router ospf 1
router-id 1.1.1.1
Thay đổi này chưa có hiệu lực ngay.
Bạn phải reset OSPF Process:
clear ip ospf process
hoặc:
Reload Router
Nếu không, router vẫn tiếp tục sử dụng Router ID cũ.
Góc nhìn thực chiến
Trong Enterprise, rất nhiều kỹ sư sử dụng Loopback làm RID:
interface Loopback0
ip address 10.255.255.X 255.255.255.255
hoặc:
router ospf 1
router-id X.X.X.X
Điều này giúp Router ID:
- Dễ nhận diện
- Không thay đổi khi interface vật lý down
- Thuận tiện khi troubleshooting
2. Mismatched Network Types
OSPF Network Type là gì?
OSPF hỗ trợ nhiều loại Network Type khác nhau.
Mỗi loại sẽ quyết định:
- Cách tìm Neighbor
- Có DR/BDR hay không
- Giá trị Timer mặc định
- Cách trao đổi LSA
Nếu hai router sử dụng Network Type không tương thích, Neighbor sẽ không hình thành.
Các OSPF Network Type phổ biến
Broadcast
Mặc định trên Ethernet.
Đặc điểm:
- Neighbor tự động khám phá
- Tự động bầu DR/BDR
- Hello = 10s
- Dead = 40s
Ví dụ:
Network Type BROADCAST
Non-Broadcast (NBMA)
Mặc định trên Frame Relay Multipoint.
Đặc điểm:
- Neighbor phải cấu hình thủ công
- DR/BDR vẫn tồn tại
- Hello = 30s
- Dead = 120s
Point-to-Point
Mặc định trên Serial Point-to-Point.
Đặc điểm:
- Neighbor tự động khám phá
- Không có DR/BDR
- Hello = 10s
- Dead = 40s
Point-to-Multipoint
Thường dùng trong Hub-and-Spoke.
Đặc điểm:
- Neighbor tự động khám phá
- Không DR/BDR
- Hello = 30s
- Dead = 120s
Point-to-Multipoint Nonbroadcast
Dùng trong môi trường không hỗ trợ Broadcast/Multicast.
Đặc điểm:
- Neighbor cấu hình thủ công
- Không DR/BDR
- Hello = 30s
- Dead = 120s
Kiểm tra Network Type
Lệnh:
show ip ospf interface gigabitEthernet1/0
Ví dụ:
Process ID 1
Router ID 10.1.12.1
Network Type BROADCAST
Tại sao Network Type Mismatch gây lỗi?
Ví dụ: Router R1
BROADCAST
Hello 10
Dead 40
DR/BDR Election Router R2
POINT-TO-MULTIPOINT
Hello 30
Dead 120
No DR/BDR
Hai router không đồng nhất:
- Timer khác nhau
- Cơ chế DR khác nhau
- Cơ chế Neighbor Discovery khác nhau
Kết quả:
Neighbor không lên.
Tình huống thực chiến: Frame Relay Hub-and-Spoke
Đây là lỗi kinh điển của CCNP TSHOOT.
Hub:
ip ospf network broadcast
Spoke:
ip ospf network point-to-multipoint
Kết quả:
- Hello không đồng nhất
- DR Election không đồng nhất
- Route Exchange bất thường
Neighbor có thể không hình thành hoặc hoạt động không ổn định.
Troubleshooting OSPF Routes – Vì sao Route bị mất?
Ngay cả khi Neighbor đã lên Full, route vẫn có thể bị thiếu.
Một số nguyên nhân phổ biến: Interface không tham gia OSPF
network statement sai
hoặc:
ip ospf process-id area area-id
không được cấu hình.
Kết quả:
Network không được quảng bá.
Có nguồn thông tin tốt hơn
Ví dụ:
Static Route AD=1
OSPF AD=110
Static sẽ được ưu tiên.
Route OSPF không được cài vào Routing Table.
Route Filtering
Ví dụ:
distribute-list
area filter-list
prefix-list
Có thể ngăn route xuất hiện trong RIB.
Stub Area cấu hình sai
Ví dụ:
Router nhận:
0.0.0.0/0
thay vì route chi tiết.
Kỹ sư thường nghĩ route bị mất nhưng thực tế đó là hành vi của Stub Area.
Interface bị Shutdown
OSPF chỉ quảng bá mạng khi interface:
up/up
Nếu interface:
administratively down
mạng sẽ không được quảng bá.
Sai Designated Router
Trong mô hình Hub-and-Spoke, nếu router không phù hợp trở thành DR:
- LSA Exchange bất thường
- Route bị thiếu
- Neighbor không đầy đủ
Duplicate RID
Hai router có cùng Router ID:
- LSDB không ổn định
- SPF tính toán sai
- Route biến mất khỏi Topology
Góc nhìn thực chiến CCNP/CCIE
Nếu OSPF Neighbor không lên:
DOWN
INIT
2WAY
→ Kiểm tra:
- Area
- Timer
- Authentication
- Network Type
- ACL
Nếu Neighbor đã Full nhưng Route bị mất:
→ Kiểm tra:
- Network Statement
- Passive Interface
- Route Filtering
- Stub Area
- Interface Status
- DR Election
- Duplicate RID
Đặc biệt trong môi trường Enterprise, Data Center hoặc SD-WAN có quy mô lớn, Duplicate Router ID thường xuất hiện do clone template hoặc automation, còn Network Type Mismatch thường xảy ra khi migration từ Frame Relay, DMVPN, MPLS hoặc khi thay đổi thiết kế Hub-and-Spoke. Đây là hai lỗi ít gặp nhưng một khi xuất hiện sẽ gây ra những hành vi rất khó dự đoán trong OSPF và là chủ đề xuất hiện thường xuyên trong các kỳ thi CCNP Enterprise và CCIE Enterprise Infrastructure.