<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/">
	<channel>
		<title>Vietnamese Professional - CCIE Enterprise</title>
		<link>https://www.forum.vnpro.org/</link>
		<description />
		<language>vi</language>
		<lastBuildDate>Sun, 07 Jun 2026 13:11:43 GMT</lastBuildDate>
		<generator>vBulletin</generator>
		<ttl>60</ttl>
		<image>
			<url>images/misc/rss.png</url>
			<title>Vietnamese Professional - CCIE Enterprise</title>
			<link>https://www.forum.vnpro.org/</link>
		</image>
		<item>
			<title>So sánh MultiPath và Load Balancing</title>
			<link>https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/441073-so-sánh-multipath-và-load-balancing</link>
			<pubDate>Wed, 03 Jun 2026 13:13:30 GMT</pubDate>
			<description>Vì sao ECMP chưa đủ cho Storage Network? 
 
 
Trong các mạng AI, HPC hoặc Storage hiện đại, chúng ta thường triển khai nhiều đường kết nối song song...</description>
			<content:encoded><![CDATA[<b>Vì sao ECMP chưa đủ cho Storage Network?</b><br />
<br />
<br />
Trong các mạng AI, HPC hoặc Storage hiện đại, chúng ta thường triển khai nhiều đường kết nối song song giữa máy chủ và hệ thống lưu trữ nhằm tăng băng thông và khả năng dự phòng.<br />
Nhiều người cho rằng ECMP sẽ tự động phân phối lưu lượng đều trên tất cả các đường truyền. Tuy nhiên thực tế không hoàn toàn như vậy. Mời các bạn đọc tiếp để hiểu rõ hơn sự khác nhau giữa hai cơ chế này.<br />
ECMP hoạt động dựa trên cơ chế băm (hashing) các thông tin của một flow như Source IP, Destination IP, Protocol, Source Port và Destination Port. Sau khi tính toán, toàn bộ dòng lưu lượng (flow) sẽ được gán vào một đường đi cụ thể. Điều này có nghĩa là:<ul><li>Một phiên NVMe/TCP có thể sử dụng duy nhất một liên kết 100G.</li>
</ul><ul><li>Một luồng RoCEv2 có thể chỉ chạy trên một đường truyền duy nhất.</li>
</ul><ul><li>Một số liên kết có thể hoạt động gần như tối đa công suất trong khi các liên kết khác lại nhàn rỗi.</li>
</ul>Đây là hiện tượng <b>hot spot</b> hoặc <b>uneven utilization</b> (sử dụng tài nguyên không đồng đều). Trong khi đó, Fibre Channel từ lâu đã hỗ trợ cân bằng tải theo từng tác vụ I/O, giúp các hoạt động đọc ghi được phân bố đồng đều hơn trên nhiều đường kết nối.<br />
Để đạt được hiệu quả tương tự trong môi trường IP Storage, các nhà sản xuất khuyến nghị triển khai <b>MPIO (Multipath I/O)</b> trên máy chủ. MPIO cho phép hệ điều hành nhìn thấy nhiều đường truy cập đến cùng một thiết bị lưu trữ và chủ động phân phối các lệnh I/O qua nhiều đường khác nhau. Kết quả của kỹ thuật này là:<ul><li>Tận dụng tốt hơn tổng băng thông của nhiều liên kết.</li>
</ul><ul><li>Giảm hiện tượng nghẽn cục bộ.</li>
</ul><ul><li>Tăng khả năng chịu lỗi khi một đường truyền gặp sự cố.</li>
</ul><ul><li>Cải thiện hiệu năng tổng thể cho các ứng dụng AI, cơ sở dữ liệu và lưu trữ hiệu năng cao.</li>
</ul><b>Góc nhìn thực tế cho HẠ TẦNG AI Infrastructure</b><br />
<br />
<br />
Trong các cụm GPU AI hiện đại sử dụng NVMe/TCP hoặc RoCEv2 trên Ethernet 100G/200G/400G, việc chỉ dựa vào ECMP thường không đủ để khai thác hết năng lực mạng. Do đó, các kiến trúc AI-ready Data Center thường kết hợp:<ul><li>ECMP trong mạng Spine-Leaf để mở rộng quy mô (scale-out)</li>
</ul><ul><li>MPIO trên máy chủ để phân phối I/O hiệu quả</li>
</ul><ul><li>RDMA/RoCEv2 để giảm độ trễ</li>
</ul><ul><li>Nhiều NIC và nhiều đường truyền vật lý để tăng thông lượng</li>
</ul><b>Tóm lại, ECMP giúp cân bằng các dòng lưu lượng flow mạng, còn MPIO cân bằng các hoạt động lưu trữ. Muốn khai thác tối đa hạ tầng Storage Network cho AI, cần kết hợp cả hai cơ chế này thay vì chỉ dựa vào ECMP.</b>​]]></content:encoded>
			<category domain="https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise">CCIE Enterprise</category>
			<dc:creator>dangquangminh</dc:creator>
			<guid isPermaLink="true">https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/441073-so-sánh-multipath-và-load-balancing</guid>
		</item>
		<item>
			<title>Ba cách triển khai RDMA</title>
			<link>https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/440870-ba-cách-triển-khai-rdma</link>
			<pubDate>Fri, 29 May 2026 11:29:16 GMT</pubDate>
			<description>Hình này mô tả ba cách triển khai RDMA (Remote Direct Memory Access) trên hạ tầng mạng hiện đại: RoCE, RoCEv2 và iWARP, đồng thời cho thấy cách chúng...</description>
			<content:encoded><![CDATA[Hình này mô tả ba cách triển khai <b>RDMA (Remote Direct Memory Access)</b> trên hạ tầng mạng hiện đại: <b>RoCE, RoCEv2 và iWARP</b>, đồng thời cho thấy cách chúng ánh xạ giữa thế giới <b>Ethernet</b> và <b>InfiniBand</b>.<br />
<br />
Điểm quan trọng nhất là ứng dụng AI, HPC hay Storage không làm việc trực tiếp với TCP/IP hay Ethernet. Chúng sử dụng tập lệnh <b>RDMA Verbs</b> của InfiniBand để truy cập bộ nhớ từ xa với độ trễ cực thấp và gần như không cần CPU tham gia.<br />
<br />
<b>iWARP</b> hoạt động trên nền TCP. Nó tận dụng cơ chế đáng tin cậy của TCP như truyền đúng thứ tự, kiểm soát luồng (flow control) và kiểm soát nghẽn (congestion control). Ưu điểm là dễ triển khai trên mạng IP hiện hữu, nhưng chi phí xử lý giao thức thường cao hơn.<br />
<br />
<b>RoCE (RDMA over Converged Ethernet)</b> là RDMA chạy trực tiếp trên Ethernet Layer 2. Phiên bản đầu tiên không hỗ trợ định tuyến IP nên chỉ hoạt động trong cùng miền Layer 2. Vì vậy RoCE thường yêu cầu mạng lossless sử dụng các cơ chế như PFC (Priority Flow Control).<br />
<br />
<b>RoCEv2</b> là phiên bản được sử dụng phổ biến hiện nay. Thay vì chỉ chạy trên Ethernet Layer 2, nó đóng gói RDMA vào UDP/IP nên có thể định tuyến qua mạng Layer 3. Nhờ đó RoCEv2 phù hợp với các AI Data Center quy mô lớn sử dụng kiến trúc Spine-Leaf. RoCEv2 thường kết hợp với:<ul><li>ECN (Explicit Congestion Notification) để tránh nghẽn.</li>
<li>DSCP để phân loại QoS.</li>
<li>UDP để hỗ trợ cân bằng tải trên mạng.</li>
</ul><br />
Ở phía phải của hình là <b>InfiniBand</b>, vốn được thiết kế ngay từ đầu cho HPC và AI với cơ chế <b>credit-based flow control</b> giúp tránh mất gói. Trong khi đó Ethernet phải bổ sung các công nghệ như PFC và ECN để đạt được hành vi gần tương tự.<br />
<br />
Nếu nhìn từ góc độ hạ tầng AI hiện nay:<ul><li><b>InfiniBand</b> vẫn thống trị các siêu máy tính và cụm GPU cực lớn.</li>
<li><b>RoCEv2</b> đang trở thành lựa chọn phổ biến trong các AI Data Center dựa trên Ethernet.</li>
<li><b>iWARP</b> ít phổ biến hơn trong các triển khai AI quy mô lớn.</li>
</ul><br />
Một cách đơn giản, có thể xem:<br />
<br />
<b>InfiniBand = RDMA nguyên bản</b><br />
<br />
<b>RoCEv2 = RDMA chạy trên Ethernet/IP</b><br />
<br />
<b>iWARP = RDMA chạy trên TCP/IP</b><br />
<br />
Đây cũng là lý do tại sao khi xây dựng mạng cho AI/ML, các kỹ sư mạng ngày nay phải hiểu thêm về <b>PFC, ECN, QoS, Spine-Leaf và RDMA</b>, thay vì chỉ tập trung vào các giao thức Ethernet truyền thống.​]]></content:encoded>
			<category domain="https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise">CCIE Enterprise</category>
			<dc:creator>dangquangminh</dc:creator>
			<guid isPermaLink="true">https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/440870-ba-cách-triển-khai-rdma</guid>
		</item>
		<item>
			<title>Hạ tầng cho AI</title>
			<link>https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/440664-hạ-tầng-cho-ai</link>
			<pubDate>Mon, 25 May 2026 11:22:31 GMT</pubDate>
			<description>AI không chỉ là mô hình, mà là cả một bài toán hạ tầng 
 
 
Nhiều người khi nói về AI thường chỉ nghĩ đến mô hình: LLM nào tốt hơn, tham số bao nhiêu...</description>
			<content:encoded><![CDATA[<b>AI không chỉ là mô hình, mà là cả một bài toán hạ tầng</b><br />
<br />
<br />
Nhiều người khi nói về AI thường chỉ nghĩ đến mô hình: LLM nào tốt hơn, tham số bao nhiêu tỷ, dùng pre-training hay fine-tuning, có tích hợp RAG hay không. Nhưng nếu nhìn từ góc độ hạ tầng, mô hình AI thực ra chỉ là phần nổi của tảng băng.<br />
<br />
Phía sau một hệ thống AI chạy được trong môi trường thật là cả một stack công nghệ khá đồ sộ.<br />
<br />
Ở lớp trên cùng là vòng đời của mô hình AI: huấn luyện ban đầu (pre-training), tinh chỉnh (fine-tuning), bổ sung tri thức ngoài qua RAG, rồi cuối cùng là giai đoạn suy luận (inference) — tức lúc người dùng thực sự gửi prompt và chờ phản hồi. Mỗi giai đoạn này lại có yêu cầu hạ tầng rất khác nhau. Huấn luyện thì ngốn GPU, inference thì cần tối ưu độ trễ, còn RAG lại phụ thuộc mạnh vào hệ thống lưu trữ và truy xuất dữ liệu.<br />
<br />
Ngay bên dưới là lớp framework và công cụ quản lý AI. Đây là thế giới của PyTorch, TensorFlow, Hugging Face, orchestration pipeline, model serving và monitoring. Xa hơn nữa là lớp ảo hóa và Kubernetes — thứ đang dần trở thành “VMware của thời AI”.<br />
<br />
Nhưng điều thú vị nhất nằm ở phần data center.<br />
<br />
Dù là AI triển khai trong doanh nghiệp (on-prem AI) hay các cụm AI quy mô hyperscale, những thành phần cốt lõi gần như không thay đổi: compute, storage, kiến trúc mạng, bảo mật và khả năng quan sát hệ thống.<br />
<br />
Compute thì ai cũng nghĩ đến GPU. Nhưng network mới là thứ dễ bị đánh giá thấp.<br />
<br />
AI training không giống workload enterprise truyền thống. GPU không thể ngồi chờ dữ liệu. Nếu mạng chậm, latency cao, congestion xảy ra hoặc east-west traffic nghẽn, cụm GPU trị giá hàng triệu đô có thể bị idle chỉ vì network bottleneck.<br />
<br />
Đó là lý do vì sao trong AI data center, mạng không còn là “phần kết nối” nữa, mà trở thành một thành phần trực tiếp quyết định hiệu suất AI.<br />
<br />
Nhìn hàng dưới của sơ đồ sẽ thấy rõ hơn: access, WAN, inter-data center, edge compute, inter-cluster. Điều này cho thấy AI không phải chỉ nằm trong một rack server. Nó là một hệ sinh thái phân tán, nơi dữ liệu, mô hình và compute liên tục di chuyển giữa nhiều domain.<br />
<br />
<b>AI engineer có thể nói về model, nhưng để AI chạy thật ngoài production, hạ tầng mới là nơi quyết định thành bại.</b>​]]></content:encoded>
			<category domain="https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise">CCIE Enterprise</category>
			<dc:creator>dangquangminh</dc:creator>
			<guid isPermaLink="true">https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/440664-hạ-tầng-cho-ai</guid>
		</item>
		<item>
			<title>Cơ chế Packet Switching</title>
			<link>https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/440314-cơ-chế-packet-switching</link>
			<pubDate>Sat, 16 May 2026 10:36:46 GMT</pubDate>
			<description>Packet Switching và Ảnh Hưởng Đến Hiệu Năng Router 
 
 
Ngoài các vấn đề về CPU utilization cao đã đề cập trước đó, một yếu tố khác có thể ảnh hưởng...</description>
			<content:encoded><![CDATA[<b>Packet Switching và Ảnh Hưởng Đến Hiệu Năng Router</b><br />
<br />
<br />
Ngoài các vấn đề về <b>CPU utilization cao</b> đã đề cập trước đó, một yếu tố khác có thể ảnh hưởng mạnh đến hiệu năng của router là <b>chế độ packet switching</b> mà thiết bị đang sử dụng. Trong thực tế, không phải mọi router đều xử lý packet theo cùng một cách. Cách router quyết định chuyển tiếp packet phụ thuộc rất nhiều vào <b>kiến trúc phần cứng và phần mềm</b> của thiết bị.<br />
<br />
Vì vậy, khi troubleshooting ngoài môi trường production, bạn luôn nên tham khảo tài liệu của dòng router cụ thể để hiểu chính xác cách nó triển khai forwarding plane.<br />
<br />
Tuy nhiên, về mặt tổng quát, các router Cisco và multilayer switch thường hỗ trợ ba cơ chế packet switching chính:<ul><li><b>Process Switching</b></li>
<li><b>Fast Switching (Route Caching)</b></li>
<li><b>Cisco Express Forwarding - CEF (Topology-Based Switching)</b></li>
</ul><br />
Đây là những khái niệm rất quan trọng đối với kỹ sư CCNP/CCIE, bởi vì chúng ảnh hưởng trực tiếp đến <b>throughput, latency, CPU load, và khả năng mở rộng của hệ thống</b>.  <hr /> <b>Packet Switching Là Gì?</b><br />
<br />
<br />
Packet switching là quá trình router quyết định:<div style="margin-left:40px">&quot;Packet này sẽ được gửi đi đâu?&quot;</div> <br />
Khi một packet đi vào router, thiết bị phải thực hiện nhiều bước xử lý:<br />
<br />
<b>Bước 1: Loại bỏ Layer 2 header</b><br />
<br />
Ví dụ Ethernet header sẽ bị bỏ đi vì MAC source/destination chỉ có ý nghĩa trong local segment.<br />
<br />
Ví dụ packet đến với:<br />
Src MAC: 00:11:22:33:44:55<br />
Dst MAC: AA:BB:CC:DD:EE:FF<br />
<br />
Router sẽ bỏ phần này. <hr /><br />
<b>Bước 2: Kiểm tra Layer 3 header</b><br />
<br />
Router đọc thông tin IP:<br />
Source IP<br />
Destination IP<br />
TTL<br />
Protocol<br />
<br />
Ví dụ:<br />
Source IP: 10.1.1.10<br />
Destination IP: 192.168.1.100<br />
<br />
Router sẽ tra cứu routing table để xác định next-hop. <hr /><br />
<b>Bước 3: Quyết định forwarding</b><br />
<br />
Ví dụ routing table:<br />
192.168.1.0/24 via 172.16.1.1<br />
<br />
Router xác định:<div style="margin-left:40px">&quot;Packet này phải gửi ra interface GigabitEthernet0/1&quot;</div>  <hr /><br />
<b>Bước 4: Viết lại Layer 2 header</b><br />
<br />
Router tạo Ethernet frame mới:<br />
New Source MAC = MAC của router trên cổng ra<br />
New Destination MAC = MAC của next-hop<br />
<br />
Ví dụ:<br />
Src MAC: 00:AA:BB:CC:DD:EE<br />
Dst MAC: 11:22:33:44:55:66 <hr /><br />
<b>Bước 5: Tính lại FCS</b><br />
<br />
Do frame đã thay đổi nên checksum Layer 2 cũng phải được tính lại. <hr /><br />
<b>Bước 6: Forward packet</b><br />
<br />
Packet được gửi ra cổng phù hợp. <hr /> <b>1. Process Switching</b><br />
<br />
<b>Cách hoạt động</b><br />
<br />
<br />
Đây là phương pháp packet switching truyền thống nhất.<br />
<br />
Với <b>process switching</b>, mỗi packet đi vào đều được CPU xử lý trực tiếp.<br />
<br />
Luồng xử lý:<br />
Packet đến<br />
↓<br />
CPU kiểm tra header<br />
↓<br />
CPU tra routing table<br />
↓<br />
CPU rewrite Layer 2 header<br />
↓<br />
CPU tính FCS<br />
↓<br />
CPU gửi packet ra ngoài<br />
<br />
Toàn bộ quyết định forwarding đều do CPU đảm nhiệm. <hr /> <b>Minh họa logic</b><br />
<br />
Incoming Packet<br />
↓<br />
CPU xử lý<br />
↓<br />
Routing Decision<br />
↓<br />
Rewrite Frame<br />
↓<br />
Outgoing Interface<br />
<br />
Điều này tương ứng với mô hình:<ul><li><b>Control Plane tham gia trực tiếp</b></li>
<li>CPU trở thành điểm xử lý trung tâm</li>
</ul><hr /> <b>Vì sao chậm?</b><br />
<br />
<br />
CPU là tài nguyên hữu hạn.<br />
<br />
Nếu traffic nhỏ:<br />
100 pps<br />
<br />
CPU vẫn xử lý ổn.<br />
<br />
Nhưng nếu traffic tăng:<br />
50,000 pps<br />
100,000 pps<br />
500,000 pps<br />
<br />
CPU sẽ nhanh chóng quá tải.<br />
<br />
Kết quả:<ul><li>latency tăng</li>
<li>packet drop</li>
<li>routing protocol bị ảnh hưởng</li>
<li>management session lag</li>
<li>SSH/Telnet phản hồi chậm</li>
</ul><hr /> <b>Ví dụ thực tế</b><br />
<br />
<br />
Router nhận traffic:<br />
200 Mbps<br />
<br />
Packet size trung bình:<br />
500 bytes<br />
<br />
Packets per second:<br />
200,000,000 / (500 × 8)<br />
= 50,000 pps<br />
<br />
Nếu CPU phải process-switch 50,000 packet mỗi giây:<br />
<br />
=&gt; cực kỳ nặng. <hr /> <b>Khi nào xảy ra?</b><br />
<br />
<br />
Thông thường router hiện đại không dùng process switching cho forwarding thông thường.<br />
<br />
Nhưng vẫn có thể xảy ra khi:<ul><li>packet đầu tiên của flow</li>
<li>traffic đặc biệt cần CPU xử lý</li>
<li>exception traffic</li>
<li>control-plane traffic</li>
<li>fast switching bị disable</li>
<li>CEF bị disable</li>
</ul><hr /> <b>Cấu hình ép dùng Process Switching</b><br />
<br />
<br />
Có thể disable Fast Switching và CEF bằng lệnh:<br />
interface GigabitEthernet0/0<br />
no ip route-cache<br />
<br />
Lệnh này buộc interface dùng process switching. <hr /> <b>Kiểm tra</b><br />
<br />
show ip interface<br />
<br />
Ví dụ:<br />
IP fast switching is disabled <hr /> <b>Tác động đến Troubleshooting</b><br />
<br />
<br />
Nếu router CPU cao, cần kiểm tra:<br />
show processes cpu<br />
<br />
Nếu CPU bị packet forwarding chiếm nhiều:<br />
IP Input<br />
<br />
process <b>IP Input</b> cao thường là dấu hiệu process switching hoặc exception packet processing.<br />
<br />
Ví dụ:<br />
PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min Process<br />
66 458293 ... IP Input<br />
<br />
Nếu IP Input cao bất thường:<br />
<br />
→ nghi ngờ packet đang đi vào CPU. <hr /> <b>Kiến thức thực chiến</b><br />
<br />
<br />
Process switching gần như là “worst-case forwarding path”.<br />
<br />
Nếu traffic data-plane phải đi qua CPU:<br />
<br />
router sẽ giống như:<div style="margin-left:40px">&quot;Dùng general-purpose CPU để làm forwarding ASIC&quot;</div> <br />
Điều này cực kỳ kém hiệu quả. <hr /> <b>Tóm tắt</b><br />
<br />
<br />
Process switching có đặc điểm:<br />
<br />
<b>Ưu điểm</b><ul><li>đơn giản</li>
<li>luôn hoạt động</li>
<li>xử lý được exception traffic</li>
</ul><br />
<b>Nhược điểm</b><ul><li>CPU intensive</li>
<li>throughput thấp</li>
<li>latency cao</li>
<li>không scalable</li>
</ul><hr /><br />
Trong phần tiếp theo, cơ chế <b>Fast Switching</b> và đặc biệt <b>Cisco Express Forwarding (CEF)</b> mới là các kỹ thuật giúp router forwarding hiệu quả ở tốc độ cao.<br />
​]]></content:encoded>
			<category domain="https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise">CCIE Enterprise</category>
			<dc:creator>dangquangminh</dc:creator>
			<guid isPermaLink="true">https://www.forum.vnpro.org/forum/ccie®/ccie-enterprise/440314-cơ-chế-packet-switching</guid>
		</item>
	</channel>
</rss>
