Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Spine And Leaf

    Kiến trúc Spine-Leaf: Vì sao Data Center hiện đại rời bỏ mô hình 3-tier truyền thống?




    Nếu từng học mạng doanh nghiệp cổ điển, chúng ta quen với mô hình Core – Distribution – Access. Kiến trúc này đã phục vụ rất tốt suốt nhiều năm trong campus network và giai đoạn đầu của data center. Nhưng khi workload ảo hóa, microservices, east-west traffic và AI/ML fabric xuất hiện, mô hình đó bắt đầu lộ ra giới hạn.

    Từ đó Spine-Leaf trở thành kiến trúc thống trị trong data center hiện đại. Từ Three-Tier đến Spine-Leaf

    1. Mô hình 3-tier truyền thống


    Kiến trúc phân cấp gồm:
    • Access layer kết nối server
    • Distribution layer thực hiện aggregation
    • Core layer cung cấp backbone tốc độ cao

    Mô hình này có nhiều điểm mạnh:
    • Tính sẵn sàng cao
    • Dễ mở rộng trong giai đoạn đầu
    • Quen thuộc với kỹ sư mạng
    • Phân tách L2/L3 tương đối rõ ràng

    Nhưng có hai vấn đề lớn. STP và băng thông bị lãng phí


    Trong kiến trúc này, Layer 2 thường dựa vào Spanning Tree.

    Vấn đề là:

    STP chặn các đường dự phòng để tránh loop.

    Kết quả:
    • Chỉ một số uplink forwarding
    • Các liên kết còn lại idle
    • Lãng phí băng thông
    • Convergence chậm

    Sau này Cisco đưa ra vPC (Virtual Port Channel) để active-active uplinks, nhưng vẫn chưa giải quyết triệt để bài toán scale.
    2. Virtualization làm thay đổi traffic pattern


    Đây mới là lý do thật sự khiến kiến trúc cũ gặp khó.

    Trước đây traffic chủ yếu là north-south:

    Client ↔ Server.

    Nhưng với virtualization, VM mobility, distributed applications:

    Server ↔ Server traffic (east-west) tăng đột biến.

    Trang 3-4 trong tài liệu minh họa rất rõ điều này. Khi workload nằm rải trong nhiều pod, traffic giữa hai máy chủ có thể phải đi:

    Access → Distribution → Core → Distribution → Access

    Đường đi dài, độ trễ tăng.

    Đây là điều AI clusters, storage fabrics, container workloads rất ghét.
    3. Spine-Leaf ra đời để tối ưu East-West


    Spine-Leaf thực chất là Clos Architecture hai tầng:
    • Leaf switches kết nối servers/endpoints
    • Spine switches kết nối tất cả leaf switches

    Nguyên tắc vàng:

    Every leaf connects to every spine.

    Không có leaf-to-leaf.
    Không có spine-to-spine.

    Đây là điểm cực kỳ quan trọng.
    4. Tại sao mô hình này mạnh?

    ECMP Everywhere


    Vì có nhiều đường equal-cost song song nên routing dùng ECMP.

    Traffic được hash và phân phối trên nhiều path.

    Không còn blocked links như STP.

    Toàn bộ fabric forwarding.

    Đây là "all links active" đúng nghĩa.
    5. Maximum Two Hops


    Trong spine-leaf:
    • Nếu server cùng leaf: 1 hop
    • Nếu khác leaf: luôn 2 hops

    Server A → Leaf → Spine → Leaf → Server B

    Luôn predictable.

    Điều này cực kỳ quan trọng cho:
    • Low-latency trading
    • Storage fabrics
    • GPU clusters
    • AI training fabrics (RoCE)

    6. Scale-out thay vì Scale-up


    Muốn mở rộng?

    Thêm spine.

    Muốn thêm server?

    Thêm leaf.

    Đây là tư duy hyperscaler.

    Không phải mua chassis to hơn.

    Mà mở rộng ngang (horizontal scale).

    Giống cách cloud providers làm.
    7. Oversubscription giảm mạnh


    Tài liệu trang 5 nhấn mạnh điểm này khá hay.

    Trong 3-tier cũ:

    Có thể có oversubscription ratio cao:

    20:1
    8:1
    4:1

    Trong spine-leaf, có thể thiết kế:

    3:1
    1:1
    Thậm chí non-blocking fabric.

    Muốn giảm oversubscription:

    Tăng số spine.

    Rất elegant.
    8. L2 hay L3 Spine-Leaf?


    Đây là chủ đề hay bị hiểu nhầm.

    Spine-leaf có thể chạy: Layer 2 Fabric


    Thường dùng:
    • TRILL
    • SPB
    • (ngày nay thường là EVPN/VXLAN control plane)

    Mục tiêu:

    Multi-path nhưng vẫn Layer 2 semantics.
    Layer 3 Fabric (phổ biến hơn)


    Thường dùng:
    • eBGP underlay
    • OSPF/IS-IS underlay
    • VXLAN EVPN overlay

    Đây là mô hình Cisco ACI, Nexus EVPN fabric, SDA fabric đều dùng theo biến thể khác nhau.
    9. Ưu điểm nổi bật


    Tài liệu liệt kê khá đúng các lợi ích cốt lõi: Improved Redundancy


    Mỗi leaf nối mọi spine.

    Không có single path dependency.
    Increased Bandwidth


    All-active forwarding.

    Không còn idle links.
    Lower Latency


    Maximum two hops.

    Deterministic forwarding.
    Better Scalability


    Scale-out fabric.

    Thêm spine/leaf là tăng năng lực.
    Lower Cost


    Có thể dùng fixed-form factor switches thay vì chassis lớn.

    Đây là triết lý web-scale networking.
    10. Nhược điểm?


    Không có kiến trúc nào miễn phí.

    Spine-leaf đánh đổi bằng: Cabling phức tạp


    Nếu có 32 leaf và 8 spine:

    256 uplinks.

    Cabling có thể rất lớn.
    Thiết kế control plane khó hơn


    Phải hiểu:
    • ECMP hashing
    • Underlay routing
    • BGP EVPN
    • VXLAN VTEP
    • Failure domains

    Không còn “plug-and-play” như campus.
    11. Vì sao AI/ML hạ tầng gần như mặc định dùng Spine-Leaf?


    Vì AI traffic là east-west cực lớn.

    Ví dụ:

    All-reduce giữa GPU.

    Traffic pattern kiểu elephant flows.

    Cần:
    • Low latency
    • High bisection bandwidth
    • Lossless transport (RoCE + PFC/ECN)
    • Predictable pathing

    Spine-leaf đáp ứng gần như tự nhiên.

    Đây là lý do NVIDIA reference architectures, Cisco Nexus AI fabrics, Arista AI backbones đều dựa trên Clos/Spine-Leaf.
    12. Một góc nhìn CCIE thú vị


    Campus dùng nhiều hierarchical forwarding.

    Data center hiện đại dùng fabric thinking.

    Đây là thay đổi tư duy lớn:

    Từ:

    “Where should I place VLANs?”

    sang:

    “How should the fabric forward everywhere?”

    Đó là chuyển dịch từ mạng truyền thống sang network fabric.
    Kết luận


    Spine-Leaf không chỉ là sơ đồ đẹp với spine và leaf.

    Nó là lời giải cho ba vấn đề mà mô hình 3-tier không xử lý tốt:
    • East-West traffic explosion
    • Scale-out growth
    • Deterministic low-latency forwarding

    Nếu nói đơn giản:

    Three-tier tối ưu cho client-server era.
    Spine-leaf tối ưu cho cloud era.

    Và bây giờ là kỷ nguyên AI.
    Attached Files
    Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X