Các khối lượng công việc AI đòi hỏi năng lực tính toán rất cao. Để tăng tốc huấn luyện mô hình và xử lý các tập dữ liệu lớn, người ta sử dụng phương pháp tính toán phân tán. Phương pháp này phân bổ khối lượng công việc trên nhiều máy chủ hoặc nút tính toán được kết nối thông qua một mạng tốc độ cao, độ trễ thấp.
InfiniBand cung cấp độ trễ siêu thấp và là lựa chọn hàng đầu trong tính toán khoa học cũng như các ứng dụng AI. Các giải pháp kết nối InfiniBand, kết hợp với máy chủ và lưu trữ tích hợp các nút tính toán tăng tốc, mang lại hiệu năng tối ưu để đáp ứng yêu cầu mạng tốc độ cao, độ trễ thấp.
InfiniBand cung cấp nhiều mức hiệu năng liên kết, đạt tốc độ lên đến 800 Gbps. Mỗi tốc độ liên kết đều hỗ trợ truyền thông độ trễ thấp trong toàn bộ hệ thống, cho phép thông lượng cao hơn so với các giao thức khác.
Tổng quan về InfiniBand
InfiniBand là một liên kết truyền thông dùng để trao đổi dữ liệu giữa bộ xử lý và các thiết bị I/O, hỗ trợ tới 64.000 thiết bị có thể định địa chỉ. Kiến trúc InfiniBand là một đặc tả chuẩn công nghiệp, định nghĩa khung I/O dạng kết nối điểm-điểm chuyển mạch, dùng để kết nối máy chủ, hạ tầng truyền thông, thiết bị lưu trữ và các hệ thống nhúng.
InfiniBand đặc biệt phù hợp để kết nối nhiều luồng dữ liệu (clustering, truyền thông, lưu trữ, và quản lý). Đơn vị nhỏ nhất của kiến trúc InfiniBand là một subnet. Các bộ định tuyến (router) sẽ kết nối nhiều subnet lại để hình thành một mạng InfiniBand lớn hơn.
Các lớp của InfiniBand
Kiến trúc InfiniBand được chia thành nhiều lớp, mỗi lớp hoạt động độc lập.
Như minh họa trong hình, hệ thống InfiniBand bao gồm:
Đặc điểm nổi bật
Câu hỏi ôn tập
Mạng InfiniBand hỗ trợ bao nhiêu thiết bị có thể định địa chỉ?
InfiniBand cung cấp độ trễ siêu thấp và là lựa chọn hàng đầu trong tính toán khoa học cũng như các ứng dụng AI. Các giải pháp kết nối InfiniBand, kết hợp với máy chủ và lưu trữ tích hợp các nút tính toán tăng tốc, mang lại hiệu năng tối ưu để đáp ứng yêu cầu mạng tốc độ cao, độ trễ thấp.
InfiniBand cung cấp nhiều mức hiệu năng liên kết, đạt tốc độ lên đến 800 Gbps. Mỗi tốc độ liên kết đều hỗ trợ truyền thông độ trễ thấp trong toàn bộ hệ thống, cho phép thông lượng cao hơn so với các giao thức khác.
Tổng quan về InfiniBand
InfiniBand là một liên kết truyền thông dùng để trao đổi dữ liệu giữa bộ xử lý và các thiết bị I/O, hỗ trợ tới 64.000 thiết bị có thể định địa chỉ. Kiến trúc InfiniBand là một đặc tả chuẩn công nghiệp, định nghĩa khung I/O dạng kết nối điểm-điểm chuyển mạch, dùng để kết nối máy chủ, hạ tầng truyền thông, thiết bị lưu trữ và các hệ thống nhúng.
InfiniBand đặc biệt phù hợp để kết nối nhiều luồng dữ liệu (clustering, truyền thông, lưu trữ, và quản lý). Đơn vị nhỏ nhất của kiến trúc InfiniBand là một subnet. Các bộ định tuyến (router) sẽ kết nối nhiều subnet lại để hình thành một mạng InfiniBand lớn hơn.
Các lớp của InfiniBand
Kiến trúc InfiniBand được chia thành nhiều lớp, mỗi lớp hoạt động độc lập.
Như minh họa trong hình, hệ thống InfiniBand bao gồm:
- Channel Adapter (CA): được chia thành HCA (Host Channel Adapter) và TCA (Target Channel Adapter).
- HCA: là điểm thiết bị qua đó một nút cuối IB (ví dụ: máy chủ hoặc thiết bị lưu trữ) kết nối vào mạng IB.
- TCA: là dạng đặc biệt của channel adapter, thường dùng trong môi trường nhúng như thiết bị lưu trữ.
- Switches (Bộ chuyển mạch): Hoạt động tương tự switch mạng chuẩn nhưng phải đáp ứng yêu cầu hiệu năng cao và chi phí thấp của InfiniBand.
- Routers (Bộ định tuyến): Truyền tiếp gói tin từ subnet này sang subnet khác mà không tiêu thụ hoặc sinh thêm gói tin.
- Cables (Cáp): Bao gồm cáp đồng và cáp quang.
- Connectors (Đầu nối)
Đặc điểm nổi bật
- InfiniBand hỗ trợ RDMA (Remote Direct Memory Access) nguyên bản, đây là một trong những lý do nó được ưa chuộng trong HPC (High-Performance Computing).
- Với sự phát triển của RoCE (RDMA over Converged Ethernet), Ethernet đang dần trở thành công nghệ thay thế InfiniBand nhờ chi phí thấp, khả năng tương thích rộng rãi và dễ sử dụng.
Câu hỏi ôn tập
Mạng InfiniBand hỗ trợ bao nhiêu thiết bị có thể định địa chỉ?
- 32.000
- 38.000
- 64.000 ✅
- 66.000