Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Hạ tầng tính toán cho AI/ML

    Trong khóa huấn luyện này, chúng ta sẽ tìm hiểu về phần cứng tính toán cần thiết để vận hành các khối lượng công việc AI/ML (Artificial Intelligence / Machine Learning). Nội dung tập trung vào các công nghệ phần cứng cốt lõi hỗ trợ AI/ML, bao gồm Cisco Unified Computing System (UCS), tầm quan trọng của GPU, cũng như các cơ chế chia sẻ tài nguyên tính toán nhằm mang lại hiệu năng cao với chi phí hợp lý. Ngoài ra, chúng ta cũng sẽ bàn về TCO (Total Cost of Ownership) trong AI/ML và những nền tảng cơ bản của AI/ML clustering. Tổng quan về Hạ tầng Tính toán


    Doanh nghiệp ở nhiều ngành công nghiệp khác nhau đang nhận ra sức mạnh của AI/ML. Các nhà khoa học dữ liệu (data scientists) sử dụng tập dữ liệu lớn để huấn luyện mô hình AI/ML. Một khi được huấn luyện, các mô hình này có thể áp dụng rộng rãi trong nhiều lĩnh vực, từ chăm sóc sức khỏe, sản xuất, thương mại, đến các dịch vụ số.

    Để đáp ứng các nhu cầu này, Cisco cung cấp nhiều lựa chọn nền tảng hạ tầng, bao gồm:
    • Cisco UCS C-Series Rack Server
    • Cisco UCS X-Series Servers
    • Cisco UCS Converged Infrastructure FlashStack
    • Cisco UCS Converged Infrastructure FlexPod
    • Cisco UCS Hyperconverged Infrastructure

    Những nền tảng này phù hợp cho cả traininginference của AI/ML, đồng thời có thể triển khai ở data center hoặc edge. Quản lý Hạ tầng Hợp Nhất


    Cisco cung cấp giải pháp quản lý hợp nhất thông qua:
    • Cisco Nexus Dashboard
    • Cisco Intersight (nền tảng quản lý dựa trên cloud)

    Hai công cụ này giúp loại bỏ silo, cung cấp mô hình vận hành thống nhất từ data center đến edge, đồng thời:
    • Giảm chi phí vận hành.
    • Tăng tốc xử lý sự cố bằng phân tích và tự động hóa chủ động.
    Ảo hóa và Công cụ Quản lý AI


    Để tận dụng hiệu quả hạ tầng phần cứng, doanh nghiệp triển khai ảo hóa thông qua OpenShiftKubernetes, cho phép trừu tượng hóa tài nguyên hạ tầng. Trên đó, các công cụ AI như PyTorchNVIDIA AI hỗ trợ triển khai và quản lý mô hình.

    Hệ sinh thái này còn tích hợp NVIDIA NGC – một kho dịch vụ AI trên cloud, bao gồm:
    • NVIDIA NeMoBioNeMo: phục vụ mô hình ngôn ngữ và khoa học sự sống.
    • NVIDIA Riva Studio: tập trung vào xử lý giọng nói và hội thoại.
    • NGC Private Registry: chia sẻ an toàn các phần mềm AI độc quyền.
    Khai thác Generative AI


    Generative AI mở ra khả năng:
    • Biến văn bản thành hình ảnh.
    • Tạo giọng nói chân thực.
    • Hỗ trợ nghiên cứu khoa học và phát triển sản phẩm.

    Tuy nhiên, để khai thác trọn vẹn tiềm năng này, doanh nghiệp cần một hạ tầng mạnh mẽ, tối ưu, được thiết kế chuyên biệt cho AI/ML.

    👉 Đây là bức tranh nền tảng về hạ tầng tính toán cho AI/ML. Trong các bài viết tiếp theo, chúng ta sẽ đi sâu hơn vào từng thành phần: từ GPU, clustering, đến TCO, và các kiến trúc triển khai tối ưu.
    Attached Files
    Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X