Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Vai trò của AI trong mạng doanh nghiệp

    Vai trò của AI trong mạng doanh nghiệp


    Hãy tưởng tượng công ty của bạn vừa mở rộng mảng dịch vụ Managed Services và tiếp nhận một khách hàng doanh nghiệp mới. Hạ tầng được quản trị này đã tích hợp sẵn một số công cụ AI của Cisco cùng với một trợ lý LLM (Large Language Model) do nội bộ phát triển, được cấu hình cho môi trường của khách hàng. Các công cụ này đang hoạt động và liên tục thu thập dữ liệu telemetry từ nhiều chi nhánh và các workload trên đám mây.

    Nhiệm vụ của bạn là tận dụng các công cụ đã được triển khai sẵn này để cải thiện thời gian phản ứng với sự cố, đơn giản hóa quá trình xử lý sự cố và chủ động ngăn ngừa các vấn đề lặp lại. Vai trò của bạn không phải là xây dựng AI từ đầu, mà là làm việc trong một môi trường mà các hệ thống thông minh đã hiện hữu. Thách thức nằm ở việc diễn giải những gì AI hiển thị, xác thực các khuyến nghị của AI, sau đó thực hiện khắc phục hoặc chuyển tiếp (escalate) cho đội ngũ phù hợp.

    Bạn đang trực ca tối tại NOC (Network Operations Center) thì một cảnh báo xuất hiện: tỷ lệ mất gói (packet loss) đang tăng đột biến trên nhiều kết nối VPN của khách hàng. Lúc này là 9 giờ 42 phút tối và không có kỹ sư cấp cao nào đang trực.

    Bạn bắt đầu theo cách truyền thống: kiểm tra biểu đồ Cisco NetFlow, phân tích syslog và các SNMP Trap. Không có dấu hiệu nào thực sự nổi bật. Bạn tiếp tục xem các đầu ra CLI, cô lập các thiết bị nghi vấn và chạy nhiều lệnh chẩn đoán.

    Một đồng nghiệp ngồi gần đó nhắc bạn hãy kiểm tra các công cụ phát hiện bất thường (Anomaly Detection).

    Bạn mở dashboard AI. Ngay lập tức, module phát hiện bất thường đã đánh dấu một đợt tăng đột biến lưu lượng outbound từ một router biên cụ thể. Đồng thời, trợ lý LLM gửi thông báo vào ứng dụng chat nội bộ. Dựa trên các sự cố trong quá khứ, LLM nhận ra đây là một mẫu (signature) đã từng xảy ra và đề xuất danh sách kiểm tra:
    • Kiểm tra sự sai lệch thời gian NTP trên các thiết bị biên.
    • Truy vết đường đi định tuyến đến các đầu cuối VPN của khách hàng.
    • Kiểm tra tình trạng queue drop trên các interface VPN và WAN.

    Những gì bạn đang trải nghiệm không chỉ là tự động hóa (Automation), mà là ra quyết định tăng cường bởi AI (Augmented Decision-Making). Thay vì bắt đầu từ con số không, bạn được AI định hướng ngay đến những nguyên nhân gốc có khả năng cao nhất.

    Chỉ trong vài phút, bạn đã:
    • Kiểm tra thống kê interface.
    • Xác thực hành vi định tuyến.
    • Phát hiện tất cả các VPN concentrator bị ảnh hưởng đều đang chạy cùng một phiên bản firmware.

    Thậm chí, trợ lý AI còn phát hiện một sự cố tương tự xảy ra vào quý trước và đề xuất kế hoạch rollback trước khi sự cố lan rộng.

    Để khai thác hiệu quả các công cụ và thông tin này, người vận hành cần chú ý đến bốn khía cạnh:
    • Tích hợp công cụ AI (AI Tool Integration)
    • Hỗ trợ ra quyết định (Decision Making)
    • Tương quan đa miền (Cross-Domain Correlation)
    • Phản ứng với sự cố (Incident Response)

    Hãy nhớ rằng, sử dụng AI không có nghĩa là loại bỏ vai trò của con người trong quá trình ra quyết định. Ngược lại, AI giúp bạn hành động nhanh hơn, tự tin hơn và có nhiều ngữ cảnh hơn. Khi cần escalte, bạn cũng có khả năng giải thích rõ ràng lý do cho từng hành động đã thực hiện.
    Góc nhìn dành cho Network Engineer: AI đang thay đổi NOC như thế nào?


    Trước đây, khi xảy ra packet loss trên VPN, quy trình xử lý thường là:

    Alert → Kiểm tra NetFlow → Xem Syslog → Kiểm tra SNMP → SSH vào thiết bị → Chạy hàng chục lệnh show → Đưa ra giả thuyết → Tiếp tục thử và sai (trial-and-error).

    Quá trình này có thể kéo dài hàng giờ.

    Trong kỷ nguyên AI, quy trình đã thay đổi:

    Telemetry → AI phát hiện bất thường → LLM đối chiếu lịch sử sự cố → Đề xuất checklist → Kỹ sư xác thực → Khắc phục hoặc rollback.

    AI không thay thế Network Engineer. AI đóng vai trò như một Senior Engineer luôn sẵn sàng hỗ trợ, có khả năng:
    • Phân tích hàng triệu điểm telemetry trong vài giây.
    • Ghi nhớ các sự cố lịch sử mà con người khó có thể nhớ hết.
    • Tương quan dữ liệu từ nhiều miền khác nhau như Network, Security, Cloud và Application.
    • Đề xuất nguyên nhân gốc (Root Cause) và phương án xử lý.

    Tuy nhiên, quyết định cuối cùng vẫn thuộc về con người. Network Engineer vẫn phải:
    • Đánh giá mức độ tin cậy của khuyến nghị từ AI.
    • Xác minh bằng dữ liệu thực tế.
    • Hiểu tác động của thay đổi trước khi triển khai.
    • Chịu trách nhiệm cho các hành động vận hành.

    Đây chính là mô hình của Agentic EnterpriseAI-Augmented Network Operations: AI trở thành người đồng hành, còn Network Engineer chuyển từ vai trò "gõ lệnh và dò lỗi" sang vai trò "phân tích, xác thực và ra quyết định".

    Trong tương lai gần, kỹ năng quan trọng nhất của một kỹ sư mạng không còn là nhớ thật nhiều lệnh CLI, mà là biết đặt câu hỏi đúng cho AI, hiểu ngữ cảnh hệ thống và đưa ra quyết định đúng thời điểm. Đây sẽ là yếu tố tạo nên sự khác biệt của Network Engineer trong kỷ nguyên AI.
    Attached Files
    Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X