Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Đội Ngũ Vận Hành Mạng Doanh Nghiệp Đang Tụt Hậu Khi AI Nâng Cao Yêu Cầu Hạ Tầng

    Đội Ngũ Vận Hành Mạng Doanh Nghiệp Đang Tụt Hậu Khi AI Nâng Cao Yêu Cầu Hạ Tầng


    Phân tích tin tức
    Ngày 08/06/2026
    Thời gian đọc: 8 phút

    Tình trạng thiếu hụt nhân tài, sự phân mảnh của các công cụ quản lý và độ phức tạp của môi trường đám mây đang khiến các đội ngũ vận hành mạng (NetOps) gặp nhiều khó khăn. Thách thức này càng trở nên nghiêm trọng khi các doanh nghiệp bắt đầu triển khai các khối lượng công việc AI trên hạ tầng mạng hiện có.

    Theo báo cáo Network Management Megatrends 2026 của Enterprise Management Associates (EMA), chỉ khoảng 31% chuyên gia CNTT cho biết chiến lược vận hành mạng của tổ chức họ đang hoàn toàn thành công. Con số này đã giảm đáng kể so với mức 42% cách đây hai năm.

    Báo cáo được xây dựng dựa trên khảo sát 352 chuyên gia CNTT tại Bắc Mỹ và Châu Âu, đồng thời chỉ ra rằng các đội ngũ mạng hiện nay đang phải đối mặt với nhiều áp lực cùng lúc:
    • Thiếu hụt nhân sự có kỹ năng.
    • Quá nhiều công cụ quản lý và giám sát.
    • Môi trường Hybrid Cloud và Multi-Cloud ngày càng phức tạp.
    • Các workload AI xuất hiện trên những mạng chưa được thiết kế để phục vụ AI.

    Shamus McGillicuddy, Phó Chủ tịch Nghiên cứu về Hạ tầng và Vận hành Mạng của EMA, nhận định:
    "Các chuyên gia vận hành mạng biết rõ họ cần phải làm tốt hơn, nhưng họ không nhận được sự hỗ trợ cần thiết. Họ cần ngân sách để tuyển thêm nhân sự, cần các công cụ tốt hơn, cần nhiều tự động hóa hơn và cần có tiếng nói lớn hơn trong việc thiết kế các kiến trúc Hybrid Cloud và Multi-Cloud. Nếu CIO muốn thành công với chiến lược AI, họ phải đầu tư nghiêm túc cho đội ngũ mạng. Chính mạng sẽ quyết định thành bại của các dự án AI."

    Thực Trạng Trung Tâm Vận Hành Mạng (NOC)


    Một trong những vấn đề kéo dài nhiều năm là hiện tượng Tool Sprawl – doanh nghiệp sử dụng quá nhiều công cụ khác nhau để quản lý mạng.

    Một tổ chức CNTT điển hình hiện sử dụng từ 4 đến 10 công cụ giám sát và xử lý sự cố mạng. Điều đáng chú ý là con số này gần như không thay đổi trong hơn một thập kỷ qua.

    EMA cũng phát hiện rằng số lượng công cụ nhiều hay ít không có mối tương quan rõ ràng với mức độ thành công trong vận hành mạng.

    Một số thống kê đáng chú ý:
    • Chỉ 58% sự cố mạng được phát hiện chủ động trước khi người dùng bị ảnh hưởng.
    • Chỉ 37% cảnh báo từ hệ thống giám sát thực sự phản ánh một sự cố có thật.
    • 28% sự cố mạng xuất phát từ lỗi cấu hình hoặc thao tác thủ công của quản trị viên.
    • Trung bình 29% thời gian làm việc mỗi ngày của kỹ sư mạng dành cho việc xử lý sự cố.

    McGillicuddy cho biết:
    "Các chuyên gia CNTT tin rằng 53% các sự cố mạng hằng ngày có thể được ngăn chặn nếu họ có công cụ tốt hơn."

    Không ngạc nhiên khi có tới:

    73% doanh nghiệp dự định thay thế một phần hoặc toàn bộ hệ thống Network Monitoring hoặc Network Observability trong vòng hai năm tới.
    Xu Hướng Lớn Số 1: Khủng Hoảng Nhân Tài Ngày Càng Trầm Trọng


    Khó khăn trong tuyển dụng chuyên gia mạng đang tăng nhanh:
    • Năm 2022: 26%
    • Năm 2024: 41%
    • Năm 2026: 52%

    Theo EMA, sự thiếu hụt tập trung chủ yếu ở nhóm kỹ sư trung cấp và cao cấp, nơi đòi hỏi các kỹ năng về:
    • Cloud
    • Security
    • Automation

    Một kiến trúc sư giám sát mạng tại một công ty giải trí thuộc Fortune 500 chia sẻ:
    "Chúng tôi liên tục được yêu cầu làm nhiều việc hơn với ít người hơn. Công việc trước đây cần 25 người thì giờ ban lãnh đạo muốn 10 người đảm nhận."

    Tự Động Hóa Là Cứu Cánh Nhưng Cũng Là Thách Thức


    Việc thiếu nhân sự khiến các doanh nghiệp buộc phải đẩy mạnh tự động hóa.

    Tuy nhiên chính khoảng cách kỹ năng lại là rào cản lớn nhất.

    Các nguyên nhân cản trở tự động hóa gồm:
    • Thiếu kỹ năng trong đội ngũ: 46%
    • Công cụ hạn chế hoặc không tích hợp được: 36,4%
    • Chất lượng dữ liệu thấp hoặc thiếu khả năng quan sát: 31,8%
    • Lo ngại rủi ro và các quy định quản trị: 31,8%
    • Hạn chế ngân sách: 29,8%
    • Kháng cự thay đổi trong tổ chức: 27,3%
    • Thiếu niềm tin vào tự động hóa: 25%

    Xu Hướng Lớn Số 2: Tự Động Hóa Day-2 Operations


    Trước đây, tự động hóa mạng chủ yếu tập trung vào:
    • Provisioning
    • Triển khai cấu hình

    Đây được gọi là Day-0 và Day-1 Operations.

    Ngày nay trọng tâm đã chuyển sang Day-2 Operations, bao gồm:
    • Phát hiện sự cố
    • Phân loại và đánh giá sự cố
    • Chẩn đoán nguyên nhân
    • Khắc phục tự động

    Có tới 79% doanh nghiệp xem tự động hóa Day-2 là ưu tiên cao hoặc rất cao.
    Agentic AI Đang Trở Thành Mục Tiêu Mới


    Doanh nghiệp hiện không chỉ muốn tự động hóa theo kịch bản cố định.

    Họ muốn các hệ thống AI có khả năng:
    • Hiểu trạng thái mạng
    • Phân tích nguyên nhân
    • Đưa ra quyết định
    • Thực hiện hành động tự động hoặc bán tự động

    Đây chính là khái niệm Agentic AI for NetOps.

    55% doanh nghiệp cho biết tính năng AI là yêu cầu bắt buộc khi đánh giá công cụ mới.

    Những tác vụ được ưu tiên tự động hóa nhất gồm:
    • Ứng phó và cô lập sự cố bảo mật: 54,3%
    • Tối ưu hiệu năng và dung lượng mạng: 49,7%
    • Tự khắc phục sự cố (Self-Healing): 44,3%
    • Tối ưu cấu hình: 40,3%
    • Giảm nhiễu cảnh báo: 37,5%

    MCP Đang Trở Thành Mảnh Ghép Quan Trọng


    EMA cũng ghi nhận sự quan tâm ngày càng lớn đối với Model Context Protocol (MCP).

    MCP cho phép các AI Agent giao tiếp với nhiều công cụ quản lý mạng thông qua một giao diện tiêu chuẩn.

    Theo McGillicuddy:
    "MCP đang trở thành một lớp trừu tượng giúp giải quyết tình trạng Tool Sprawl."

    Đây là một trong những xu hướng rất đáng chú ý trong lĩnh vực AIOps và Agentic Networking hiện nay.
    Xu Hướng Lớn Số 3: Hybrid Cloud Và Multi-Cloud Vẫn Là Bài Toán Chưa Có Lời Giải


    69% doanh nghiệp đang vận hành Hybrid Cloud.

    66% doanh nghiệp đang sử dụng Multi-Cloud.

    Tuy nhiên chỉ:

    36% cho rằng họ quản lý hiệu quả môi trường mạng trên Cloud.

    Các khó khăn chính bao gồm:
    • Mỗi nhà cung cấp Cloud có kiến trúc mạng riêng.
    • Telemetry không đồng nhất.
    • Thiếu kỹ năng Cloud Networking.
    • Thiếu khả năng quan sát xuyên suốt từ On-Premises đến Cloud.

    McGillicuddy nhận xét:
    "Nhiều nhà cung cấp giải pháp Network Observability vẫn chưa đạt được tính năng tương đương giữa AWS, Azure và Google Cloud."

    Xu Hướng Lớn Số 4: Mạng Cho AI Đã Xuất Hiện Nhưng Công Cụ Chưa Sẵn Sàng


    47,7% doanh nghiệp đã triển khai workload AI trên hạ tầng mạng.

    Phần lớn số còn lại dự kiến triển khai trong vòng hai năm tới.

    Tuy nhiên chỉ:

    35% tin rằng các công cụ Network Observability hiện tại đủ khả năng quản lý hạ tầng AI.
    Những Thách Thức Mới Của AI Networking


    Khác với ứng dụng CNTT truyền thống, AI đưa ra nhiều yêu cầu hoàn toàn mới:
    • Giám sát GPU Cluster.
    • Theo dõi GPU Utilization.
    • Phân tích Tail Latency trong quá trình Inference.
    • Xác định nguyên nhân sự cố giữa GPU, ứng dụng và mạng.
    • Quan sát đồng thời nhiều lớp hạ tầng.

    Các tính năng mà doanh nghiệp mong muốn nhất gồm:
    • AI hỗ trợ xử lý và khắc phục sự cố: 51,3%
    • Cảnh báo chủ động cho rủi ro AI: 49,3%
    • Nhận diện AI Workload thông qua Packet Analysis thời gian thực: 46,9%
    • Streaming Telemetry thời gian thực: 40,2%
    • Tương quan dữ liệu giữa GPU, Application và Network: 34,3%

    Các Đội Ngũ Thành Công Đang Làm Gì Khác Biệt?


    EMA nhận thấy các tổ chức vận hành mạng thành công có một số đặc điểm chung:

    Họ đặt tiêu chuẩn rất cao đối với độ chính xác của dữ liệu quan sát mạng.

    Họ đã vượt ra khỏi các script và runbook truyền thống để chuyển sang các công cụ quản lý sử dụng AI và Agentic AI.

    Họ không tập trung vào việc giảm số lượng công cụ bằng mọi giá mà ưu tiên khả năng tích hợp, chia sẻ dữ liệu và kết nối quy trình làm việc giữa các công cụ.

    Đồng thời, họ xây dựng khả năng quan sát và kiểm soát bảo mật thống nhất trên cả môi trường On-Premises lẫn Cloud.
    Góc Nhìn Cho Kỷ Nguyên AI


    Báo cáo của EMA cho thấy một thực tế rõ ràng:

    AI không chỉ tạo ra nhu cầu về GPU hay mô hình ngôn ngữ lớn (LLM). AI đang buộc toàn bộ hạ tầng mạng doanh nghiệp phải thay đổi.

    Trong nhiều năm qua, mạng được xem là một hạ tầng ổn định phục vụ ứng dụng. Nhưng trong kỷ nguyên Agentic AI, mạng đang trở thành yếu tố quyết định hiệu năng, độ tin cậy và khả năng mở rộng của các hệ thống AI.

    Nói cách khác, khi doanh nghiệp triển khai AI, câu hỏi không còn là "Mô hình AI nào tốt nhất?" mà là:

    "Hạ tầng mạng của bạn đã sẵn sàng cho AI hay chưa?"

    Và theo số liệu của EMA, phần lớn doanh nghiệp hiện nay vẫn đang trong quá trình tìm câu trả lời cho câu hỏi đó.
    Attached Files
    Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X