AI Ops - Vietnamese Professional

dangquangminh

Super Moderator

Brainiac

Join Date: Oct 2005

Posts: 11497
- Share
- Tweet
#1

AI Ops

12-04-2026, 03:06 PM

AIOps – Khi AI bước vào thế giới Network thực tế

Nếu bạn là Network Engineer hoặc đang làm trong hạ tầng IT, đây là một bước chuyển cực kỳ quan trọng.

Trước đây:
Monitoring → Alert → Engineer xử lý

Thời gian phản ứng phụ thuộc con người

Khó correlate nhiều sự kiện cùng lúc

Hiện nay với AIOps, chúng ta đang chuyển sang:

👉 Observe → Analyze → Decide → Act (tự động)
🧠 1. Building Network Agents – Tư duy mới về AI trong Network

Điểm thú vị là AI không chỉ là chatbot nữa. Nó đang trở thành Agent vận hành hệ thống. 🔹 RAG – “Playbook cho AI”

Trong networking, bạn có:
Runbook xử lý sự cố

SOP (Standard Operating Procedure)

KB nội bộ

RAG giúp AI:
Tra cứu tài liệu nội bộ

Áp dụng đúng ngữ cảnh hệ thống của bạn

➡️ Ví dụ:
AI đọc log → tra runbook → đề xuất fix đúng chuẩn nội bộ
🔹 MCP – Context trước khi hành động

MCP (Model Context Protocol) cực kỳ quan trọng trong môi trường enterprise:

AI không thể “đoán mò”, nó cần:
Topology

Config hiện tại

Policy bảo mật

Trạng thái hệ thống

➡️ Nếu không có context:
AI = nguy hiểm (đặc biệt trong network & security)
🔹 Fine-tuning – Kiến thức “tribal”

Trong mỗi tổ chức luôn có:
Kinh nghiệm ngầm (tribal knowledge)

Cách xử lý riêng

Rule không viết thành tài liệu

Fine-tuning giúp:
👉 Biến AI thành “senior engineer của công ty”
📊 2. Anomaly Detection – AI thay đổi cách vận hành NOC/SOC

Thay vì:
Rule-based alert (static threshold)

AI giúp:
Phát hiện bất thường dựa trên baseline động

Correlate nhiều nguồn:
Network (NetFlow, SNMP)

Application

User behavior

➡️ Ví dụ thực tế:
Latency tăng nhẹ + packet loss nhỏ + CPU spike
→ AI nhận ra “pattern sự cố” trước khi user complain

🔁 3. Self-Healing Networks – Bước tiến lớn nhất

Đây là mục tiêu cuối cùng của AIOps:

👉 Network có thể tự chữa lỗi

Cách hoạt động:
Thu thập telemetry (real-time)

AI phân tích

Trigger action:
Thay đổi config

Restart service

Scale resource

Mở ticket đúng team

⚠️ Góc nhìn thực tế (rất quan trọng)

Không phải cứ có AI là:
“Network sẽ tự chạy hoàn toàn”

Thực tế: ❌ Sai lầm phổ biến:
Cho AI quyền write config trực tiếp

Không có guardrail

Không kiểm soát data input

✅ Best Practice:
Human-in-the-loop

Policy-based automation

Audit log đầy đủ

Zero Trust cho AI actions

🎯 Kết luận – Kỹ năng mới cho Network Engineer

Trong 3–5 năm tới, kỹ sư mạng sẽ không chỉ:
Config CLI

Troubleshoot thủ công

Mà cần:
Hiểu AI workflow

Biết dùng RAG / Agent

Làm việc với telemetry & automation

👉 Nói cách khác:
Network Engineer → AI-Augmented Infrastructure Engineer

Attached Files

Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

Email : dangquangminh@vnpro.org
https://www.facebook.com/groups/vietprofessional/
Tags: None