Model Context Protocol (MCP) – "TCP/IP của thế giới AI Agent"
Nếu TCP/IP là giao thức giúp các máy tính giao tiếp với nhau, thì Model Context Protocol (MCP) đang được xem là giao thức chuẩn giúp AI Agent giao tiếp với công cụ (tools), dữ liệu và hệ thống bên ngoài.
Đây là lý do MCP đang trở thành một trong những công nghệ quan trọng nhất trong kỷ nguyên Agentic AI. MCP là gì?
Model Context Protocol (MCP) là một giao thức chuẩn (standardized interface) kết nối giữa mô hình AI (LLM) với các công cụ và hệ thống bên ngoài.
Thay vì để mỗi AI phải tích hợp riêng với từng API hay từng ứng dụng, MCP định nghĩa một ngôn ngữ chung để AI có thể khám phá và sử dụng các khả năng (capabilities) mà hệ thống cung cấp.
MCP không cung cấp quyền truy cập trực tiếp vào toàn bộ hệ thống, mà chỉ công bố các chức năng được phép sử dụng. Điều này giúp tăng tính bảo mật và khả năng kiểm soát.
Những đặc điểm quan trọng của MCP
Chuẩn hóa giao tiếp giữa AI và công cụ
MCP đóng vai trò như một API chuẩn dành riêng cho AI Agent.
Một MCP Server có thể đại diện cho:
LLM chỉ cần hiểu MCP thay vì học cách gọi hàng trăm API khác nhau.
Exposes capabilities, not raw systems
Đây là tư tưởng rất quan trọng.
MCP không cho AI quyền điều khiển toàn bộ hệ thống.
Ví dụ:
Thay vì cho AI truy cập trực tiếp vào GitHub REST API, MCP chỉ công bố các khả năng như:
AI chỉ nhìn thấy các chức năng này mà không cần biết API phía sau hoạt động như thế nào.
Điều này giống như abstraction trong lập trình.
Structured Input và Output
MCP yêu cầu mọi lời gọi công cụ đều có cấu trúc rõ ràng.
Ví dụ:
Input
hostname = R1
interface = GigabitEthernet0/0
description = WAN
Output
Status = Success
Previous Description = Internet
Current Description = WAN
Điều này giúp AI không phải phân tích các chuỗi văn bản tự do vốn dễ gây lỗi.
Trust Boundary
Một điểm mạnh khác của MCP là xác định rõ ranh giới giữa:
LLM chỉ đưa ra yêu cầu.
MCP quyết định:
Đây chính là lớp bảo mật rất quan trọng.
Vì sao MCP ra đời?
Slide tóm tắt bằng ba câu rất hay:
LLM có khả năng suy luận.
Các công cụ mới là thành phần thực hiện hành động.
Ví dụ:
LLM không thể tự cấu hình router.
Nhưng Netmiko, Ansible hoặc Catalyst Center API thì có thể.
Đây chính là giá trị lớn nhất.
MCP biến quá trình:
Reasoning
↓
Planning
↓
Tool Selection
↓
API Call
↓
Execution
thành một quy trình chuẩn hóa và có kiểm soát.
So sánh với TCP/IP Stack
Hình bên phải của slide rất thú vị khi so sánh TCP/IP với Agentic AI. Layer 1
TCP/IP
Physical
↓
Agentic AI
Execution Systems / APIs
Đây là nơi các hệ thống thực sự tồn tại:
Layer 2
TCP/IP
Data Link
↓
Agentic AI
MCP
Đây là lớp kết nối AI với các hệ thống.
Nó tương tự Data Link vì tạo ra phương thức giao tiếp chuẩn giữa Agent và công cụ.
Layer 3
TCP/IP
Network
↓
Agentic AI
A2A (Agent-to-Agent)
Đây là lớp cho phép nhiều AI Agent giao tiếp với nhau.
Ví dụ:
có thể phối hợp để giải quyết một sự cố.
Layer 4
TCP/IP
Transport
↓
Agentic AI
Reasoning & Planning Engine
Đây là nơi:
Layer 5
TCP/IP
Application
↓
Agentic AI
Agent Interface
Đây là giao diện mà con người tương tác:
MCP là Control Plane của AI
Dòng cuối cùng của slide có thể xem là ý quan trọng nhất:
Trong mạng máy tính, Control Plane quyết định cách mạng hoạt động, còn Data Plane thực hiện việc chuyển tiếp gói tin.
Tương tự, trong Agentic AI:
Đối với kỹ sư mạng, có thể hình dung:
Chính vì vậy, MCP đang được xem là nền tảng kết nối giữa trí tuệ của AI và thế giới hạ tầng CNTT, giúp các AI Agent có thể làm việc với hàng nghìn công cụ khác nhau theo một chuẩn chung, thay vì phải tích hợp riêng lẻ với từng API.
Nếu TCP/IP là giao thức giúp các máy tính giao tiếp với nhau, thì Model Context Protocol (MCP) đang được xem là giao thức chuẩn giúp AI Agent giao tiếp với công cụ (tools), dữ liệu và hệ thống bên ngoài.
Đây là lý do MCP đang trở thành một trong những công nghệ quan trọng nhất trong kỷ nguyên Agentic AI. MCP là gì?
Model Context Protocol (MCP) là một giao thức chuẩn (standardized interface) kết nối giữa mô hình AI (LLM) với các công cụ và hệ thống bên ngoài.
Thay vì để mỗi AI phải tích hợp riêng với từng API hay từng ứng dụng, MCP định nghĩa một ngôn ngữ chung để AI có thể khám phá và sử dụng các khả năng (capabilities) mà hệ thống cung cấp.
MCP không cung cấp quyền truy cập trực tiếp vào toàn bộ hệ thống, mà chỉ công bố các chức năng được phép sử dụng. Điều này giúp tăng tính bảo mật và khả năng kiểm soát.
Những đặc điểm quan trọng của MCP
Chuẩn hóa giao tiếp giữa AI và công cụ
MCP đóng vai trò như một API chuẩn dành riêng cho AI Agent.
Một MCP Server có thể đại diện cho:
- GitHub
- Cisco Catalyst Center
- VMware vCenter
- Kubernetes
- ServiceNow
- Database
- File System
- Gmail
- Calendar
- Slack
LLM chỉ cần hiểu MCP thay vì học cách gọi hàng trăm API khác nhau.
Exposes capabilities, not raw systems
Đây là tư tưởng rất quan trọng.
MCP không cho AI quyền điều khiển toàn bộ hệ thống.
Ví dụ:
Thay vì cho AI truy cập trực tiếp vào GitHub REST API, MCP chỉ công bố các khả năng như:
- List repositories
- Create Issue
- Merge Pull Request
- Read File
AI chỉ nhìn thấy các chức năng này mà không cần biết API phía sau hoạt động như thế nào.
Điều này giống như abstraction trong lập trình.
Structured Input và Output
MCP yêu cầu mọi lời gọi công cụ đều có cấu trúc rõ ràng.
Ví dụ:
Input
hostname = R1
interface = GigabitEthernet0/0
description = WAN
Output
Status = Success
Previous Description = Internet
Current Description = WAN
Điều này giúp AI không phải phân tích các chuỗi văn bản tự do vốn dễ gây lỗi.
Trust Boundary
Một điểm mạnh khác của MCP là xác định rõ ranh giới giữa:
- AI
- Công cụ
- Hệ thống thật
LLM chỉ đưa ra yêu cầu.
MCP quyết định:
- Tool nào được gọi
- Input nào hợp lệ
- Người dùng có đủ quyền hay không
- Kết quả nào được trả về
Đây chính là lớp bảo mật rất quan trọng.
Vì sao MCP ra đời?
Slide tóm tắt bằng ba câu rất hay:
Models reason
LLM có khả năng suy luận.
Tools act
Các công cụ mới là thành phần thực hiện hành động.
Ví dụ:
LLM không thể tự cấu hình router.
Nhưng Netmiko, Ansible hoặc Catalyst Center API thì có thể.
MCP controls how reasoning becomes action
Đây chính là giá trị lớn nhất.
MCP biến quá trình:
Reasoning
↓
Planning
↓
Tool Selection
↓
API Call
↓
Execution
thành một quy trình chuẩn hóa và có kiểm soát.
So sánh với TCP/IP Stack
Hình bên phải của slide rất thú vị khi so sánh TCP/IP với Agentic AI. Layer 1
TCP/IP
Physical
↓
Agentic AI
Execution Systems / APIs
Đây là nơi các hệ thống thực sự tồn tại:
- Router
- Switch
- Kubernetes
- VMware
- GitHub
- Linux
- Database
Layer 2
TCP/IP
Data Link
↓
Agentic AI
MCP
Đây là lớp kết nối AI với các hệ thống.
Nó tương tự Data Link vì tạo ra phương thức giao tiếp chuẩn giữa Agent và công cụ.
Layer 3
TCP/IP
Network
↓
Agentic AI
A2A (Agent-to-Agent)
Đây là lớp cho phép nhiều AI Agent giao tiếp với nhau.
Ví dụ:
- Network Agent
- Security Agent
- DevOps Agent
có thể phối hợp để giải quyết một sự cố.
Layer 4
TCP/IP
Transport
↓
Agentic AI
Reasoning & Planning Engine
Đây là nơi:
- chia nhỏ bài toán
- lập kế hoạch
- lựa chọn công cụ
- quyết định bước tiếp theo
Layer 5
TCP/IP
Application
↓
Agentic AI
Agent Interface
Đây là giao diện mà con người tương tác:
- Chat
- Voice
- UI
- Natural Language
MCP là Control Plane của AI
Dòng cuối cùng của slide có thể xem là ý quan trọng nhất:
MCP is the control plane between cognition and execution.
Trong mạng máy tính, Control Plane quyết định cách mạng hoạt động, còn Data Plane thực hiện việc chuyển tiếp gói tin.
Tương tự, trong Agentic AI:
- LLM đảm nhiệm phần cognition (nhận thức và suy luận).
- Execution Systems (API, CLI, Netmiko, Ansible, GitHub, Kubernetes...) là nơi thực hiện hành động.
- MCP đóng vai trò Control Plane, kiểm soát cách suy luận của AI được chuyển thành các hành động thực tế một cách an toàn, có cấu trúc và đúng quyền hạn.
Đối với kỹ sư mạng, có thể hình dung:
- LLM giống như Network Architect đưa ra quyết định.
- MCP giống như Control Plane của router, quyết định sử dụng công cụ nào và thực thi theo chính sách nào.
- Các API và hệ thống mạng giống như Data Plane, nơi các thay đổi cấu hình và thao tác thực sự diễn ra.
Chính vì vậy, MCP đang được xem là nền tảng kết nối giữa trí tuệ của AI và thế giới hạ tầng CNTT, giúp các AI Agent có thể làm việc với hàng nghìn công cụ khác nhau theo một chuẩn chung, thay vì phải tích hợp riêng lẻ với từng API.