MCP - Accessing the API - Vietnamese Professional

Trần Ngọc

Member

Newbie

Join Date: Jul 2025

Posts: 39
- Share
- Tweet
#1

MCP - Accessing the API

24-08-2025, 09:37 PM

Accessing the API

Trong mô-đun này, chúng ta sẽ tìm hiểu cách truy cập Claude và sử dụng nó để tạo ra một đoạn văn bản. Để giúp bạn hiểu cách hoạt động, tôi sẽ hướng dẫn bạn toàn bộ vòng đời của một yêu cầu đến Anthropic API. Chúng ta cũng sẽ xem qua một chút về những gì đang diễn ra bên trong Claude.
Để bắt đầu, hãy hình dung một ứng dụng chatbot tiêu chuẩn. Giả sử bạn đang xây dựng một ứng dụng web và muốn hiển thị cửa sổ chat cho người dùng trong trình duyệt. Khi người dùng nhập tin nhắn và nhấn gửi, họ sẽ kỳ vọng rằng một phản hồi sẽ “tự động” xuất hiện.
Như tôi đã nói, chúng ta sẽ tìm hiểu những gì diễn ra đằng sau hậu trường để tạo ra văn bản này và hiển thị nó trên màn hình. Chúng ta sẽ chia nhỏ quá trình này thành 5 bước và đi qua từng bước một.
Bước 1: Khi người dùng nhập văn bản và nhấn gửi, văn bản đó sẽ được gửi đến máy chủ mà bạn – lập trình viên – triển khai. Tôi nhắc bước này chỉ để làm rõ: bạn không nên gọi trực tiếp đến Anthropic API từ ứng dụng web hoặc mobile. Mỗi khi gọi API, bạn cần kèm theo API key bí mật. Cách tốt nhất để giữ bí mật là không bao giờ đưa key vào trong ứng dụng phía client, mà chỉ gọi API thông qua server của bạn.
Bước 2: Khi server nhận được request từ client, server sẽ gửi request trực tiếp đến Anthropic API. Thông thường, bạn sẽ dùng một trong các SDK chính thức mà Anthropic phát hành. Hiện tại có SDK cho Python, TypeScript, JavaScript, Go và Ruby. Bạn cũng có thể gọi bằng HTTP request thường nếu muốn.
Trong request này, bạn bắt buộc phải gửi kèm:
API key

Tên mô hình muốn sử dụng

Danh sách tin nhắn (bao gồm cả văn bản mà người dùng nhập)

Giá trị max tokens (giới hạn số lượng token mà Claude sẽ sinh ra)

Bước 3: Đây là nơi quá trình sinh văn bản thật sự diễn ra – trong Anthropic API. Chúng ta sẽ đi qua quá trình này ở mức khái quát.
Quá trình sinh văn bản được chia thành 4 giai đoạn:
Tokenization (Phân tách thành token):
Văn bản đầu vào được chia nhỏ thành các chuỗi nhỏ gọi là token. Một token có thể là cả từ, một phần từ, khoảng trắng hoặc ký hiệu. Để đơn giản, giả sử mỗi từ là một token.

Embedding (Biểu diễn):
Mỗi token được chuyển thành một vector số (danh sách dài các con số). Embedding này có thể xem như “định nghĩa bằng số” của từ đó. Một từ có thể mang nhiều nghĩa, và chỉ khi đặt trong ngữ cảnh mới rõ nghĩa chính xác. Tương tự, embedding ban đầu chứa nhiều khả năng nghĩa, và sẽ được làm rõ nhờ các token xung quanh.

Contextualization (Ngữ cảnh hóa):
Các embedding được điều chỉnh dựa trên embedding xung quanh, để làm nổi bật nghĩa phù hợp nhất theo ngữ cảnh.

Generation (Sinh văn bản):
Sau khi đã ngữ cảnh hóa, các embedding được đưa vào tầng đầu ra, nơi mô hình tạo ra xác suất cho mỗi từ tiếp theo có thể xuất hiện. Mô hình không chỉ chọn từ có xác suất cao nhất, mà dùng sự kết hợp giữa xác suất và ngẫu nhiên để tạo ra văn bản tự nhiên hơn. Từ được chọn sẽ được thêm vào, và toàn bộ quá trình lặp lại cho đến khi đủ số lượng token hoặc mô hình quyết định dừng.

Trong khi sinh văn bản, mô hình sẽ liên tục kiểm tra:
Đã vượt quá số token cho phép (max tokens) chưa?

Có tạo ra end of sequence token chưa? (dấu hiệu mô hình coi là điểm kết thúc hợp lý).

Bước 4: Sau khi sinh xong văn bản, Anthropic API sẽ gửi phản hồi về server. Phản hồi này gồm:
Tin nhắn sinh ra (generated text)

Usage (số lượng token đầu vào và token đầu ra)

Stop reason (lý do mô hình dừng: kết thúc tự nhiên hay vượt giới hạn token)

Bước 5: Server nhận phản hồi từ API và gửi lại văn bản này về ứng dụng web hoặc mobile của bạn để hiển thị cho người dùng.
Tags: None