Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Xây dựng AI Agent riêng cho doanh nghiệp:

    Xây dựng AI Agent riêng cho doanh nghiệp: Đừng vội Fine-tune, hãy bắt đầu từ Context Engineering


    Khi nói đến việc xây dựng AI Agent nội bộ, nhiều người thường nghĩ ngay đến việc huấn luyện lại mô hình (Fine-tuning). Tuy nhiên, thực tế của phần lớn doanh nghiệp lại hoàn toàn khác.

    Khoảng 80–90% giá trị của một AI Agent đến từ việc cung cấp đúng ngữ cảnh (Context), dữ liệu và công cụ, chứ không phải thay đổi trọng số của mô hình.

    Đó cũng là thông điệp chính của sơ đồ trên.
    Một AI Agent riêng cần những thành phần nào?


    Để xây dựng một AI Agent chạy hoàn toàn trong doanh nghiệp, bạn chỉ cần một công nghệ nền tảng tương đối đơn giản. 1. Compute Infrastructure


    Đây là nơi chạy mô hình ngôn ngữ (LLM).

    Bạn không nhất thiết phải sử dụng các mô hình hàng trăm tỷ tham số. Hiện nay, nhiều doanh nghiệp đã có thể triển khai các mô hình mã nguồn mở như:
    • Mistral 7B
    • Qwen 2.5 7B
    • Llama 3.x 8B

    Các mô hình này có thể chạy trên một hoặc vài GPU phổ thông nhưng vẫn đáp ứng tốt nhiều tác vụ doanh nghiệp.

    Bên cạnh đó, bạn cần một Agent Runtime như CrewAI để điều phối nhiều AI Agent cùng cộng tác, phân chia nhiệm vụ và phối hợp xử lý công việc.
    2. Vector Database


    LLM không thể nhớ toàn bộ tài liệu của doanh nghiệp.

    Thay vào đó, tài liệu sẽ được lưu dưới dạng Embedding trong một Vector Database như:
    • Chroma
    • Milvus
    • Qdrant
    • pgvector

    Khi người dùng đặt câu hỏi, AI sẽ tìm những tài liệu liên quan nhất trước khi tạo câu trả lời. Đây chính là nền tảng của Retrieval-Augmented Generation (RAG).
    3. Memory


    AI Agent cần ghi nhớ các cuộc hội thoại và trạng thái làm việc.

    Ví dụ:
    • Người dùng đang xử lý ticket nào
    • Khách hàng thuộc phòng ban nào
    • Agent đã thực hiện bước nào
    • Công việc còn dang dở

    Các thông tin này thường được lưu trong cơ sở dữ liệu như MongoDB, giúp AI Agent duy trì ngữ cảnh qua nhiều phiên làm việc.
    Hai cách phát triển AI hoàn toàn khác nhau


    Hình minh họa chia AI thành hai hướng tiếp cận. 1. Applied AI/ML – Cách doanh nghiệp nên bắt đầu


    Ở hướng này, không thay đổi trọng số của mô hình (Model Weights Unchanged).

    Thay vào đó, doanh nghiệp nâng cao khả năng của AI thông qua:
    • MCP (Model Context Protocol)
    • RAG
    • Tool Calling
    • Agent-to-Agent (A2A)
    • Prompt Engineering
    • Memory
    • Workflow

    Đây được gọi là Augmentation – mở rộng năng lực của mô hình bằng dữ liệu và công cụ bên ngoài.

    Hiện nay, phần lớn các hệ thống AI Agent trong doanh nghiệp đều được xây dựng theo hướng này vì chi phí thấp, triển khai nhanh và dễ cập nhật.
    2. Core AI/ML – Thay đổi chính mô hình


    Nếu doanh nghiệp cần AI có kiến thức hoặc hành vi rất đặc thù, khi đó mới cần can thiệp vào trọng số của mô hình.

    Các kỹ thuật phổ biến gồm:
    • Fine-tuning
    • LoRA
    • QLoRA
    • RLHF (Reinforcement Learning from Human Feedback)
    • RLVF (Reinforcement Learning from Verifiable Feedback)

    Đây là công việc đòi hỏi nhiều GPU, dữ liệu chất lượng cao và đội ngũ AI chuyên sâu.
    Tháp phát triển AI


    Sơ đồ bên phải mô tả các cấp độ phát triển AI theo thứ tự từ nền tảng đến nâng cao. Pre-training


    Đây là giai đoạn xây dựng Foundation Model từ hàng nghìn tỷ token.

    Chỉ những tổ chức như OpenAI, Anthropic, Meta hay Google mới có đủ nguồn lực để thực hiện ở quy mô lớn.
    Fine-tuning


    Điều chỉnh trọng số của mô hình để phù hợp với một lĩnh vực cụ thể như y tế, tài chính hoặc pháp lý.
    Reinforcement Learning


    Tiếp tục cải thiện mô hình bằng cơ chế phản hồi và phần thưởng, giúp AI đưa ra các quyết định phù hợp hơn trong những nhiệm vụ phức tạp.
    Augmentation


    Không thay đổi mô hình mà mở rộng khả năng thông qua RAG, công cụ, API, cơ sở dữ liệu và AI Agent.

    Đây là hướng đi phổ biến nhất trong doanh nghiệp hiện nay.
    Context Engineering


    Đây là tầng cao nhất và cũng đang trở thành xu hướng của AI Agent hiện đại.

    Thay vì cố gắng làm cho mô hình "thông minh hơn", mục tiêu là cung cấp đúng ngữ cảnh, đúng dữ liệu và đúng công cụ tại đúng thời điểm. Một AI Agent có thể truy cập tài liệu nội bộ, gọi API, sử dụng cơ sở dữ liệu, phối hợp với các agent khác và ghi nhớ lịch sử làm việc sẽ tạo ra giá trị lớn hơn nhiều so với việc chỉ tăng số lượng tham số của mô hình.
    Kết luận


    Đối với đa số doanh nghiệp, xây dựng AI Agent không bắt đầu bằng việc huấn luyện một mô hình mới. Điều quan trọng hơn là lựa chọn một mô hình mã nguồn mở phù hợp, triển khai trên hạ tầng nội bộ, kết hợp với Vector Database, Memory, RAG và Agent Runtime để tạo ra một hệ thống AI có khả năng truy cập tri thức doanh nghiệp và thực hiện công việc một cách an toàn.

    Nói cách khác, lợi thế cạnh tranh ngày nay không còn nằm ở việc sở hữu mô hình lớn nhất, mà ở khả năng xây dựng một hệ sinh thái AI Agent biết khai thác đúng ngữ cảnh, đúng dữ liệu và đúng công cụ để hỗ trợ công việc. Đây chính là tinh thần của Context Engineering – xu hướng đang định hình thế hệ AI Agent tiếp theo.
    Attached Files
    Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X