Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Cách Hoạt Động Của RAG

    • Ở post trước tôi đã nói sơ qua về RAG và lí do tại sao RAG lại quan trọng đối với các mô hình như GPT, Llama. Ở bài này tôi sẽ giải thích cách hoạt động của RAG
    • Quá trình RAG diễn ra theo ba bước chính:
    • Bước 1: Lập chỉ mục (Indexing): Đây là giai đoạn chuẩn bị. Bạn cần xây dựng một cơ sở dữ liệu tri thức (knowledge base) chứa các tài liệu mà bạn muốn LLM truy cập.
    • Các tài liệu này có thể là: tài liệu nội bộ công ty, các bài báo khoa học, trang web, sách, v.v.
    • Mỗi tài liệu sẽ được chia nhỏ thành các đoạn văn (chunks) nhỏ hơn.
    • Mỗi đoạn văn này sau đó sẽ được chuyển đổi thành một vector số (vector embedding) bằng cách sử dụng các mô hình nhúng (embedding models).
    • Các vector này được lưu trữ trong một cơ sở dữ liệu vector (vector database), có khả năng tìm kiếm nhanh chóng dựa trên sự tương đồng về ngữ nghĩa.
    • Bước 2: Truy xuất (Retrieval)
    • Khi người dùng đưa ra một câu hỏi (query), câu hỏi này cũng sẽ được chuyển đổi thành một vector embedding.
    • Vector của câu hỏi sẽ được sử dụng để tìm kiếm trong cơ sở dữ liệu vector.
    • Hệ thống sẽ tìm ra các đoạn văn có vector gần nhất (tương đồng nhất về ngữ nghĩa) với vector của câu hỏi.
    • Các đoạn văn này chính là các tài liệu tham khảo (context documents) mà RAG sẽ sử dụng.
    • Bước 3: Tạo sinh (Generation)
    • Cuối cùng, câu hỏi ban đầu của người dùng và các tài liệu tham khảo đã được truy xuất sẽ được kết hợp lại thành một câu lệnh duy nhất (prompt).
    • Cấu trúc câu lệnh thường sẽ là: "Hãy trả lời câu hỏi sau dựa trên thông tin trong tài liệu sau đây: [Nội dung tài liệu]. Câu hỏi: [Câu hỏi của người dùng]."
    • Prompt này được đưa vào một mô hình ngôn ngữ lớn (LLM).
    • LLM sẽ sử dụng thông tin trong tài liệu tham khảo để tạo ra câu trả lời cuối cùng, đảm bảo tính chính xác và bám sát vào nguồn thông tin được cung cấp.
Working...
X