Một hệ thống AI phân loại khách hàng:
- Test: Accuracy ~92%
- Model hoạt động ổn định
Điểm đáng chú ý nằm ở data:
- Data train được thu thập từ trước đó một thời gian
- Data thực tế có sự thay đổi về hành vi
- Một số field đầu vào chưa đồng nhất
Trong AI, model chỉ là một phần.
Để hệ thống chạy tốt lâu dài, cần quan tâm nhiều đến:
- Chất lượng data
- Sự thay đổi của data theo thời gian
- Tính đồng nhất trong pipeline
Gợi ý tối ưu
- Kiểm tra và cập nhật data định kỳ
- Theo dõi sự thay đổi của dữ liệu (data drift)
- Chuẩn hóa input trước khi đưa vào model
Nếu bạn triển khai hệ thống này, bạn sẽ ưu tiên bước nào trước?
A. Rà soát lại model
B. Kiểm tra và cập nhật data
C. Tối ưu pipeline
D. Khác
Comment lựa chọn + cách bạn sẽ làm
(Cùng chia sẻ để mọi người có thêm góc nhìn thực tế)