Tổng quan về GPU – Trái tim của hạ tầng AI hiện đại
GPU (Graphics Processing Unit) ban đầu được thiết kế để tăng tốc xử lý đồ họa trong trò chơi điện tử, cho phép hiển thị hình ảnh chất lượng cao theo thời gian thực. Tuy nhiên, cùng với sự phát triển của AI, GPU ngày nay đã trở thành một trong những phần cứng quan trọng nhất cho xử lý dữ liệu song song. GPU tích hợp vs GPU rời
GPU rời mạnh mẽ hơn nhưng tiêu thụ nhiều điện năng và tỏa nhiệt lớn, do đó thường cần hệ thống làm mát riêng. GPU và ứng dụng thực tế
Khác với CPU tối ưu cho xử lý tuần tự (serial), GPU có hàng nghìn lõi nhỏ chuyên cho tính toán song song (parallel).
Nhờ đó, mô hình AI vốn cần tính toán khối lượng khổng lồ có thể huấn luyện nhanh gấp nhiều lần trên GPU thay vì CPU (từ vài tuần xuống chỉ còn vài giờ hoặc vài ngày). Kiến trúc GPU
GPU bao gồm nhiều Streaming Multiprocessors (SMs), bộ nhớ cache L2 và High Bandwidth Memory (HBM).
Trên GPU NVIDIA hiện đại có thể có 3 loại lõi khác nhau:
CUDA là nền tảng lập trình của NVIDIA, cho phép dùng C++, Python, Fortran để viết code tận dụng GPU.
Câu hỏi ôn tập
Câu hỏi: Hai tác vụ nào là lý tưởng cho GPU? (Chọn hai)
✅ Đáp án đúng:
GPU (Graphics Processing Unit) ban đầu được thiết kế để tăng tốc xử lý đồ họa trong trò chơi điện tử, cho phép hiển thị hình ảnh chất lượng cao theo thời gian thực. Tuy nhiên, cùng với sự phát triển của AI, GPU ngày nay đã trở thành một trong những phần cứng quan trọng nhất cho xử lý dữ liệu song song. GPU tích hợp vs GPU rời
- GPU tích hợp (Integrated GPU): gắn trực tiếp vào CPU, đủ dùng cho các tác vụ cơ bản.
- GPU rời (Discrete GPU): là một card đồ họa chuyên dụng cắm vào khe PCIe, có sức mạnh vượt trội, phù hợp cho các ứng dụng yêu cầu hiệu năng cao như AI, 3D rendering, hay video editing.
GPU rời mạnh mẽ hơn nhưng tiêu thụ nhiều điện năng và tỏa nhiệt lớn, do đó thường cần hệ thống làm mát riêng. GPU và ứng dụng thực tế
- GPU cho Gaming: tăng tốc hiển thị đồ họa 2D/3D, hỗ trợ độ phân giải cao, FPS mượt.
- GPU cho Video Editing: hỗ trợ xử lý song song, tăng tốc AI tích hợp, giúp render video nhanh hơn.
- GPU cho Data Center: phục vụ AI, ảo hóa, phân tích dữ liệu, dựng hình 3D, và xử lý song song quy mô lớn.
Khác với CPU tối ưu cho xử lý tuần tự (serial), GPU có hàng nghìn lõi nhỏ chuyên cho tính toán song song (parallel).
- CPU: mạnh về xử lý đơn luồng (single-threaded).
- GPU: mạnh về xử lý song song (parallel tasks), đặc biệt là các phép tính ma trận và số thực dấu chấm động (floating-point).
Nhờ đó, mô hình AI vốn cần tính toán khối lượng khổng lồ có thể huấn luyện nhanh gấp nhiều lần trên GPU thay vì CPU (từ vài tuần xuống chỉ còn vài giờ hoặc vài ngày). Kiến trúc GPU
GPU bao gồm nhiều Streaming Multiprocessors (SMs), bộ nhớ cache L2 và High Bandwidth Memory (HBM).
- SMs: thực hiện tính toán số học và logic.
- Cache + HBM: cung cấp băng thông cực cao cho dữ liệu và lệnh.
Trên GPU NVIDIA hiện đại có thể có 3 loại lõi khác nhau:
- CUDA cores: lõi chính cho tính toán song song.
- Tensor cores: tối ưu cho ma trận, AI, deep learning.
- Ray-tracing cores: mô phỏng ánh sáng chân thực trong đồ họa.
CUDA là nền tảng lập trình của NVIDIA, cho phép dùng C++, Python, Fortran để viết code tận dụng GPU.
- CPU xử lý phần tuần tự.
- GPU xử lý khối lượng tính toán nặng theo dạng song song.
Câu hỏi ôn tập
Câu hỏi: Hai tác vụ nào là lý tưởng cho GPU? (Chọn hai)
- AI workloads
- I/O operations
- parallel tasks
- sequential tasks
- single-threaded tasks
✅ Đáp án đúng:
- AI workloads
- parallel tasks