Memory-Centric Computing Và Tương Lai AI

Nguyễn Thị Ngọc Tuyền

Member

Newbie

Join Date: Mar 2026

Posts: 37
- Share
- Tweet
#1

Memory-Centric Computing Và Tương Lai AI

8 hours ago

Memory-Centric Computing – Khi bộ nhớ trở thành trung tâm của tương lai điện toán

Mở đầu: Vì sao kiến trúc máy tính truyền thống đang dần chạm giới hạn?

Trong suốt nhiều thập kỷ, ngành công nghệ thông tin phát triển dựa trên một nguyên tắc gần như không thay đổi: CPU là “bộ não” trung tâm của hệ thống, còn bộ nhớ chỉ đóng vai trò hỗ trợ lưu trữ dữ liệu để CPU xử lý. Kiến trúc này, vốn bắt nguồn từ mô hình Von Neumann nổi tiếng, đã tạo nên nền móng cho gần như mọi thiết bị điện toán hiện đại — từ laptop, smartphone cho đến siêu máy tính.

Tuy nhiên, khi thế giới bước vào kỷ nguyên AI, Big Data, điện toán đám mây và xử lý dữ liệu thời gian thực, mô hình cũ bắt đầu bộc lộ những điểm nghẽn nghiêm trọng. CPU ngày càng mạnh hơn, số lượng lõi xử lý tăng lên liên tục, nhưng hiệu suất tổng thể của hệ thống lại không tăng tương ứng. Nguyên nhân nằm ở một vấn đề âm thầm nhưng cực kỳ quan trọng: dữ liệu mất quá nhiều thời gian để di chuyển giữa CPU và bộ nhớ.

Trong nhiều hệ thống hiện đại, phần lớn năng lượng và thời gian không còn dành cho việc tính toán, mà dành cho việc “chuyển dữ liệu qua lại”. Điều này tạo nên cái gọi là “Memory Wall” — bức tường bộ nhớ, nơi tốc độ truy cập dữ liệu không theo kịp tốc độ xử lý của CPU.

Khi AI cần xử lý hàng tỷ tham số, khi datacenter phải vận hành hàng triệu truy vấn mỗi giây, hay khi xe tự lái phải phản ứng gần như tức thời với môi trường xung quanh, độ trễ trong việc truy cập dữ liệu trở thành một vấn đề sống còn.

Đó là lý do vì sao một xu hướng kiến trúc mới đang dần hình thành: Memory-Centric Computing — điện toán lấy bộ nhớ làm trung tâm.

Thay vì xem bộ nhớ là thành phần phụ trợ, mô hình này đặt bộ nhớ vào vị trí trung tâm của toàn bộ hệ thống. Đây không chỉ là một cải tiến kỹ thuật nhỏ, mà được xem là sự thay đổi tư duy lớn nhất trong ngành kiến trúc máy tính kể từ nhiều thập kỷ qua.

Memory-Centric Computing là gì?

Memory-Centric Computing là mô hình kiến trúc máy tính trong đó bộ nhớ trở thành thành phần trung tâm thay vì CPU.

Trong kiến trúc truyền thống, CPU chịu trách nhiệm xử lý còn dữ liệu phải liên tục được chuyển từ RAM hoặc storage đến CPU rồi gửi ngược trở lại. Điều này tạo ra độ trễ lớn và tiêu tốn năng lượng đáng kể.

Memory-Centric Computing cố gắng đảo ngược cách tiếp cận đó bằng nhiều phương pháp khác nhau:
Đưa việc xử lý đến gần dữ liệu hơn

Giảm khoảng cách giữa bộ nhớ và bộ xử lý

Cho phép xử lý trực tiếp bên trong bộ nhớ

Tăng khả năng chia sẻ dữ liệu giữa nhiều bộ xử lý

Tối ưu băng thông truy cập dữ liệu

Nói cách khác, thay vì “đưa dữ liệu đến CPU”, hệ thống mới cố gắng “đưa khả năng tính toán đến nơi dữ liệu tồn tại”.

Điều này nghe có vẻ đơn giản, nhưng tác động của nó cực kỳ lớn.

“Memory Wall” – Bức tường vô hình kìm hãm hiệu năng hiện đại

Trong nhiều năm, tốc độ CPU tăng trưởng cực nhanh nhờ định luật Moore. Nhưng tốc độ cải thiện của bộ nhớ lại chậm hơn nhiều.

Kết quả là CPU thường xuyên phải chờ dữ liệu được tải từ RAM hoặc storage. Một CPU hiện đại có thể thực hiện hàng tỷ phép tính mỗi giây, nhưng nếu dữ liệu chưa kịp đến nơi thì toàn bộ sức mạnh đó gần như bị lãng phí.

Đây chính là “Memory Wall”.

Trong các hệ thống AI hiện đại, vấn đề này còn nghiêm trọng hơn. Một mô hình ngôn ngữ lớn có thể chứa hàng trăm tỷ tham số. Chỉ riêng việc di chuyển dữ liệu giữa GPU và bộ nhớ đã tiêu tốn lượng điện năng khổng lồ.

Nhiều nghiên cứu cho thấy năng lượng dùng để di chuyển dữ liệu đôi khi còn lớn hơn cả năng lượng dùng để tính toán.

Điều này khiến ngành công nghệ nhận ra rằng tương lai hiệu năng không còn phụ thuộc chủ yếu vào CPU nhanh hơn, mà phụ thuộc vào khả năng xử lý dữ liệu hiệu quả hơn.

Sự khác biệt giữa CPU-Centric và Memory-Centric

Trong mô hình CPU-Centric truyền thống:
CPU là trung tâm

Bộ nhớ đóng vai trò hỗ trợ

Dữ liệu phải liên tục di chuyển

Độ trễ tăng khi dữ liệu lớn

Tiêu thụ điện năng cao

Trong mô hình Memory-Centric:
Bộ nhớ là trung tâm

Tính toán diễn ra gần dữ liệu

Giảm việc truyền dữ liệu

Hiệu suất tốt hơn với AI và Big Data

Tiết kiệm điện năng hơn

Sự thay đổi này tương tự như việc thay đổi cách tổ chức cả một thành phố. Thay vì mọi người đều phải di chuyển đến một nơi trung tâm để làm việc, giờ đây công việc được phân tán gần nơi dữ liệu tồn tại nhất.

Processing In Memory (PIM) – Xử lý trực tiếp trong bộ nhớ

Một trong những công nghệ quan trọng nhất của Memory-Centric Computing là PIM — Processing In Memory.

Ý tưởng của PIM là tích hợp khả năng xử lý ngay bên trong chip bộ nhớ. Điều này giúp giảm đáng kể việc truyền dữ liệu giữa CPU và RAM.
Trong các hệ thống truyền thống:
Dữ liệu nằm trong RAM

CPU yêu cầu dữ liệu

Dữ liệu được chuyển đến CPU

CPU xử lý

Kết quả được ghi trở lại RAM

Trong PIM:
Dữ liệu nằm trong RAM

Việc xử lý diễn ra ngay tại đó

Chỉ riêng việc loại bỏ bước truyền dữ liệu đã giúp tăng hiệu năng và giảm điện năng đáng kể.
PIM đặc biệt phù hợp với:
AI inference

Machine Learning

Database lớn

Phân tích dữ liệu thời gian thực

Hệ thống recommendation

Xử lý video

Edge AI

Các hãng lớn như Samsung, SK Hynix và Micron đều đang đầu tư mạnh vào công nghệ này.

HBM – High Bandwidth Memory và vai trò trong AI

Một thành phần quan trọng khác trong Memory-Centric Computing là HBM — High Bandwidth Memory.

HBM là loại bộ nhớ có băng thông cực cao, được thiết kế để phục vụ GPU và AI accelerator.

Khác với RAM truyền thống, HBM được xếp chồng theo chiều dọc bằng công nghệ 3D stacking, giúp:
Tăng tốc độ truyền dữ liệu

Giảm độ trễ

Tiết kiệm điện

Tăng mật độ bộ nhớ

Đây là lý do vì sao các GPU AI hiện đại của NVIDIA hay AMD đều phụ thuộc rất lớn vào HBM.

Trong nhiều trường hợp, sức mạnh AI hiện đại không còn phụ thuộc chủ yếu vào số nhân GPU, mà phụ thuộc vào khả năng cung cấp dữ liệu đủ nhanh từ bộ nhớ.

CXL – Công nghệ thay đổi cách máy chủ truy cập bộ nhớ

Một bước tiến lớn khác là CXL — Compute Express Link.

CXL cho phép CPU, GPU, accelerator và bộ nhớ chia sẻ dữ liệu hiệu quả hơn thông qua kết nối tốc độ cao.

Trước đây, mỗi thiết bị thường có vùng nhớ riêng. Điều này gây lãng phí tài nguyên và làm tăng độ phức tạp khi xử lý dữ liệu lớn.

Với CXL:
Bộ nhớ có thể được chia sẻ linh hoạt

GPU và CPU truy cập dữ liệu hiệu quả hơn

Datacenter dễ mở rộng hơn

Giảm bottleneck trong AI training

Nhiều chuyên gia tin rằng CXL sẽ đóng vai trò nền tảng cho thế hệ datacenter AI tiếp theo.

AI và sự bùng nổ của nhu cầu bộ nhớ

AI chính là động lực lớn nhất thúc đẩy Memory-Centric Computing.

Các mô hình AI hiện đại không chỉ cần sức mạnh xử lý lớn mà còn cần lượng bộ nhớ khổng lồ.
Ví dụ:
Large Language Models

Generative AI

Computer Vision

Recommendation Systems

Autonomous Driving

Tất cả đều phụ thuộc vào việc xử lý lượng dữ liệu cực lớn trong thời gian rất ngắn.

Nếu dữ liệu di chuyển quá chậm, GPU mạnh đến đâu cũng không thể đạt hiệu suất tối đa.

Đó là lý do ngành công nghiệp bắt đầu chuyển từ “compute-centric” sang “data-centric”.

Memory-Centric Computing trong datacenter

Datacenter hiện đại đang đối mặt với ba áp lực lớn:
Chi phí điện năng

Khối lượng dữ liệu khổng lồ

Yêu cầu AI ngày càng tăng

Memory-Centric Computing giúp giải quyết cả ba vấn đề này.

Bằng cách giảm việc truyền dữ liệu, datacenter có thể:
Tiết kiệm điện

Tăng tốc xử lý

Giảm nhiệt lượng

Tăng mật độ tính toán

Tối ưu AI workload

Trong tương lai, nhiều datacenter có thể được thiết kế xoay quanh “memory fabric” thay vì CPU cluster truyền thống.

Vai trò của công nghệ 3D Packaging

Một yếu tố thúc đẩy mạnh mẽ Memory-Centric Computing là 3D Packaging.

Thay vì đặt CPU và bộ nhớ cách xa nhau trên bo mạch chủ, công nghệ mới cho phép xếp chồng các thành phần gần nhau hơn theo chiều dọc.

Điều này giúp:
Giảm khoảng cách truyền dữ liệu

Tăng băng thông

Giảm tiêu thụ điện

Tăng tốc AI

Apple, Intel, AMD, NVIDIA và TSMC đều đang đầu tư mạnh vào hướng đi này.

Edge AI và tương lai của xử lý gần dữ liệu

Không chỉ datacenter, Edge AI cũng phụ thuộc lớn vào Memory-Centric Computing.
Các thiết bị edge như:
Camera AI

Xe tự lái

Robot

Thiết bị IoT

Drone

Thiết bị y tế thông minh

đều cần xử lý dữ liệu ngay tại chỗ với độ trễ cực thấp.

Trong những môi trường này, việc gửi dữ liệu lên cloud rồi chờ phản hồi là không khả thi.

Memory-Centric Computing giúp thiết bị:
Phản ứng nhanh hơn

Tiết kiệm pin hơn

Giảm phụ thuộc internet

Tăng tính riêng tư dữ liệu

Thách thức của Memory-Centric Computing

Dù đầy tiềm năng, Memory-Centric Computing vẫn đối mặt nhiều khó khăn.

Một trong những vấn đề lớn nhất là chi phí sản xuất.
Các công nghệ như:
HBM

3D stacking

PIM

Advanced packaging

đều cực kỳ đắt đỏ và phức tạp.
Ngoài ra còn có các vấn đề khác:
Khả năng tương thích phần mềm

Thiết kế hệ điều hành mới

Quản lý nhiệt

Độ ổn định hệ thống

Chuẩn hóa kết nối

Bảo mật dữ liệu

Việc thay đổi kiến trúc máy tính ở quy mô toàn ngành không thể diễn ra trong một sớm một chiều.

Các công ty đang dẫn đầu cuộc đua

Nhiều tập đoàn công nghệ lớn đang đầu tư mạnh vào Memory-Centric Computing.

NVIDIA tập trung vào GPU + HBM cho AI.

Samsung và SK Hynix phát triển bộ nhớ thế hệ mới cho AI datacenter.

Intel thúc đẩy CXL và advanced packaging.

AMD phát triển kiến trúc chiplet kết hợp bộ nhớ tốc độ cao.

IBM nghiên cứu điện toán neuromorphic và memory processing.

Micron tập trung vào memory architecture cho AI.

Cuộc cạnh tranh này được xem là một trong những chiến trường công nghệ quan trọng nhất của thập kỷ tới.

Tương lai sau kiến trúc Von Neumann?

Nhiều chuyên gia tin rằng Memory-Centric Computing có thể trở thành bước chuyển lớn tiếp theo sau kiến trúc Von Neumann truyền thống.

Trong tương lai:
Bộ nhớ và xử lý có thể hòa làm một

AI accelerator sẽ phổ biến hơn CPU truyền thống

Datacenter sẽ được thiết kế xoay quanh dữ liệu

Tốc độ truy cập dữ liệu sẽ quan trọng hơn xung nhịp CPU

Điều này có thể thay đổi hoàn toàn cách phần mềm được viết, cách hệ điều hành vận hành và cách hạ tầng cloud được xây dựng.

Học gì nếu muốn theo đuổi lĩnh vực này?

Memory-Centric Computing là lĩnh vực giao thoa giữa:
Computer Architecture

Embedded Systems

Semiconductor Engineering

AI Infrastructure

High Performance Computing

Cloud Infrastructure

Hardware Acceleration

Những người muốn theo đuổi lĩnh vực này thường cần kiến thức về:
Kiến trúc máy tính

Bộ nhớ và storage

GPU computing

Parallel computing

AI infrastructure

FPGA

Datacenter architecture

Đây là lĩnh vực cực kỳ tiềm năng vì nhu cầu AI toàn cầu đang tăng rất nhanh.

Thi chứng chỉ liên quan tại trung tâm khảo thí Pearson VUE thông qua VNPro tại TP.HCM

Đối với những người muốn phát triển chuyên sâu theo hướng hạ tầng hiện đại, datacenter, cloud, AI infrastructure hoặc computer architecture, có thể tham khảo các chứng chỉ quốc tế liên quan đến hệ thống máy tính, cloud và networking.

Nhiều kỳ thi quốc tế hiện nay được tổ chức thông qua hệ thống Pearson VUE tại VNPro ở TP.HCM.

Trung tâm: VIET Professional Co., Ltd (VnPro) – TP. Hồ Chí Minh
Địa chỉ: 276-278 Ung Văn Khiêm, Phường Thạnh Mỹ Tây, TP. Hồ Chí Minh

Một số hướng chứng chỉ phù hợp gồm:
Cloud Infrastructure

Data Center

AI Infrastructure

Networking

Linux System Administration

Hardware & System Architecture

Việc thi thông qua Pearson VUE tại VNPro giúp thí sinh tiếp cận các chứng chỉ quốc tế ngay tại Việt Nam với môi trường thi đạt chuẩn toàn cầu.

Kết luận: Khi dữ liệu trở thành trung tâm của toàn bộ ngành công nghệ

Trong nhiều năm, ngành công nghệ tập trung vào việc làm cho CPU nhanh hơn. Nhưng khi AI và dữ liệu bùng nổ, thế giới bắt đầu nhận ra rằng hiệu năng thực sự không còn nằm ở tốc độ xử lý đơn thuần, mà nằm ở khả năng di chuyển và truy cập dữ liệu hiệu quả.

Memory-Centric Computing đại diện cho sự thay đổi tư duy đó.

Đây không chỉ là một xu hướng kỹ thuật mới, mà có thể là nền móng cho thế hệ điện toán tiếp theo — nơi dữ liệu trở thành trung tâm của mọi kiến trúc hệ thống.

Từ AI, cloud, edge computing cho đến xe tự lái và siêu máy tính, tương lai của công nghệ có thể sẽ không còn xoay quanh CPU nữa, mà xoay quanh bộ nhớ, băng thông dữ liệu và khả năng xử lý gần nơi dữ liệu tồn tại nhất.

Cuộc cách mạng này có thể âm thầm hơn AI tạo sinh hay metaverse, nhưng tác động của nó lên ngành công nghệ trong 10–20 năm tới có thể sâu sắc không kém bất kỳ xu hướng lớn nào từng xuất hiện trong lịch sử điện toán hiện đại.
Tags: None

Previous template Next