🎙 CODECS – Chuyển giọng nói thành gói tin số trong VoIP
Khi chúng ta nói chuyện qua điện thoại IP, giọng nói (tín hiệu analog) sẽ được chuyển thành dữ liệu số, nén lại, rồi gửi qua mạng. Quá trình này được thực hiện nhờ codec (coder-decoder).
Codec không chỉ đơn thuần “ghi âm” mà còn lấy mẫu – lượng tử hóa – mã hóa – và có thể nén để giảm băng thông tiêu thụ.
1. Vì sao phải chuyển từ Analog sang Digital?
📌 Kết luận: Digital bền hơn, sạch hơn khi truyền qua mạng.
2. Quá trình chuyển đổi Analog → Digital
Quy trình này gọi là Pulse Code Modulation (PCM) và tiêu chuẩn nổi tiếng nhất là G.711. Bước 1 – Lấy mẫu (Sampling)
💡 Ví dụ: Giống như chụp ảnh liên tục để tái tạo lại chuyển động. Chụp càng nhiều ảnh/giây thì hình càng mượt.
Bước 2 – Lượng tử hóa (Quantization)
Bước 3 – Mã hóa (Encoding)
Bước 4 – Nén (Compression – tùy chọn)
3. Dải tần và các loại băng thông thoại
📌 Narrowband là tiêu chuẩn cũ của điện thoại PSTN và VoIP đời đầu, đủ cho hội thoại nhưng thiếu chi tiết cho nhạc (MOH – Music On Hold).
📌 Wideband và cao hơn cho âm thanh trong trẻo hơn, thường dùng trong hội nghị trực tuyến HD.
4. Ví dụ về băng thông Codec
💡 Lưu ý: Đây là băng thông payload chưa tính overhead của IP/UDP/RTP, thực tế sẽ cao hơn khoảng 30–40%.
5. Tóm tắt quá trình PCM trong VoIP
📌 Câu hỏi ôn tập
Điện thoại truyền thống hoạt động ở dải tần nào?
✅ 300 – 4000 Hz
Khi chúng ta nói chuyện qua điện thoại IP, giọng nói (tín hiệu analog) sẽ được chuyển thành dữ liệu số, nén lại, rồi gửi qua mạng. Quá trình này được thực hiện nhờ codec (coder-decoder).
Codec không chỉ đơn thuần “ghi âm” mà còn lấy mẫu – lượng tử hóa – mã hóa – và có thể nén để giảm băng thông tiêu thụ.
1. Vì sao phải chuyển từ Analog sang Digital?
- Giọng nói con người là tín hiệu analog (dạng sóng liên tục).
- Mạng máy tính truyền dữ liệu ở dạng digital (0 và 1).
- Khi truyền đi xa, tín hiệu analog sẽ bị suy giảm và nhiễu.
- Analog: phải khuếch đại ⇒ khuếch đại cả nhiễu.
- Digital: được tái tạo (regenerate) ⇒ loại bỏ nhiễu và giữ nguyên dữ liệu ban đầu.
📌 Kết luận: Digital bền hơn, sạch hơn khi truyền qua mạng.
2. Quá trình chuyển đổi Analog → Digital
Quy trình này gọi là Pulse Code Modulation (PCM) và tiêu chuẩn nổi tiếng nhất là G.711. Bước 1 – Lấy mẫu (Sampling)
- Lấy giá trị biên độ của sóng tại các khoảng thời gian đều nhau (PAM – Pulse Amplitude Modulation).
- Tần số lấy mẫu phải gấp đôi tần số cao nhất của tín hiệu (Định lý Nyquist).
- Trong điện thoại: tần số thoại ~ 300–4000 Hz ⇒ lấy mẫu 8000 mẫu/giây (mỗi mẫu cách nhau 125 µs).
💡 Ví dụ: Giống như chụp ảnh liên tục để tái tạo lại chuyển động. Chụp càng nhiều ảnh/giây thì hình càng mượt.
Bước 2 – Lượng tử hóa (Quantization)
- Chuyển giá trị biên độ liên tục thành các mức rời rạc (steps).
- Mức đo càng nhỏ thì tiếng càng rõ, nhưng dữ liệu càng lớn.
- Dùng 8 đoạn chính, mỗi đoạn chia thành 16 khoảng. Các đoạn gần biên độ 0 có độ chia nhỏ hơn để giảm méo tiếng.
- Hai chuẩn nén logarit:
- A-law (châu Âu, phần lớn thế giới)
- Mu-law (Bắc Mỹ, Nhật Bản)
Bước 3 – Mã hóa (Encoding)
- Chuyển giá trị lượng tử thành 8-bit (octet).
- Bit đầu: dấu (+ hoặc -), 7 bit còn lại: giá trị.
- A-law và Mu-law khác nhau ở cách ánh xạ bit ⇒ không tương thích trực tiếp.
Bước 4 – Nén (Compression – tùy chọn)
- Mục tiêu: giảm băng thông mà vẫn giữ chất lượng đủ dùng.
- Ví dụ:
- G.711: 64 kbps (không nén, chất lượng cao)
- G.729: 8 kbps (nén mạnh, tiết kiệm băng thông)
- Opus: 6–510 kbps (linh hoạt, dùng nhiều trong WebRTC)
3. Dải tần và các loại băng thông thoại
| Narrowband | 8 kHz | 200–3400 Hz |
| Wideband | 16 kHz | 50–7000 Hz |
| Super WB | 32 kHz | 50–14,000 Hz |
| Fullband | 44.1 kHz+ | 20–20,000 Hz |
📌 Narrowband là tiêu chuẩn cũ của điện thoại PSTN và VoIP đời đầu, đủ cho hội thoại nhưng thiếu chi tiết cho nhạc (MOH – Music On Hold).
📌 Wideband và cao hơn cho âm thanh trong trẻo hơn, thường dùng trong hội nghị trực tuyến HD.
4. Ví dụ về băng thông Codec
| G.711 | 64 kbps |
| G.722 | 48/56/64 kbps |
| iLBC | 13.3–15.2 kbps |
| G.729 | 8 kbps |
| Opus | 6–510 kbps |
5. Tóm tắt quá trình PCM trong VoIP
- Giọng nói (analog)
- Lấy mẫu (8 kHz cho narrowband)
- Lượng tử hóa (chia mức)
- Mã hóa thành bit (A-law/Mu-law)
- (Tùy chọn) Nén giảm băng thông
- Truyền qua mạng (IP/UDP/RTP)
- Giải nén + Giải mã thành sóng analog ở bên nhận.
📌 Câu hỏi ôn tập
Điện thoại truyền thống hoạt động ở dải tần nào?
✅ 300 – 4000 Hz