Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • 🎙 CODECS – Chuyển giọng nói thành gói tin số trong VoIP

    🎙 CODECS – Chuyển giọng nói thành gói tin số trong VoIP


    Khi chúng ta nói chuyện qua điện thoại IP, giọng nói (tín hiệu analog) sẽ được chuyển thành dữ liệu số, nén lại, rồi gửi qua mạng. Quá trình này được thực hiện nhờ codec (coder-decoder).

    Codec không chỉ đơn thuần “ghi âm” mà còn lấy mẫu – lượng tử hóa – mã hóa – và có thể nén để giảm băng thông tiêu thụ.
    1. Vì sao phải chuyển từ Analog sang Digital?
    • Giọng nói con người là tín hiệu analog (dạng sóng liên tục).
    • Mạng máy tính truyền dữ liệu ở dạng digital (0 và 1).
    • Khi truyền đi xa, tín hiệu analog sẽ bị suy giảm và nhiễu.
      • Analog: phải khuếch đại ⇒ khuếch đại cả nhiễu.
      • Digital: được tái tạo (regenerate) ⇒ loại bỏ nhiễu và giữ nguyên dữ liệu ban đầu.

    📌 Kết luận: Digital bền hơn, sạch hơn khi truyền qua mạng.
    2. Quá trình chuyển đổi Analog → Digital


    Quy trình này gọi là Pulse Code Modulation (PCM) và tiêu chuẩn nổi tiếng nhất là G.711. Bước 1 – Lấy mẫu (Sampling)
    • Lấy giá trị biên độ của sóng tại các khoảng thời gian đều nhau (PAM – Pulse Amplitude Modulation).
    • Tần số lấy mẫu phải gấp đôi tần số cao nhất của tín hiệu (Định lý Nyquist).
    • Trong điện thoại: tần số thoại ~ 300–4000 Hz ⇒ lấy mẫu 8000 mẫu/giây (mỗi mẫu cách nhau 125 µs).

    💡 Ví dụ: Giống như chụp ảnh liên tục để tái tạo lại chuyển động. Chụp càng nhiều ảnh/giây thì hình càng mượt.
    Bước 2 – Lượng tử hóa (Quantization)
    • Chuyển giá trị biên độ liên tục thành các mức rời rạc (steps).
    • Mức đo càng nhỏ thì tiếng càng rõ, nhưng dữ liệu càng lớn.
    • Dùng 8 đoạn chính, mỗi đoạn chia thành 16 khoảng. Các đoạn gần biên độ 0 có độ chia nhỏ hơn để giảm méo tiếng.
    • Hai chuẩn nén logarit:
      • A-law (châu Âu, phần lớn thế giới)
      • Mu-law (Bắc Mỹ, Nhật Bản)

    Bước 3 – Mã hóa (Encoding)
    • Chuyển giá trị lượng tử thành 8-bit (octet).
    • Bit đầu: dấu (+ hoặc -), 7 bit còn lại: giá trị.
    • A-law và Mu-law khác nhau ở cách ánh xạ bit ⇒ không tương thích trực tiếp.

    Bước 4 – Nén (Compression – tùy chọn)
    • Mục tiêu: giảm băng thông mà vẫn giữ chất lượng đủ dùng.
    • Ví dụ:
      • G.711: 64 kbps (không nén, chất lượng cao)
      • G.729: 8 kbps (nén mạnh, tiết kiệm băng thông)
      • Opus: 6–510 kbps (linh hoạt, dùng nhiều trong WebRTC)

    3. Dải tần và các loại băng thông thoại
    Narrowband 8 kHz 200–3400 Hz
    Wideband 16 kHz 50–7000 Hz
    Super WB 32 kHz 50–14,000 Hz
    Fullband 44.1 kHz+ 20–20,000 Hz





    📌 Narrowband là tiêu chuẩn cũ của điện thoại PSTN và VoIP đời đầu, đủ cho hội thoại nhưng thiếu chi tiết cho nhạc (MOH – Music On Hold).
    📌 Wideband và cao hơn cho âm thanh trong trẻo hơn, thường dùng trong hội nghị trực tuyến HD.
    4. Ví dụ về băng thông Codec
    G.711 64 kbps
    G.722 48/56/64 kbps
    iLBC 13.3–15.2 kbps
    G.729 8 kbps
    Opus 6–510 kbps
    💡 Lưu ý: Đây là băng thông payload chưa tính overhead của IP/UDP/RTP, thực tế sẽ cao hơn khoảng 30–40%.
    5. Tóm tắt quá trình PCM trong VoIP
    1. Giọng nói (analog)
    2. Lấy mẫu (8 kHz cho narrowband)
    3. Lượng tử hóa (chia mức)
    4. Mã hóa thành bit (A-law/Mu-law)
    5. (Tùy chọn) Nén giảm băng thông
    6. Truyền qua mạng (IP/UDP/RTP)
    7. Giải nén + Giải mã thành sóng analog ở bên nhận.

    📌 Câu hỏi ôn tập


    Điện thoại truyền thống hoạt động ở dải tần nào?
    300 – 4000 Hz
    Attached Files
    Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X