Static Code Analysis – "Kiểm tra mã nguồn mà không cần chạy chương trình"

dangquangminh

Super Moderator

Brainiac

Join Date: Oct 2005

Posts: 11179
- Share
- Tweet
#1

Static Code Analysis – "Kiểm tra mã nguồn mà không cần chạy chương trình"

1 day ago

DevSecOps (Phần 3): Static Code Analysis – "Kiểm tra mã nguồn mà không cần chạy chương trình"

Bạn có thể phát hiện bug mà không cần chạy ứng dụng hay không?

Câu trả lời là có.

Đó chính là nhiệm vụ của Static Code Analysis – một trong những bước quan trọng nhất trong CI/CD Pipeline và cũng là "tuyến phòng thủ đầu tiên" của DevSecOps.
Static Code Analysis là gì?

Thông thường, khi kiểm thử phần mềm, chúng ta sẽ chạy chương trình, cung cấp dữ liệu đầu vào và kiểm tra kết quả đầu ra. Đây là cách hoạt động của các bài Unit Test, Integration Test hay Functional Test.

Ngược lại, Static Code Analysis không chạy chương trình.

Thay vào đó, các công cụ sẽ đọc trực tiếp source code, phân tích cấu trúc, cú pháp và các quy tắc lập trình để tìm ra lỗi, lỗ hổng bảo mật hoặc những đoạn mã có chất lượng kém ngay từ khi developer vừa commit code.

Chính vì không cần build hay thực thi ứng dụng nên Static Analysis có tốc độ rất nhanh và thường là bước đầu tiên trong CI Pipeline.
Static Analysis kiểm tra những gì?

Các công cụ Static Analysis hiện nay có thể phát hiện rất nhiều vấn đề trước khi phần mềm được biên dịch hoặc triển khai. 1. Phát hiện bug tiềm ẩn

Nhiều lỗi không được Unit Test bao phủ vẫn có thể được phát hiện thông qua việc phân tích mã nguồn.

Ví dụ:
Biến chưa được khởi tạo

Hàm không bao giờ được gọi

Sai cú pháp

Logic dễ gây lỗi

Một số công cụ phổ biến:
Prospector

Pyflakes

2. Đo độ phức tạp của mã nguồn

Một hàm dài hàng trăm dòng thường rất khó đọc, khó bảo trì và dễ phát sinh lỗi.

McCabe sẽ tính toán Cyclomatic Complexity để đánh giá mức độ phức tạp của từng hàm hoặc module.

Độ phức tạp càng cao thì càng nên được refactor thành các thành phần nhỏ hơn.
3. Phát hiện Dead Code

Trong quá trình phát triển, rất nhiều đoạn code cũ không còn được sử dụng nhưng vẫn tồn tại trong repository.

Những đoạn mã này:
làm tăng kích thước dự án

gây khó đọc

tạo thêm bề mặt tấn công nếu chứa lỗ hổng

Vulture là công cụ chuyên dùng để tìm và loại bỏ những đoạn Unused Code này.
4. Kiểm tra lỗ hổng bảo mật

Đây là phần quan trọng nhất đối với DevSecOps.

Các công cụ như Bandit sẽ rà soát source code để phát hiện:
Insecure Coding Practices

Hardcoded Password

Insecure Random Number

Command Injection

SQL Injection tiềm ẩn

Unsafe Deserialization

Các lỗi thường gặp thuộc OWASP Top 10

Việc phát hiện ngay trong giai đoạn CI giúp giảm đáng kể chi phí khắc phục sau này.
5. Phát hiện Credentials bị lộ

Một sai lầm rất phổ biến là đưa trực tiếp vào Git:
Password

API Key

Access Token

SSH Private Key

Một khi đã commit lên repository, việc xóa commit không đồng nghĩa với việc bí mật đã an toàn.

Dodgy giúp phát hiện các credentials bị hard-code trước khi chúng được merge vào branch chính.
6. Kiểm tra kiểu dữ liệu

Python là ngôn ngữ linh hoạt về kiểu dữ liệu nhưng điều đó cũng dễ dẫn đến các lỗi khó phát hiện.

Mypy kiểm tra Type Hint để phát hiện:
truyền sai kiểu tham số

trả về sai kiểu dữ liệu

sử dụng object không đúng cách

Điều này đặc biệt hữu ích đối với các dự án lớn có nhiều lập trình viên cùng tham gia.
7. Chuẩn hóa Coding Style

Một dự án có hàng chục developer sẽ rất khó bảo trì nếu mỗi người viết theo một phong cách khác nhau.

Các công cụ như:
Pylint

pycodestyle

giúp đảm bảo toàn bộ source code tuân thủ cùng một chuẩn, chẳng hạn PEP 8 trong Python Community. Nhờ đó mã nguồn dễ đọc, dễ review và giảm đáng kể các lỗi do thiếu tính nhất quán.
Đừng chạy thủ công, hãy để CI/CD làm việc đó

Mặc dù các công cụ Static Analysis có thể được chạy trực tiếp trên máy của developer, nhưng cách làm hiệu quả nhất là tích hợp chúng vào CI/CD Pipeline.

Mỗi lần có commit mới:
Pipeline tự động chạy Static Analysis.

Nếu phát hiện lỗi hoặc vi phạm chính sách, pipeline sẽ dừng ngay.

Developer nhận phản hồi chỉ sau vài chục giây và sửa lỗi trước khi mã nguồn được merge.

Đây là một trong những nguyên tắc cốt lõi của DevSecOps:
Shift Left Security – đưa các hoạt động kiểm thử và bảo mật về sớm nhất có thể trong vòng đời phát triển phần mềm.

CI/CD Pipeline được cấu tạo như thế nào?

Để tự động hóa toàn bộ quá trình Build – Test – Deploy, mọi hệ thống CI/CD hiện đại đều dựa trên ba thành phần cốt lõi:
Pipeline

Stage

Job

Job

Job là đơn vị nhỏ nhất trong CI/CD.

Một Job có thể thực hiện một công việc cụ thể như:
Build source code

Tạo Docker Image

Chạy Unit Test

Thực hiện Static Code Analysis

Deploy ứng dụng

Mỗi Job chỉ có hai trạng thái:
Success

Failed

Stage

Nhiều Job có cùng mục tiêu sẽ được nhóm thành một Stage.

Ví dụ:

Build Stage
Compile source code

Build Docker Image

Kiểm tra dependency

Test Stage
Unit Test

Static Analysis

Security Scan

Code Coverage

Các Job trong cùng một Stage thường chạy song song (parallel) để rút ngắn thời gian xử lý.

Nếu chỉ một Job thất bại, toàn bộ Stage sẽ được đánh dấu là Failed và Pipeline dừng ngay lập tức.
Pipeline

Pipeline là thành phần cao nhất, điều phối toàn bộ quá trình Build → Test → Deploy.

Pipeline thường được khai báo bằng các tệp cấu hình như:
.gitlab-ci.yml

GitHub Actions Workflow

Azure Pipelines YAML

Jenkinsfile (Groovy DSL)

Mỗi khi developer push code lên repository, Pipeline sẽ tự động kích hoạt và thực hiện lần lượt các Stage đã được định nghĩa.

Một quy trình CI/CD điển hình đối với ứng dụng container hóa sẽ gồm:
Tạo Docker Image từ source code.

Chạy các bài kiểm thử trên image vừa tạo.

Đẩy image lên Container Registry.

Triển khai image mới lên máy chủ hoặc môi trường Staging/Production.

Static Code Analysis không thay thế Unit Test hay Integration Test, nhưng nó giúp phát hiện rất nhiều lỗi ngay từ khi mã nguồn còn "nằm trên giấy". Kết hợp Static Analysis với Automated Testing trong CI/CD chính là nền tảng để xây dựng các hệ thống DevSecOps hiện đại: phát hiện lỗi sớm, giảm rủi ro và tăng tốc phát hành phần mềm mà vẫn đảm bảo chất lượng.

Attached Files

Đặng Quang Minh, CCIE#11897 (Enterprise Infrastructure, Wireless, Automation, AI), CCSI#31417

Email : dangquangminh@vnpro.org
https://www.facebook.com/groups/vietprofessional/
Tags: None

Previous template Next