Hệ thống mới mang tên CodeMender được thiết kế để giải quyết bài toán mất cân bằng giữa tốc độ phát triển phần mềm và khả năng kiểm soát bảo mật. Đây là một tác nhân AI tự động (autonomous AI agent) có thể hoạt động độc lập để đảm bảo an toàn cho mã nguồn.
Điểm đặc biệt của CodeMender là khả năng vừa phản ứng nhanh (reactive) – vá lỗi bảo mật mới được phát hiện ngay lập tức, vừa chủ động (proactive) – tự viết lại các đoạn mã cũ nhằm loại bỏ toàn bộ nhóm lỗ hổng tiềm ẩn trước khi chúng bị khai thác.
Nhờ vậy, các lập trình viên và nhóm phát triển có thể tập trung vào việc phát triển tính năng, cải thiện hiệu năng thay vì phải xử lý thủ công từng lỗi bảo mật.
CodeMender được xây dựng dựa trên sức mạnh suy luận nâng cao của mô hình Gemini Deep Think – dòng mô hình AI mới của Google. Nền tảng này cho phép hệ thống tự động phân tích, gỡ lỗi và khắc phục các vấn đề bảo mật phức tạp với độ chính xác cao.
Để đạt được khả năng này, CodeMender được trang bị bộ công cụ phân tích và suy luận về mã trước khi thực hiện bất kỳ thay đổi nào. Sau khi chỉnh sửa, hệ thống còn có bước kiểm định (validation) để đảm bảo rằng bản vá là chính xác và không tạo ra lỗi mới – còn gọi là “regression”.
Dù kết quả ban đầu rất khả quan, Google DeepMind vẫn triển khai CodeMender một cách thận trọng, đặt trọng tâm vào tính ổn định và độ tin cậy.
Hiện tại, mọi bản vá do CodeMender tạo ra đều được con người kiểm tra lại trước khi gửi đến các dự án mã nguồn mở. Nhóm nghiên cứu cũng đang mở rộng quy mô áp dụng dần dần, nhằm đảm bảo chất lượng và thu nhận phản hồi từ cộng đồng phát triển.
Đặc biệt, hệ thống sử dụng kiến trúc đa tác nhân (multi-agent architecture) – mỗi AI agent đảm nhận một nhiệm vụ chuyên biệt trong quá trình phân tích và sửa lỗi, giúp tối ưu hiệu suất và độ chính xác.
Một điểm nổi bật khác là CodeMender được hỗ trợ bởi mô-đun phê bình tự động (AI critique tool) – mô hình ngôn ngữ lớn (LLM) chuyên dùng để so sánh sự khác biệt giữa mã gốc và mã đã chỉnh sửa.
Nhờ đó, tác nhân chính có thể tự xác minh và tự điều chỉnh nếu phát hiện thay đổi gây ra tác dụng phụ không mong muốn.
Trong một thử nghiệm thực tế, CodeMender đã khắc phục thành công lỗi tràn bộ nhớ (heap buffer overflow) được phát hiện qua báo cáo sự cố. Dù bản vá cuối cùng chỉ thay đổi vài dòng mã, nhưng nguyên nhân gốc rễ lại nằm ở lỗi quản lý ngăn xếp (stack management) khi xử lý thẻ XML trong quá trình phân tích cú pháp – một vị trí hoàn toàn khác trong mã nguồn.
Điều này cho thấy khả năng tư duy phân tích sâu và tự tìm nguyên nhân cốt lõi của CodeMender, mở ra tương lai nơi AI có thể hỗ trợ lập trình viên không chỉ vá lỗi mà còn nâng cao toàn bộ chất lượng phần mềm.