Khi trí tuệ nhân tạo (AI) tạo sinh phát triển, khả năng tạo ra hình ảnh và video sống động thường vượt xa khả năng kiểm soát chúng. Khi các hệ thống này vượt ra khỏi lĩnh vực nghệ thuật kỹ thuật số để tiến vào các lĩnh vực có rủi ro cao hơn như y học và lái xe tự động, những lo ngại về "ảo giác" và rò rỉ dữ liệu có bản quyền ngày càng trở nên cấp bách.
Kim Min Gyu, GS về AI tại ĐH Kookmin lập luận rằng, câu trả lời nằm ở một phương pháp toán học chặt chẽ hơn. Trong một bài báo được chọn để trình bày tại International Conference on Learning Representations 2026 (ICLR), một trong ba hội nghị hàng đầu về AI, ông và các cộng sự tại ĐH British Columbia đã giới thiệu một khung lý thuyết gọi là "Luồng hướng dẫn An toàn" (Safety-Guided Flow - SGF).
Phương pháp này nhằm mục đích mang lại sự nhất quán cho một tập hợp các công cụ an toàn rời rạc. Các nhà phát triển thường dựa vào các kỹ thuật "khử nhiễu" để lọc ra các kết quả có hại, nhưng các phương pháp này thường chỉ là các giải pháp tạm thời. Nghiên cứu cho thấy, các kỹ thuật như vậy có thể được hiểu trong một khung toán học duy nhất. Bằng cách mô hình hóa sự an toàn như một "hàm tiềm năng", SGF có thể chặn các kết quả có vấn đề hiệu quả hơn và giảm nguy cơ các mô hình ghi nhớ và sao chép tài liệu có bản quyền.
Nghiên cứu cũng nêu bật một vấn đề quan trọng về thời gian. Dựa trên lý thuyết điều khiển, nhóm nghiên cứu nhận thấy rằng, các biện pháp bảo vệ hiệu quả nhất ở giai đoạn đầu tiên của quá trình tạo hình ảnh, khi hệ thống AI bắt đầu hình thành hình ảnh từ nhiễu. Sau đó, các biện pháp can thiệp có thể được giảm dần khi đầu ra ổn định.
Công trình này được công bố trong bối cảnh các cơ quan quản lý và các nhà lãnh đạo ngành đang tăng cường giám sát các hệ thống AI tạo sinh. Chính phủ các nước như Hoa Kỳ, nhiều nước châu Âu và châu Á đang cân nhắc các quy định để giải quyết rủi ro, từ thông tin sai lệch đến vi phạm sở hữu trí tuệ, trong khi các công ty phải đối mặt với áp lực ngày càng tăng để chứng minh rằng, các mô hình của họ vừa an toàn, vừa minh bạch.
Các nhà nghiên cứu cho biết, khuôn khổ này có thể cung cấp một cách tiếp cận có hệ thống hơn để tạo ra hình ảnh an toàn, cho thấy các phương pháp an toàn hiện có có thể được thống nhất và áp dụng hiệu quả hơn, đặc biệt là bằng cách tập trung các biện pháp bảo vệ vào giai đoạn đầu của quá trình tạo hình ảnh.

4 hours ago
3






