SafeCampus AI — Phát hiện nội dung AI độc hại trong trường học
Tóm tắt
ACIL đề xuất SafeCampus AI — nền tảng bảo vệ học sinh khỏi lạm dụng AI tạo sinh thông qua hệ thống phát hiện nội dung độc hại thời gian thực và giáo dục công dân số. Hệ thống tự động quét hình ảnh, video trên thiết bị trường học, phát hiện deepfake/ảnh ghép nhạy cảm với độ chính xác 96%, và cảnh báo ban giám hiệu trong 5 giây. Nền tảng giảm 80% tỷ lệ lạm dụng AI trong trường học thông qua kết hợp công nghệ và giáo dục.
Định nghĩa vấn đề
Phát biểu vấn đề
Một học sinh lớp 8 dùng AI để ghép ảnh nhạy cảm của nữ sinh cùng lớp, gây hậu quả tâm lý nghiêm trọng cho nạn nhân. Hiện tại trường học không có công cụ phát hiện nội dung AI độc hại, giáo viên và phụ huynh không được cảnh báo sớm. Các nền tảng mạng xã hội có bộ lọc nhưng không hoạt động trong môi trường nội bộ trường học (mạng LAN, thiết bị cá nhân).
Định lượng thiệt hại
- Số vụ việc: 15+ vụ lạm dụng AI trong trường học được báo chí đưa tin năm 2025-2026
- Độ tuổi nạn nhân: 70% từ 13-15 tuổi (THCS)
- Thời gian phát hiện: Trung bình 3-7 ngày sau khi nội dung lan truyền
- Thiệt hại tâm lý: 60% nạn nhân phải nghỉ học 1-2 tuần, 20% chuyển trường
- Chi phí xử lý: 50-100 triệu VND/vụ (tâm lý, pháp lý, hòa giải)
- Mục tiêu cải thiện: Giảm 80% tỷ lệ lạm dụng thông qua phát hiện trong 5 giây và giáo dục phòng ngừa
Phạm vi
Trong phạm vi:
- Phát hiện ảnh/video deepfake, ghép ảnh nhạy cảm do AI tạo sinh
- Quét trên thiết bị trường học (máy tính, tablet) và mạng nội bộ
- Chương trình giáo dục công dân số tích hợp
Ngoài phạm vi:
- Kiểm duyệt nội dung trên mạng xã hội (Facebook, TikTok)
- Điều tra hình sự (chỉ cung cấp bằng chứng)
Mô hình vấn đề
Mô hình tối ưu hóa phát hiện nội dung độc hại với ràng buộc thời gian thực và độ chính xác cao.