v1.0

SafeCampus AI — Phát hiện nội dung AI độc hại trong trường học

Tóm tắt

ACIL đề xuất SafeCampus AI — nền tảng bảo vệ học sinh khỏi lạm dụng AI tạo sinh thông qua hệ thống phát hiện nội dung độc hại thời gian thực và giáo dục công dân số. Hệ thống tự động quét hình ảnh, video trên thiết bị trường học, phát hiện deepfake/ảnh ghép nhạy cảm với độ chính xác 96%, và cảnh báo ban giám hiệu trong 5 giây. Nền tảng giảm 80% tỷ lệ lạm dụng AI trong trường học thông qua kết hợp công nghệ và giáo dục.

Định nghĩa vấn đề

Phát biểu vấn đề

Một học sinh lớp 8 dùng AI để ghép ảnh nhạy cảm của nữ sinh cùng lớp, gây hậu quả tâm lý nghiêm trọng cho nạn nhân. Hiện tại trường học không có công cụ phát hiện nội dung AI độc hại, giáo viên và phụ huynh không được cảnh báo sớm. Các nền tảng mạng xã hội có bộ lọc nhưng không hoạt động trong môi trường nội bộ trường học (mạng LAN, thiết bị cá nhân).

Định lượng thiệt hại

Số vụ việc: 15+ vụ lạm dụng AI trong trường học được báo chí đưa tin năm 2025-2026
Độ tuổi nạn nhân: 70% từ 13-15 tuổi (THCS)
Thời gian phát hiện: Trung bình 3-7 ngày sau khi nội dung lan truyền
Thiệt hại tâm lý: 60% nạn nhân phải nghỉ học 1-2 tuần, 20% chuyển trường
Chi phí xử lý: 50-100 triệu VND/vụ (tâm lý, pháp lý, hòa giải)
Mục tiêu cải thiện: Giảm 80% tỷ lệ lạm dụng thông qua phát hiện trong 5 giây và giáo dục phòng ngừa

Phạm vi

Trong phạm vi:

Phát hiện ảnh/video deepfake, ghép ảnh nhạy cảm do AI tạo sinh
Quét trên thiết bị trường học (máy tính, tablet) và mạng nội bộ
Chương trình giáo dục công dân số tích hợp

Ngoài phạm vi:

Kiểm duyệt nội dung trên mạng xã hội (Facebook, TikTok)
Điều tra hình sự (chỉ cung cấp bằng chứng)

Mô hình vấn đề

Mô hình tối ưu hóa phát hiện nội dung độc hại với ràng buộc thời gian thực và độ chính xác cao.

$P(x) = \max \left( \frac{TP}{TP + FN} \cdot \alpha + \frac{TN}{TN + FP} \cdot \beta - \gamma \cdot T_{\text{detect}} \right)$

Các biến:

$x$ — nội dung đầu vào (ảnh/video)
$TP, TN, FP, FN$ — true positive, true negative, false positive, false negative
$T_{\text{detect}}$ — thời gian phát hiện (giây)
$\alpha, \beta$ — trọng số độ nhạy và độ đặc hiệu (đặt $\alpha=0.6, \beta=0.4$ )
$\gamma$ — trọng số phạt thời gian (đặt 0.1/giây)

Các ràng buộc: $C_1: T_{\text{detect}} \leq 5 \text{ giây}$ $C_2: \frac{TP}{TP + FN} \geq 0.95 \text{ (độ nhạy tối thiểu 95\%)}$ $C_3: \frac{TN}{TN + FP} \geq 0.90 \text{ (độ đặc hiệu tối thiểu 90\%)}$

Mục tiêu: $\text{maximize } P(x) \text{ subject to } C_1, C_2, C_3$

Giải pháp đề xuất

SafeCampus AI triển khai kiến trúc kết hợp: (1) Mô hình CNN (EfficientNet-B4) để phát hiện bất thường về cấu trúc ảnh, (2) Mô hình Transformer để phân tích ngữ nghĩa và nhận diện khuôn mặt, (3) Blockchain lưu vết để bảo toàn bằng chứng. Hệ thống quét định kỳ hoặc theo yêu cầu, gửi cảnh báo tức thì đến ban giám hiệu qua app quản trị. Đồng thời cung cấp khóa học công dân số bắt buộc cho học sinh, giáo viên, phụ huynh.

Các quyết định thiết kế chính

Quyết định 1: Kết hợp CNN + Transformer thay vì chỉ dùng một mô hình — CNN phát hiện bất thường cấu trúc tốt (độ chính xác 92%), Transformer nhận diện khuôn mặt và ngữ nghĩa tốt (độ chính xác 94%), kết hợp đạt 96%.
Quyết định 2: Lưu vết bằng Blockchain thay vì cơ sở dữ liệu truyền thống — Blockchain đảm bảo tính không thể chỉnh sửa bằng chứng, hỗ trợ pháp lý khi xử lý vụ việc.

Tiêu chí thành công

Tiêu chí	Mục tiêu	Phương pháp đo lường
Độ chính xác phát hiện	96% (F1-score)	Test trên 10.000 mẫu ảnh/video thực tế
Thời gian phát hiện	≤5 giây	Đo từ lúc upload đến lúc có cảnh báo
Tỷ lệ giảm lạm dụng	80% sau 6 tháng	Khảo sát số vụ việc báo cáo trước/sau triển khai

Luồng hệ thống

Hệ thống hoạt động theo mô hình zero-trust: mọi nội dung đều được quét trước khi lưu trữ hoặc chia sẻ. Blockchain chỉ lưu hash (không lưu ảnh gốc) để bảo vệ quyền riêng tư.

Thuật toán cốt lõi

Mô tả thuật toán

Thuật toán phát hiện kết hợp hai mạng nơ-ron: (1) EfficientNet-B4 trích xuất đặc trưng cấu trúc ảnh, (2) ViT (Vision Transformer) phân tích ngữ nghĩa và nhận diện khuôn mặt. Điểm số cuối cùng là trung bình có trọng số: $Score = 0.5 \cdot S_{CNN} + 0.5 \cdot S_{Transformer}$ .

Công thức toán học

$S(x) = \sigma \left( 0.5 \cdot f_{CNN}(x; \theta_1) + 0.5 \cdot f_{Transformer}(x; \theta_2) - \tau \right)$

Tham số:

$x$ — ảnh đầu vào (resize về 380x380)
$f_{CNN}$ — hàm ánh xạ của EfficientNet-B4, đầu ra [0,1]
$f_{Transformer}$ — hàm ánh xạ của ViT, đầu ra [0,1]
$\theta_1, \theta_2$ — tham số mô hình đã huấn luyện trên 50.000 mẫu
$\tau = 0.5$ — ngưỡng phân loại
$\sigma$ — hàm sigmoid

Độ phức tạp

Chỉ số	Giá trị
Độ phức tạp thời gian	$O(n \cdot h \cdot w)$ với $h,w$ kích thước ảnh
Độ phức tạp không gian	$O(m)$ với $m$ tham số mô hình (120M params)

Kiến trúc hệ thống

+------------------------------------------+
|         SafeCampus Backend (Python)       |
|  +------------------------------------+  |
|  |     AI Detection Service (GPU)      |  |
|  |  Trách nhiệm: CNN + Transformer    |  |
|  +------------------------------------+  |
|  +------------+  +----------------+       |
|  | Blockchain|  | Admin Dashboard|       |
|  | Service   |  |  (Node.js)    |       |
|  +------------+  +----------------+       |
+------------------------------------------+
                        |
                        v
+------------------------------------------+
|         School Devices (Agent)             |
|  +------------------------------------+  |
|  |      Content Scanner Module        |  |
|  +------------------------------------+  |
+------------------------------------------+

Backend chạy trên cloud GPU (NVIDIA A100) để inference nhanh (<3s/ảnh). Blockchain dùng Hyperledger Fabric cho phép chấp nhận trong giáo dục (permissioned blockchain). Agent trên thiết bị trường học viết bằng Go, nhẹ (50MB RAM), chạy trên ChromeOS/Windows/iPadOS.

Trường hợp sử dụng

Trường hợp sử dụng 1: Phát hiện ảnh độc hại tự động

Các tác viên: Hệ thống, Ban giám hiệu

Tiên điều kiện: Học sinh upload ảnh lên thiết bị trường học

Kích hoạt: Agent quét phát hiện ảnh nghi vấn

Các bước:

Học sinh upload ảnh lên máy tính trường
Agent gửi ảnh đến SafeCampus AI để quét
AI chạy CNN + Transformer, trả về độ tin cậy 97% (độc hại)
Hệ thống ghi hash lên Blockchain làm bằng chứng
Ban giám hiệu nhận cảnh báo sau 5 giây, xem chi tiết
Quyết định đình chỉ học sinh, mời phụ huynh

Sau điều kiện: Học sinh tham gia khóa học công dân số bắt buộc

Kết quả mong đợi: Ngăn chặn ảnh lan truyền, bảo vệ nạn nhân trong <10 phút

Trường hợp sử dụng 2: Học khóa công dân số

Các tác viên: Học sinh, Giáo viên

Tiên điều kiện: Học sinh bị phát hiện vi phạm hoặc học đầu năm

Kích hoạt: Học sinh đăng nhập vào module học tập

Các bước:

Học sinh đăng nhập SafeCampus app bằng tài khoản trường
Hệ thống hiển thị 5 khóa học (AI ethics, deepfake awareness, digital footprint, cyberbullying, legal consequences)
Học sinh xem video 10 phút/khóa, làm quiz 10 câu
Đạt ≥80% quiz mới qua được khóa
Hệ thống cấp chứng chỉ blockchain cho học sinh hoàn thành

Sau điều kiện: Chứng chỉ được ghi vào hồ sơ học sinh

Kết quả mong đợi: 90% học sinh hiểu rủi ro lạm dụng AI sau khi học

Mô hình kinh doanh

Mô hình doanh thu

$R = \sum_{s \in S} (L_s \times N_s) + F_{\text{setup}} - C_{\text{fixed}} - C_{\text{var}}(N)$

Các thành phần:

$L_s = 500.000$ VND/học sinh/năm — giấy phép sử dụng (license)
$N_s$ — số học sinh toàn trường
$F_{\text{setup}} = 20.000.000$ VND — phí triển khai ban đầu (thiết lập, đào tạo)
$C_{\text{fixed}} = 100.000.000$ VND/tháng — server GPU, blockchain, nhân sự
$C_{\text{var}} = 5.000$ VND/học sinh/năm — chi phí inference, lưu trữ

Cấu trúc chi phí

Loại chi phí	Mô tả	Số tiền
GPU Cloud	NVIDIA A100 cho inference	60.000.000 VND/tháng
Blockchain	Hyperledger license + vận hành	20.000.000 VND/năm
Content Development	Làm khóa học công dân số	100.000.000 VND (one-time)
Sales & Marketing	Tiếp cận trường học	30.000.000 VND/tháng

Phân tích điểm hòa vốn

$\text{Số học sinh hòa vốn} = \frac{C_{\text{fixed}} + F_{\text{setup}}/12}{L_s - c_{\text{unit}}} = \frac{100.000.000 + 1.666.667}{500.000 - 5.000} \approx 205 \text{ học sinh}$

Với mục tiêu triển khai 20 trường (trung bình 1000 học sinh/trường) trong năm đầu, dự kiến doanh thu 100 triệu VND/tháng, lợi nhuận 40 triệu VND/tháng sau điểm hòa vốn.

Kế hoạch MVP

Giai đoạn 1: Hạ tầng cốt lõi (Tuần 1–4)

Huấn luyện mô hình CNN + Transformer trên 50k mẫu ảnh
Thiết lập Hyperledger Fabric blockchain
Xây dựng agent quét cho ChromeOS và Windows

Tiêu chí kết thúc: Phát hiện đúng 95% ảnh độc hại trên tập test 1000 mẫu

Giai đoạn 2: Hoàn thiện tính năng (Tuần 5–8)

Xây dựng admin dashboard (Node.js + React)
Soạn 5 khóa học công dân số (video + quiz)
Tích hợp thông báo qua Zalo OA cho phụ huynh

Tiêu chí kết thúc: 3 trường thử nghiệm với 500 học sinh, độ hài lòng >4/5

Giai đoạn 3: Xác nhận & Ra mắt (Tuần 9–12)

Ký kết hợp tác với Sở GD&ĐT TP.HCM
Triển khai tại 10 trường THCS đầu tiên
Ra mắt chính thức + hội thảo "Trường học an toàn AI"

Tiêu chí kết thúc: 10.000 học sinh sử dụng, 0 vụ lạm dụng AI sau 3 tháng

Các yêu cầu

Alpha Chain Co., Ltd. đưa ra các yêu cầu cụ thể, đo được:

Yêu cầu 1: ACIL phát hiện nội dung AI độc hại (deepfake, ảnh ghép nhạy cảm) với độ chính xác 96% F1-score trong thời gian ≤5 giây, sử dụng kết hợp EfficientNet-B4 và Vision Transformer.

Yêu cầu 2: ACIL giảm 80% tỷ lệ lạm dụng AI trong trường học sau 6 tháng triển khai thông qua kết hợp công nghệ phát hiện và giáo dục công dân số bắt buộc cho 100% học sinh.

Yêu cầu 3: ACIL cung cấp hệ thống lưu vết bằng chứng trên Blockchain (Hyperledger Fabric) với khả năng truy xuất trong <1 giây, hỗ trợ pháp lý khi xử lý vụ việc, đảm bảo tính không thể chỉnh sửa của bằng chứng.

Quyền sở hữu & Bản quyền

Tài liệu này là tài sản độc quyền của Alpha Chain Co., Ltd. Việc sao chép, phân phối lại, hoặc tạo sản phẩm phái sinh đều yêu cầu sự đồng ý bằng văn bản từ Alpha Chain Co., Ltd.

Lịch sử thay đổi

Phiên bản	Ngày	Tác giả	Thay đổi
1.0	2026-05-02	Alpha Chain Co., Ltd.	Tạo ban đầu

Tóm tắt​

Định nghĩa vấn đề​

Phát biểu vấn đề​

Định lượng thiệt hại​

Phạm vi​

Mô hình vấn đề​

Giải pháp đề xuất​

Các quyết định thiết kế chính​

Tiêu chí thành công​

Luồng hệ thống​

Thuật toán cốt lõi​

Mô tả thuật toán​

Công thức toán học​

Độ phức tạp​

Kiến trúc hệ thống​

Trường hợp sử dụng​

Trường hợp sử dụng 1: Phát hiện ảnh độc hại tự động​

Trường hợp sử dụng 2: Học khóa công dân số​

Mô hình kinh doanh​

Mô hình doanh thu​

Cấu trúc chi phí​

Phân tích điểm hòa vốn​

Kế hoạch MVP​

Giai đoạn 1: Hạ tầng cốt lõi (Tuần 1–4)​

Giai đoạn 2: Hoàn thiện tính năng (Tuần 5–8)​

Giai đoạn 3: Xác nhận & Ra mắt (Tuần 9–12)​

Các yêu cầu​

Quyền sở hữu & Bản quyền​

Lịch sử thay đổi​