Skip to main content
v1.0

SafeCampus AI — Phát hiện nội dung AI độc hại trong trường học

Tóm tắt

ACIL đề xuất SafeCampus AI — nền tảng bảo vệ học sinh khỏi lạm dụng AI tạo sinh thông qua hệ thống phát hiện nội dung độc hại thời gian thực và giáo dục công dân số. Hệ thống tự động quét hình ảnh, video trên thiết bị trường học, phát hiện deepfake/ảnh ghép nhạy cảm với độ chính xác 96%, và cảnh báo ban giám hiệu trong 5 giây. Nền tảng giảm 80% tỷ lệ lạm dụng AI trong trường học thông qua kết hợp công nghệ và giáo dục.


Định nghĩa vấn đề

Phát biểu vấn đề

Một học sinh lớp 8 dùng AI để ghép ảnh nhạy cảm của nữ sinh cùng lớp, gây hậu quả tâm lý nghiêm trọng cho nạn nhân. Hiện tại trường học không có công cụ phát hiện nội dung AI độc hại, giáo viên và phụ huynh không được cảnh báo sớm. Các nền tảng mạng xã hội có bộ lọc nhưng không hoạt động trong môi trường nội bộ trường học (mạng LAN, thiết bị cá nhân).

Định lượng thiệt hại

  • Số vụ việc: 15+ vụ lạm dụng AI trong trường học được báo chí đưa tin năm 2025-2026
  • Độ tuổi nạn nhân: 70% từ 13-15 tuổi (THCS)
  • Thời gian phát hiện: Trung bình 3-7 ngày sau khi nội dung lan truyền
  • Thiệt hại tâm lý: 60% nạn nhân phải nghỉ học 1-2 tuần, 20% chuyển trường
  • Chi phí xử lý: 50-100 triệu VND/vụ (tâm lý, pháp lý, hòa giải)
  • Mục tiêu cải thiện: Giảm 80% tỷ lệ lạm dụng thông qua phát hiện trong 5 giây và giáo dục phòng ngừa

Phạm vi

Trong phạm vi:

  • Phát hiện ảnh/video deepfake, ghép ảnh nhạy cảm do AI tạo sinh
  • Quét trên thiết bị trường học (máy tính, tablet) và mạng nội bộ
  • Chương trình giáo dục công dân số tích hợp

Ngoài phạm vi:

  • Kiểm duyệt nội dung trên mạng xã hội (Facebook, TikTok)
  • Điều tra hình sự (chỉ cung cấp bằng chứng)

Mô hình vấn đề

Mô hình tối ưu hóa phát hiện nội dung độc hại với ràng buộc thời gian thực và độ chính xác cao.

P(x)=max(TPTP+FNα+TNTN+FPβγTdetect)P(x) = \max \left( \frac{TP}{TP + FN} \cdot \alpha + \frac{TN}{TN + FP} \cdot \beta - \gamma \cdot T_{\text{detect}} \right)

Các biến:

  • xx — nội dung đầu vào (ảnh/video)
  • TP,TN,FP,FNTP, TN, FP, FN — true positive, true negative, false positive, false negative
  • TdetectT_{\text{detect}} — thời gian phát hiện (giây)
  • α,β\alpha, \beta — trọng số độ nhạy và độ đặc hiệu (đặt α=0.6,β=0.4\alpha=0.6, \beta=0.4)
  • γ\gamma — trọng số phạt thời gian (đặt 0.1/giây)

Các ràng buộc: C1:Tdetect5 giaˆyC_1: T_{\text{detect}} \leq 5 \text{ giây} C2:TPTP+FN0.95 (độ nhạy toˆˊi thiểu 95%)C_2: \frac{TP}{TP + FN} \geq 0.95 \text{ (độ nhạy tối thiểu 95\%)} C3:TNTN+FP0.90 (độ đặc hiệu toˆˊi thiểu 90%)C_3: \frac{TN}{TN + FP} \geq 0.90 \text{ (độ đặc hiệu tối thiểu 90\%)}

Mục tiêu: maximize P(x) subject to C1,C2,C3\text{maximize } P(x) \text{ subject to } C_1, C_2, C_3


Giải pháp đề xuất

SafeCampus AI triển khai kiến trúc kết hợp: (1) Mô hình CNN (EfficientNet-B4) để phát hiện bất thường về cấu trúc ảnh, (2) Mô hình Transformer để phân tích ngữ nghĩa và nhận diện khuôn mặt, (3) Blockchain lưu vết để bảo toàn bằng chứng. Hệ thống quét định kỳ hoặc theo yêu cầu, gửi cảnh báo tức thì đến ban giám hiệu qua app quản trị. Đồng thời cung cấp khóa học công dân số bắt buộc cho học sinh, giáo viên, phụ huynh.

Các quyết định thiết kế chính

  • Quyết định 1: Kết hợp CNN + Transformer thay vì chỉ dùng một mô hình — CNN phát hiện bất thường cấu trúc tốt (độ chính xác 92%), Transformer nhận diện khuôn mặt và ngữ nghĩa tốt (độ chính xác 94%), kết hợp đạt 96%.
  • Quyết định 2: Lưu vết bằng Blockchain thay vì cơ sở dữ liệu truyền thống — Blockchain đảm bảo tính không thể chỉnh sửa bằng chứng, hỗ trợ pháp lý khi xử lý vụ việc.

Tiêu chí thành công

Tiêu chíMục tiêuPhương pháp đo lường
Độ chính xác phát hiện96% (F1-score)Test trên 10.000 mẫu ảnh/video thực tế
Thời gian phát hiện≤5 giâyĐo từ lúc upload đến lúc có cảnh báo
Tỷ lệ giảm lạm dụng80% sau 6 thángKhảo sát số vụ việc báo cáo trước/sau triển khai

Luồng hệ thống

Hệ thống hoạt động theo mô hình zero-trust: mọi nội dung đều được quét trước khi lưu trữ hoặc chia sẻ. Blockchain chỉ lưu hash (không lưu ảnh gốc) để bảo vệ quyền riêng tư.


Thuật toán cốt lõi

Mô tả thuật toán

Thuật toán phát hiện kết hợp hai mạng nơ-ron: (1) EfficientNet-B4 trích xuất đặc trưng cấu trúc ảnh, (2) ViT (Vision Transformer) phân tích ngữ nghĩa và nhận diện khuôn mặt. Điểm số cuối cùng là trung bình có trọng số: Score=0.5SCNN+0.5STransformerScore = 0.5 \cdot S_{CNN} + 0.5 \cdot S_{Transformer}.

Công thức toán học

S(x)=σ(0.5fCNN(x;θ1)+0.5fTransformer(x;θ2)τ)S(x) = \sigma \left( 0.5 \cdot f_{CNN}(x; \theta_1) + 0.5 \cdot f_{Transformer}(x; \theta_2) - \tau \right)

Tham số:

  • xx — ảnh đầu vào (resize về 380x380)
  • fCNNf_{CNN} — hàm ánh xạ của EfficientNet-B4, đầu ra [0,1]
  • fTransformerf_{Transformer} — hàm ánh xạ của ViT, đầu ra [0,1]
  • θ1,θ2\theta_1, \theta_2 — tham số mô hình đã huấn luyện trên 50.000 mẫu
  • τ=0.5\tau = 0.5 — ngưỡng phân loại
  • σ\sigma — hàm sigmoid

Độ phức tạp

Chỉ sốGiá trị
Độ phức tạp thời gianO(nhw)O(n \cdot h \cdot w) với h,wh,w kích thước ảnh
Độ phức tạp không gianO(m)O(m) với mm tham số mô hình (120M params)

Kiến trúc hệ thống

+------------------------------------------+
| SafeCampus Backend (Python) |
| +------------------------------------+ |
| | AI Detection Service (GPU) | |
| | Trách nhiệm: CNN + Transformer | |
| +------------------------------------+ |
| +------------+ +----------------+ |
| | Blockchain| | Admin Dashboard| |
| | Service | | (Node.js) | |
| +------------+ +----------------+ |
+------------------------------------------+
|
v
+------------------------------------------+
| School Devices (Agent) |
| +------------------------------------+ |
| | Content Scanner Module | |
| +------------------------------------+ |
+------------------------------------------+

Backend chạy trên cloud GPU (NVIDIA A100) để inference nhanh (<3s/ảnh). Blockchain dùng Hyperledger Fabric cho phép chấp nhận trong giáo dục (permissioned blockchain). Agent trên thiết bị trường học viết bằng Go, nhẹ (50MB RAM), chạy trên ChromeOS/Windows/iPadOS.


Trường hợp sử dụng

Trường hợp sử dụng 1: Phát hiện ảnh độc hại tự động

Các tác viên: Hệ thống, Ban giám hiệu

Tiên điều kiện: Học sinh upload ảnh lên thiết bị trường học

Kích hoạt: Agent quét phát hiện ảnh nghi vấn

Các bước:

  1. Học sinh upload ảnh lên máy tính trường
  2. Agent gửi ảnh đến SafeCampus AI để quét
  3. AI chạy CNN + Transformer, trả về độ tin cậy 97% (độc hại)
  4. Hệ thống ghi hash lên Blockchain làm bằng chứng
  5. Ban giám hiệu nhận cảnh báo sau 5 giây, xem chi tiết
  6. Quyết định đình chỉ học sinh, mời phụ huynh

Sau điều kiện: Học sinh tham gia khóa học công dân số bắt buộc

Kết quả mong đợi: Ngăn chặn ảnh lan truyền, bảo vệ nạn nhân trong <10 phút

Trường hợp sử dụng 2: Học khóa công dân số

Các tác viên: Học sinh, Giáo viên

Tiên điều kiện: Học sinh bị phát hiện vi phạm hoặc học đầu năm

Kích hoạt: Học sinh đăng nhập vào module học tập

Các bước:

  1. Học sinh đăng nhập SafeCampus app bằng tài khoản trường
  2. Hệ thống hiển thị 5 khóa học (AI ethics, deepfake awareness, digital footprint, cyberbullying, legal consequences)
  3. Học sinh xem video 10 phút/khóa, làm quiz 10 câu
  4. Đạt ≥80% quiz mới qua được khóa
  5. Hệ thống cấp chứng chỉ blockchain cho học sinh hoàn thành

Sau điều kiện: Chứng chỉ được ghi vào hồ sơ học sinh

Kết quả mong đợi: 90% học sinh hiểu rủi ro lạm dụng AI sau khi học


Mô hình kinh doanh

Mô hình doanh thu

R=sS(Ls×Ns)+FsetupCfixedCvar(N)R = \sum_{s \in S} (L_s \times N_s) + F_{\text{setup}} - C_{\text{fixed}} - C_{\text{var}}(N)

Các thành phần:

  • Ls=500.000L_s = 500.000 VND/học sinh/năm — giấy phép sử dụng (license)
  • NsN_s — số học sinh toàn trường
  • Fsetup=20.000.000F_{\text{setup}} = 20.000.000 VND — phí triển khai ban đầu (thiết lập, đào tạo)
  • Cfixed=100.000.000C_{\text{fixed}} = 100.000.000 VND/tháng — server GPU, blockchain, nhân sự
  • Cvar=5.000C_{\text{var}} = 5.000 VND/học sinh/năm — chi phí inference, lưu trữ

Cấu trúc chi phí

Loại chi phíMô tảSố tiền
GPU CloudNVIDIA A100 cho inference60.000.000 VND/tháng
BlockchainHyperledger license + vận hành20.000.000 VND/năm
Content DevelopmentLàm khóa học công dân số100.000.000 VND (one-time)
Sales & MarketingTiếp cận trường học30.000.000 VND/tháng

Phân tích điểm hòa vốn

Soˆˊ học sinh hoˋa voˆˊn=Cfixed+Fsetup/12Lscunit=100.000.000+1.666.667500.0005.000205 học sinh\text{Số học sinh hòa vốn} = \frac{C_{\text{fixed}} + F_{\text{setup}}/12}{L_s - c_{\text{unit}}} = \frac{100.000.000 + 1.666.667}{500.000 - 5.000} \approx 205 \text{ học sinh}

Với mục tiêu triển khai 20 trường (trung bình 1000 học sinh/trường) trong năm đầu, dự kiến doanh thu 100 triệu VND/tháng, lợi nhuận 40 triệu VND/tháng sau điểm hòa vốn.


Kế hoạch MVP

Giai đoạn 1: Hạ tầng cốt lõi (Tuần 1–4)

  • Huấn luyện mô hình CNN + Transformer trên 50k mẫu ảnh
  • Thiết lập Hyperledger Fabric blockchain
  • Xây dựng agent quét cho ChromeOS và Windows

Tiêu chí kết thúc: Phát hiện đúng 95% ảnh độc hại trên tập test 1000 mẫu

Giai đoạn 2: Hoàn thiện tính năng (Tuần 5–8)

  • Xây dựng admin dashboard (Node.js + React)
  • Soạn 5 khóa học công dân số (video + quiz)
  • Tích hợp thông báo qua Zalo OA cho phụ huynh

Tiêu chí kết thúc: 3 trường thử nghiệm với 500 học sinh, độ hài lòng >4/5

Giai đoạn 3: Xác nhận & Ra mắt (Tuần 9–12)

  • Ký kết hợp tác với Sở GD&ĐT TP.HCM
  • Triển khai tại 10 trường THCS đầu tiên
  • Ra mắt chính thức + hội thảo "Trường học an toàn AI"

Tiêu chí kết thúc: 10.000 học sinh sử dụng, 0 vụ lạm dụng AI sau 3 tháng


Các yêu cầu

Alpha Chain Co., Ltd. đưa ra các yêu cầu cụ thể, đo được:

Yêu cầu 1: ACIL phát hiện nội dung AI độc hại (deepfake, ảnh ghép nhạy cảm) với độ chính xác 96% F1-score trong thời gian ≤5 giây, sử dụng kết hợp EfficientNet-B4 và Vision Transformer.

Yêu cầu 2: ACIL giảm 80% tỷ lệ lạm dụng AI trong trường học sau 6 tháng triển khai thông qua kết hợp công nghệ phát hiện và giáo dục công dân số bắt buộc cho 100% học sinh.

Yêu cầu 3: ACIL cung cấp hệ thống lưu vết bằng chứng trên Blockchain (Hyperledger Fabric) với khả năng truy xuất trong <1 giây, hỗ trợ pháp lý khi xử lý vụ việc, đảm bảo tính không thể chỉnh sửa của bằng chứng.


Quyền sở hữu & Bản quyền

© 2026 Alpha Chain Co., Ltd. Tất cả quyền được bảo lưu.

Tài liệu này là tài sản độc quyền của Alpha Chain Co., Ltd. Việc sao chép, phân phối lại, hoặc tạo sản phẩm phái sinh đều yêu cầu sự đồng ý bằng văn bản từ Alpha Chain Co., Ltd.


Lịch sử thay đổi

Phiên bảnNgàyTác giảThay đổi
1.02026-05-02Alpha Chain Co., Ltd.Tạo ban đầu