Online Lab / Image Classification

图像分类在线训练(按流程)

训练推理监督学习视觉模型摄像头采集

原理介绍(教学版)

1. 模型在做什么?

把一张图片当作数字矩阵输入。前面的卷积层会学习边缘、纹理、形状等视觉模式;后面的全连接层把这些模式映射成“属于每个类别的概率”。

2. 为什么要先采集素材?

模型不会“天生认识你的分类”。它只能从你采集的样本中学习。如果每个类别样本差异明显、数量够,模型会更容易学会区分。

3. 训练阶段做了什么?

每轮训练都会:前向计算预测结果 → 与真实标签比较误差(loss)→ 反向传播更新参数。重复多轮后,预测会逐步变准。

4. 推理阶段怎么看结果?

推理不会再更新参数,只输出各类别概率。概率最高的类别就是当前判定结果。实时推理就是把这个过程持续作用在摄像头视频帧上。

完整执行思路(从 0 到 1):
A. 定义分类(你关心的类别)
B. 用摄像头采集每类样本(保证角度、光线、距离有变化)
C. 统一预处理(缩放到 64x64,归一化到 0~1)
D. 本地训练(epochs/batch 决定学习强度和速度)
E. 实时摄像头推理验证效果

给非专业用户的实操建议:
1) 每类先采集 30~80 张,类别间背景尽量区分。
2) 训练后如果经常混淆,优先补“容易误判”的样本,而不是盲目加轮次。
3) 模型是“小而快”的教学模型,不追求工业级精度,重点是理解训练与推理闭环。

步骤 1:输入素材(按类别采集训练样本)

摄像头未开启。
请先添加至少 2 个类别并采集样本。

步骤 2:训练模型(浏览器本地训练)

等待训练...

步骤 3:实时摄像头推理

请先完成训练,然后点击“打开并开始实时推理”。
按住画面采集
镜头信息:未开启
当前已采集:0 张
实时推理
等待开启实时推理...
镜头信息:未开启