当前位置:80小说网 > 都市言情 > 职场小聪明 > 第907章 AI怎么抓图

第907章 AI怎么抓图(1 / 2)

上一章 章节列表 下一页
好书推荐: 入夜,诱他疯宠 竞技之王 曦狂:青春纪 我,历史系!小小清穿拿捏拿捏 姐姐帮我!年下弟弟疯批爱撩 必要时我会变成一条龙 荒武洞天:从拆迁户到古神 小丧尸的古代成长日记 四合院:小透明的逆袭之路 【快穿】反派养成有限公司

图片是怎么识别的,把图变成黑白,例如28x28的图,也就是有764个点,黑白是0-255的色素,然后除以255,就会得到一个1到0.0几的数,也就是说是一个28x28的1和0组成的2维矩阵,然后让他变成一维数,就是由0和1组成的764个数,然后开始抓图,例如隔一秒,就可以比对这两个数的不同,然后还原点阵,就可以拿到坐标,这样就可以把变化的方块抓出来,当然根据方块坐标抓出来的是原图的彩色小图,就会抓很多,然后有关这个人的放一起,无关的放一起,然后用随机森林算法,就可以计算出一个模型,就可以认出跟你有关的视频里的人,然后截图。还有个用途,就是把运动的物体用框框起来,这就是跟踪。

你的描述基本已经把图像识别的核心流程说出来了,只是里面有些地方可以更精确地表述,这样你就能更系统地理解**“从原图 → 数字特征 → 比对识别 → 跟踪”**的全过程。

我给你按步骤梳理一下:

?

1. 图像数字化与预处理

?\t输入:一张彩色图片(RGb,每个像素 3 个通道,0~255)。

?\t转灰度:将彩色转成灰度值,公式通常是:

Gray = 0.299R + 0.587G + 0.114b

得到一个只有一个通道的矩阵,每个值在 0~255。

?\t归一化:除以 255,让数据变成 0~1 范围,更适合机器学习算法计算。

?\t尺寸调整:比如你说的 28x28,就是把原图缩放成 784(28x28)个像素点。

?\t展平:把二维矩阵拉成一维向量(784 个数)。

这一步是为了让后续算法能直接处理。

?

2. 运动检测(抓变化)

?\t核心思想:对比相邻两帧的像素矩阵。

?\t把当前帧矩阵 _t 和上一帧矩阵 _{t-1} 做差:

d = |_t - _{t-1}|

?\t如果某个像素差值大于阈值(比如 0.2),说明这里有变化。

?\t变化区域提取:

?\t根据变化点的分布,用轮廓检测或连通区域标记,找到“方块”位置。

?\t用方块坐标裁剪原彩色图 → 得到目标小图。

?

3. 样本分类(人脸或人识别)

?\t你说的随机森林可以做,但在视觉领域更常用(卷积神经网络),因为它能自动提取空间特征。

?\t样本准备:

?\t把抓到的小图分两类:和目标有关 \/ 无关。

?\t提取特征(像素值、hoG特征、深度特征等)。

?\t训练分类器(随机森林、SV、等)。

?\t预测时,把新的方块特征输入模型,输出类别标签。

?

4. 跟踪(trag)

?\t检测是找到目标,跟踪是保持它在视频里的位置。

?\t常用方法:

?\t卡尔曼滤波(Kalan Filter):预测下个位置。

?\tKcF \/ oSSE 跟踪器:基于模板匹配的快速跟踪。

?\tSoRt \/ deepSoRt:结合检测结果和运动轨迹,能同时跟多个目标,并保持 Id 一致。

?\t最终效果:视频里目标被框住,框会跟着它动。

?

5. 结合用途

?\t安防监控:运动检测 + 人脸识别 → 自动标记陌生人。

?\t体育分析:跟踪球员或球的位置。

上一章 章节列表 下一页
新书推荐: 废婿之隐龙觉醒 亲妈重生在七零,带着崽崽杀疯了 哄我婚前试爱?闪婚哥哥死对头他才后悔 重生1985,从卖火锅开始成为世界首富 宦海狂澜 被他吻时心动 乱世帝都 别给我刷黑科技啦 官妻 无敌大百科[快穿]