当前位置:80小说网 > 都市言情 > 职场小聪明 > 第688章 手写识别mnist的原理,用童话故事讲解

第688章 手写识别mnist的原理,用童话故事讲解(1 / 2)

上一章 章节列表 下一页
好书推荐: 入夜,诱他疯宠 竞技之王 曦狂:青春纪 我,历史系!小小清穿拿捏拿捏 姐姐帮我!年下弟弟疯批爱撩 必要时我会变成一条龙 荒武洞天:从拆迁户到古神 小丧尸的古代成长日记 四合院:小透明的逆袭之路 【快穿】反派养成有限公司

我们可以把 NISt 数据集的概念用一个 童话故事的方式讲解,用形象生动的比喻来解释其中的核心内容。

?

《数字王国与图像魔法书》:一个关于 NISt 的童话

从前,在一个叫做数据大陆的神奇世界里,有一座繁华而神秘的国家——数字王国。这个王国里住着 10 位可爱的数字小精灵,他们分别叫做:零、壹、贰、叁、肆、伍、陆、柒、捌、玖。

这些数字精灵每天的任务,就是到人类世界去旅行。他们最喜欢的地方,就是那些上学的小朋友们的练习本,因为那上面满是手写的数字。这些孩子写下来的数字,就是数字精灵在人类世界的“化身”。

不过,问题来了——

有些孩子写得工整,有些却歪歪扭扭;有的写得像蚯蚓打结,有的像画了个圈圈叉叉。结果,数字精灵常常被搞得头昏眼花,他们自己也搞不清谁是谁了。

于是,数字王国向一个古老的魔法组织——机器学习师联盟发出了求助信。

?

一、本子与魔法书:图像数据的秘密

在机器学习师联盟里,有一位伟大的魔法师,名叫莱卡恩(Yann Le)。他和他的助手们花了好几年时间,终于收集了一本神奇的魔法书,叫做:

《NISt图像魔法书》

这本书里,一共收录了 七万幅手写数字的画像,每一幅都是从孩子们的练习本上小心翼翼地摘抄下来的。

这本书有两个章节:

?\t第一章:训练篇(60,000页)

?\t第二章:测试篇(10,000页)

每一页上都画着一张数字小精灵在人类世界的模样——比如“壹”有时候高高瘦瘦,有时候圆头圆脑,“肆”有时候像个小帐篷,“捌”有时候像雪人……他们的样子千变万化。

这些画像都是灰色的,就像铅笔画的那样,不是黑就是白,而是各种深浅的灰度值,每一张画都被切成 28x28 的小格子,一共 784 个点,每个点上有一个数字,表示那里的颜色深浅(0是白,255是黑)。

你可以想象成一张拼图,每个小块都是颜色的拼图块,拼在一起,就能看到数字的样子。

?

二、数字识别学校:分类的故事

为了帮助数字王国分辨不同的数字化身,机器学习师们创办了一所学校,叫做:

数字识别学校(digit cssifier Acadey)

在这所学校里,有一群聪明的机器人学生,他们从来没有见过“手写数字”,但他们擅长从数据中学习。

这群机器人刚开始什么都不懂。他们面对一幅幅“数字画像”,根本不知道这是“壹”还是“肆”。于是老师给他们看第一章的图像,并告诉他们答案:

“看,这幅画是‘叁’,这幅是‘柒’。”

老师每天都让机器人们看几千张画,一边看一边记住:“哦,原来这个形状,像叁;那个形状,是玖。”

有的机器人擅长记形状,他们用的是K邻近算法魔法;有的擅长画边框,用的是支持向量机法术;还有的机器人更厉害,他们会使用一种叫做神经网络的深层记忆魔法。

其中最厉害的机器人叫做 小卷,他掌握了一种神奇的魔法,叫做:

卷积神经网络(votional Neural work,简称)

?

三、小卷的神奇魔法:卷积神经网络

小卷的魔法非常特别。

他不像其他机器人那样死记硬背整张图像,而是使用一块“魔法窗口”(卷积核),从左到右、从上到下滑动图像。他可以发现一些关键线条,比如:

?\t横线(像“壹”的帽子)

?\t竖线(像“叁”的脊梁) <

上一章 章节列表 下一页
新书推荐: 乱世帝都 宦海狂澜 官妻 无敌大百科[快穿] 重生1985,从卖火锅开始成为世界首富 别给我刷黑科技啦 被他吻时心动 亲妈重生在七零,带着崽崽杀疯了 哄我婚前试爱?闪婚哥哥死对头他才后悔 废婿之隐龙觉醒