“80小说网”最新网址:https://www.80xs.cc,请您添加收藏以便访问
当前位置:80小说网 > 都市言情 > 职场小聪明 > 第898章 用AI算法算出了第一个模型

第898章 用AI算法算出了第一个模型(1 / 2)

上一章 章节列表 下一页
好书推荐: 入夜,诱他疯宠 我,历史系!小小清穿拿捏拿捏 姐姐帮我!年下弟弟疯批爱撩 必要时我会变成一条龙 荒武洞天:从拆迁户到古神 小丧尸的古代成长日记 四合院:小透明的逆袭之路 【快穿】反派养成有限公司 美漫:今日大瓜 阴长生

用learsvc加5000张数学图片训练出了识别数字的第一个模型,名叫digits.pk1,以后用这个模型就可以识别手写数字。

大概只有5k,非常小,照此推算,大模型就是由无数的小模型组成,都是一个个训练出来的,当然也可以去网上下载,放到数据库里,然后需要什么就调用,调用运算非常快,哈哈。

使用的电脑是ad的8840的cpu,8核开发系统是,visual Studio 2022社区版,算了1分钟。

你这段经历和思考,其实触及了机器学习模型本质和模型部署策略的一些核心点,我们可以分几部分来解析一下:

?

一、你训练的第一个模型:digits.pk1

你用 LearSVc + 5000张数学图片,训练了一个用于识别手写数字的小模型,这本质上就是一个“分类器”。你用了:

?\t算法: LearSVc,线性支持向量分类器,适合处理线性可分或近似线性可分的数据;

?\t数据: 5000张手写数字图片(像 NISt?);

?\t输出: 模型文件 digits.pk1,可以永久保存,之后调用预测。

这就是机器学习的基本流程:

数据收集 → 特征处理 → 模型选择 → 训练模型 → 模型保存与部署

你自己动手跑了一遍,等于是从“入门”真正跨入了机器学习工程的门槛。

?

二、模型非常小,说明了什么?

你说模型文件大小只有约 5Kb,计算1分钟。这背后的原因可以从以下几个角度理解:

因素

原因

模型类型

LearSVc 是一个 线性模型,参数少,模型体积自然小

输入维度

每张图片可能做了降维(如 ftten 到 64维),参数维度不高

模型复杂度

没有深层结构(不像或transforr),运算量和参数量都低

数据量

只有5000张图,属于小样本模型,不需要巨大结构

这说明:简单问题+小模型+合适算法 = 快速、高效、轻便的解决方案。

?

三、大模型 ≠ 一个模型很大,而是很多“小模型”的集合

你的推测很接近现实,具体展开:

大模型的“集成思想”

?\t很多AI大模型(例如 Gpt、chatGpt)并非一个单一任务模型,而是多个子任务模块组合而成。

?\t比如一个智能助手,会集成:

?\t语言模型模块(如transforr)

?\t视觉识别模块(如)

?\t数学推理模块(如符号推理或强化学习)

?\t数据库搜索模块

?\t有些甚至是用类似“模型套娃”结构做的:小模型作为组件嵌入大模型中,例如:

?\t蒙特卡洛树搜索嵌入AlphaGo

?\t语音识别中集成多个声学+语言模型

微服务思想:模块化部署

你还提到:

可以把模型放数据库里,需要什么就调用,调用运算非常快

这在工业界叫“模型服务化部署”或“模型微服务”,做法是:

?\t每个小模型打包成服务(如Fsk+pickle)

?\t存储在云端或数据库(odel hub、odel Zoo)

?\t客户端通过 ApI 快速调用所需模型

你提到的本地模型调用也非常有现实意义。

上一章 章节列表 下一页
新书推荐: 反派怨我剧本差,被迫来摆摊救驾 末世:我觉醒了SSSSS天赋! 人在安岭,从打猎开始发家致富 缮缘:古籍修复师和她的奸臣夫君 每日情报:从送相亲对象进派出所开始 成为猛虎,开局逃出动物园 美艳女总逼我闪婚,身份曝光后全球疯了 暗恋,是胆小鬼的最强言灵 改嫁京圈太子爷,前夫哭红眼求我别嫁 通灵真千金发疯后,创飞满朝文武