目 录
1. 概述... 2
2. 测试DeepSeek 15B原生模型... 3
3. 测试微调训练后的大模型... 4
4. 微调模型训练过程及代码... 6
1. 概述
基于DeepSeek-R1-Distill-Qwen-1.5B模型训练自主的领域大模型,例如打造针对钢铁、矿山、有色、稀土、建材、加工制造等领域的大模型。促进大模型技术在具体领域的应用与落地,助力行业向智能制造转型升级。
本文介绍:
(1)基础模型DeepSeek-R1-Distill-Qwen-1.5B与微调训练后的deepseek-1.5b-lora模型使用对比。
(2)微调训练模型的过程及Python代码。
下载代码:https://github.com/wxzz/iNeuOS_LLM。
2. 测试DeepSeek-R1 15B原生模型
2.1 提示词1:iNeuOS是什么?
结论:回答内容与iNeuOS不相关。
提问:iNeuOS是什么?
回答:如下图:
2.2 提示词2:iNeuOS工业互联网操作系统的特点?
结论:回答内容说了一大堆废话,与提问内容不相关,浪费资源。
提问:iNeuOS工业互联网操作系统的特点?
回答:如下图:
2.3 提示词3:iNeuOS工业互联网操作系统的功能介绍?
结论:回答内容说了一大堆英文,与提问内容不相关,浪费资源。
提问:iNeuOS工业互联网操作系统的功能介绍?
回答:如下图:
3. 测试微调训练后的大模型
3.1 提示词1:iNeuOS是什么?
结论:回答的内容与iNeuOS有少许的相关性,但是回答的内容不成体系,可能与由于提问太过笼统、训练模型的数据集都有关系。
提问:iNeuOS是什么?
回答:如下图:
3.2 提示词2:iNeuOS工业互联网操作系统的特点?
结论:相比提示词1,回答的内容与iNeuOS相关的内容更多了,回答的准确度提高了,内容更体系化。
提问:iNeuOS工业互联网操作系统的特点?
回答:如下图:
3.3 提示词3:iNeuOS工业互联网操作系统的功能介绍?
结论:回答的内容大部分与训练模型的数据集相关,内容更有逻辑感。
提问:iNeuOS工业互联网操作系统的功能介绍?
回答:如下图:
3.4 提示词4:写一份物联网的方案,包含数据采集、数据可视化、数据表报等
结论:增加回答难度,回答的内容基本与训练模型的数据集相关,如果提示词更完善,那么回答的内容更准确。
提问:依据iNeuOS工业互联网操作系统相关内容,写一份物联网的方案
回答:如下图:
4. 微调模型训练过程及代码
4.1 代码工程目录
下载代码:https://github.com/wxzz/iNeuOS_LLM。
[table][tr][td=1,1,553]LLM/
├───
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |