大模型技术在工业行业的应用探讨
来源: | 作者:pmod6d781 | 发布时间: 2024-10-09 | 185 次浏览 | 分享到:

一、关于大模型的认知



大模型,相对小模型(如更贴合具体业务场景的数据分析模型)而言,有四个特点:第一,参数规模特别大,动辄千亿、万亿级,榜单还在不断刷新;第二,训练的数据集特别大,可能互联网上质量比较好的一些数据都被爬下来用作训练了;第三,训练或运行对计算资源的需求特别大,目前主流的大模型只是运行起来就需要至少200GB左右的显存,微调和训练的需求更大,这么大的GPU的硬件支持;第四,最厉害的是能力强大,更接近通用人工智能。

大语言模型,天然匹配写代码写文档等需求。许多工业企业也对新技术非常感兴趣,希望在大模型中找到特殊应用场景。

二、什么样的场景适合工业企业着手做第一个基于大模型的项目?

大模型擅长处理大量文本类型的语料,工业领域正好有海量的文本语料知识(如标准、论文、专家报告、操作规范等),可以通过大模型的方式去做整体的归纳整理和学习。有如下几类场景:

第一类,智能问答。例如,在很多条件严苛的工业现场,构建工业领域的智能问答运维系统,可以提高工业领域的知识查询效率,便于及时采取行动。还有,水、电、燃气等工业领域面向大量终端用户的客户服务系统。

第二类,文本处理。例如,将大模型应用于设备缺陷分析、事故过程处理等各类报告的学习中,有了特定格式特定风格的文本基础,再人为输入数据和少量信息,就可以自动生成报告,以减轻人力负担。

第三类,数据分析,大模型对数据的处理更接近人脑的处理方式,不会刻意区分是时序数据还是文本数据,都会从海量数据中提取出有用信息。例如,自动获取设备运行数据,生成设备运行的指标分析,来判断这个设备的健康趋势,并能够根据数据结果匹配既往的最佳处理方案。再如通用图像识别等,用于工业现场的自动化巡检和问题诊断。

在常见的运维领域之外,在研发设计领域,文档体量也不小,也可以考虑利用大模型的技术加速方案快速生成,并结合专家经验和行业知识进行细化迭代。还有更多潜在的场景仍在探索定义当中。


三、如何将大模型技术应用于实际工作中?

首先要确定一个具体的业务场景,找到对应的文本类数据、非结构化类数据等。接着,将这些数据与企业的工单、规程、案例、专家总结报告等进行整合,建立相应的知识逻辑体系,随后确定合适的交互方式,以便更好地发挥大模型的优势。

四、如何选择合适的技术路线构建大模型?

第一步是底层通用模型的选型。首先考虑选择公有云版本还是私有部署版。目前地球上最牛的大模型还是ChatGPT,但只能在公有云上,且中国境内使用受限。即使不管制,工业企业一般也很少会把自己的语料喂给ChatGPT,会有数据泄露的风险。所以第一步是找一个可以做私有化部署的开源大模型。