基于大模型技术的工业智能应用开发
来源: | 作者:pmod6d781 | 发布时间: 2024-10-09 | 826 次浏览 | 分享到:

1、当前大模型数字化应用开发的主流技术路线


世界上做大模型的人可以分成两类:一类是研发基础大模型的人,这类中不需要太多,研发出十几个基础模型可能就足够了;大多数人是基于一个基础模型去工业现场开发智能化应用。

大家可能比较关注这么几点:

第一,大模型如何基于私有的知识库去做问答?在工业行业里很典型的需求,可能90%的人都能想到这一点。

第二、大模型能不能基于数据库的实时数据去回答?例如当下我的设备情况如何,这需要结合数据库中最新的数据。

第三、还有更少的人会想到大模型能不能帮我画CAD图纸?或者能不能帮我生成一个3D模型?

以上的场景在理论上都是可以的,只是这些场景已经超越了我们最常见的对话模式,需要更多的智能应用开发工作。

2、这样一个递进的过程,大概分哪几个阶段或者是几种类型?

基于大模型的智能应用开发,有一个循序渐进的技术阶梯。从低到高,从简单的复杂,从不灵活到灵活,大概有这么几个阶段:

第一阶段,提示工程,或者叫指令工程。只对输入进行一些约束或者优化,通过重新组织问题去刺激大模型的神经元,让它产生更好的输出。虽然它还没有走到客制化的阶段,但这是后面几个阶段的基础。

第二阶段,私有知识库。原理上次直播也提到了,有一个外部的知识库,当用户提问的时候,通过向量的相似搜索的算法,能够把和问题最相关的几个语料作为问题的上下文,一起传给大模型。提示模板的动态提示技术类似写程序,先写一个“请根据以下材料作答:{}”,括号({})里的内容需要动态填入,这就是一个模板。私有知识库的内容搜出来以后,就填到括号的位置上。所以你问了一个五个字的问题,背后可能生成了几千字的提示词喂给大模型。

第三阶段,工作流(Chain)。通过把大模型交互和自定义逻辑结合起来,在自定义逻辑中可以访问外部系统,做任何加工,实现更复杂的场景。比如说让大模型结合外部数据库,或者调用信息化系统的API。

第四阶段,微调基础模型。前面的3个招儿都使了,效果还不尽如人意,就再把基础模型调一调,调完之后再叠加前面那3把武器一起用。

第五阶段,重新训练一个完整的大模型,最复杂、投入难度最大,一般情况下不建议。

作为工业企业去启动大模型或者基于大模型的智能应用开发,我们建议从第一阶段开始,逐步递进。

3、从第一阶段来看,如何更好地向大模型提问,有什么建议?

提示工程更多的是一些经验的积累。大模型出现了这么长时间,关注我们的受众可能每个人都和大模型至少对话过几次了,也积累了一些技巧。如果把大模型当成是一个人看,那怎么能把这事儿给你讲明白,你的输出会更符合我的期望?就跟带下属是一个感觉!于是有人总结了很多模板,比如写作任务或营销方案,这些任务的最佳实践应该什么?