基于大模型技术的工业智能应用开发

来源: | 作者:pmod6d781 | 发布时间: 2024-10-09 | 850 次浏览 | 分享到:

1、当前大模型数字化应用开发的主流技术路线

世界上做大模型的人可以分成两类：一类是研发基础大模型的人，这类中不需要太多，研发出十几个基础模型可能就足够了；大多数人是基于一个基础模型去工业现场开发智能化应用。

大家可能比较关注这么几点：

第一，大模型如何基于私有的知识库去做问答？在工业行业里很典型的需求，可能90%的人都能想到这一点。

第二、大模型能不能基于数据库的实时数据去回答？例如当下我的设备情况如何，这需要结合数据库中最新的数据。

第三、还有更少的人会想到大模型能不能帮我画CAD图纸？或者能不能帮我生成一个3D模型？

以上的场景在理论上都是可以的，只是这些场景已经超越了我们最常见的对话模式，需要更多的智能应用开发工作。

2、这样一个递进的过程，大概分哪几个阶段或者是几种类型？

基于大模型的智能应用开发，有一个循序渐进的技术阶梯。从低到高，从简单的复杂，从不灵活到灵活，大概有这么几个阶段：

第一阶段，提示工程，或者叫指令工程。只对输入进行一些约束或者优化，通过重新组织问题去刺激大模型的神经元，让它产生更好的输出。虽然它还没有走到客制化的阶段，但这是后面几个阶段的基础。

第二阶段，私有知识库。原理上次直播也提到了，有一个外部的知识库，当用户提问的时候，通过向量的相似搜索的算法，能够把和问题最相关的几个语料作为问题的上下文，一起传给大模型。提示模板的动态提示技术类似写程序，先写一个“请根据以下材料作答：{}”，括号（{}）里的内容需要动态填入，这就是一个模板。私有知识库的内容搜出来以后，就填到括号的位置上。所以你问了一个五个字的问题，背后可能生成了几千字的提示词喂给大模型。

第三阶段，工作流（Chain）。通过把大模型交互和自定义逻辑结合起来，在自定义逻辑中可以访问外部系统，做任何加工，实现更复杂的场景。比如说让大模型结合外部数据库，或者调用信息化系统的API。

第四阶段，微调基础模型。前面的3个招儿都使了，效果还不尽如人意，就再把基础模型调一调，调完之后再叠加前面那3把武器一起用。

第五阶段，重新训练一个完整的大模型，最复杂、投入难度最大，一般情况下不建议。

作为工业企业去启动大模型或者基于大模型的智能应用开发，我们建议从第一阶段开始，逐步递进。

3、从第一阶段来看，如何更好地向大模型提问，有什么建议？

提示工程更多的是一些经验的积累。大模型出现了这么长时间，关注我们的受众可能每个人都和大模型至少对话过几次了，也积累了一些技巧。如果把大模型当成是一个人看，那怎么能把这事儿给你讲明白，你的输出会更符合我的期望？就跟带下属是一个感觉！于是有人总结了很多模板，比如写作任务或营销方案，这些任务的最佳实践应该什么？