基于大模型技术的工业智能应用开发

来源: | 作者:pmod6d781 | 发布时间: 2024-10-09 | 835 次浏览 | 分享到:

比如我在二维XY坐标上随便随手画一条线，从零点到任何一个点都是一个二维向量。然后我又画了第二根、第三根线，假设前两根线肉眼可见离得比较近，第三根线明显方向反了，我们就认为第一根线和第二根线的相似度比较高。

向量在数据空间也是类似的道理，向量化之后，它会用向量相似度的算法去搜，看哪些内容和你提的问题最相关。它通过相似度算法，去计算问题向量和可参考的数据库中哪些更匹配，然后把搜索结果作为上下文。

5、基于大模型的第二阶段应用中，影响反馈效果的因素有哪些？

一方面取决于事先准备的知识库有多好，另一方面取决于搜索精度有多高。

行业知识库的准备是一项精细化的工程，数据预处理会面临很多专业词汇的分词问题。例如变流器急停，是大家约定俗成的一种简称。类似缩写、同义词、近义词在数据库的数据加工过程中，做行业智能应用的人要去面对的很现实的工程问题。

向量的切分也有不同的粒度，词向量、句向量、段向量。还是以简历举例，简历实际包含了很多段落，有基本信息、工作经历、教育经历、荣誉等。把这些表达不同意思的段落尽量分成不同的向量，这样搜得会更精确。所以人工干预知识库的加工，工作量很大。

为什么要谈到搜索精度？比如说你有10万个向量，挨个对比效率很低，工程应用中用近似搜索，必然会造成一些精度的损失。对于应用来说，能理解到这个程度就可以了。如果有小伙伴致力于研究向量问题，可以继续钻研。

最后，处理过程当中，私有知识库的融入，大模型并不会动态地把它学习进去。外部调用不会改编模型的参数，我们提到的前三层应用都不会改变底层的参数。这种外挂的信息会存在短时记忆，过段时间就忘了。它只是用非常强的语言理解能力，在上下文中去学习，以更好的交互方式来呈现。

6、哪个大模型在工业领域好用？

从技术角度，评测大模型一般从四个维度去看：

第一是知识能力，训练数据量决定了知识储备。

第二是对话能力，就是得说人话。

第三，与Agent（智能体）的配合度。这一步很关键。对话功能之外，把大模型融入到一个智能的流程，在流程驱动下，可能有关键步骤，需要大模型去产生一些关键的输出。在一个编程的环境下，这时与模型打交道的是一段程序，提示词的用法跟返回的格式都有一定的要求。当大模型没有这方面的能力产生正确的规划，就出不来相应结果。

第四是安全合规和道德素养。不能协助犯罪和违背公德。

从应用角度，主要取决于做哪些场景。当然也需要考虑大模型在社区的口碑如何、是否开源、版本收费问题及费用高低、对资源的消耗如何等等。

7、基于大模型的第三层应用，如何与其他系统实时交互？