基于大模型技术的工业智能应用开发
来源: | 作者:pmod6d781 | 发布时间: 2024-10-09 | 835 次浏览 | 分享到:



比如我在二维XY坐标上随便随手画一条线,从零点到任何一个点都是一个二维向量。然后我又画了第二根、第三根线,假设前两根线肉眼可见离得比较近,第三根线明显方向反了,我们就认为第一根线和第二根线的相似度比较高。

向量在数据空间也是类似的道理,向量化之后,它会用向量相似度的算法去搜,看哪些内容和你提的问题最相关。它通过相似度算法,去计算问题向量和可参考的数据库中哪些更匹配,然后把搜索结果作为上下文。

5、基于大模型的第二阶段应用中,影响反馈效果的因素有哪些?

一方面取决于事先准备的知识库有多好,另一方面取决于搜索精度有多高。

行业知识库的准备是一项精细化的工程,数据预处理会面临很多专业词汇的分词问题。例如变流器急停,是大家约定俗成的一种简称。类似缩写、同义词、近义词在数据库的数据加工过程中,做行业智能应用的人要去面对的很现实的工程问题。

向量的切分也有不同的粒度,词向量、句向量、段向量。还是以简历举例,简历实际包含了很多段落,有基本信息、工作经历、教育经历、荣誉等。把这些表达不同意思的段落尽量分成不同的向量,这样搜得会更精确。所以人工干预知识库的加工,工作量很大。

为什么要谈到搜索精度?比如说你有10万个向量,挨个对比效率很低,工程应用中用近似搜索,必然会造成一些精度的损失。对于应用来说,能理解到这个程度就可以了。如果有小伙伴致力于研究向量问题,可以继续钻研。

最后,处理过程当中,私有知识库的融入,大模型并不会动态地把它学习进去。外部调用不会改编模型的参数,我们提到的前三层应用都不会改变底层的参数。这种外挂的信息会存在短时记忆,过段时间就忘了。它只是用非常强的语言理解能力,在上下文中去学习,以更好的交互方式来呈现。

6、哪个大模型在工业领域好用?

从技术角度,评测大模型一般从四个维度去看:

第一是知识能力,训练数据量决定了知识储备。

第二是对话能力,就是得说人话。

第三,与Agent(智能体)的配合度。这一步很关键。对话功能之外,把大模型融入到一个智能的流程,在流程驱动下,可能有关键步骤,需要大模型去产生一些关键的输出。在一个编程的环境下,这时与模型打交道的是一段程序,提示词的用法跟返回的格式都有一定的要求。当大模型没有这方面的能力产生正确的规划,就出不来相应结果。

第四是安全合规和道德素养。不能协助犯罪和违背公德。

从应用角度,主要取决于做哪些场景。当然也需要考虑大模型在社区的口碑如何、是否开源、版本收费问题及费用高低、对资源的消耗如何等等。

7、基于大模型的第三层应用,如何与其他系统实时交互?