工业数据智能之基石——领域数据模型
来源: | 作者:pmod6d781 | 发布时间: 2023-04-12 | 2550 次浏览 | 分享到:
前情回顾:上一期,我们从工业人的视角,看当前类GPT技术对职业发展的冲击和可能带来的变革。其中提到,简单重复的体力劳动会慢慢被机器人和自动化技术替代,而简单重复的脑力劳动则可能面临人工智能带来的挑战。更准确地说,积极使用和熟练使用这些新工具的人,未来的竞争力和能产生的价值会更大,会慢慢替代不会使用新工具的人。经过一段时间的过渡,将会形成新的经济社会分工,直到下一次变革到来。

本期摘要:当前工业数智化进程中,要应用人工智能技术,到底应该怎么做?有哪些可以做,有哪些能出成绩?有哪些坑需要避免?

Q1:人工智能模型=算法+算力+数据,如果说通用人工智能领域慢慢进入算力时代,那工业领域模型的发展进程如何?

通用人工智能,比如像文本、图像等处理,已经慢慢从数据时代往算力时代演进。大模型的训练已经不是一般个人玩家,或小型组织玩得起的了。有个隐性前提是,这个领域的算法和数据足够成熟,可以支撑暴力求解,算力的爆发力就显现出来了。而当一个瓶颈被突破了,优势被无限放大之后,肯定又会出现下一个瓶颈。

工业数据的应用具有隔离性、专业性和有限性。由于数据条件的制约,目前工业领域人工智能的应用相对通用领域来说,要滞后一些,还不到比拼算力的阶段。工业数据的信息密度比较低,比如大部分设备的运行状态都相对稳定,或是长期稳定在某个点,或是在一组开关机状态间循环。虽然数据量比较大,例如一个小时3600个点,也可能只在一个点附近有轻微噪声波动。真正能提取出来的有效数据并不多,远没有到需要算力去大力出奇迹的程度。

在数据问题解决之前,算力本身不会是瓶颈。随着数据的积累,也许会朝着(算力)这个方向发展。但我们还需要看到,工业数据背后产生的机制是物理定律,甚至很多时候可以用仿真模型很大程度上去逼近它,这也算是工业里面的一种优势。融入这些先验机理,能够很大程度弥补数据信息不足。

Q2:工业领域智能模型与通用智能模型之间有什么区别?工业领域模型当前的工作重点是什么?

工业领域模型和通用领域模型的形态不一样。工业场景中,语言处理类的模型相对比较少。类ChatGPT等语言模型跟面向生产运行过程的工业数据挖掘相比,不论从数据类型、支撑算法还是最终要解决的业务问题都不一样,也就不具有可比性。

如果说通用智能处于算力时代,那工业数字化当前还是处于数据时代。但这个数据时代,不是停留在数据收集,而是数据的可理解、可消费、可使用。

让数据智能成为工业企业的创新管道和价值管道,最费时间精力也最关键的一环就是业务解析和数据探索的匹配。需要理解底层的基本原理、其背后的业务逻辑,需要结合着前期调研、业务专家的分享,再对比数据去理解和相互印证。这个阶段的心智负担往往非常重,而这个环节打通之后,模型设计、模型开发也就相对轻松。