工业数据采集背后的那些坑(下)
来源: | 作者:pmod6d781 | 发布时间: 2023-06-28 | 2902 次浏览 | 分享到:

作为工业数字化的基础,不管是从基础的监控类应用开始,还是从数据资产积累的目的出发,大家都或早或晚开始了数据采集的工作。上一期我们对数据采集过程中企业的需求,比如完整性、稳定性、时效性、非侵入性、安全合规、成本等因素,以及对数据采集过程中面临的一些典型挑战,进行了分析和探讨。这一期,我们聊聊在数据采集的过程中面临这些问题之后,如何应对。


Q1:过去在数据采集现场,还碰到过哪些棘手的问题?

虽然我们所有人都希望数据采集能够毕其功于一役,一次性解决问题,往往现实不是这样的。上一期已经聊到了很多棘手的挑战,仍有一些在实施过程中防不胜防。

例如,数据接口的问题,有一些系统一开始数据接口规范定义都很好,通信协议都很清晰,在真正实施的时候,就会发现方方面面的问题都出来了。可能涉及到一些接口不开放,甚至还需要进一步的商务合作,还有一些系统时间也长了,可能业主自己也找不到原来厂家是谁负责的。

还有一些多方协同的不可控变数,例如在一个矿场上做车载的数据采集,sim卡有效期是一年,一年之内你要续费,结果由于一些额外的因素没有及时续费,再续要实名认证。但是实名认证几百辆车很麻烦,于是就需要把设备拆下来,重新替换sim卡。

还有一些极端环境因素的影响,安全防护的考虑,跨部门协同也有不同立场上的风险平衡问题等等,数采确实也是一个持续的迭代的事情。

Q2:从企业的角度看,数据采集需要做哪些准备工作?

第一,业务目标和场景定义。首先要以终为始,先确认要分析什么样的场景,才能确定下来采集哪些数据。不同目标对数据要求的侧重点会有差异,需要综合总体目标去判断,可能需要哪几类数据。例如就做实时监控,要求全量数据,这也是一种目的。

第二,梳理现有的数据清单。先把数据归类,比如有哪些设备、哪些测点,数据的采样频率如何,哪些数据目前没有,需要加装传感器。

第三,样例数据的初步分析。拿到一些样例数据,了解数据质量如何,有的在数据清单里,但可能传感器工作不正常,或者准确度特别差,就需要改造。但样例数据不能代表全部数据的情况,对潜在工作量的预判不能过分乐观。

第四,制定相关的采集标准。明确数据格式、数据质量、数据安全等各方面标准,根据这些标准,可以保证数据的一致性和可比性,从而提高数据的可利用价值。

第五,制定数据采集方案。设计具体的实施方案,比如数据怎么采、网络怎么架构、怎么部署,技术架构是否有可扩展性。前期尽量做得比较细致一些,包括采集的方式和具体的工具。自动接入一般会包含硬件和软件,要建立一整套软硬件解决方案。比如硬件方面,包括哪些传感器、哪些监控的设备、是有线传感器还是无线传感器、现场有没有工业网络、是否安全合规?软件方面,需要对数据源所在软硬件的负载情况做系统性分析和可行性验证,避免数采负载对原有系统带来过大的冲击。弄清楚采集软件是哪些,数据采上来之后,传输、存储和处理都需要哪些软件来进行支持,数据访问链路和接口是否畅通?关键路径是否存在实施风险?是否满足实时或者批量获取的需求?