昆仑数据线上课No.4 | 工业大数据实用“避坑”指南
来源: | 作者:pmod6d781 | 发布时间: 2020-03-04 | 848 次浏览 | 分享到:

本文作者:昆仑数据首席数据科学家 田春华

数据分析过去在工业应用中取得了的一些成绩,也有很多不如意的地方,今天分享在实际过程中有哪些常见的误区,由于时间问题,今天只讲7个技术方面,后边有时间再给大家细细聊。

7个误区,分三批,包括规划层面,技术路线方面,以及执行层面,可能遇到的问题。

1、言不及义:脱离业务逻辑的数据分析是浪费。

曾和合作伙伴探索过空压机的大数据分析。在涉及到工业设备的大数据分析应用中,有很多PHM的案例。但在跳到智能运维之前,最好先讨论一下预期的业务逻辑,我们的目标是做第三方运维业务(大数据用来提高维修效率),还是通过空压机的数据,来支撑一种新的业务模式,比如供应链金融、业务流程优化、能效优化等。

首先剖析一下,先不考虑现实条件,假设技术是百分之百的成功,这个技术实现之后,到底能干嘛?

一年的这种压缩机,它的运维成本到底是多少?如果我是这个设备制造商,我做智能运维到底是来帮谁实现什么?我的收入或者我的成本来自于什么地方?

如果智能运维的收入包括利润率都非常低,整个产业链,整个行业都还没有发力,不妨转变业务逻辑,不要急于模仿一些看似别人在其他领域已经成熟的案例,先灵魂拷问自己的商业本质是否合理。

2、指雁为羹:脱离约束条件的“乌托邦”很难成功。

案例:这类问题通常出现在一些调度优化、运筹优化层面,一讲生产调度或者运筹优化,大家很容易的就想做全局优化,这是大家的梦想,只有全局优化才能有提升的空间。但是现实中,要具体问题具体分析,不能脱离物理世界的约束条件。

例如港口的集装箱码头,其中一个很重要的问题就是码头的堆场优化。因为堆场决定容量,香港的码头是比较拥挤的,做对比优化的空间很大,效益也大,我们要分析船来了之后怎么快速的支持装货、卸货。

但是做堆场优化,业务范围到底做多大?客户希望做端到端的堆场优化,一个集装箱来了,就要决定最优位置。这里忽略了,为了做堆场优化,首先要有比较明确的集装箱的到达量预测,预测必须相对准确;第二,我要整个装备的维修周期数据,要获得排班数据,要获得船期数据等各种关联数据;第三,要避免场内卡车的拥堵,如果同一艘船的所有集装箱都放在一起,装船时候可能会造成局部拥堵。

现实情况下你很难获得这么全的数据,中间的约束很多,首先,流量预测就很难做的精准。第二,船的到达,按说有固定的周期,但是也有些天气因素,有些如当前疫情因素是不完全可控的。在这种情况下,如果做优化,是基于大量的假设,效果可能会打一些折扣。