2020工业大数据创新竞赛圆满落幕,赛情抢先看
来源: | 作者:pmod6d781 | 发布时间: 2020-11-27 | 3226 次浏览 | 分享到:

2020年11月24-25日,由工业和信息化部指导,中国信息通信研究院、国网湖南省电力有限公司、富士康工业互联网股份有限公司共同主办,宝安区人民政府特别支持的“第四届工业大数据创新竞赛”决出胜负并颁奖。

北京工业大数据创新中心协办,昆仑数据提供技术支持,协助合作伙伴湖南电力,参与此次赛题选择、算法论证、过程答疑及最终答辩。昆仑数据CEO陆薇博士在工业互联网区域创新发展论坛暨全国工业大数据创新竞赛颁奖仪式上发表专题演讲,分享了“以设备为中心”和“以用户为中心”的装备制造业服务化转型路径与案例。

这场竞赛,选手们表现如何?

本次工业大数据竞赛的参赛队伍整体水平较高,从工业过程的理解、数据探索、分析、异常值处理、建模、验证到最后的答辩都比较有系统性。

本次竞赛最大的惊喜在于,无论是水库入库流量预测还是注塑机尺寸虚拟测量,都有不少选手将机理加数据的工业大数据正道落到了实处。有的选手从机理出发辅以数据建模的物理数据建模过程;也有更多选手在大数据建模基础上辅助以工业机理和工况理解,修正特征工程和模型选择,以达到更好的模型泛化性与解释性。

第一个题目有选手从专业的水文分析角度,对汛期、地理、人文等影响因子进行了深入分析和建模,也有选手借鉴RC电路充放电过程对降雨汇聚到径流的过程进行了物理建模。

而第二个题目有选手从机理出发,提出了基于小扰动理论的线性模型+非线性修正的解题思路,从理论到实践给出了非常漂亮的结果;也有选手从数据模型出发不断深入研究数据与工况关系不断修正得到稳定可靠模型的解题思路。

相对遗憾的是,大部分选手对于数据背后的物理含义以及工业过程的理解还不够精细。例如第一个题目,大部分选手只是考虑到了降雨量对流量的影响,而缺乏对蒸发量影响的显性分析与建模;而第二个题目中,即使许多最后模型效果不错的方案,都对多维尺寸测量值自身的相关性缺乏考虑,也很少有选手对于数据进行系统性的工况分析。

总体来说,由于网络竞赛形式本身的局限和其它一些因素制约,本届大赛的决赛答辩队伍基本都具有了较好的工业与数据相融合的意识和行之有效的解题思路,使我们对于未来的竞赛涌现更多好的结果充满了期待。

水库入库流量预测是典型分析场景吗?

工业过程是对自然规律的工程化利用,是一个强机理的过程。这种机理在不同行业和不同环节上体现不同。在新能源(水电、风电、太能能等)领域,这种机理体现在对自然环境的认知上;在加工制造中,机理又体现在人机料法环多个因素共同作用下的工艺过程中;在输配领域,机理不仅体现在输配过程中的动力学或电磁学机理,也包括了消费端的社会规律过程。

本次竞赛中,入库流量预测就是一个侧重自然环境分析的题目。入库流量的宏观机理比较通俗易懂,水的循环过程在小学自然课就有涉及。但在工业实践中,很多要素和过程并不能直接观测(如地表径流、蒸发等)或不可能密集观测,观测量的时空颗粒度不同,也存在一定噪声或误差。这时候数据挖掘提供一种可能的方法,如何融合异构的数据源,去构建一个相对可靠的模型,变得非常有意义。

工业大数据创新竞赛在过去几届尝试从不同行业、不同行业为大家诠释工业大数据分析的丰富内涵。昆仑数据曾与金风科技、攀钢集团携手,在此前的工业大数据创新竞赛中,为“风力发电机组叶片结冰检测”、“风力发电机组齿形带故障预警”、“钢卷仓储吞吐量预测”等赛题提供相关技术支持。

关于本届竞赛

本届大赛聚焦“互联工业 赋智赋能”主题,得到全国工业互联网、大数据等领域权威专家和创新团队的高度关注,自7月26日正式启动以来,共有2600余支队伍、超过5000余人参赛,接近前三届参赛人数总和。决赛期间,来自全国各地的37支队伍进入答辩环节,围绕两大赛道三大赛题奉献精彩表现,来自清华、北大、北航、北邮、阿里、腾讯、百度、优也、昆仑数据等单位的二十多位工业互联网顶级专家学者担任评委,通过点评打分决出最终获奖名次。

中国工业大数据创新竞赛(简称“竞赛”)是首个由政府主管部门指导的工业大数据领域的权威性全国赛事,目前已连续举办四届,赛题涉及能源、钢铁、电子信息等多个行业,累计吸引产学研各界万余人参赛,为工业大数据领域的相关研究人员和创业者们提供了成果转移转化的交流平台,推动形成战略引领、技术创新和协同互动的良好创新生态。

感谢参与竞赛支持的昆仑数据田春华博士、李令莱博士及相关同事对本文的贡献。