昆仑数据线上课No.5 | 疫后数字化机遇,“工业思维”如何加持“数据思维”
来源: | 作者:pmod6d781 | 发布时间: 2020-03-12 | 4143 次浏览 | 分享到:

从数据分析的角度,我们要做的不是沉浸于deep learning,先进的算法,提高模型精度,而是怎么去加持工业现场的机理,要首先对数据进行符合工业常识的筛选,才避免去做重复工。

纯粹的利用数据建模的过程往往会得到两种结果:第1种,辛普森悖论,你得到结论可能是跟工业认知完全相反。第2种,这个结论是一个显而易见的结论。那不用你去做任何的数据分析,工业专家也知道这个因子跟这个问题之间是什么样的影响关系。这种工作,没有充分利用你的 prior knowledge。

例如贝叶斯公式,都是从先验出发,得到一个后验。实际上先验是工业专家的支持,后验加持数据基础上得到了一些新的推论。

所以如果真正要去解决工业的问题,是一定要把这两者以一种合适的方式来结合在一起。不是说这边从数据出发,那边从工业出发,因为像现在我们看见这种双峰分布,就不是光靠温度的一个物理定律能够解释得通的,一定是要去思考背后的一些原因。

最后给大家做一些推荐。

例如:我想了解一下数据分析能做什么?应该看什么书?我不推荐专业书。

我这里列了三本书,都是非常有趣的书。

还有一个玩具:Google当时推出Alpha Go之后,同步也开源了TensorFlow游戏场 http://playground.tensorflow.org。可以直观的看到神经网络是如何工作的,这个对于初学者太友好了,一下就能知道神经网络它的每一层,每一个神经元是如何在工作。