件或者数据很多,数据分析模块必须具备识别这种显性因果联系的能力。

    与这些显性因果相对应的,就是隐性因果联系。

    那个著名的啤酒和尿布的案例其实就是隐性因果联系,这些隐性因果之间,不一定具备必然性,但是因和果之间,往往存在或然性联系。

    就单个事例来说,这种因果联系未必成立,但是将其置于一个足够大的基数上时,这种因果联系就凸显出来,这是一种概率学意义上的因果关系。

    另外有一个案例,就是基于这种概率学因果关系的。一个搜索公司,它想研究今年冬天流感爆发的可能性,但是它研究的角度非常有意思,他不是从医学角度来研究,而是程序和算法角度来研究。

    它通过分析5000万条最频繁检索的词汇,将之和疾病中心在5年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型,从中寻找关联性,寻找那些隐藏起来或然联系,最终它成功预测了流感的爆发,甚至可以精确到特定的地区和城市。

    如果说显性因果只需要事先标注和设定,那么隐性因果明显就需要挖掘和寻找了,而如何找到这些隐性因果,就是数据分析模块的主要功能,同时也是这个模块是否设计成功的一个标志性指标。

    【马上就要515了,希望继续能冲击515红包榜,到5月15日当天红包雨能回馈读者外加宣传作品。一块也是爱,肯定好好更!】
!!
章节列表 转码阅读中,不进行内容存储和复制