数据化管理:选举日,大数据预测失灵了吗?

  • A+
所属分类:人物观点 大数据

今天川普“意外”的当选震惊了全宇宙,华尔街的精英们没有想到,硅谷的精英们也没有想到(除了一个人投资大师,还因为之前支持川普险些被要求离开Facebook董事会),各国政要也没有想到......选举日,川普的各种打脸日。

赌博公司也被打脸了,昨天某博彩公司开出的赔率为川普4.97,希拉里1.12,只是在最后时刻大局基本确定的时候川普的赔率才由早间的4.5掉到1.02,希拉里的赔偿则由1.22上升到9.0。当然赌博公司是不会赔钱的,赔钱的只是买希拉里的那些赌徒。

被打脸的还有各种大数据预测,之前的各种预测都是希拉里获胜,有些甚至是预测希拉里大比例获胜。在奥巴马竞选时大显身手的大数据这次不灵了吗?到底发了什么?

1、大数据预测失灵,错在哪儿?

错不在大数据,在用大数据做预测模型的人身上。很多大数据的模型是人在建立的,人的主观意识会影响模型的建立,选取的分析方法,权重的不同设定等等都会影响影响最后的预测效果。并且这次选举前,媒体一边倒的看好希拉里大胜也势必会影响预测模型的细节。

第二可能错在抽样调查上,总统选举前各种民意调查,而这种民意调查结果都是大数据预测的一个重要数据源。调查样本的取舍,回答是否真实意愿,这些因素都不是大数据预测能够左右的。我深度怀疑很多之前民调说选希拉里的人最后是投票给川普的,因为选希拉里意为这是精英的选择,而川普代表作草根。

第三个原因是这次选举的新情况,民主党、共和党都有自己固定的票仓,一般不会跳票,所以左右最后结果的是那些摇摆州。摇摆州的的票是非常难以预测额,很多是伯仲之间(这次公布的数据也体现了这种现象)。之前的选举摇摆州的选票基本上是互有胜负,而这次川普基本上拿下了所有摇摆州的选票。

我认为的最后一个原因是川普一直在社交媒体上鼓励大家走出来投票。美国大选投票率普遍不到六成,2012年是58%,2000年只有49%,今年的投票率还没有公布,但是很可能会高过以往的数据。难道正是这些沉默的选票帮助了川普的获胜?

当然这些都只是事后的分析,具体什么原因就等待个各大数据公司的复盘吧。

2、本届选举大数据仍然发挥巨大的作用

知名的大数据公司TargetSmart 给民主党的希拉里提供大数据的分析服务,另一家Deep Root Analytics(深根分析公司)则给共和党的川普提供数据分析服务。2016年的总统大选奥巴马就是借助这种大数据的功力赢得了选举,《连线》杂志曾经说过奥巴马在竞选连任时“对当初帮他入主白宫的69,456,897名美国人姓甚名谁,了如指掌。”

社交媒体时代,我们都习惯把自己的隐私放到深交媒体中去,我们分享自己的观点,和不同意见的人撕逼,拍下中意的候选人的背景图片上传到深交网络,自己的朋友圈画像等等都会成为大数据分析的一部分。

Deep Root Analytics公司的分析总监曾经说过,大数据在总统大选中的作用就是“武器化”,它是除了候选人本身、候选人团队之外的一枚强大的武器,并且是精准瞄准的那种。特朗普的分析公司除了Deep Root之外还有一家英国的剑桥分析公司,他们的主要作用是利用超市购物数据,电视播放信息,选民在网上的浏览记录等去把那些摇摆州的投票人找出来(据说为每个用户建立4000-5000个数据点),然后设计对应的方案去影响他们的投票。

川普本来就是一个超级网红(他在Twitter和Facebook上一共有2580万粉丝,而希拉里只有1892万),粉丝数量川普占绝对优势。当然一个粉丝并不代表一个选票,有的粉丝可能是敌对阵营的支持者,关注川普就是为了黑川普的。但是这些都是数据,非常宝贵的数据,数据公司会分析川普和希拉里的每个粉丝的社交媒体内容,判断他们的投票意向再加以适当影响。

和希拉里谨慎地发布相比,川普就大嘴很多,每一次川普的发推都是有目的的(当然大部分不是川普发的,而是川普的团队利用其账号的发布,这种做法还让奥巴马吐槽说“一个连推特都管理不好的人,怎么能管好核弹密码?”)。每一次发推既是一种测试,也能影响一部分目标粉丝的决策,并且每一条推特下面的转评赞信息也是一个宝贵的大型数据库,所有数据都是一种态度,分析这些信息可以决定下一次的发推策略。

3、大数据背景下的蝴蝶效应

美国的一只蝴蝶,当然是一只巨大的蝴蝶,扇了一下翅膀,全世界的股市都出现了地震。跌的最多的是日本日经指数,-5.36%,作为美国的最忠实盟友,他们好像是最怕川普上台的了。下图是今天跌幅超过1%的指数(欧洲股市还在交易中,美洲股市目前还没有开盘)。

数据化管理:选举日,大数据预测失灵了吗?

股市为什么会跌?因为金融市场最怕不确定性,而川普的过往言论造成了太多的X因素。

今天另一条刷屏的图片是这条义乌图片,好像很有道理的样子。

数据化管理:选举日,大数据预测失灵了吗?

当然旗帜制造数据不是大数据,而是小数据。但是如果把这些数据收集全了也是一个非常好的预测数据源。而义乌真的走在我们的前面,百度了一下竟然有一个“中国义乌小商品指数”,牛!

数据化管理:选举日,大数据预测失灵了吗?

以后浙商可以到世界上去吹牛了。蝴蝶效应的另一个作用是催生了好多川普希拉里概念股:

1、川普概念股:川大智胜、川金诺、川环科技、川润股份、川仪股份、川投能源、拓普集团、爱普股份、厚普股份

2、希拉里概念股:西仪股份,新希望

3、为啥万科也涨,因为川大叔的女儿叫ivanka!ivanka!ivanka

网名额智慧是无穷的,虽然没有太多直接的联系,但是股市有时候总是很神经质,谁知道是不是蝴蝶效应了?记得前几个月陆家嘴啪啪啪视频出来的时候,有人还拉升了曲美家居的股票呢,原因竟然是女主使用的椅子疑似是曲美公司的。

这就是蝴蝶效应,影响的是大众的心智,通过这种心智去改变外在事物。

黄成明
深入浅出数据分析(中文版)
数学建模教材(包括十大算法、matlab、lingo、spss、exce以及多种实例模型)
MySQL必知必会
2016年度中国软件开发者白皮书下载(PDF)

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: