【大选】谁说媒体混淆视听,制造假民调?数据王Sam Wang一边吃苍蝇一边认错
总统大选这个年终大剧看起来是已经大结局了。但是个中细节还是引各位看官回味不已!其中,受大家吐槽最多的可就是选前的民调了!在选前,各大媒体发布的民调几乎一边倒地显示“民心在希拉里这边”,但现实却结结实实地打脸了这些发布民调的媒体。到底是媒体作假企图瞒天过海,混淆视听?还是民调失实,已不可信?你知道嘛?号称2016选举数据之王的Sam Wang也已经跪了。表示数据预测结果和现实的反差让他只有吃个苍蝇来谢罪了!今年大选,民调数据无疑是支撑民众关心大选信息的重要参考,同时也是竞选团队非常关注的民情风向标。尤其随着大数据和数据新闻的流行,各类“靠数据说话”,“数据是不会骗人的”这样的论调让今年的大选前夕可谓数据图表满天飞。这时候你们有想过做新闻的亲们的文科出身吗?学新闻或者是英文出身的他们要怎么来做大数据,建数学模型分析数据?所以,他们往往直接“拿来主义”,选用靠谱团队的数据结果。这其中,有两个人尤为突出,号称今年大选的数据之王。一位是之前就名声大噪的Nate Silver,他和他的团队运作的是知名的FiveThirtyEight数据库,而另一位,也可以说是今年大选真正的数据之王,华裔科学家,Sam Wang, 他的Princeton Election Consortium网站从选举一开始就发布各类民调数据。他的数据和结论也被纽约时报,The Huffington Post等响当当的媒体转载发布。
Wang曾在大选前直言,他的数据结论显示,希拉里无疑将会获得总统选举的最后胜利,因为,数据就这样稳定地摆在那里。如果现实不同于预测,他愿意自食一只苍蝇谢罪。(言下之意,我的数据炒鸡靠谱!绝不会有错!谁会傻到吃苍蝇啊!)然鹅,结果大家自然是都知道了。他也是爽快人。只有在社交媒体上发布只能“自食苦果”的信息了。
大选日前夕 Wang的预测。现在看来,确实和实际有所出入。
那么我们不禁要问,Wang可是数据专家,又是受过良好教育的普林斯顿教授。不至于说胡话欺瞒公众吧?那么,到底是数据计算方法出了问题,还是采样出了问题?又或者,这样的民调办法根本就无法正确预测?
让我们来看看Wang和Sliver都是怎么做数据的。
Wang表示,他的数据比Sliver以及别人做得可能更靠谱。因为,他和他的团队的办法做到了在最大程度上降低未知和不确定性。原来,Sliver的团队做法是通过得到单个民意调查人的选情意向数据,从而来推算整个州选民的支持率份额。也就是说,这样的做法将用到大量的统计数据运算方法,比如大量的参数,各种算回归曲线等,从而来推算数据结论。然而,这样基于参数的统计分析很不靠谱。因为,每一个参数都可能存在不确定性。因此,大量的参数参与其中,不确定性被大大增加,可见,由此得来的统计分析结果很可能就会离现实情况差之千里。
而Wang则完全摈弃了这样的传统做法。他的PEC模型所采纳的数据来源于每天更新的每个州的民调结果。这样一来,不停更新的数据带来了更庞大的数据支撑,也正因为如此,他自信这样的数据采纳和分析办法可以将不确定性降到最低,以此来跟真相无比靠近。
有人直言,Wang的分析预测网站做得极其难看。这是为啥?其实,Wang对数据的执着纯属业余爱好,“半路出家”。他是普林斯顿大学的神经学教授。从他的个人履历来看,这只是个喜欢数学的物理系和神经学专业人士。他从04年开始加入PEC玩数据,此后更是越来越上瘾做起了预测大选结果的大事。
那么,为何看起来缜密的科学却失算了呢?
因为这是人心啊!各位!记得咱老祖宗说的话吗?啥叫人心叵测?啥叫人心隔肚皮?啥叫最难琢磨是女人的心?呵呵,男人的心又何尝是那么好琢磨的。
各类民调、预测总是对希拉里有利
据悉,此次民调和现实大相径庭后,有一部分有识之士便提出,不是Wang他们做得不好,而是人心变化太快,真的是难以捉摸。
甚至有一种说法提出,以民调的形式用于政治选举预测或许会退出历史舞台。
FiveThirtyEight同样预测希拉里应当大比例获胜
因为,它至少有如下缺点。
- 数据采集可能永远跟不上现实发展
- 参与民调的人数可能大大小于实际,因此便会不准确
- 投票,或许是一瞬间的选择,很难提前预测并归类
因此,业界建议,还是让民调回到广告业喜欢的,最初的作用中去吧。让民调去了解Target audience到底喜不喜欢某一个产品,从而起到商业作用,或许更实际、更少不确定性。
反观总统大选。你以为大选的效应都结束了吗?公众都认命了吗?
并不是。
这个国家,一部分人开心滴拥护Trump当选。而另一些人,看来是恨透了这样的结果。
各类反对Trump当选的游行可谓遍地开花。好像和胜选的歌舞升平形成了鲜明的反差。
在小编看来,这个冬季终究是属于红色的。例如,Starbucks换了红色圣诞杯,一身红装的圣诞老人也即将登场。可见,红色,是大主流。