今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。
但是辩论的胜负判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里赢,27%认为川普赢,据此可以说希拉里大获全胜。
但是网上有很多对这次辩论结果的投票,有的票数几十万、几百万,都是一面倒地认为川普赢。川普就因此宣布自己赢了,说除了“没人看的CNN”,所有的“民意调查结果”都是他赢得了辩论,并嘲笑说CNN只对300人(其实是500多人)的调查怎么能算数呢。川粉也坚信网上投票结果,跟着川普嘲笑CNN的民意调查人数太少,甚至有一家一直力挺川普的微信公众号还抱怨人们想去CNN网站投票找不到门,大骂CNN。
其实那种网民自己去投的网上投票的结果才是完全不可信的,即使有几百万、几千万票数,也不可信。首先是网上投票很容易作弊,一个人可以反复地投,也就是刷票。有的网站为了避免刷票,限定一个IP只能投一次票,但是通过代理服务器是可以随便换IP的,这种限制难不倒懂点网络技术的人,何况还有现成的刷票软件可以自动换IP刷票,想刷多少票都可以。有一个关于支持谁当总统的网络投票有高达一千七百万次投票,95%是支持川普,谁会傻到去相信这样的投票结果没有作弊?即使投票的网民都很诚实,不作弊,网上投票结果也不可靠。支持者会到处拉票,比的是哪方支持者更狂热更爱拉票。川普支持者往往比希拉里支持者狂热、偏执,川普支持者就被发现在某些论坛拉票,列出了各个投票网站的链接号召川普支持者去投票。再退一步说,即使某个网站的网络投票没人作弊也没人拉票,其投票结果也只是反映该网站读者的意见,而不能反映全体选民的民意,因为一个网站的读者往往是有倾向性的,例如美国有一个著名的极右网站Breitbart是一直支持川普的(其主编是川普竞选团队的CEO),该网站的读者就基本上是支持川普的,投票的结果当然是大部分人(约75%)认为川普获胜,其实我们应该惊讶的是其读者中居然还有25%认为希拉里获胜。
所以网上投票说难听点是垃圾,说好听点是好玩,不能当真。想要知道民意,就要做民意调查。民意调查要由组织者通过打电话、发邮件等方式主动找人询问(以打电话为主,但是现在很多人都不接陌生电话了,所以也有网上调查,但是是通过发邮件邀请的方式,不是网民自己找上门),这样就可避免调查对象重复投票、拉票、倾向性等问题。如果要调查的人群很小,挨个挨个去问就可以了。例如对“你认为总统辩论谁赢了”这问题,你想统计一个班的学生的看法,让每个学生依次回答就可以了。但是如果你想了解全校学生的看法,假定一个学校有三万名学生,一个个去问显然是不现实的,即使能做到,工作量也太大了。在这种情况下就可以采取随机抽样的方式,只找一部分人做调查。如果找的人数太少,没有代表性,结果容易出现偏差;但是如果找的人数太多,则是浪费。那么找多少人合适呢?或者说,需要多大的样本呢?
样本的大小和几个因素有关。一个因素是置信度,它表示的是你对调查结果的信心。因为不是对所有的人做调查,置信度不可能是百分之百,但是如果调查了足够多的人数,你就会对调查结果的可靠性很有信心。一般取置信度95%,意思是有95%的几率是这个结果。另一个因素是抽样误差,据此可以知道调查结果的正负变化范围(所谓置信区间)。可接受的误差越大,需要的样本就越小,反之,可接受的误差越小,需要的样本就越大。
民意调查可接受的误差通常是2%~5%。“你认为总统辩论谁赢了”是个比率问题(支持希拉里和支持川普之比),在调查前我们是不知道比率的,这时候可以设置为50%,因为在比率为50%时需要的样本最大。知道了人群总数(总体)、置信度、误差和比率这些参数之后,统计学上就有公式可以计算需要的样本大小。网上有现成的民意调查计算器(例如http://www.surveysystem.com/sscalc.htm ),把这些参数输进去,就可以算出样本大小。假定总体有3万人,置信度95%,误差5%,算得样本大小为379。也就是说,你要知道3万名学生对“你认为总统辩论谁赢了”这个问题的看法,随机抽样379人做调查就够了,调查结果有95%的可能是成立的,有5%的误差——假如调查结果是50%的人认为希拉里赢,意思是如果重复调查20次,有19次的结果是45%~55%的人认为希拉里赢。
如果我们想要知道一个30万人的城市对这个问题的民意呢?其他参数不变,把总体改成30万,算得的样本大小是384,只需要多调查5个人。如果要调查的是全美国人口呢?美国人口大约是3亿人,算得的样本大小还是384。在总体足够大以后(几万人以上),需要的样本大小基本不变了,调查全国和调查一个城市需要的样本大小其实是一样的,这虽然违反直觉,但是事实就是如此。
所以,要对全美国做民意调查,随机抽查300人也是可以的,川普、川粉的嘲笑只不过暴露了他们对统计学的无知。不过,抽查300人的误差有些大,全国性民意调查的误差一般控制在3%左右,因此需要的样本大小通常是1000人左右。CNN/ORC调查了521人,误差是4.5%,误差稍大,但是因为调查的结果比率悬殊(62%:27%),这个误差并不会改变希拉里大胜的结论。CNN/ORC调查采用的是简单随机抽样的方式,这样抽得的随机样本不一定能很好地符合人群分布特征,例如其中认同民主党的人数偏高。所以有时候为了获得能代表人群分布的样本,会采取分层抽样的方式,先根据人群特征设定各个群体的比例,然后再在各个群体随机抽样。
因为是抽样调查,即使精心地设计,也不能保证每次调查结果就一定可靠。但是如果有别的调查机构也做了类似调查,那就可以相互验证。如果各个调查的结果都一致,就说明非常可靠。CNN是第一个公布总统辩论的民意调查结果的,随后其他民意调查也都得到了类似的结果:NBC News的结果52%:21%,ppp的结果51%:40%,YouGov的结果49%:22%,Politico的结果49%:26%,Echelon Insights的结果48%:22%,路透社的结果:48%:23%,福克斯的结果61%:21%,Post-ABC的结果53%:18%。所有的调查结果都认为希拉里赢了,而且除了ppp的调查,都认为希拉里大获全胜,认为希拉里赢的选民人数是认为川普赢的选民人数的2~3倍。不知为何川普、川普支持者只顾着骂最先出头的CNN,而无视其他的调查结果?特别是保守派电视台福克斯一直是支持川普、获得川普的信任的,其民意调查结果比分比CNN还悬殊,认为希拉里赢的人数是认为川普赢的人数的3倍,川普、川粉怎么不去骂福克斯?
当然,再多的民意调查结果也不会让川普承认自己输了,他本来就是极度自恋的人,从不认输也从不认错。而川粉对川普是一种类似邪教的追随,川普认为自己赢了,他们也就只能跟着喊他赢了,然后认为所有的民意调查结果都是不可靠的,都是被民主党收买的,只有他们刷出来的网上投票才能代表民意。