本文分四部分。不了解投票来龙去脉的可参考(一),只关心分析结果的可直接看(二,三),关心具体分析方法的可参考(四)。
一、背景
二、系统误差消除后的数据分析结果
三、对投票未涵盖人群倾向的简要分析
四、附录:数据分析方法
一、背景
最近一位老友在台湾学术访问,和若干台湾朋友聊天后得到如下印象:很多台湾人并不希望大陆民主化。因他们感觉共产党本身出于种种考虑,并不会轻易对台湾动武“统一”之。但大陆民众中对台动武的呼声很高。因此一旦民主化,新政府按民意办事,台湾反而更加危险。
这种想法固然颇有似是而非之处,但感觉上,由于共党多年“统一祖国”的宣传,似乎的确大部分大陆人倾向于武力统一台湾。但是,出于显而易见的政治原因,几十年来从未有可能在大陆对此进行较为公正的民意调查。不过,随着sns时代的来临,这种调查突然间成为可能。
新浪微博是在大陆最为常用的推特类sns工具。有趣的是,该网站内置投票功能。任何人均可举行对任何问题的投票。发起投票后,发起人的关注者或“粉丝”立即可见此投票,他们参与后可选择将投票转发分享给自己的粉丝。这样投票总人数可成链式增长。在言论审查方面,由于sns的特点,新浪官方只能实行事后审查,即在投票发起后,一旦发现涉及敏感话题,再行删除。
针对“打台湾”问题,笔者在新浪围脖于7月6日北京时间早晨9:41分发起投票(民意调查)。题目为“你对武力收复台湾的态度”,题干及选项叙述如下。
************
背景:不少台湾人并不希望大陆民主化。理由是他们感觉gcd在可预见的将来并不会打台湾,但大陆人大部分想打台湾,所以一旦民主化,按民意办事,打台湾的可能性会大增。故本投票调查:你作为大陆公民对“打台湾”的态度是?
1. 祖国必须统一,支持收复台湾
2. 愿保持现状,但若台湾宣布独立,则必须动武。
3. 即使台湾宣布独立也不动武,但不承认其独立。
4. 完全愿意让台湾人民自由选择。
*************
几位名人,如 @肖雪慧,@仝宗锦, @袁伟时, @刘瑜 等帮助本人转发了投票。
由于未经过仔细斟酌,题干的叙述有些罗嗦。原因是笔者先前一贴先提到了台湾人这种态度,进行此投票愿意是将其作为讨论的一部分,没料到参与人数之多。题干表述也有不够准确之处。例如第一项未指明“武力统一”。但从网友反馈来看,并未妨碍大家的理解。
二、系统误差消除后的数据分析结果
投票在7月7日北京时间早晨9:05 左右被删除。7月7日北京时间9:00最后录得的投票结果为:
总人数:10153
选项 1: 2427, 占24%
选项 2: 1010, 占10%,
选项 3: 346, 占3%,
选项 4: 6374, 占63%
这样的结果令很多人感到震惊。很难想象愿意让台湾人自由选择的人数竟然占压倒多数。不过,这样的数字存在很大系统误差。例如,投票由笔者发起,则笔者的“粉丝”参与量远高于平均水平,而笔者粉丝多持自由主义观点,他们选4的比例会远高于一般人群。因此,光看最终结果并不准确。
幸运的是,在投票进行中的任何时刻均可查看记录中间结果。在网友帮助下,共记录中间结果70多次,形成了动态数据。这些动态数据可以帮助消除系统误差,得出较为准确的结果。具体分析方法见附录。这里先提供分析结果。
通过消除系统误差,得到:
(1)新浪微博网友政治热情高到足以参加投票的人群中(不分左右,只论足够热情),选这四个选项的比例分别估计为:
选项一(“打台湾”)—— 31%
选项二(“保持现状,独则打”)—— 14%
选项三(“独亦不打,但不予承认”)—— 4%
选项四(“愿让台湾人自由选择”)——50%
(2)在自由派/右派群体(定义是“右倾”程度达到典型“自由派名人”@袁伟时@刘瑜 粉丝平均水平)中,选四的比例约为80%。
三、对投票未涵盖人群倾向的简要分析
在上节中提到,该投票只能涵盖新浪围脖上有足够政治热情参与的人群,并不能代表政治上相对较为冷感,无兴趣参与的人群。这部分人群占总人数比例暂时无法估计,但对于其倾向一个合理分析是,他们或许更倾向于选2,即不独则不打。原因有二:
(1)共产党长期宣传统一祖国,无论你是否关心政治,均只能被动接受。对政治关心不多的人有较少机会接触思想资源得以改变观点去同情台湾人的自由选择。
(2)这一人群应该“打台湾”热情也不强,否则他们会已经参与到此投票中。
因此,他们很可能会更多选2。这能解释为何选2的比例远远低于不少人的直觉。
最后,该投票还有一个局限:只有新浪微博的网友才能参与。新浪微薄的用户超过一亿,年轻一代人中参与的比例尤其高。因此该投票更能代表年轻人的观点。
四、附录:数据分析方法
下文将介绍笔者所采用的分析方法以及得到的结论。
首先,对数据进行差分后,可以得到投票的每一段中选择各项的人数及比例。比如,假定当有1000人投票时,有500人选4,当有2000人投票时,有
1100人选4,则容易算出第二个1000票中共有600人选4,
比例为60%。由于不同阶段的票数可能来自于不同倾向的人群,这种分析方法便于估算不同人群的各自倾向。
以到某一时间点为止得到的总票数为横轴,以该时间点附近时间段内各项票数增加量占该段总增加量比例为纵轴做图。得到图一。其中,左上和右上是关于选项1和选项4。左下和右下是关于选项
2,3。容易看出,数据摆动较大。这符合sns传播的特点。假定某位左倾人士对选项1投票的同时共享给他的粉丝,这些粉丝同时扎堆投1的可能性很大,造成该段1的比例较高。但当某位右倾人士发现此投票并投4时,根据类似的理由,他的粉丝也会扎堆投4,造成4的比例升高,1的比例相应降低。通过对较大段数据取平均可消除噪声看出总体趋势。笔者采取的是将约每500票分为一组,求平均得出该组中各项比例。经过这种消噪声处理的数据在图中用红线标出。
观察消除噪声后的数据可发现,选第1项,即“打台湾”的比例从未超过50%。最高时仅达43%。最低时仅有10%。选第4项的比例最低时约为43%,最高时则高达80%。相对而言,选2,3项的比例保持平稳,分别约为10%和3%的水平。因此,在新浪网友中,有意愿参与此类投票的人群中,支持给台湾自由选择的比例有很大可能超过4成,想要武力打台湾的少于四成。在对岸不宣布独立则倾向不动武的约为10%,即便对方独立也不动武,但不愿予以承认的,约3%,比例最低。
利用另一种分析方法可估算出更准确的数据。微博此类投票存在很强的“名人效应”。假设有一位右派(自由派)名人(标准为粉丝数达到几万人),在某一时间点推荐了此投票,将立刻造成其粉丝大量参与,此人的粉丝也多持自由派观点,其中投4的比例将占压倒多数。在投票数据上,这将造成该段得票中4所占比例突然上升,1所占比例突然下降。随着投票的进行,这种“名人”效应将逐渐衰减,反应在分段投票数据上,4的比例将逐渐下降,1的比例则回升。一个合乎逻辑的假设是,当4的比例在“名人效应”后重新见底及1的比例重新见顶时,可认为参与投票的人群已经回到“一般人群”
(否则比例的下降和上升将继续),此时到下一波“名人效应”冲击波到来之前的数据,将最能代表“一般参与者”的态度。
图 1. 各阶段投票各选项得票比例。
“名人效应”在图1中有突出显示。各图中的两条竖线代表当投票进行到约4250票和8400票时两位名人 @袁伟时 (粉丝6万)和 @刘瑜
(粉丝15万)推荐了投票。可以看出,推荐后,1的比例(左上图)立即有很大下降,4的比例(右上图)则较大上升。在 @刘瑜
推荐后(第二道竖线处)很快投票被新浪微博管理方删除,因此没有观察到名人效应衰减的阶段。但这种衰减在 @袁伟时
推荐后(第一道竖线处)可以很明显看到。@袁伟时 带来的名人效应在约6500票时消失殆尽,直到8400票时 @刘瑜 带来新的“名人效应”。
因此,按照前面提到的逻辑,将6500票-8200票这段看成能代表“一般参与者”的阶段是较可信的。原始数据显示,6513票时,各项票数为1667,
592, 199, 4055,而8170票时,为2189,827, 265, 4889。这说明在这段1657票中,各项得票为522,
235, 66, 834,比例为31%,14%, 4%, 50%。这大致可以当作消除系统误差后的较可靠数据。
为说明在 @袁伟时 和 @刘瑜 之间并没有其他显著的名人效应,可以观察票数增加的速度变化。
图2. 投票速率
其中,横轴为距离开始投票的分钟数,纵轴为平均每分钟投票总数的增加量。两条黑色竖线表示 @袁伟时 和 @刘瑜
推荐的时间点。两条红色竖线表示北京时间晚11:00及清晨8:00。他们之间属于投票率较低的夜间。
很显然,在两位名人推荐投票后,投票率立即大增。在袁伟时推荐造成投票率上升及刘瑜再次推荐间,投票率较为稳定的下降。这证明了该时间段内并无其他“名人效应”。
然后,我们可以利用“名人效应”来分析以袁伟时,刘瑜粉丝为代表的自由派/右派人群的投票特点。首先,由于刘瑜粉丝众多,她推荐后,投票率大量上升,该段投票中,选4的比例迅速升至80%。可以认为,该段投票绝大部分来自刘瑜的粉丝,故刘瑜粉丝中投4的比例可估计为80%。
对袁伟时粉丝投4
比例的分析略为复杂,因为袁伟时粉丝数量不如刘瑜,故推荐后投票率上升不多,他推荐后一段时间的得票仍有大量来自之前“一般网友”的贡献。幸运的是,根据之前的投票速率,即刚才已经分析得到的一般网友投票比例,可以轻易把这部分贡献减去得到袁伟时粉丝的数据。计算表明,袁伟时粉丝投4的比例也约为80%。
这说明,自由派/右派网友有80%的压倒多数支持给台湾人民自由选择。