实验:怎么定量地确定因果关系?
前面两讲,我们分别说了抽样和问卷。如果调查对象内部差异特别大,又不能全部测量,那就用抽样,用样本推断总体;如果想了解人的内部状态,那就用问卷。
当然,生活里还有一些时候,我们就是看到了两个事物,想确定它们之间有没有因果关系,或者想知道一个判断是不是靠谱。这时候还可以怎么办呢?
这一讲,我们就来说一个以确立因果关系为目标的收集数据的方式——实验。
这一讲的任务就是让你理解,当收集数据是为了确立因果关系的时候,对收集数据提出了什么样严格的甚至是变态的要求。
实验的过程
因果关系的表达应该是这样的句式,“因为……所以……”。因为你吃了这片药,所以你变聪明了。但关键问题是,怎么证明这件事呢?怎么证明确实是吃药让人变聪明了呢?
要证明这一点,就要分好几步。
第一步,肯定是要吃药。
吃药这个行为,用实验的术语就叫“操纵自变量”,也叫“干预”,也可以叫“处理”。这一步看起来好像很容易,只要受试者把药吃了就行。但实际上,非常不容易。这个药是用水服下的,还是用茶水服下的?是整个吞下的,还是碾碎了吃的?是饭前吃的,还是饭后吃的……也就是说,你要保证干预和处理的标准一致。
第二步,吃药之后,得看看受试者是不是比吃药前更聪明了。
怎么证明这一点呢?得做两次智商测验。实验开始前做一次,比如得了90分,吃药之后一小时,再做一次。只有得分大于90,而且还得大不少,才能说明确实变聪明了。要是第二次测验得了91分,只比原来多1分,你说吃这个药会让人变聪明,我估计不会有人相信的。智商测试本来就是个范围,万一有误差呢?
这里,智商是因变量,也就是我们要干预或者处理的结果。智商测试,就是测量因变量。其中,第一次智商测试,用实验的术语叫“前测”;第二次测试,就叫“后测”。后测和前测的差异,也就是你实施干预或者处理的前后差别,就是“效果”。
如果差异大,就说明有效果。此时,你就可以下结论——吃这款药是你变聪明的原因。
怎么确保实验可靠?
刚才,咱们简单把实验过程过了一遍,你发现没有,这里的难点在哪里呢?在选择因变量,也就是你要测量什么来衡量自己干预或者处理的效果。
你想,我们的目标是看这个药是不是让人变聪明了,但测量什么代表聪明程度呢?
上面的案例里,我们自然地用到了智商测验。但智力水平就等于聪明程度吗?肯定不是所有人都赞同这一点。比如,有人可能就觉得,解决问题变快才是变聪明了,所以我们就不要做智商测试,而是让受试者做脑筋急转弯。看看吃药之前10分钟能解开几道题,吃药之后10分钟又能解开几道题,如果成功的题目大大增加了,就是变聪明了。
因变量的本质就是,对因果关系里那个结果的操作化。如果你选择的因变量与那个结果对应得特别好,做出的结论就让人信服;对应得不好,就难以让人信服。显然,用智商对应聪明,就比用脑筋急转弯更让人信服一点。
而且,因变量找准了,测量的仪器也得准确。测血压,血压计得是好的吧?测智商,测试题不能是100年前的版本吧?仪器不行,数据就不可能准确。数据不准,结论就不可能靠谱。
那么,找准了因变量,也选择了靠谱的测量工具,我们就可以宣布找到因果关系了吗?
还是不能。为了对抗各种攻击,我们还要做很多工作。
其中最猛烈的攻击就是,不吃药就没有这个效果吗?
所以,我们还要设置一个对照组。对照组的任务就是,确保除了自变量的干预不同这一点之外,其他的都相同。因此,我们必须也给一些人吃药,但这个药不是真的,然后看看这些没有真正吃药的人前测后测的差异,与吃药的人前测后测的差异的差异是多大。虽然这句话像一个绕口令,但含义不难理解。
有了对照组,实验组和对照组的差异才能被解释成来源于你做的干预,也就是自变量的作用。
如果没有对照组,有时候甚至会得出相反的结论。
我给你举一个例子:
维基百科的内容是用户自发贡献的,用户贡献内容不要求回报。于是研究人员就想知道,如果给用户发一个精神性的奖励,这些人的贡献会不会提高呢?研究人员就选择了100名有杰出贡献的用户,给他们发了精神性的奖励。结果发现,三个月内,这些人的贡献反而减少了。
难道奖励带来了负面影响吗?
幸亏研究人员设置了对照组。另外还有100名杰出贡献者,没有给奖励。结果发现,三个月内,这些人的贡献也减少了,不但减少了,而且比奖励组减少得更多。所以,贡献下降是整体趋势,奖励有很好的正面作用,缓解了贡献的下降速度。
除此之外,还有一个严重的攻击是:对照组和干预组是两拨人,怎么可能相同呢?前面也说过,人和人之间是有差异的,你怎么保证是真正的对照呢?
这确实是个问题。目前看,最 好的办法就是用双胞胎,一个干预,一个对照。这样能说服绝大部分人。可是,我们找不到那么多双胞胎,怎么办呢?次优的办法就是随机化。意思是说,你招募100名受试者,谁进入干预组,谁进入对照组,完全随机,按随机分配的结果来。
还有,要是受试者一听说这个药有效,心理随之产生变化,尽管吃了假药也变聪明了怎么办?要是实验者发真药的时候和发假药的时候表情不一样怎么办?
双盲实验就是解决这个问题的。谁吃真药谁吃假药,受试者不知道,实验者也不知道,实验结束后才揭晓。
此外,还有一个社会期望的干扰——前测一做完,受试者就会猜实验者要什么。比如,原来这是要测量我是不是歧视女性,那在后测的时候,受试者就会隐藏自己的真实想法。
总之,干扰因素很多很多,上面只是一些主要的。你要知道,好的实验没有那么容易操作。
最后,还有一个重要的问题就是,受试者的代表性决定了结论的适用范围。要是受试者是老鼠,你敢把结论推广到人类吗?要是受试者是大学生,能代表全社会吗?
有一个著名的案例,可口可乐改过一次配方,一推出就被骂惨了,只好改回来。可口可乐公司有那么鲁莽吗?人家在实验室是严格测试过的,受试者更喜欢新配方。但是,没办法,实验室不是社会,在实验室喝一口不等于在家喝一瓶。
事实上,在实验室发生的社会过程很难在真实的社会环境中出现,所以实验室中发现的效应很多都是临时的,不能应用到社会上。
总结一下,实验法通过操纵自变量、控制无关变量、观测因变量这样的逻辑,确保得出因果性结论。因此,实验法特别适合范围有限、界定明确的概念和假设。
两个经典的实验案例
下面,介绍两个在真实社会中做实验的案例。通过这两个案例,你会进一步理解,实验不一定要在实验室做,在真实世界进行会让结论更可信。
先说一个验证性的实验:
研究者的目的是检验一个想法,这个想法是,“如果从监狱释放的囚犯所得到的不仅仅是一套衣服和路费,而是能够帮助他们熬过过渡时期的少量资金支持,帮他们重新找到生活中的位置,那么就可以推迟或者阻止他们再次犯罪。”这个想法听起来很有道理,但毕竟只是想法,是不是真的就要检验。
研究者选择了2000名释放的犯人,随机分成了6组。第一组资助释放者半年。第二组资助一个季度,但是减免个人所得税。第三组也资助一个季度,但是所得税不减免。第四组不给钱,只提供找工作的帮助。第五组什么都不提供,只进行谈话。第六组什么也不做,连联系都不联系。
结果怎么衡量呢?看一年之后的被捕率。比较各个组的被捕率,就能知道哪一种方式对降低犯罪率是有效的。
最终结果揭晓:一年之后的被捕率,第一组,50%;第二组,49%;第三组,49%;第四组,49%。第五组,48%;第六组,49%。结论很明显,各种力度和方式的资助,统统无效。
这个研究是1980年做的,结果发表之后,引发了社会各界对犯罪惩罚的作用和相关刑事惩戒政策的深入讨论。
再说一个商业性的案例:
这个实验的受试者有11万人。美国游乐园都有一个项目,坐过山车。游客在上面大喊大叫的时候,被拍下来。当游客下来之后,实验者告诉他,你可以买这张照片做纪念。不过,一半游客听到的是,“你可以按自己的意愿付钱,而且收入的一半将捐赠给慈善机构”;而另一半听到的是,“这张照片的价格是多少”。
结果表明,按意愿付钱的游客会比告知固定价格的游客给更多的钱。
思考题
最后,出一道思考题:
某新闻媒体播出了一则新闻,主题是国产电饭煲PK日本电饭煲。日本电饭煲是市场的宠儿,都说比国产的好。于是,记者就组织了一次实验。找一只日本电饭煲和一只国产电饭煲,大米用同一种好大米,水用一样的好品牌的纯净水。分别做出米饭,请10位大爷大妈品尝。当然,事先不会告诉大爷大妈哪碗米饭是哪种电饭煲做出来的。
结果呢?认为国产电饭煲比日本电饭煲好的,5人;日本的比国产的好的,3人;一样好的,2人。国产电饭煲胜出。于是,根据这个结果,加上一些技术参数的比较,记者得出“国产电饭煲胜过日本电饭煲”的结论。
划重点
1. 实验法是通过操纵自变量、控制无关变量、观测因变量这样的逻辑,既找到了因果性,也能知道原因的效果大小。 2. 实验法特别适合范围有限、界定明确的概念和假设。因此,实验法最大的问题就在于结论的外推,一不小心就会把结论的适用范围错误地扩大。 3. 走出实验室做实验,让实验控制与真实的社会生活接近,会让实验的结论更可靠。
点击咨询~
【免责声明】
1、个别文章内容来源于网络善意转载,版权归原作者所有,如侵权,请联系删除;
2、所有图片来源于网络,版权归原作者所有。如有侵权问题请告知,我们会立即处理。

