测量:如何定量地把握一个事物?
上一讲,我们学习了两个重要的预备知识:一,数据、变量和表格是三个不同层级的概念;二,数据一共有四种类型,分别是类别、次序、间隔和比例。
预备知识准备好,我们就可以用它来工作了。做什么工作呢?
我们先讲一个盲人摸象的故事。故事的内容你肯定很熟悉。几个盲人被要求摸一头大象,告诉大家大象是什么。摸到大象牙齿的说,大象像大萝卜;摸到了耳朵的说,大象像大蒲扇;摸到腿的说像柱子;摸到尾巴的说像草绳。
这是一个非常好的隐喻,说明对事物的了解不能以偏概全。但是要我说,故事里的盲人比我们运气好多了。因为这些盲人是被确定地告知,有一头大象,就在这里,你要做的就是触摸它,然后告诉大家它像什么。这个前提太重要了。
反过来,现实生活中的我们,可比故事里的盲人差太多了。你摸过量子吗?看得见员工敬业度吗?抓得住现代化吗?这些东西看不见摸不着,甚至就是人们创造出来的观念,怎么定量地去把握它们呢?这就需要我们去测量。
注意,这一讲我们讨论的是测量一个完整的事物,甚至是一个抽象的概念,而不是测量事物的某一个指标。换句话说,我们是要测量大象、描述大象这种动物,而不是测量大象的身高、体重这样单一的指标。
现在问题来了,怎么才能做好测量呢?有哪些要注意的地方呢?这一讲,我们就说说这个问题。
测量的目标是什么?
在展开测量前,我们要明白的第一点就是——测量的目标是什么?答案很清楚,是必须得到一组指标。
举个例子,营商环境。我们都有感觉,在这个国家,干企业干买卖挺好干;在那个国家,就不好干。但是请注意,这叫感觉,如果你要做跨国投资,光凭感觉可不行,怎么确切地知道一个国家的营商环境究竟怎么样呢?
2019年10月,国务院发布了《优化营商环境条例》,自2020年1月1日起施行。其中对营商环境是怎么说的呢?条例是这样说的:营商环境是指市场主体在准入、生产经营、退出等过程中,涉及的政务环境、市场环境、法治环境、人文环境等有关外部因素和条件的总和。
这样的定义很准确,但它只是描述性的,拿着它,还是很难准确地把握一个地方的营商环境到底怎么样。所以,我们需要测量。
世界银行就是通过8个指标来衡量一个国家的营商环境的。我念一下这8个指标:创建一家企业的难易程度,取得营业执照的难易程度,雇佣工人的难易程度,解雇工人的难易程度,产权登记的难易程度,缴税的难易程度,跨境贸易的难易程度,关停企业的难易程度。
难易程度是能打分的,能拿数据准确表示。这样一来,一组8个指标合起来,就能迅速比较出全球不同国家的营商环境。所以说,测量就是一个得到指标体系的过程。
测量该怎么做?
现在我们知道了,测量的目标就是一组指标,可问题又来了——我们怎么找到这些合适的指标呢?换句话说,怎么确定测量什么指标,不测量什么指标呢?
比如,我们总说职场优势,怎么科学地评价一个人的职场优势在哪里?劣势在哪里?需要做哪些方面的测量呢?
方法当然有很多。这里介绍一种常用的,就是借助维度,对认知对象的各个属性进行拆分。
比如刚才的问题,怎么评价一个人的职场优势呢?
北森公司就提供了一个测评方法,分了5个维度,分别是动机能量、思维决策、情感成熟度、人际互动、任务执行。你说,动机能量也很复杂啊,指标还有很多,那就再分维度。北森公司继续分拆动机能量,具体来说,就是成功愿望、权力动机、亲和动机和活力四个维度。这样,找合适的指标的难度就降低了。
不知道你注意到没有,前面国务院的条例里其实也分解了营商环境不同的维度,分别是政务环境、市场环境、法治环境、人文环境,一共4个。
人文环境,说的就是文化传统、宗教信仰等对经济活动的影响。你看,国内有的地方,非要喝一顿大酒才能签单,也有的不是一个县的就被排斥,这就是人文环境的不同。这方面,世界银行的版本就没有考虑。没有考虑也挺好,毕竟世界银行是一个联合国经济组织,还是少涉及文化比较好。
听完这些例子,可能你会觉得,这些维度都确定好了,似乎就是唯一的答案。其实不是这样的。很多事物,人的认识不一致、角度不一致、目的不一致,维度的选取也就不一致。
举个例子,同情心,这个事物怎么分解成维度呢?有很多种方案。比如,可以分解为,感情方面的同情心和行动方面的同情心;也可以分解为,对人类的同情心和对动物的同情心;还可以分解为,宽恕他人的同情心和怜悯他人的同情心。这就有三种方案了,还可以有更多。
所以,如何分解维度反映了你如何理解事物。确定了维度,也就确定了要测量的指标。
不过要提醒你的是,虽然划分维度的方案有很多种,但并不是说维度和指标可以随意选择。在划分维度、选择指标时,我们至少要遵循两个原则。
第一,边际效应最 大化原则。
意思是,多增加一个指标是不是更好的说明了认知对象。如果是,那就增加;如果没有更好的说明认知对象,那就不需要增加。
比如对营商环境,8个指标是多了还是少了?那要看少一个会有什么损失,多一个会有什么好处。如果少了不能全面说明营商环境,那就不能少;多了没有什么意义,那就不需要增加。
第二,可靠性原则,也叫“信度”。
意思是,保证每次测量都能得到稳定的结果。前几年,国内有一家主流电视媒体做了一个报道,记者在田间街头随意拦截一些人,问对方:“你幸福吗?”有的人就误会了,回答说:“我姓曾。”这说明,不是每次测量都保证测量的就是幸福。这样做调查,就是可靠性不达标,或者说信度不达标。
真实的情况是,对于一个认知对象,大家会各自提出自己的指标体系,相互竞争,最后迭代出一个共识的方案。
怎么保证测量的就是你想测量的?
现在我们学会了找合适的指标,也得到了一组测量的结果。可问题又来了,怎么保证你测量的就是你想测量的呢?
这不是绕口令,而是一个非常重要的问题。这方面的学问也很庞大,术语叫“效度”,就是评价测量的有效性。那么,具体怎么做呢?怎么保证我们想测量A时测量到的确实是A,而不是B呢?
这里,简单介绍三种思路。
第一,考虑关联性。
比如,当初清华大学的国学大师们出考题,考题是对子的上联——“孙行者”,让学生对下联。这些大师认为,对联的水平与国学水平有关,测量对联水平就是在测量国学水平。
第二,考虑结构性。
很多变量在理论上是有联系的,如果有证据证明了这种联系,我们就可以说自己的测量是有效的。
比如,我们用某种方式测量了“婚姻满意度”,是不是有效呢?我们知道,如果婚姻不忠诚,对婚姻的满意度就不会高,这两个变量应该是密切相关的。所以,我们就可以看看测量的结果与婚姻忠诚度这个变量之间的关系。如果确实是相关的,我们对婚姻满意度的测量很可能是有效的;如果不相关,那就很可能无效。
第三,考虑完备性。
也就是看,测量的内容是不是全面包含了要认知的对象。比如测量数学能力,但是出的都是代数方面的题目,没有几何方面的,就很难说服大家这个测量全面考察了数学能力。
其实,之所以有这么多方法,就是因为没有什么办法可以确保测量的有效性。这正是我们这些真正的盲人面对的困境。
不过虽然如此,我们还是不能耍小聪明。小聪明就是“打哪指哪”,明明不知道测量出了什么,偏要强行解释我们完美地测量出了什么。这是自己骗自己。
有了上一讲和这一讲的铺垫,接下来我们就可以学习各种收集数据的方法了。下一讲,我们先说一个最经典的方法——抽样。
划重点
1. 测量的目标就是为了得到一组指标。这样一来,我们就可以用这组指标描述一个事物了。 2. 为了全面把握一个事物,测量时可以用维度拆分的方法,具体要遵循两个原则——边际效应最 大化原则和可靠性原则。 3. 为了保证测量的就是我们想测量的,我们需要用各种方法进行确认,考虑关联、结构和完备性是三个常用的方法。
在线咨询~
【免责声明】
1、个别文章内容来源于网络善意转载,版权归原作者所有,如侵权,请联系删除;
2、所有图片来源于网络,版权归原作者所有。如有侵权问题请告知,我们会立即处理。

