当今的中国是骗子横行的时代。说“钱多人傻”似乎有些刻薄,不过可以肯定的是:国人的腰包确实鼓了;很多人的知识结构和水平不足以鉴别真伪。这给了很多骗子可乘之机。事实上,随便去欧美淘一淘三四十年前的老骗术就可以轻松回国骗钱。对很多人来说,骗与不骗是良心问题,不是能不能的问题。
心理学是重灾区。中国心理学最近 20 年发展迅猛,但是和世界水平还相距甚远,更远远满足不了国内人民的巨大需求。于是就给了很多人可乘之机。据说某个从未受过正规心理学训练的非专业人士靠几天培训拿下一个 MBTI[1]的证书就可以两个小时收取 1500 元咨询费。且不说 MBTI 测验其实很容易获取,随便一个商学院老师就可以轻松搞到;重要的是 MBTI 不但不像吹的那么神,简直可以说完全没有用处,不能帮助人了解自己,更无法有效规划职业,更不要说由一个不懂心理测量的外行来解释。
MBTI 测试中使用的 4 个维度。图片来源:dylanninin.com
MBTI 测试会将人归入上述 16 种性格之一。图片来源:dylanninin.com
下面我就以 MBTI 为例来讲解一些心理测量的基本原理,帮助大家识别有价值的和欺人的心理测量工具。
理论基础:完全缺乏实证
先简单回顾一下 MBTI 的来龙去脉。1921 年,卡尔·荣格(是的,就是弗洛伊德的朋友那个荣格)一拍脑门就写了本书,叫做《心理类型》(Psychological Types),里面提出了 4 个维度,把人按照人格分成 16 种类型[2]。大家不要急着责怪荣格,他明确指出了这个分类只是出自自己的观察,有待实证检验。1942 年,凯瑟琳·布里格斯从费城某银行的人力资源经理那里学习了一些测验的基本方法,她于是和女儿一起,这对没有经过任何正规心理学培训的母女就开发出了这个 70 年后仍经久不衰的 MBTI 测验。你可能会说,不要小看“民科”,英雄不问出处,人家母女不能自学成才么。其实,心理学界真的不是因为歧视人家母女才挤兑 MBTI,再说荣格可是大名鼎鼎的。MBTI 的问题还是在于这个测验本身。
测量工具:信度差是致命问题
心理测验是根据理论开发的测量工具,要判断工具的有效性首先要从理论入手。荣格对心理的把握还是很有一套的,他提出来的内外向维度可能是有史以来最广为人知的心理类型。不过荣格和很多当时同时代的心理学家一样,理论强但是缺乏实证的训练。他的 4 种心理类型理论现在已经被实证基础更强、更全面、更经得起推敲的“大五”人格理论所取代[3]。从这个角度来说,不能就说荣格的理论是完全错误、没有价值的,但是已经有了更好的理论,为什么还要抱残守缺呢?
但 MBTI 最致命的问题,来自它的测量工具。
判断一个测验是否有效需要考察两个指标:信度和效度。这里先说前者。信度简单来说就是测量工具的一致性。比如尺子是测量身高的工具,信度高的尺子不管是今天测还是明天测,不管是在中国测还是在美国测,不管是你来测还是我来,结果都是一样的。如果测出来的结果差异太大,这尺子就要扔掉,因为信度太差。MBTI 就是信度很差的一把心理测量的“尺子”。同一个人,今天测量可能是个 ENTJ,过几天可能就是个 INFP(大家莫担心,这些字母不过是表示你属于哪一类,这里无需考虑具体含义)[4]。
为什么会信度低呢?问题首先出在背后的理论上。假设要画老虎,找不到老虎怎么办,只好照猫画虎。理论(猫)是对现实(虎)的抽象,测验工具(画)是对该理论的量化表达。问题是照猫画虎,画得再像也不是老虎。
MBTI 理论中,评价人的个性有 4 个维度:内向型-外向型、直觉型-实感型、理解型-判断型以及思考型-情感型。所有人在每个维度上都是非此即彼,即要么内向,要么外向;要么思考型,要么情感型。但实际上这 4 个维度中,只有内外向是符合这个描述的——即一个人要么内向,要么外向,不能同时兼备。其他 3 个维度上这个说法则是错误的:一个人完全可以智商很高(思考型),同时情商(情感型)也高,或者二者都很低。因此这个二分法是对现实对一个错误描述,是有缺陷的。
另外,二分法认为人群的分布符合双峰分布而不是正态分布。举例来说,人类的身高就是双峰分布,比如下图中男性身高多集中在 70 英寸(177 厘米),女人则是 65 英寸(165 厘米);而如果只考虑男人的身高,就是正态分布。在同一个维度上,证据表明人类心理是正态分布,而不是双峰分布。
记分方法:“强行”归类不靠谱
MBTI 的记分方法也是遵循这个二分法,这也是信度低的最主要原因。
MBTI 的记分方法有两大问题。一是迫选。MBTI 的题目是二选一。比如你是喜欢坐在屋里看电视还是喜欢找人侃大山。甲根本无法独处,时刻和朋友在一起。乙两者都喜欢,不过侃大山的时候更多些。丙其实独处更多些,但是刚刚和好基友倾谈了一番,于是自然选择了侃大山。根据答案,这 3 个差别很大的人都被归类为外向。等下周再测的时候,乙和丙手一抖就能变成内向。而绝大部分人更接近乙和丙而不是甲,因此 MBTI 的重测信度很差。迫选的理由是因为背后的理论,前面说过了双峰分布理论是错误的,因此迫选法也是有问题的。
二是分类。MBTI 在每个维度上把人分为两类,如果你得分超过中值,就归为一类,否则为另一类。以内外向为例,得分 51%(甲)和 90%(乙)都会归为外向。事实上,甲更接近丙(49%)而不是乙,而丙的 MBTI 类型则是内向。
在其他 3 个维度上,分成两类问题更大。以思考型-情感型为例,甲智商很高,遇事爱思考,同时情商也高,让他在思考型和情感型之间迫选会很痛苦。乙智商情商都很平庸,让他在两者之间迫选估计和甲一样痛苦。丙的智商明显高于情商。这三个人最终可能都选择了思考型,从得分上看没有区别,但是这三个人事实上区别很大。
因此,任何把人强分入几类的,不管是用颜色、星座还是任何其他东西,都是胡扯。按照 MBTI,全世界才 16 种人,可信么?
测量效度:信度都没有,谈啥效度啊?
效度是考察测量工具的另一个关键指标。简单来说,效度就是该工具测量出来的东西是否有效,能否预测重要的结果。一个测量光有信度是不够的。比如星座的信度就极高,只要知道你的出生日期任何人都几乎可以 100% 的知道你的星座,问题是星座测量再准确也是无用,因为星座的理论是错误的,人出生的时辰和人的性格,运势,姻缘没半毛钱关系。效度的检验大体是这样的:假如理论说A推出B,结果A的测量工具果然能够预测B,那么就是效度高。
当理论是正确的,测验工具的信度就会影响效度。比如,身高和体重有正相关,因此知道了身高就可以在一定程度上预测体重。信度越高的测量身高的工具预测体重就越准确。
信度是效度的基础。信度低的工具,每次测量的结果都不同,怎么能准确预测任何东西。MBTI 的信度就很低,因此效度根本无从谈起。
靠谱的大五人格,也不可过分迷信
你可能会说,如果只是迫选和分类的问题,那改良一下不就得了?或者既然分类法问题这么大,为什么很多心理学理论都在用呢?难道用分类的都不科学?或者既然 MBTI 不科学,那么我想了解自己的个性怎么办呢?
如果你问得出前两个问题,说明你的批判思维很强,赞一个。
以内外向为例,这是 MBTI 的一个维度,也是目前心理学界比较公认的最为靠谱的“大五”人格理论中最重要的维度之一(你看,心理学界并不歧视荣格或者迈尔斯母女)。另外,先不要忙着指责:16 个分类不行,5 个怎么会更靠谱?要记住,这 5 个是“维度”,不是“分类”。大五人格能预测很多重要的指标[5],比如工作表现,学业成绩等。现在也有很多证据证明基因对大五人格的影响,甚至大五人格也被证明具有神经基础。
虽然大五人格被广为接受,但过分相信大五人格测验仍然是危险的。以尺子为例,用它来测量身高的误差是很小的,用数字来说可以轻松达到 0.99(1.00 是满分,代表没有误差)甚至更高,因此可以信任。而人格测量的信度极少能达到 0.90。因此必须明白大五人格测验的结果可以参考,但不能迷信。你要是批评说:“你们心理学搞了 100 多年才搞到这样”?我只能回答:“是的”。考虑到人的复杂性,这已经是很了不起的成就了。
心理学给不了你人生的终极解答
总结来说,考察一个测验要看它的信度和效度。信度取决于具体的测量实践(如题目选取、记分方法、汇报形式等)。迫选和人为分类是早期心理测量常用的方法,因为其信度低,所以已经被其他量化方法所取代。简单分类也已经基本消失。一个靠谱的心理学家不会简单地说你是内向或者外向,而会说你的得分在内外向维度上的排名是多少百分比,至少也要加上你是非常外向,比较外向,还是接近中间(和大多数人一样,既不怎么外向也不怎么内向)。这是给个人反馈用,如果是专业用途(如招聘选拔),还有更多的细节要注意。
希望大家看完这篇文章,能掌握基本的判断心理测验的基本概念:信度和效度。另外无论是自测还是有专家解读的时候,都要记住心理测验的功能和局限性。考虑到人群是正态分布的,我们大部分人都更接近中等外向,中等宜人,中等尽责等等。
对于生活,我们每个人都有很多问题,我的命运是什么,该干什么工作,该娶谁做老婆等等等等。好消息是,心理学能给出一些答案,比如一些婚恋机构就通过心理测试来进行匹配,并且取得了一些成就(好于随机配对)。坏消息是,这些答案恐怕不是很多人心目中的终极答案。毕竟生活还是要你自己去过的。但有一点可以确定的是:心理学解答不了,星象什么的更是不行。
心理测量工具也有高下之分,明白了信度和效度,至少就不容易被哄骗了。(编辑:球藻怪)