您当前的位置: 首页 >  面试

凌云时刻

暂无认证

  • 0浏览

    0关注

    1437博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

从心理学角度看,如何提高招聘面试的准确率?

凌云时刻 发布时间:2022-02-08 14:20:42 ,浏览量:0

作为团队leader,相信你在组建团队招聘面试方面已经身经百战、阅人无数。招聘过程中你应该也遇到过难以取舍的情形,也会有自己的喜爱偏好,这时,应该相信自己的直觉判断吗?

设想一个面试场景:候选人A曾在创业团队中摸爬滚打,实战经验丰富,思考深邃,能够透过现象直抓本质,让你有种“心动”的感觉,但可惜的是毕业学校不是985;另一个候选人B则是仪容干净,出身名校,有亮眼的外企就职经历,在面试过程中举止有度,回答问题时谈吐有方,但不足之处是年龄有些偏大。在判断两位候选人谁的未来职业空间更大时,你基于过去的面试经验一定有自己的喜爱偏好,这时应该相信自己的直觉判断吗?

专家的直觉性判断,到底可靠不可靠?

十多年前从学校毕业参加招聘面试时,很多互联网及IT公司特别流行使用“无领导小组”集体面试法:即将所有候选人划分为若干个小组,每个小组设定一个虚拟的情景,由小组成员自发进行讨论、解决问题。在这个过程中,面试官会在旁边观察、记录每个人的表现,包括他的领导能力、表达能力、创新能力、团队协作精神等等,最后给每个候选人评定一个综合能力得分。 在这里插入图片描述

时隔多年,我还依稀记得第一次参加“无领导小组”面试的情形,我们大约七八个候选人被分为一组,给定的虚拟情景是:

“假定我们乘坐一条小木船漂浮在大海上,此时发现木船正在漏水,接下来应该怎么办?”

接下来就是大家争先恐后、七嘴八舌的讨论过程。“无领导小组”面试法的原理,是希望借助面试官的丰富经验,通过观察模拟情景下每位候选人的行为表现,来推断该候选人未来在职场中的发展空间。这种面试方法深受很多公司的喜爱,几乎是校园招聘的标准动作。那么,这种测评方法真的科学可靠吗?

心理学家丹尼尔·卡尼曼在以色列军队工作期间,曾用“无领导小组”方式对新入伍的士兵进行了一项评估实验,通过对新兵在训练场上的行为表现,来预测他们将来在军官学校或战场上的发展潜力:

  • 每一组参加实验的有8个士兵,他们彼此互不相识,身上只贴数字标签以作区别。他们的任务是:8个人外加一根圆木,集体都要翻过一堵1.8米高的墙,整个过程中任何人都不许身体触碰到墙体,圆木既不能碰到地面也不能碰到墙体。一旦出现了任何一种违规情况,他们就必须重新开始。
  • 有两位考核官对士兵的行为进行观察,记录下在任务完成过程中谁在扮演leader角色,谁在积极地寻找解决办法,以及每位士兵的团队协作精神、面对危机时的不同反应等等。
  • 团队任务完成后,两位考核官要对这些新兵的领导能力和决策能力进行总结,并且给每位新兵未来在军官学校的表现给出一个评估分数。

这项评估实验持续了几年的时间,期间积累了大量士兵的评估数据。同时,等新兵完成评测转到军官学校开始正式学习后,每隔几个月丹尼尔·卡尼曼就会跟军官学校的教官召开一次会议,将当初“无领导小组”的评估结果与这些新兵在军官学校的实际表现进行对比。

最终结论是:当初对这些士兵的评估结果准确性极低,基本为0。

可见,即便是经验丰富的心理学专家,在情景化面试中仍然无法准确评估候选人在未来的实际表现。在这里,专家变成了“砖家”。但是,当我们身体不舒服去医院看病时,主治医师往往能通过你的病情描述就能准确判断出病因及症结。这时,医生的直觉性判断起到了关键性作用,可以为患者的抢救措施争取宝贵的先机。那么问题来了,同样都是各自领域的资深专家,为什么医疗诊断时专家的直觉很准确,而招聘面试时专家的判断却那么不靠谱呢?

什么场景下可以相信专家的判断?

大脑中的直觉判断是如何产生的? 我们之前介绍了大脑的决策过程其实是由“系统1”和“系统2”相互配合,来完成我们的思考、决策过程。其中“系统1”是一直处于运行状态,它不善于质疑,相信“眼见为实”,过往的记忆或经验对其影响很大;而“系统2”则处处相反,它默认是不工作的,只有“系统1”遇到无法解决的问题,需要“系统2”来帮助时它才会被唤起。它依靠理性进行工作,需要对信息进行分析、思考,可以处理复杂的问题。

在这里插入图片描述

为什么一名职业象棋选手在几秒钟内就能判断出一个棋局中“黑方获胜概率高还是红方概率高”?大脑是如何快速完成信息分析、记忆调取并给出最终决策方案的?美国著名认知心理学家加里·克莱因提出一种“预认知”决策制定理论:

  • 首先,由“系统1”自主调用联想记忆将备选方案呈现在大脑中。这个过程可以通过日常训练得以强化,使其形成“巴普洛夫条件反射”,日常训练的频率越高,大脑调取记忆的速度就越快;
  • 然后,“系统1”会激活“系统2”对这个方案进行模拟以检测其是否有效,如果“系统2”判断方案基本可行,那就会作为大脑的最终决策;如“系统2”经过深思熟虑判断方案不可行,则会通知“系统1”重新寻找替代方案。 在这里插入图片描述

从上述大脑的直觉判断流程中可以看到,“系统1调用记忆生成方案”和“系统2对方案在大脑中进行模拟”这两步关键动作,可以通过日常大量的训练来提升相应能力。那为什么不同领域专家的直觉判断有很大偏差呢?差异点是在第1步“信息输入”时的“场景复杂度”。

如果是一个相对简单、可选项相对收敛的场景,我们就比较容易找到其中的规律性,比如针对一副象棋残局,不同角色的棋子走法是被规则框定的,“马走日象走田”,这样黑方和红方能够选择的每一步剩余招数基本是可以穷举的,如果是经过长期训练的职业选手,就可以准确预测出来接下来的棋局走势。

而如果是一个比较复杂、影响因素比较多的场景,我们就很难从中找到其规律性,比如预测某个候选人未来在职场中的发展空间,这个不仅取决于其自身的业务能力、心理素质、情商水平,还会受到“所处行业政策是否稳定、业务增长速度是否够快、团队领导是否赏识”等其他诸多因素的影响,任何一项因素的变数都会影响最终的结果,此时专家的预判准确度就会很低。那么在复杂场景下,有哪些因素会影响我们的大脑决策过程,导致直觉判断不可靠呢?

为什么复杂场景下的专家直觉不可靠?

  1. 系统1对复杂问题进行了替换

在一个规律性较差或复杂度高的场景中,大脑的“启发性判断”就会被激活。当“系统1”遇到复杂性问题后,它可能不会激活“系统2”,而是把这个复杂问题替换为一个与之相关联但很简单的“启发性问题”,然后自己来回答,并且会把替代后的答案等同于原始问题的答案。

更重要的是,大脑会忽略自己已经替换了原始问题这个事实。由于“系统1”这个“狸猫换太子”的动作完成得非常迅速,所以它给出的答案能够轻松通过“系统2”的审查。我们利用“无领导小组”面试方法对候选人能力的判断就是一个“启发性判断”的典型案例。面试官在一个虚构的场景下观察候选人的言谈举止,根据其在一个小时内的表现去推断该候选人未来的发展潜力。这是一个复杂性的问题,于是大脑会不自觉地将其替换为“小组讨论中,他的表现好吗?”这个简单问题,并且大脑会将这个问题的答案,坚定的认为就是原来那个问题的答案。 在这里插入图片描述

大脑完成问题替换并得到最终答案后,反过来会进一步强化大脑对这个结论的自信程度。“系统1”的特点是“相信眼见为实”,即便是证据有限的情况下它也能得出结论,并能构建出一个逻辑非常连贯的故事。相对而言,证据的数量和质量并不那么重要,逻辑自洽才重要。大脑得到的最终结论,其逻辑上的连贯性能给人带来信心,逻辑越连贯,自信心就越强。

  1. 高门槛的技能容易诱发“技能错觉”

复杂场景下容易出现的第二个现象就是“技能错觉”,即行业专家对自身的专业技能过度自信,从而产生了一种无限放大的错觉,而忽略了“复杂场景难以预测”的本质特征。

最典型的职业是股票分析师,他们每天都会查询大量的行业发展及经济预测数据,查看各个上市企业的资产损益表和资产负债表,评估公司高管团队的管理水平,还要掌握行业竞争的变化情况。由于这些技能都有一定的专业门槛,从业人员都需要进行大量的专业化学习以及训练。所以他们认为自己拥有的就是高水平技能,由“专业技能”得出的“专业预测”也就越准确。

另外,股票分析师每天都会根据自己搜集的信息,按照自己的理论和逻辑对每天股市的涨跌情况进行分析、总结。只要大脑形成了一套逻辑连贯的解释理由,大脑就会信以为真。如果大脑每天都完成一遍“分析-解释-说服”的历程,长此以往经过反复练习,大脑就会认为已经把握了行业本质规律,掌握的理论不仅可以完美解释历史,并且还可以去推测未来。

专家们最常犯的错误,就是从已经发生的历史解读中去预测未来,但却忽视了“未来是不可预知的”这一事实。但是,他们面对的股票市场本身就是一个极其复杂的交易场所,每只股票的涨跌情况不仅受到企业自身经营状况的影响,还受到宏观层面国家经济发展走势、金融货币政策松紧程度、行业监管治理政策、大众群体心理预期等等众多因素的影响。即便股票分析师掌握了某个企业最全面的经营分析数据,但是他仍然无法判断当前的股价是被高估了还是被低估了,因为他无法回答的最关键问题是:

该公司当前的股价是由哪些信息反映出来的?是否已经包含了你已知的这些信息?

丹尼尔·卡尼曼曾经做过一项数据研究:针对一家金融投资公司的25位投资经理,根据他们每年的投资收益率由高到低进行排名。如果某些投资经理连续多年的排名都能名列前茅,那说明股票的投资收益确实跟每个人的专业能力相关,是他们的专业投资能力让他们保持了业绩排名的稳定性。

他调研了25位投资经理连续8年每年的投资收益排名数据; 以每两年的年终排名数据为一组,统计两者间的相关度系数,比如第一年和第二年,第一年和第三年……总共就会有28组相关度系数。 最终数据显示,28组相关度系数的平均值仅为0.01,也就是基本不相关,即股票的投资收益与专业技能没有关联关系。 在这里插入图片描述

  1. 外界条件的刺激会干扰系统1的判断

由于“系统1”是依靠直觉进行判断,它跟我们的感官系统密切相关,将视觉、嗅觉、听觉、触觉等感知到的信息进行综合处理,形成大脑的直觉和感觉等信息。这个特点就导致“系统1”会不可避免地被外界环境刺激物所干扰,在无意识中影响“系统1”的最终判断结果。耶鲁大学心理系教授劳伦斯·威廉姆斯和约翰·巴格曾经联合做过一个著名的“热咖啡”实验,以此证明外界环境如何在无意识状态下影响你的判断:

  • 参与实验者是41名女性大学生,平均年龄18岁,将其分为A、B两组;
  • 每位实验参与者独自来到一栋大楼的前台,由一位工作人员带领其乘坐电梯到四楼。工作人员手里拿着一杯咖啡、一个记录本。在乘坐电梯前往四楼的过程中,工作人员需要在记录本上记录下来参与者的姓名和时间,所以就会随口询问参与者是否可以帮忙拿一下咖啡杯。待工作人员记录填写完毕后,马上就把咖啡杯拿回来,这个过程仅仅持续几秒钟;
  • 整个实验过程中,唯一的区别是那个咖啡杯。A组参与者拿到的是一杯热咖啡,B组参与者拿到的是一杯冰咖啡;
  • 来到四楼后,每位参与者都会拿到同样的一段文字描述信息,其内容是对某个人(张三)的概括性描述,“聪明、有技巧、勤奋、果断、务实和谨慎”。然后工作人员会给每位参与者一张问卷,让其对“张三”在人际交往方面的热情程度进行判断,比如,他是快乐还是不快乐,是大方还是小气,合群还是孤僻等,每项指标1为最低分,7为最高分。

实验结果表明,触碰过热咖啡的参与者(哪怕只是接触了几秒钟的时间),会更倾向于问卷中的“张三”是一个“暖男型”的人,尽管他们根本没有见过这个人。他们给“张三”的综合评分平均是4.71分,明显高于触碰过冷咖啡的参与者(冷咖啡群体平均4.25分)。可见,仅仅是让面试官拿到一杯热咖啡,他在评估简历时对候选人的好感都能明显提升! 在这里插入图片描述

如何提高招聘面试的准确率?

综合来说,在复杂场景下,由于“系统1”会出现“复杂问题替换、技能错觉、外界环境干扰”等缺陷,从而影响了大脑信息判断的准确率。而招聘面试,本质上是对候选人未来职业表现的能力预测,恰恰属于复杂场景的范畴。那么,我们有什么方法能够有针对性地提升招聘面试的准确率呢?

面试应该依赖算法公式,而不是专家的直觉判断 由于“系统1”的特性是与生俱来的,它可以被针对性地引导、弱化,但不能被彻底地改变。所以我们应当在招聘面试这种复杂场景中尽可能减少人为地判断因素,而是让“没有感情”的机器/算法/公式去代替人的决策。业界有两种常见的行为评估方法:

  • 统计预测法(statistical prediction):通过搜集各种纬度的数据,借助数据统计模型按照某种规则来自动化生成预测结果,过程中尽量减少主观性意见;
  • 临床预测法(clinical prediction):通过访谈交流、心理测量评价以及搜集历史数据,借助专家的经验生成预测结果,这种方法以专家的主观性判断为基础。

心理学家西奥多·萨宾为了对比两种预测方法的优劣,曾做过一个“预测大学生期末成绩”的实验,实验对象是 162名刚刚进入大学一年级的新生(73名男同学和89名女同学),实验目标是分别使用两种预测方法来预测他们在第一学期期末的考试成绩排名。 在这里插入图片描述

从上表可以看到,统计预测法所依赖的数据,仅仅是临床预测法的一个数据子集,临床预测法不仅考虑了高中成绩、高考成绩,还叠加了专家访谈+大量的性格/能力测试等数据。依照这两种方法分别对162名大学生的期末成绩进行了预测,等到第一学期期末考试后,将他们实际的期末考试成绩与预测值进行比对,以验证其预测数据准确性。 在这里插入图片描述

最终结果非常惊人:简单粗暴的统计预测法,完胜了经验丰富、调研手段更灵活的博士辅导员,或者说,至少预测结果不次于临床预测法。

事后,通过对比两种预测方法背后模型的差异性,发现辅导员们根据自己的职业经验,在临床预测法中过高估计了其中2项信息数据的重要度,从而影响了整体的准确度。可见,在复杂场景下,要提升预测的准确度,就要减少人为的经验判断,算法公式可能比专家更可靠!

简单模型比复杂模型更可靠 那么,如果辅导员们将“临床预测法”中所需要的8个信息维度全部都转变为可衡量的数据,并设计一个复杂度更高的测算模型(比如用“回归分析法”针对8个信息维度设置不同的权重),即升级版的“统计预测法”,那预测结果准确度会不会更高呢?答案是不一定。心理学家罗宾·道斯致力于将数学统计模型应用在认知决策的研究领域,根据他的实验研究,简单的统计模型,往往比复杂的模型更有效:

  • 复杂模型,即以某种算法来针对模型中的每个变量设置不同的权重,以使随后的加权合成与实际标准值之间的相关性最大化;
  • 简单模型,用“简单粗暴”的方法来为每个变量设置权重,比如,通过专家的经验设置不同权重值,或从“临床预测法”的实践中推导出来,或者更简单粗暴地将所有变量的权重值设置为平均值。

原因是,专家在设计数学模型时,往往要考虑兼容非常特殊的一些场景,以此显示自己在该领域的专业性、考虑全面性。这样就导致,复杂的模型虽然增强了其场景的兼容性,但是对常见的80%以上的场景反而会降低其准确性。

“专家+算法”的组合可能是最优解 尽管我们一直在强调,在复杂场景下数学模型的预测效果要比专家判断更准确,但实际上,即便是最简单的数学模型,它所依赖的最关键的数学变量有哪几个维度,这仍然要借助行业专家的经验才能判断出来,所以我们无法完全脱离专家的价值贡献。因此,在招聘面试中,由行业专家来设计“岗位核心能力模型”,由数学公式来形成最终信息的整合,这种方式可能会有更好的效果:

  • 首先由经验丰富的专家根据拟招聘岗位的工作特点,来设计一个表格,列出该岗位最需要的候选人应具备的一级考核维度有哪些,比如专业技能、沟通能力、抗挫折能力等等,一级考核维度之间要相对独立,数量不要太多,4-6项为佳;
  • 针对每个一级维度去细化一些子问题,这些子问题的答案可以帮助面试官来判断候选人在这个一级维度上的能力强弱,最终用1~5分给一个量化评估结果。所以细化的子问题越多,就越容易客观地评估这个维度的能力。比如针对“沟通能力”这个一级维度,可以细化成一系列的子问题,“你想做的某个产品功能,研发同学不赞同,应该如何说服他?”“你的某些工作需要依赖其他团队,但是双方的KPI不匹配,应该如何洽谈合作?”等等;
  • 面试官要按顺序去评估每项一级考核维度,根据候选人的回答情况要立即完成对该项维度的评分。在完成这一项考核维度的评分之前,不能跳到下一个维度进行测评。其目的是为了避免“光环效应”的干扰(因为认可/讨厌候选人某个维度的能力,进而认可/讨厌其他维度的能力);
  • 当所有的一级考核维度都分别完成评分后,最后交给一个事先拟定好的算法公式来加权计算,生成该候选人最终的综合得分,同时面试官不要干预最终得分的计算过程;
  • 根据候选人的最终综合得分,挑选得分最高者来录用。

从心理学角度看,如何提高招聘面试的准确率?

关注
打赏
1663816507
查看更多评论
立即登录/注册

微信扫码登录

0.0467s