环球百事通!当机器人成为“面试官”

业界 | 2022-12-20 13:52:16
时间:2022-12-20 13:52:16   /   来源: 新京报      /   点击数:()

一个月内,图图完成了六场只有自己参加的面试。

点击面试邮件链接,对着镜头回答三到六个问题,总耗时不到20分钟——这是AI面试(人工智能面试)的流程。

面试结束后短短几分钟内,一份百分制的成绩单就和图图的简历绑定在一起,被递交给负责招聘的HR。


(资料图片仅供参考)

仿佛是流水线上的产品,求职者在机器精密复杂的数据分析后,被打上“优秀”或“不优秀”的标签。只有通过机器的面试,他们才有机会见上真人面试官。

不少求职者试图“讨好”机器人。有人精心准备面试题目库,反复背诵;有人事前录下练习片段,学习调整表情和语音语调;有人在反复试错中摸索AI的“喜好”;还有人在不断的失败中自我怀疑。

李斯特为参加AI面试搜集的题库及回答。受访者供图

只有一个人的面试

支起平板电脑,点开邮件链接,图图端坐在书桌前,在跳转页面中完成了信息确认和人脸识别验证。

屏幕左侧出现一个女性虚拟形象,短发,身穿职业装,手里拿着纸和笔。她是这场面试的面试官,在正式开始前,虚拟人用电子合成声,向图图介绍了如何录制和作答时间等注意事项。

一共有三道题目。

第一道题目是自我介绍,虚拟面试官读完题目后,图图有30秒时间来准备,作答时间为2分钟。

按下录制按钮,图图需要把脸放置在屏幕里提示的虚线框内,不能太高,也不能太低,如果超出这个区域,屏幕立马会弹出提醒。

图图看着对面的“非人类面试官”,莫名的紧张扑面而来。

“我甚至最简单的一句话都说不出来”,第一道题目图图就卡壳了,2分钟的作答时间显得无比漫长。

沉默中,她看着屏幕里虚拟面试官仍在点头,露出弧度不变的微笑,“感觉她在嘲讽我,我更说不出来了”。

图图觉得,在真人面试中能侃侃而谈的自己不见了。

AI面试产品中的虚拟面试官。图片来源:“多面”AI面试软件截图

在之前的实习面试中,她会观察面试官的反应和表情,并据此有针对性的进行下一步的回答。表达中的停顿、表情、手势,都可以帮助双方的沟通。如果某句话没有说好,图图会再重复一遍,继续解释她的意图。

“但你知道AI不会理解你,”图图很无奈,“比如某一句话重复多了,不仅没有得分还会减分。”

当“这是一场需要拿到高分的考试”压倒“这是一场交流”时,压力逐渐在弥漫。

第二道题目是“谈谈公司未来的发展”。

屏幕上是倒计时,停顿的五六秒内,图图大脑里一片空白,以及只有她自己能感觉到的尴尬。

没有寒暄和问候,没有互动和反馈,更没有个性化的问题。不到15分钟,图图秋招的第一场面试匆匆结束了,关掉摄像头的她像一只被放了气的气球。

图图就读于上海一所大学,会计专业。第一次收到AI面试的邮件通知时,她并没有在意这种形式,满心以为“表达真实的自己就可以了”。

后来,图图在社交平台上搜索“面经”时才知道,在她点击提交后,在短短几分钟、甚至更短的时间内,负责该岗位招聘的面试官会收到一份评分报告。这份报告,是综合分析她在录制视频中的作答文本、表情、声音等内容后得出的。

报告中的分数在该岗位全部求职者中的排名,决定着这次求职就此止步,还是进入下一轮。

在苏州读大学的叶子参与第一次AI面试时,做了“充足的准备”,但结果“可谓是惨败”。

叶子根据网上的“面经”总结,AI面试的题目大多都类似“宝洁八大问”,比如你做过的最有成就感的事、你最挫败的事、描述一次团队合作的经历、描述你如何制定了一个很高的目标,并且实现它等等。

由于准备时间较短,叶子耍了一个小聪明。她从网上整理了题库,按照“宝洁八大问”STAR原则模板——在什么情境(Situation)下,主要任务(Task)是什么,做了哪些行动(Action),结果(Result)如何——写好答案。然后在面试时把手机靠在屏幕旁,差不多照着读了一遍。

猜对了题目,全程表达流畅,叶子觉得自己该讲的点也都讲到了。结果,成绩让她大跌眼镜,只有61分,刚刚及格。

叶子开始反思自己的面试表现,并试图在社交平台上寻找“讨好AI面试官”的经验。

“是不是眼睛没有直视摄像头,总瞟手机屏幕会直接影响分数?是不是答题时间不足?是不是自己准备的案例比较复杂?不够直白、口语化的表达,没有踩到一些关键术语上?甚至我说了一些倒装句,AI不能明白我的意思?”

她怀疑自己可能踩了雷区。“读稿确实是作弊行为,人工智能在分析答案上未必智能,但在捕捉眼神、表情等方面应该很灵敏。”

但这些都只是叶子的猜测,“AI可以被讨好吗?谁能完全确定黑盒子里的规则呢?”

只需要找到候选人中88%的精英就够了

在招聘的另外一端,HR们的感受和庞大的求职者群体并不相同,他们更在意如何利用更高效的方式筛选出相对合适的候选人,AI面试就是这样的选择。

AI面试是指采用语音识别、图像识别等人工智能技术对候选人进行面试,并对答案进行分析,然后根据职位所需的特质进行赋分,给出评分报告,筛选出得分较高的候选人,HR结合简历来判断是否进行后续的面试。

2004年美国诞生全球首个AI视频面试领域的服务商,从2017年开始,国内陆续有研发AI视频面试的公司出现。

它被引入招聘面试环节,承担着“初面”的功能,应用于在面向应届毕业生(或实习生)的高竞争岗位,例如银行、投资机构、头部外企的校招。另外,AI面试也被用于销售、导购、服务人员等岗位的招聘。

万森是一家大型银行总部的人力资源专家,他所在公司从2018年开始使用人工智能辅助简历筛选,后续开始采购AI面试的服务。

在万森看来,这种面试形式适用于有大量初筛需求的公司,对大型公司来说,初筛的效率对招聘进度的影响程度很大。

万森算了一笔账,以5分钟的视频为例,人工观看最快也要2分钟,人工智能则可以在10秒内完成数据分析。

而“快速筛选、降低成本”,也是市面上主流的 AI 面试产品的核心卖点。

根据多位HR介绍,一次传统面试的时间大约需要30分钟。而猎聘网旗下的“多面AI面试”可以帮助3名面试官在48小时内完成5000人的初筛面试。近屿智能的“AI得贤招聘官”,在小规模的面试场景中,可为人类面试官节省至少65%的面试时间。以100份简历录取2人的场景为例,使用AI面试后,招聘时间从2220分钟缩短至507分钟,效率提升约4.5倍。

那么,一场AI面试是如何开始的?

在招聘开始前,万森会根据公司需求,确定每个岗位候选人需要考核的能力。

以销售岗位为例,万森希望找到性格活泼、能说会道的候选人,如果有对外业务,会希望候选人有优秀的外语能力。因此他会注重人际交往能力、市场洞察力、性格特征等几个方面。

在每个AI面试产品的后台,都有许多常见的胜任力模型供选择,例如沟通能力、执行力、逻辑思维、创新能力、内驱力等几十种,而每一种能力后面都有推荐的面试题目。

某平台发布的AI模拟面试题。图片来源:网络截图

这意味着,每一个职位所需要的技能,都需要被标准量化。比如“请结合实际经历,谈谈你是如何在新环境中融入团队并适应学习或工作的”,关注的是候选人的“抗压能力”和“学习反思”能力。

近屿智能CEO方小雷认为,胜任力模型是目前人力资源领域最科学和底层的基础方法,这些维度和标签是根据企业咨询和真实面试案例梳理制定,据此制定AI面试考察的方向。

除了配置某个岗位需要考核的能力,万森还会根据不同能力的重要性来调整不同的分数占比。

当岗位的素质模型确定后,在内部测试中,万森所在的部门会向该模型输入去年收到的简历及面试视频,标注已录取的候选人,“让机器去学习我们的喜好, 告诉它回答到哪些方面能拿到高分。”

而求职者在AI面试得分的高低,就取决于和模型的相似程度。

万森介绍,读取语言部分的信息,只是人工智能收集的一部分信息,视频中非语言信息也会成为判分的依据。例如,人工智能可以根据谈话的语速、语调来判断性格特征;或是根据面部表情来判断情绪。

在全部面试完成后,万森所在的部门会人工观看每一个岗位面试评分的前十名和后十名。通过对比机器和人工的评分结果,一旦出现严重不匹配的情况,该岗位会重新进行测评,但他说“目前还没出现重测”。

从面试结果上看,AI面试没有淘汰人,只是给出了建议,最后依旧是人工选择进入下一轮面试的人选。但据多位HR反映,他们不会看所有的视频,会直接淘汰排名靠后的人选。

“会有遗珠,肯定是有一些优秀的人没办法通过AI筛选出来”,但万森也承认人事部门不会为此花上几百个小时去寻找,他们只需要找到这一批候选人中88%的精英就够了。

把自己当成“机器人”

求职者们在不断失败中反思自己,也在各大社交平台上搜寻“讨好AI秘笈”。

叶子为第二次AI面试做了更加充足的准备,这是一家头部快消公司的管培生岗位。

叶子录下了练习视频,发现自己面对镜头时表情很拘谨,不自然,眼神经常飘去其他地方;遇到卡壳时会有小动作,声音颤抖。

为此她早早预约了图书馆的研讨室,叶子把自己准备的答案背得滚瓜烂熟,做好表情管理,练习语速流畅,以及让声音保持饱满的感情,还对着镜子练习了微笑。

和叶子一样,李斯特也在失败中不断自我怀疑。

李斯特是英国一所大学的市场营销专业硕士研究生,她的秋招开始得更早,求职方向是快消外企、奢饰品、零售和地产方向。8月3日,她投递了第一份简历。截至目前,她参加了15场AI面试,通过了5场。

李斯特的秋招投递表格。受访者供图

11月1日下午参加的那场奢饰品行业的AI面试,让李斯特摸索出一个简单且重要的结论,这可能也是她之前10次都失败的原因。

“盯着手机摄像头亮起的绿点。”

当天晚上快九点,李斯特收到了AI面试产品平台工作人员的电话,询问她有没有时间参加第二天的群面,并告知她的AI面试得分特别高,求职公司的HR希望能够尽早见到她。

“我之前所有说的内容都是差不多的,结构化面试的题目是很相似的,唯一的区别就在于我那一次死盯着绿色的点,而之前都是看屏幕中的自己。”

这是李斯特前一天在AI面试技巧帖子的评论区中看到的,有网友说自己做了这样的测试。“没有任何官方信息告诉我们眼睛盯着的地方对整体分数影响,所以导致前面很多家公司我没有与真人沟通的机会了。”

一开始,李斯特尝试跟机器人聊天。“因为招聘的公司不会完全承认自己只看测评分数,部分HR说他们真的会看内容的,我早期抱着幻想。”

她试图把对面当成真人,用一些轻松的语气开一些玩笑,以及口语化的表达。但迟迟没有下一轮通知,让李斯特意识到这样不行,“分数不够高,HR看不见你。”

把自己当成“机器人”,去迎合人工智能的评分标准,李斯特开始尝试用机器化的方式去回答问题。

比如AI面试官问,“举例说明面对复杂问题时,如何定位关键点并找出解决方案。”

李斯特能够识别出这是想要考察解决问题的能力。在真人面前,她会直接从亮点说起,然后根据面试官的兴趣展现自己的能力。在AI面试中,李斯特只能按照时间线的顺序回答。“第一件事是梳理资源,第二件事是展开调查,第三是把已有资源量化,第四呈现具体方案。”她感觉自己逐渐从一个立体的人变成了平面的人。

一切都以机器的喜好为先,但有时候李斯特搞不清楚机器喜欢什么。比如当AI面试官问,“当你需要严格按照一个政策或规定,而这个规定对你来讲是不方便的,你会怎么做?”

如果在跟真人聊,李斯特会强调自己的灵活性,既尊重这个规则,但也会很灵活的去处理。但在面对AI的时候,“我不确定AI是更注重我的灵活性,还是更注重我是不是一个守规则的人。”

算法的判断可靠吗?

事实上,AI面试官的“能力”取决于多种因素,不同公司的算法逻辑也不尽相同。

一位人工智能领域的专家认为,目前AI面试产品并不是一个成型的行业,只是人工智能应用的一个场景,因此缺乏统一的行业标准,更多是根据客户的需求进行开发,“比如有的需要题库多,有的需要灵活,谁说了算?谁说了也不算”。

在“多面AI面试”中,市场部负责人叶小舟介绍,决定结果有效性的主要有两点:首先是构建数据模型时,机器学习的输入数据量和其有效性,其次是人类面试官对结果反馈的准确性。多面AI面试是学习人类面试官判定规则,如果人类面试的结果不准确,那多面AI面试结果的有效性就无法保证。

而在“AI得贤招聘官”中,AI面试官的语义分析水平,决定着对候选人回答内容的解析准确度。近屿智能CEO方小雷解释,就是让人工智能理解话语,理解“一个句子放在一句段话中的意思”。

如果AI面试产品处于“关键词分析算法”阶段,通过提取候选人回答文本中的关键词,来评判候选人回答问题的好坏,方小雷认为面试结果“会产生误判”。“(某个回答)堆砌很多词藻,命中很多关键词,但它是言之无物的,算法用一个加减乘除的公式表达,这种时候分数都是会出现问题。”

在方小雷看来,只有达到“篇章级别的理解”的程度,才能说AI面试的结果是有效的。简单来说,“篇章级别的语义识别算法”就是让人工智能理解“一个句子放在一句段话中的意思”。

AI面试视频中的语义、语音和面孔图像是三种完全不同的信号源。除了对候选人的回答内容进行分析,AI面试还会对求职者的表情、声音等非语言部分进行分析。

但方小雷称,AI面试产品很难识别微表情。他认为,目前心理学上对微表情的研究并不充分。比如一个人的眼睛朝左看一下是在回忆,但也有大量的人在想象时,眼球也会向左转动,因此不能作为判断的标准来训练机器。他说现阶段表情识别只做到“宏表情”,也即判断开心、悲伤、愤怒、厌恶、恐惧等几种明确的表情。

“命中率”高,也即同一个候选人的人工评分和机器评分的一致性高,是大部分AI面试产品用来评估有效性的方法。市面主流的AI面试产品官方数据显示,人工智能面试官的筛选出来的结果相对准确。比如“多面AI面试”的判断结果与人工判断结果的吻合率达90%以上。在大规模的面试场景中,近屿智能的“AI得贤招聘官”的正确性远超人类面试官的平均水平。“海纳招聘AI面试”则声称精准度高达98%。

上述人工智能专家提到,“机器学习不管过程”。即使作为开发者,也只能从结果推论出求职者大概怎样做才能取得高分,但他也无从得知求职者说出哪些关键词必定会加分;或者要以怎样的语速和语调,或保持怎样的表情神态作答才能满足AI的要求——因为AI评分是连同用字及表情等多个项目分析得来的结果,并非如语速适中就会加分般简单。

这背后是AI深度学习模仿人类的神经网路,当中牵涉庞大的复杂计算。香港中文大学计算机科学与工程学系系主任金国庆教授曾在接受采访时形容,深度学习的过程就像人类学习踏单车,虽然不能描述出如何保持单车平衡,但只知道反复练习便能学会这项技能。

AI面试官的学习方式就是,收集大量的候选人样本数据,并人工标注打分,将其输入机器。系统学习了经人类分析的资料后,会自动把新输入的资料(面试片段中求职者表现)和结果(反映出的性格)联系起来,比如一些使用一些积极的词汇,代表着候选人的性格积极等。

在万森看来,AI面试存在着明显的优点。比如机器的统一标准能规避人类面试官的主观性判断。万森曾做过一项研究发现,面试官更倾向于录取与自己同校的候选人。而当面试官精力有限,比如工作了4小时或更长时间以后会出现“疲劳审视”,也会影响对候选人的判断。

方小雷也认为,AI面试的高效率可以给所有候选人一个公平的机会。如果一个岗位收到了1000份简历,可能真人面试官在面试100人里面就已经找到了合适的,这意味着后面900个人会被自动淘汰。

但万森也承认,“AI很明显还没有达到人的智慧”。初筛需要完成的是求职者的特质和岗位之间的初步磨合,因此他们不会在这个环节问很复杂的场景式问题。

不是所有的岗位都适合AI面试。万森曾经遇到过一些非常优秀的程序员,由于不善言辞,在AI面试中的评分很低。他所在的公司经过权衡后,技术类岗位由笔试进行初筛,“毕竟AI不能帮你解决所有事。”

这个看起来更省事、更加公平的工具也让一些HR充满困惑。

宋威是一家第三方人力资源公司的项目经理,曾为某公司招聘大量客服人员,在他看来,人工智能也许可以筛选出表达和沟通能力良好的人,但是没办法对候选人的态度进行判断。

另外,他还担忧,AI面试可以判断一个人的综合能力,但它可能无法感知一个人的内心世界以及最深的人生动力。

AI会改变我们吗

“在系统中翻滚”,图图这样形容她的秋招。参加AI面试的同学们大多有这样一种感觉:求职的人就像一批产品在流水线中循环,仅凭系统根据复杂的计算筛选出标准化产品。

而当AI面试重复太多次,“结构化面试的一套答案就会成为肌肉记忆”,大脑一听到关键词就形成条件反射。

AI面试强调一致性而非多元化。李斯特觉得,所有应届生进入职场的过程,就像公司在筛选最适合的工具的过程,而且大部分公司都是只需要螺丝钉的,它不需要个人的。AI面试中确定的岗位特质标签,李斯特认为更应该是一种偏好,而不是一种标准,但当对方拒绝沟通时,她就没有办法输入个性化的东西。

“思维僵化”,当李斯特的AI面试和真人面试同时进行时,她很明显地感受到这一点。

那是一个汽车公司市场岗位的最后一轮面试,面试官为岗位所属事业部的HR,面试官的提问恰好也类似“宝洁八大问”。李斯特几乎迅速地搬出应对AI面试官的那一套框架来,就像背答案一样。

有博主在社交平台上分享关于宝洁公司的面试方法。图片来源:网络截图

最后李斯特被拒了,该公司的反馈是觉得她对这个行业不够热情。

面试者需要花费很大的力气,付出很大的勇气,才敢把话语权拉回到自己这一边。“可能只有经历了个人成长,内心更加坚定强大,更加抗冲击时,才敢于去做双向选择,才会敢于主动丢掉跟自己不匹配的公司。”

“求职中一个很残酷的事实是面试者其实处在比较弱势的位置,”万森曾提到了他在社交媒体上做职场面试博主的初衷。

他常常分享自己作为面试官,提出问题时到底想了解的是什么,希望帮助同学们更好的理解面试官,弥补上双方之间的不了解。

万森遇到过抱怨吐槽AI面试冷酷无情的求职者,他总是劝同学们调整心态,把它当作游戏中闯关打boss。

至于如何提前做准备,叶小舟提到多面研发了模拟训练间,并搜集了大厂题库提供给学生练习,希望帮助他们提前适应面试环境。

相比之下,李斯特更喜欢一些允许充分表达自己性格的公司。

高分通过那场奢饰品行业的AI面试后,李斯特进入了下面的流程,在线下面试中再次条件反射般准备“输出一套结构化答案”。

她惊喜地听到面试官明确表达“我不想听,我对这个不感兴趣”,并告诉她“就是想正常的聊一聊,看看合不合我眼缘。”

“放飞地去聊天”,李斯特当即决定。

两人聊了做这个工作最关键的三个点和如何看待某一种工作,猜测某家店的营业额。“我回答问题的方式变成了他洞察我思维方式的手段,回答的内容变成了判断我业务能力的素材”。

最后这场面试,李斯特当场通过。

新京报记者 李聪 编辑 陈晓舒 校对 李立军

标签:

最近更新