1. 测评常用术语解释
标准化测验
标准化测验是通过严格完整的程序编制的,具有事先确定的测验题目、规范的施测流程、客观的评分标准和标准的结果解释系统,此外还有测验的信度、效度和项目分析数据等相关资料用以说明测验的质量。因此,一套好的标准化测验的编制成本比较高,但相应地,它的科学性和价值也非常高,此外,一旦编制成功,它具有使用方便、经济、客观等特点。
编制一套标准化测验时,专业研究人员通常要经过如下几大步骤:确定与分析测量的目标和内容——题目的编写与排列——预测与题目分析——题目修订——规范测试程序和要求——样本收集与建立常模——信度效度等相关分析——制定结果解释
标准化测验能够对人的许多方面进行比较客观的评价,尤其在评价底层潜在的、不易从行为表现中直接观察出来的素质时,显示出比较高的有效性,如个性特征、智力、能力倾向、价值观、兴趣等。
信度
信度表示测量数据和结论的可靠性程度,即评价工具稳定地测评到它要测量的内容的程度。一般来说,检验信度有以下几种方法: 重测信度:在恰当的时间间隔前后,重复同样的测量,统计两次测量结果的匹配程度。 复本信度:用原本和复本同时进行测量,统计原本和复本测量结果的相关程度。 分半信度:在没有复本且不能重测的情况下,将同一测量内容的测验题目随机分成两组,统计两组测量结果的相关程度。 评分者信度:用于测量工具的标准化程度较低的情况下,比较典型的是评委主观评分的测量。不同评委的判分标准会影响测量的信度,因此需用计算两位评委评分的相关程度。
效度
效度表示评价的正确性程度,即评价工具准确地反映到它要测量的内容的程度。一般来说,检验效度有以下几种方法: 内容效度:系统地检查测量内容的适当性,即根据对要测量内容的了解去鉴别测验题目。 准则效度:用已经被假设或定义为测量某一内容有效的工具作为效标,当用新的测量工具对该内容进行测量时,统计测量结果与效标测量结果的一致性程度。 结构效度:系统地检查测量工具是否反映了要测量内容的概念和命题结构,这种方法常常在理论的研究中使用,因此也被称为理论效度。 从信度和效度的关系上来看,信度不高,效度必定不高;信度高,效度不一定高;效度不高,信度不一定不高;效度高,信度必定高。
常模
测量结果是否准确,常模(Norm)的适合性是非常关键的因素。常模是一群人在同一测量工具中得分的分布情形,这群人就是获得该常模的样本。某人在某一测量工具中的得分,需要经过常模的比较才具有意义和参考价值。例如,某人完成100题数学题,答对了70题,那么他的成绩属于优秀、普通还是不及格,就需要和他同年龄、同教育水平的群体进行比较。因此,为使测量结果更为准确,常模需要依据性别、年龄、学历,甚至所在区域、岗位性质、职位高低、行业背景等进行细分。
标准九分
它是一种标准分,将样本的测验原始得分划分为9部分,最高是9分,最低1分,除1和9的范围略大以外,其余均是以5为中心向两边各包含0.5个标准差的分数段。简单理解,即9为最高分,1为最低分,5为中间分。
掩饰性
受到测评动机的影响,被评价者在完成某些测验(如个性特征测验)时,有时会掩饰自身的真实情况,揣测测验编制者的出题用意,从社会赞许度较高的方向答题,容易导致测评结果不能准确反映被评价者的实际,甚至与实际截然相反。为鉴别真实回答与虚假回答,测验编制者在非能力测评的测验中加入掩饰性分量表,通过分析被评价在掩饰性分量表上的得分高低,了解其在测验过程中是否存在掩饰性以及掩饰程度,从而推断整个测验结果的准确性和有效性。
人机对话测试
将编制开发好的标准化测验通过软件技术加载在计算机上,并按照测验的规范要求设定操作程序。被评价者根据程序指引直接在计算机上答题,答题结束后,计算机自动统计各测量内容的得分,并对比事先设定的常模,得出测评结果。简单点说,人机对话测试就是在计算机上完成的测试。
目前,人机对话测试分单机版、局域网版、远程网络版几大类型。随着经济高速发展,企业规模不断扩大,网络技术日新月异,远程网络版人机对话测试逐渐成为主流,它不仅避免了传统纸笔测试在人力、物力、时间上的资源浪费,以及分数统计误差,还能解决不同地区同时测试统一管理的问题。
投射测验
主要用于对人格、动机等心理深层次内容的测量,它要求被评价者对一些模棱两可或模糊不清、结构不明确的刺激做出描述或反应,测评专家通过对这些反应的分析来推断被评价者的内在心理特点。投射测验基于这样一种假设:人们对外在事物的看法实际上反映出其内在的真实状态或特征。因此它可以使被评价者不愿表现的个性特征、内在冲突和态度更容易地表达出来,因而在对人格结构、内容的深度分析上有独特的功能。
但由于投射测验在计分和解释上相对缺乏客观标准,对测验结果的评价带有浓重的主观色彩,因此对主试和评分者的要求很高,一般的人事管理人员较难直接使用。
胜任素质或胜任力
胜任素质的研究始于20世纪60年代后期,通常人们也将胜任素质称为胜任力。1973年,心理学家麦克利兰提出,胜任素质是指从第一手材料直接发掘的、真正影响工作业绩的个人条件和行为特征。
关于胜任素质,麦克利兰又总结了五个特点: 1.了解绩效的最好途径是观察人们实际上做了什么而取得成功(即胜任力),而不是依靠基于智力之类的潜在特质和特性的假定。 2.测量和预测绩效最好的办法是让人们表现出你想要测量的胜任力的关键方面,而不是实施一个测验来评估潜在的特质和特性。 3.胜任力是可以学习和发展的,与此相反,特质和特性是遗传获得的,并且很难改变。 4.胜任力是可见的、可理解的,人们可以理解并发展出达到绩效所必须的胜任力水平。 5.胜任力和有意义的生活结果联系在一起,这些有意义的生活结果描述了人们在现实世界里一定会表现的方式,而绝非是只有心理学家才能理解的深奥的心理特质或构造。
素质模型或胜任力模型
岗位素质模型(或胜任力模型)是指在组织中成功担当某一职位(角色)所需的知识、技能及个性特质的特殊组合。它能够对在一个特定的组织中从事某项工作需要什么样的能力、知识与个性特质,以及什么样的行为表现对工作的高绩效有最显著、直接的影响进行清晰的描述。同时,它也能充分反映、融合组织的战略发展需求、价值观和核心竞争力。
素质模型由素质要素和素质级别两个部分组成。素质级别主要指同一职位类别不同岗位对能力素质的不同要求。因此每一素质模型都包含若干胜任素质,每一项胜任素质都有一条简短的定义和若干行为指标,每一行为指标又包含有一个叙述性定义和一个等级量表。
评估模型与素质模型的区别
由于素质模型中的素质要素通常是一种原则或者行为目标,通用性较强,缺乏针对岗位的具体指标(如追求卓越、精益求精等);又或者有些素质要素中包含了很多测评指标(如系统思维可分解为分析能力、统筹规划等),较难对素质要素本身进行直接测量。因此在现代人才测评中又提出了评估模型的概念。
评估模型是从岗位素质模型出发,将素质模型的各项素质要素作为一级指标,然后根据每个素质要素在特定企业和特定岗位中的要求,将每个一级指标分解为可直接测量的二级指标,一级指标和二级指标共同构成一个评估模型。评估模型中的二级指标一般从心理特征和能力层面将一级指标进行分解或合并,针对特定目标岗位,评估模型还说明了在每项测评指标上要求达到的等级。如同样在沟通协调能力上,对于银行的公司业务部总经理和风险管理部总经理的要求就有所不同.
心理测验
心理测验是指在对心理特质进行测量时所使用的工具,有时也称心理量表。通常它是由一组精心设计的测试题目或项目组成,其作用在于抽取一组标准化的行为样本,通过对这组行为反应进行观察分析,测验者就可以对引起行为的心理活动做出推论和解释。
心理测验是一种系统、科学、规范的施测和评定方式。包括:测验内容的标准化、测验实施过程的标准化、测评评分程序的标准化和测验结果解释的标准化。
心理测验能够对人的许多方面进行比较客观的评价,尤其在评价潜在的、不易从行为表现中直接观察出来的素质时,如个性特征、智力、能力倾向、价值观、兴趣等,具有很好的评价效果和较高的使用价值。
心理测验的编制是一个严谨的过程,包括确定的测验题目、规范的施测流程、客观的评分方法和标准的结果解释。此外标准化测验还要有信度、效度和项目分析等数据作为支持,用以说明测验的有效性和准确性。编制一套标准化测验时,专业研究人员通常要经过:确定测量目的——题目的编写与排列——预测——题目修订——规范测试流程和测试要求——建立常模样本库——分析信度和效度指标——制定结果解释。因此,一套好的心理测验的编制成本比较高,其科学性和实际应用价值也非常高。
心理测验是能够对人的智力、潜能、气质、性格、态度、兴趣等心理素质进行有效测度的标准化的测量工具,因其简便易行、程序规范、结果客观而在现代人员测评中广泛采用。
心理测验是一种标准化的测量工具。它由测验材料(文字题目、图画、操作工具等)、常模(即解释测验分数的标准)和测验指导书等组成。测验指导书是有关测验目的、内容、方式方法、施测程序、评分标准和方法、信效度资料以及常模和测验结果的解释标准等说明性的用户手册。尽管心理测验是一种标准化的、简便易行的测评工具和方法,也只有在使用得当的情况下才能发挥它的效用,否则会起到相反的效果。滥用、误用心理测验的事情在实际测评中时有发生,同时我们也还应该注意到心理测验往往是心理学家们在进行学术研究时发明的(如16PF),他应用的对象和目的与我们现实中的人才测评是有一定差异的,这些问题也是在测评中选择、使用心理测验要注意的。
心理测验在现代人才测评中倍受青睐,有两个方面原因,一是人的心理特质往往是一些比较稳定的、决定人的行为的深层次因素,因此心理测验来预测行为的准确性较高。二是心理测验的方法和技术比较成熟、标准化程度高、客观性强,容易使人产生信任感,这些特点也逐渐为其它测评方法所借鉴(如笔试法).
笔试法
笔试法是指测评前由专家命题制卷,以纸笔为测评材料的测评方法,如高考、自学考试、专业技术资格考试以及职业技能鉴定中的理论考试等所采用的都是笔试法。
一般认为笔试法特别擅长于知识的测评,对逻辑推理能力、文字表达能力、独立思考判断能力等要素的测评也是十分有效的。
应用笔试法应重点抓好试卷设计、测试和阅卷评分三个环节的工作。试卷的设计应做到取样合理,即试卷所含的试题应是所测内容的代表性样本,全面反映欲测的内容,而且要做到结构合理,各种试题应符合相应题型的规范,试卷的排版、印刷应符合阅读心理学规律。测试过程应做到实施规范,测试场地应选择安静、通风、光线明亮的地方,主试人员必须经过严格的培训,掌握测试的基本原理、要求、方法和程序。应使测评对象明确测试的目的、方法和要求,积极配合主试人员,尽最大努力发挥出自己的真实水平。阅卷评分应制定统一评分标准,采取分项流水作业、复核等方式,减少评分误差,使测试结果真实可靠。
笔试能够在统一时限内以团体方式对所有测评对象同时进行测试,所有的测评对象都使用同一份试卷(或等值复本试卷),测试的程序和规则相同,应试环境大体一致,能够比较有效地控制测试过程中各个环节的误差。因此,笔试具有实施简便、经济、易于接受等优点而在现代人才测评中广泛采用。其缺点是难于检测出应试者的实际工作能力,如组织管理能力、应变能力、环境适应能力、交往能力、沟通能力和谈判能力等。
面试法
面试是最古老而又最重要的一种人才评价选拔方法,在现代企业的人员招聘选拔中,几乎所有的企业都使用面试方法,有的兼有笔试,多数只使用面试一种方法来决定取舍。在国外一次调查中,56%的被调查者认为在人才的选拔过程中面试是最重要的,90%的组织在他们的人员选拔中使用了面试的方法。
在某种意义上,面试与笔试是互补的,即面试能够对笔试不能有效测评的一些要素进行有效的测评,反之亦然。面试主要用于测评被试如下方面的素质与特点:仪表举止,动机与态度,口头语言表达能力,综合分析能力,应变反应能力,综合分析能力,人际交往的意识与技巧,自我控制能力,如果面谈沟通得比较深入,对测评对象的性格、爱好、专业知识与技能等也能有较准确的把握。
评定法
评定是现代人才测评中最基本、也是使用最广泛的方法。评定,是指根据既定的标准,由评定者将测评对象的测评要素归入相应等级的过程。
评定法是传统考核中使用的基本方法,同时也是现代企业进行内部测评时采用的主要方法。笔试和心理测验都必须由被试自己亲自作答,具有不可替代性,而评定法除了用于自我评定外,最主要的还是用来进行他评,即由旁观者(同事、上级、下级、同行专家)对测评对象进行评定。在现代人才测评中,评定法主要用于对测评对象与岗位工作有关要素的测评,如工作业绩、质量、过程、工作行为等,同时随着测评活动的深入,越来越多的企业也使用评定法对员工的道德品质、工作态度、服务质量、思想观念、责任心、恒心毅力、对组织的忠诚等比较抽象和软性的要素的测评。 " 评定方法简便易行,适用范围广,凡是笔试、测验等量化程度高的方法难以测评的抽象的、综合性的测评要素都可用评定方法进行测评。其缺点是评定结果易受评定者主观动机、情绪、经验、知识和判断能力等主观因素的影响。
情景模拟法
所谓情景模拟是指模拟真实的工作环境和过程,让被试在模拟的情景中表现自己的才干,由评价员在旁边观察并根据测评要素进行评定的一种方法。情景模拟并不是一种新发明或创造,从古至今在人才测评的实践中经常运用,只是在现代人才选拔测评对其程序和方法进行了一些规范性处理,并形成了一些比较有特色的方法被广泛采用。
现代企业广泛应用的评价中心,其核心技术就是是情境模拟测试,即通过创设一种逼真的模拟管理情境或工作情境,将候选人放入情境中,要求其完成各种各样的工作。比如,在无领导小组讨论中,候选人与其他四、五名候选人一起围绕一个管理案例深入讨论,相互沟通、协调,进行集体决策,达成一致意见;在公文筐练习中,候选人要处理一堆公文,对管理中的各类事件进行分析、归类、处理、预测;在角色扮演中,候选人面对一位难以应对的 "下属"、"上级"或"客户",与他们进行一对一沟通,说服影响对方。在这一过程中,专业评委在一旁认真观察纪录候选人的行为表现,然后客观评价候选人的若干能力和素质。
评价中心通过设计特定的工作状态(如群体互动、一对一的单向或书面沟通的环境),运用多种测评手段,整合多位测评师的评价结果,对候选人现有能力,更对其潜在能力提供的客观、公正的评估,解决了过去对候选人工作能力及潜能的测评这一人才测评中的难点问题。
2. 公文筐测验
文件筐测试又称公文处理测验,在测验中,被评价者将扮演企业中某一重要角色(往往是目标岗位),然后把这一角色日常工作中常常遇到的各种类型的公文经过编辑加工,设计成若干种公文(文件筐)等待被评价者处理。这些待处理的公文包括各部门送来的各种报告,上级下发的各种文件,与企业相关的部门或业务单位发来的信函等等,其内容涉及企业经营管理的方面,如生产原材料的短缺、资金周转不灵、部门之间产生矛盾、职工福利、环境污染、生产安全问题、产品质量问题、市场开发问题等,既有重大决策问题,也有日常琐碎小事。要求被评价者对每一份文件都要作出处理,如写出处理或解决问题的意见,批示,或直接与部门的人员联系发布指示等等。
2.1操作要点:
◆给每位被评价者提供一个模拟的组织情境,并要求其扮演该组织中某一重要角色,要求被评价者在90分钟内按照要求处理有关联关系的8-12份文件,文件内容涉及到企业经营管理的各个方面,对每份文件都需给出书面处理意见及理由; ◆资料包括待处理的文件、评价标准和公文处理参考要点、评价表格、得分平衡表等。 ◆主要用来评价统筹规划能力、授权控制能力、协调能力、创新能力、战略决策能力、分析判断能力、资源配置能力、角色适应能力、书面表达能力等。 ◆适用于中高层管理者的选拔与评价。
3. 角色扮演
角色扮演是一种情景模拟测评法,通常的做法是选取和被评价者的工作相关的一个人际或工作情境,由一名角色扮演者饰演被评价者的客户、上级、同事、下属等角色。在这种活动中,评委设置了一系列尖锐的人际矛盾与人际冲突,要求被评价者扮演某一角色并进入角色情景,去处理各种问题和矛盾。评委通过对被评价者在不同人员角色的情景中表现出来的行为进行观察和记录,测评其素质潜能。 3.1操作要点
◆高度结构化的角色扮演往往需要经过精心的设计,被评价者在测评过程中的表现都会被记录下来,由评委根据评分规则对其进行客观准确的评价; ◆通过观察被评价者在模拟情境中的行为表现,我们可以评价其角色把握能力、人际关系的处理技巧、团队辅导能力、情绪控制能力、思维的敏捷性、应变能力、客户导向、培养下属和管理上级的能力、口头表达能力等指标; ◆通常一个结构化的角色扮演需要30-40分钟的时间; ◆适用于较高层级的管理者。
4. 无领导小组讨论
小组讨论的形式有两种,一是角色指定形式,二是无角色自由讨论形式。前者的代表是有领导小组讨论,后者的代表是无领导小组讨论。 小组讨论中典型的形式是无领导小组讨论(Leaderless Group Discussion,LGD),有关研究表明,它的使用频率为59%,是评价中心中常用的一种形式。在这种形式中,被评价者被划分为不同的小组,每组人数5-8人不等,不指定负责人,大家地位平等,要求就某些争议性较大的问题,例如额外补助金的分配、任务分担、干部提拔等问题进行讨论。最后要求形成一致意见,并推选一名成员向评委汇报。评价者则在一旁观察被评价者的行为表现并对其相关能力素质作出评价的一种方法。
4.1操作要点
◆通常由(5-8)被评价者集中起来组成小组,要求他们就某一问题开展不指定角色的自由讨论,3-5位评委通过对被评价者在讨论中的言语及非言语行为的观察作出评价; ◆LGD主要评价表达能力、沟通能力、分析判断能力、决策能力、团队领导、组织协调能力、人际影响力等指标; ◆LGD使用内容复杂、设计精巧的背景材料。它拥有一整套细致、客观的计分准则; ◆通常而言,一个高度结构化的LGD讨论需用时60-100分钟 ; ◆适用于中高层管理人员和对人际能力要求较高的一般人员(如销售代表)。
5. 评价中心 评价中心技术是现代人才测评理论及其应用高度发展的产物;它是一种系统化、标准化和综合性的人才测评方法和技术;它运用心理测验、面试、情境模拟等多种测评技术,对测评对象的性格、能力、潜能和行为表现进行综合评价。
在实施过程中,评价中心依据测评的目标岗位,将测评对象置于相应的模拟工作情境中,采用多种评价技术,观察和评价测评对象在该情境下的心理状况和能力素质,其目的是评价测评对象是否适合目标岗位,预测测评对象的能力、潜力与在目标岗位上的可能工作绩效,同时还可考察测评对象的欠缺之处,以确定使用、培养的方法
评价中心技术的本质可概括为多评委、多方法和情境模拟,具体为体现在以下几点:
真实性:采用评价中心进行测评时,测评对象的表现比较接近真实情况,不易做出伪装,对测评对象未来的表现有较好的预测效果。
综合性:评价中心的每一个情境都经过加工组合,把工作中的典型情况综合连接在一起,提高了测评的准确性,同时由于可以在同一种模拟情境中测评多种素质,扩大了测评的内容和范围。
动态性:采用评价中心进行测评时,测评对象可以进行相互作用,在这种互动过程中,测评对象的某些特征会得到更加清晰的暴露,更有利于对其进行评价。
行为性:评价中心技术借助客观的行为特征对测评对象进行评价,而所有的行为特征都是由实际管理工作中的活动和行为来定义和描述的,在实际使用中,又对每一行为特征进行了详细的界定和细致的描述。
标准化:评价中心虽然活动频繁、形式多样,但每个活动都必须按统一的测评需要进行设计。一般来说,整个测评活动的安排、所有评价者与测评对象的活动、所有测评内容,都必须以工作分析所确定的素质为目标。此外,每位评价者都必须接受统一培训,以保证评价中心在指导、时限、与测评对象的沟通交流等操作方面具有高度一致性,使每个测评对象都处于竞争机会均等的情境中,并可以获得同等表现自身能力素质的条件。
全面性:评价中心从不同的角度对测评对象进行观察,能对测评对象各方面的特点进行相互验证;评价中心在测评方式上突破了各种形式的限制,测评内容涉及到与目标岗位的工作相关的各种技能,从而给测评双方提供了多种表现和观察的机会;此外,评价者的多向结构也保证了观察范围的全面性。
目前,柏明顿已开发和使用的评价中心技术有12种之多,包括小组讨论(Group Discussion)或无领导小组讨论(LGD)、公文处理(In-Basket)、结构化情境面试、BEI行为面谈、管理游戏(management games)、角色扮演(role Play)、模拟面谈(Interview Simulation)、案例分析(Case Analysis)、事实判断(Fact Judgment)、演讲答辩等。 |