教育测量(Educational Measurement)
目录 |
教育测量是指对于教育领域内的各种事物或现象,根据一定规则进行考核,并将考核结果用数量描述出来,它可以包括对各种教育活动的测量。
教育评估的发展,是科学技术的发展进步在教育界的反映,它是以追求客观性而展开的。通过考试的实践使人们看到,笔试法的客观性确实高于口试法,教育评估向客观化迈进了一步。探讨教育评估的由来与发展,必须对教育测量有所了解,因为测量是以追求客观的量化结果为目的的。
(一)教育测量的意义
教育测量主要是通过考试来使学生的学业成就数量化的。测量,“测、度、量、称也”,“以仪器推测地面之高低、深浅、大小、广狭,谓之测量。”史蒂芬斯(S.S.Stevens)认为:“就广义来说,测量是按照法则(规则)给事物指派数字。”可见,测量就是根据测量对象的需要,运用适当的量具,按照一定的操作程序(法则),进行测、度、量、称,表现相应结果的一种技术。考试一般只对人的知识和技能的识记、理解、应用、分析综合和评价等进行测量。考试不能对物质的实态进行测量,而测量比考试的对象更广泛,它不仅包括对物质实态的直接测量,而且包括对人的精神世界的间接测量,如心理、教育程度、知识、技能、智力、兴趣、气质、性格、品德、情感、体质等,教育测量所能做到的,如需要测量、动机测量、态度测量、德育测量等,用考试方法或者无能为力,或者只是一种辅助手段。因此,考试是教育测量的手段之一。
在教育评估的历史发展中,为谋求评价客观性而做过努力的有英国的菲希尔、(G.Fisher)和美国的赖斯(J.M.Lice)。菲希尔在1864年以校长的身份,根据价值程度制定了评分标准,其评定分数为从l~5,并把它用于对本校学生的答案及作品的客观评分。1894年,赖斯以巴尔的摩市教育长的身份设计的拼字测验被视做早期的测量。他的这一举动在当时产生了巨大影响,因而赖斯被称为教育测量的先驱。
(二)心理测验与教育测量
心理测验产生于社会需要,而心理测验的产生与发展又促进了教育测量的发展。心理测验方面的早期探索者是英国差异心理学的创始人高尔顿(F.Galton)。他致力于个体差异与心理遗传的研究。他认为,人的所有特质都可以定量叙述,这是建立人类科学的必要条件。所以他就最早应用统计去处理心理学研究资料,以数量代表所测得的心理特征差异。高尔顿提出的心理测量工具,不仅为后来心理测验的研究工作铺平了道路,而且为教育评估工作的量化技术提供了重要条件。
美国心理学家卡特尔(J.M.Cattell)在莱比锡大学冯特心理学实验室从事个体差异研究。卡特尔的研究可归纳为六个项目,即反应时间、联想、知觉和阅读、心理物理学、等级评列法和个体差异。但他的研究是以心理测验和个体差异为主题的,而且重在测量基本的身体活动或感觉——运动反应,因而他的心理测验不同于智力测验。他编制的心理测验达50多种,1890年发表了名为《心理测验与测量》的论文,对实验进行了总结。
1889年,法国心理学家比纳(A.Binet)在巴黎大学创建了法国第一个心理学实验室。比纳在心理学方面最重要的贡献,是对智力的研究和智力测验方法的创新。1905年,比纳与西蒙合作编写成《比纳一西蒙智力量表》,后经几次修订,成为智力年龄表。因此,比纳被称为智力测验的创始人。
(三)教育测量运动
20世纪初,教育测量成为一次运动,其代表人物是美国心理学家桑代克(E.I.Thorndike)。1904年,桑代克发表了闻名于世的论著《精神社会测量学导论》,介绍了统计方法及编造测验的基本原理。该书提出了“凡存在的东西都有数量,凡有数量的东西都可以测量”的基本观点,为教育测量奠定了理论基础,对教育测量学的建设与发展作出了巨大贡献,因而桑代克被称为“世界教育测量之父”。此后的20年间,桑代克及其弟子先后编制多种测验模式,如算术标准学力测验、书法量表、职业测验、办事员能力测验等;作为教育测量的代表工具——关于各科教学的学历标准——也已陆续由其他学者完成,这一时期先后共发表了1300种左右。
20世纪以来,教育测量运动得到了发展,到了30年代却受到了批判,所以,有的学者把30~40年代称做批判时期。西方教育测量运动的发展,对中国产生了较大的影响.我国教育界开始了对教育测量理论的研究。教育测量运动反映了从主观评价到测量的变化,强调了评估的方法论;从测量到现代评估的转化,则强调了评估的目的论。
与物理测量相比较,教育测量的对象是复杂得多的人,主要是测量学生的内在心理特性,因此,它有与物理测量不同的特点,主要有以下几个方面:
1.教育测量的间接性
教育测量一般是间接测量。因为我们无法直接测量学生的内在心理特性,而只能通过检测其外显的行为或外在表现特征来推测个体心理活动的特点与水平。也就是说,我们只能通过测验,运用推理、判断的方法,来间接地测量学生的知识水平、智力高低、品德好坏和能力状况等等。在测验的过程中,有很多的主观因素在起作用,一次测试的实施,从每一个项目的编制、测试的实施过程,一直到评分及分数的解析等过程,始终无法排除人的主观因素的作用,因此,教育测量具有较大的主观性。
2.教育测量的多元性
进行测量必须要有相应的测量工具,测量工具的性能好坏决定测量效果的好坏。教育测量的主要工具就是测验。教育测量所用的测验是由一组题目组成的,题目是构成测验的元素。由于每一个题目只能从一个侧面反映被试的外显的行为或外在表现特征,多个题目的测试才能综合反映被试的某一方面的总体属性,因此,一个测验能否达到一定的测量目的,不仅取决于每一个题目的优劣,而且取决于题目之间的相互配合关系。对一个被试进行多次测验更能够达到准确测量的目的,但实际中又不能用同一题目进行多次测验,否则也会影响测量的准确性,这些就决定了教育测量的多元性。
3.教育测量的不确定性
教育测量的不确定性表现为随机性和模糊性。教育现象的发展和变化,有相当的部分是由偶然因素所决定的,包含着大量的随机现象。教育测量是测量学生的内在心理特性的,在测量某一方面的心理特征时,很难排除一些其他心理变化的影响;教育测量既是一种间接测量,又带有很强的主观性,随时可能受到外部环境的影响,因此,学生在参加测验时,或多或少会受到其情绪、健康状况以及周边环境等因素的影响,使测量结果出现随机性或误差。比如,对学生的品德进行测量,有些学生可能故意掩饰其本来的品德情况。在教育实践中,教育现象的不确定性不仅表现为随机性,还存在比随机性更基本、更深刻的表现形式——模糊性。这是因为教育测量对象的特质常常是很模糊的,教育测量的单位一般来说是相对的,它的意义也是比较模糊的。同样的分数,在人们心目中的含义是不同的;同样的一次考试,相同的分数,测得学生的能力可能是不同的,如选择题的“1分”就不等于填空题的“1分”,更不等于论述题的“1分”;同一科目,不同次测验的相同分数不一定是等值的。因此,对学生学习成绩的评定只是一个“大概”的数据,是一种知识掌握或能力的趋向,并不能十分准确地反应学生的实际状况。
4.教育测量的目的性
任何一个测量都具有明确的目的,教育测量必须为实现教育目的服务,即教育测量是为了掌握学生在学业、智力和思想品德等方面的情况,了解教育和教学的效果,以便更合理地组织教育活动,安排教学内容,选择教学方法,贯彻因材施教,促进学生在德、智、体、美、劳等方面全面发展。我们不能脱离教育目的和教材的要求,随意地制订量表,任意地进行测量,否则,教育测量不仅不能起到促进教育、教学水平不断提高的作用,可能还会适得其反。
教育测量的以上四个特性深刻地说明了教育测量工作的复杂性。也正因为如此,就要对教育测量的质量进行评价。衡量教育测量的质量,一般通过计算测验的信度、效度、难度和区分度等指标值来进行。有关内容将在第十章中做 教育测量的以上四个特性深刻地说明了教育测量工作的复杂性。也正因为如此,就要对教育测量的质量进行评价。衡量教育测量的质量,一般通过计算测验的信度、效度、难度和区分度等指标值来进行。有关内容将在第十章中做出详细介绍。
许多教育工作者会出考试题目,会组织各类测试,但缺乏对教育测量科学的了解和掌握,在改善测试工作和提高测试质量等方面就难以进行了。现代教育理论的发展,更加注意强调人的素质教育,强调发挥人的主观能动性,强调因材施教,要检验教育的效果,离不开对被教育者的评价,其中最重要的一环就是采用教育测量的方法来检测教育效果。因此,实施教育测量的每一个教育工作者都应深刻理解教育测量的特性,正确使用教育测量,包括明确的测量目的或目标,科学的教育测验的设计与编制,合理的施测组织,以及测验结果的评价,使教育测量能够发挥最大的功能,并把不良影响减少到最低限度,为教育学科特别是教育评价学提供准确、可靠的测量数据。
(一)教育测量的功能:
1、教育测量是改进教学的良好工具
2、教育测量是教学管理的重要手段
3、教育测量是教育研究的重要方法
(二)教育测量的要素:
1、单位
2、参照系
3、量表