一般自我效能感量表的信度和效度研究

2024-04-25

一般自我效能感量表的信度和效度研究(精选6篇)

篇1:一般自我效能感量表的信度和效度研究

一般自我效能感量表的信度和效度研究

摘要:由Schwarzer等人编制的一般自我效能感量表(GSES)目前在国际上广泛使用,本研究拟对中文版GSES的信度和效度进行研究.412名大学生接受了GSES的测试.结果表明:①和其他文字版本的GSES一样,中文版GSES也具有较高的`信度;②中文版GSES的单维度性得到了证实,印证了Schwarzer等人的有关发现;③中文版GSES具有很好的预测效度. 作者: 王才康胡中锋刘勇 Author: 作者单位: 华南师范大学教科院, 期 刊: 应用心理学 CSSCI Journal: CHINESE JOURNAL OF APPLIED PSYCHOLOGY 年,卷(期): ,7(1) 分类号: B841.7 关键词: 一般自我效能感量表 信度 结构效度 预测效度 机标分类号: B84 G44 机标关键词: 一般自我效能感量表信度中文版预测效度单维度大学生文字测试编制 基金项目: 一般自我效能感量表的信度和效度研究[期刊论文]应用心理学 --2001,7(1)王才康胡中锋刘勇由Schwarzer等人编制的一般自我效能感量表(GSES)目前在国际上广泛使用,本研究拟对中文版GSES的信度和效度进行研究.412名大学生接受了GSES的测试.结果表明:①和其他文字版本的GSES一样,中文版GSES也具有较高的信度;②中文...

篇2:一般自我效能感量表的信度和效度研究

使用平行信度测定法、2组顺向问题平行信度测定法、两样本t检验法、典型相关法、因子分析法、克朗巴赫系数α值计算法,以及Theta系数和Omega系数计算法,论述反向问题对信度的影响及其处理技巧;介绍对调查问卷中的问题进行检验的方法;研究和比较评价量表信度和效度的各种方法;提出2组顺向问题平行信度测定法.结果显示,以“北京地区农村医生培养问卷调查表”为依据,给出对问卷中反向问题处理前后的克朗巴赫系数α值的.变化;使用两样本t检验方法对每个问题的临界比率(critical ratio)检验后,筛选掉2个问题,筛选后的克朗巴赫系数α值(0.899 3)比筛选前的(0.892 9)略高;2组顺向问题平行信度测定法比较精确(r1=0.832);对问卷调查表的各个模块分别计算了克朗巴赫系数α、Theta系数、Omega系数,对总表除计算上述系数外,还计算了2组顺向问题平行信度,它们的值分别是0.899 3、0.881 3、0.956 5和0.823 0,所有的信度指标都表明该调查问卷具有非常高的信度;为简便计,选择表中的1个模块(“本科毕业生去留原因” ,包括10个问题)为例,使用因子分析法得到十分清晰的统计结构,它们表明该模块中的问题既有看得见摸得着的实际问题,也有认识上和看法上的问题.从而说明使用因子分析法能很好地分析结构效度.提示:①必须对调查问卷中的反向问题的计分重新编码,对调查问卷中的问题进行统计学检验,对问题筛选后再进行信度和效度计算;②使用克朗巴赫系数α、Theta系数、Omega系数和2组顺向问题平行信度的指标评价调查问卷的信度是比较可靠的;③用因子分析法得到的统计结构是清晰的,但不是惟一的.对于统计结构的解释有赖于专业知识,不可拘泥于统计学结果.另外,也可根据统计结构对调查问卷的设计结构进行修订.

作 者:刘学宗 张建 于书彦 作者单位:刘学宗,张建(首都医科大学数学教研室)

于书彦(首都医科大学教育改革与发展研究所)

篇3:一般自我效能感量表的信度和效度研究

关键词:饮酒,问卷调查,统计学,学生

饮酒情景是指导致个体过度饮酒行为的事件或者场景,通常分为社会交往型饮酒(convivial drinking)、助性型饮酒( intimate drinking)及应对负性情绪型饮酒(drinking to cope with negative emotions)3个方面[1]。研究显示,不同的饮酒情景与不同的人格及心理社会功能损害存在关联[2]。通过了解学生饮酒的情景因素,可以早期发现学生的潜在人格及社会功能应对缺陷问题,进行针对性干预,减少学生的酒精滥用行为以及心理社会功能损害的发生[3]。DCS-9(Drinking Context Scale-9)是O' Hare在2001年修订的量表,验证性因子分析显示用于高校学生酒精滥用问题调查时效度较好,目前被多个国际研究所采用,且量表版权公开,可以自由复制[4]。笔者对DCS-9进行了翻译,并对中文译本的信度和效度进行了初步测试,以期为中国高校学生的饮酒问题及其潜在的心理社会功能损害进行评估提供比较敏感的工具。

1 对象与方法

1.1 对象

于2011年3-6月间在温州市4所高校发布招募广告,说明此项研究目的及内容,招募存在饮酒经历的同学参加研究。为避免学生顾虑不能真实填写问卷以及参加临床评估,愿意参加此项研究的学生可以通过QQ、E-mail或电话联系课题组,可以不显示自己姓名及学校,但参加研究者每人获得研究组给定的编号及验证号码,在填写问卷及参加临床评估时需要说明自己编号及验证号码,调查以及临床评估完成后给予一定的资金奖励。共纳入500名学生进行分析。其中男生330名,年龄为17~28岁,平均(21.2±2.4)岁,占总人数的66.0%;女生170名,年龄为17~27岁,平均(20.4±2.3)岁,占总人数的34.0%。

1.2 方法

1.2.1 原量表结构和内容

DCS-9共9个条目。分为社交型饮酒情景、助性型饮酒情景及应对负性情绪型饮酒情景3个分量表,每个分量表各3个条目。采用Likert 5级评分,评分范围为0~4分,对每个条目评分细则做了详细说明,总评定时间约为3 min。

1.2.2 翻译和修改

由作者将量表进行翻译,并请母语为英语的学者对中译本进行回译,结合回译中发现的问题,对中文译本作修改后形成量表的中文终译本。

1.2.3 信度研究方法

采用SPSS 15.0对样本资料进行分析,计算总量表及分量表的Cronbach's α系数,测定量表内部一致性[5,6]。问卷调查15 d后随机抽取30名学生进行第2次测评,计算2次测评得分值相关系数,以考评量表重测信度[5,6]。

1.2.4 效度研究方法

采用AMOS 7.0软件进行验证性因素分析评定量表结构效度。采用与酒精使用障碍筛查量表(Alcohol use disorder identification test, AUDIT)相关分析方法考察量表的校标效度。此量表包括10个项目,国内测试结果显示,AUDIT得分≥7可定义为酒精滥用阳性[7]。

1.2.5 DCS-9量表界值分的划定

以国际疾病分类(ICD-10)酒精有害使用(酒精滥用)临床标准作为参考[8]。剔除标准为存在其他精神疾病或者脑疾病所致精神障碍以及其他精神活性物质使用所致精神障碍。所有参加评估的临床医师在研究开始前2周集中接受诊断一致性培训,经过培训,医师间诊断一致性KAPPA值为0.97。所有入组学生的临床评估均由2位主治医师完成,当2位主治医师意见不一致时由副主任医师或者主任医师进行评估确定诊断;所有评估医生不知道学生量表得分。根据临床诊断结果,计算量表分值ROC(Receiver Operation Curve)曲线下面积,根据曲线下面积指标标准判断量表是否具有区分功能,计算DCS-9不同分值评估筛查酒精滥用的灵敏度和特异度,根据约登指数确定界值分[9]。

2 结果

2.1 信度

总量表Cronbach's α系数为0.85,社交型情景分量表、助性型情景分量表和应对负性事件型情景分量表Cronbach's α系数分别为0.77,0.65和0.73,总量表和3个分量表的条目间平均相关系数分别为0.50,0.45,0.33和0.39。

2.2 效度

2.2.1 结构效度

验证性因素分析结果显示,该模型的GFI=0.959,NFI=0.890,CFI=0.903,TLI=0.902,χ2/df=2.950,P=0.037;REMEA=0.041,各个指数均符合测量学标准[10]。各条目对其因子的负荷系数分别为社交型情景:朋友聚会0.85,娱乐活动0.70,重要日期0.59;助性型情景:爱人同居0.78,异性约会0.70,性活动前0.79;负性情绪型饮酒情景:发生争吵0.69,感到抑郁0.84,感到愤怒0.80。

2.2.2 效标效度

DCS-9量表总分与AUDIT量表评分呈显著正相关(r=0.65,P<0.05),提示DCS-9能够筛查酒精滥用问题。

2.2.3 DCS-9区分能力及界值分的划定

以酒精滥用的临床评估标准为参考,以DCS-9评分绘制ROC曲线,计算量表不同界值分的灵敏度和特异度及ROC曲线下面积(AUC),以ROC曲线下面积>0.5认为问卷具有区分能力[9],根据约登指数[9],在问卷得分≥14时灵敏度为78.8%,特异度为81.0%,AUC为0.78。见表1,图1。

3 讨论

研究结果显示,DCS-9量表具有较好的内部一致性,结构效度考评结果显示,量表结构效度稳定,提示DCS-9可以作为筛查量表用于我国高校学生饮酒情景的调查。本研究中将DCS-9与AUDIT量表进行校标检验,并且以ICD-10酒精有害使用临床诊断为金标准进行灵敏度及特异度测试,结果显示,DCS-9与AUDIT量表呈中度正相关,DCS-9具有较好的区分能力。综合上述研究结果,提示DCS-9也可以作为高校学生酒精滥用的筛查工具使用。

研究显示,既往美国的学校饮酒干预措施主要体现为加强健康饮酒的教育以及加强学校环境的管理,但是目前研究证据显示此干预措施未能明显降低酒精滥用的发生[11];相反,有学者提出以减少危害后果为导向的干预措施[12],即通过了解个体不同饮酒背景以评估潜在酒精滥用所致心理社会功能损害,减少潜在损害为导向,进行认知行为治疗等干预措施的设置,减少学生的酒精滥用行为。研究显示,基于饮酒情景设置的干预措施具有较好的效果[12,13]。可见了解个体饮酒背景资料对于有效干预措施的制定极为重要。

调查显示,美国高校学生饮酒率高达2/3,其中40%存在发作性狂饮酒行为[14]。另有研究显示,有饮酒习惯的高校学生中接近1/3的能够达到美国精神疾病(DSM-IV)酒精滥用诊断标准[15]。国内研究显示,中国高校的学生酒精使用也不容忽视[16]。因此,对大学生酒精滥用进行干预极为重要。DCS-9量表条目简明扼要,可理解性好,耗时较少,能够短时间内筛查出饮酒背景,符合干预措施的需要,是一个较理想的工具,并且由于量表条目针对的是饮酒情景,较之直接使用酒精问卷筛查或者临床评估受试样本可接受性好,有利于获取更真实的信息。

本研究不足之处在于所有被试样本均是温州地区学生,国外研究也未显示界值分情况,无法进行比较。因此,本研究所划定的界值分难免存在商榷之处。但参与本研究的临床医师均为多年从事精神疾病治疗工作的中高级职称医师,临床经验丰富并接受过诊断一致性测试,因此,临床诊断结果和所获得的界值分具有可信性,可以推荐使用。另外,在本研究受试者中,临床筛查未有诊断酒精依赖者,因此未能明确区分酒精依赖的界值分,在以后可进行此方面研究。

篇4:一般自我效能感量表的信度和效度研究

1 资料来源与方法

资料来自于2004年~2006年临床执业医师资格考试考生学科成绩数据库, 采用分层随机抽样方法, 从全国31个考区中抽取约10000名考生的学科成绩数据。采用Visual FoxPro 6.0进行数据的调用和处理, 采用SPSS12.0进行数据的统计和分析。

2 结果与分析

2.1 信度分析

常用的信度指标有同质性信度、分半信度、复本信度和再测信度等[1]。根据研究目的和组织实施难度, 本文开展了除复本信度外的其它信度研究。

2.1.1 同质性信度:同质性信度是指测验题目在多大程度上考察了同一内容, 克伦巴赫α系数 (coefficient alpha of L.J.Cronbach) 是目前最常用的同质性信度指标。计算临床执业医师资格考试四个单元以及总分的α系数, 见表1。

从α系数来看, 2004年至2006年临床执业医师资格考试的同质性信度均令人满意。各单元的α系数中最低为2004年的第一单元 (0.7857) , 最高为2006年的第四单元 (0.8867) 。总卷的α系数均达到了0.95以上。

2.1.2 分半信度:分半信度是将测验题目均衡的分成两个部分, 以两部分得分的相关系数作为评价信度的指标。但此时得到的是半卷的信度, 需要使用斯皮尔曼-布朗 (Spearman-Brown) 公式进行校正, 从而得到全卷的分半信度。

将全部题目单纯按照题目序号的奇偶顺序进行分半, 各得到300题的奇数卷和300题的偶数卷, 然后求出全卷的分半信度, 见表2。

事实上, 临床执业医师资格考试的试卷分为若干个学科, 而每个学科的题目排列并未考虑奇偶顺序, 采用题目序号单纯奇偶分半可能损失各学科的信息。因此, 又对各学科进行了划分, 仍采用奇偶分半的方式将各学科题目平均分配到两个半卷 (300题) 中, 然后求出按照学科分半后的全卷分半信度, 见表3。

从分半信度来看, 无论是单纯按照题目序号进行分半所得结果还是按照学科进行分半所得结果均较为理想。而且, 按照学科分半所得的分半信度均高于按照题目序号单纯分半者, 提示在进行分半信度研究时应考虑学科 (分测验) 因素。

2.1.3再测信度:考虑到测试组织实施难度, 只选取了2005年和2006年临床执业医师资格考试的半卷 (300题) 进行了再测并计算相关系数, 然后采用斯皮尔曼-布朗公式进行校正。测试样本来自于某医学院校临床医学专业五年级本科生, 采用整群抽样选取两个班级, 共60人。测试间隔时间为1个月。再测信度情况见表4。

从再测信度看, 2005年和2006年临床执业医师再测信度也较令人满意。此再测信度只是半卷的再测信度, 虽然在选取半卷时考虑了其对全卷的代表性并进行了校正, 但其中必然会出现信息损失现象。在条件许可情况下, 应进行全卷的再测信度研究

2.2效度分析

常用的效度有内容效度、构想效度和效标关联效度, 其中效标关联效度又分为同时效度和预测效度[2]。对此分别进行研究, 但未开展预测效度研究。

2.2.1内容效度:临床执业医师资格考试的内容涵盖了从事临床工作所必须的基础医学知识、专业知识和公共知识等14个学科, 其中内科学和外科学又包括19个亚学科, 从考察内容来看能够满足临床工作需要。考试大纲经全国著名的医学专家们多次论证、研讨和修订, 并由卫生部医师资格考试委员会发布。考试命题由国家医学考试中心邀请全国著名的医学专家进行, 根据考试大纲和教育测量学原理反复审校并进行了试测。因此, 从考试内容到试题命制均进行了严格的质量控制, 能够保证本考试具有良好的内容效度[3]。但是, 目前的临床执业医师资格考试内容主要参考医学教育内容, 对临床工作实际情境的分析不够, 命题技巧仍需加强, 内容效度有进一步提高的空间。

2.2.2构想效度:临床执业医师考试的结构被设计为基础知识、专业知识和公共知识等三部分, 其中基础知识包括病理学、生理学、生物化学、免疫学、微生物学和药理学, 专业知识包括内科学、外科学、妇产科学和儿科学, 公共知识包括卫生法规医学伦理学、医学心理学和预防医学。

我们采用因素分析法中的主成分分析法分别对2005年和2006年临床执业医师资格考试成绩数据进行分析, 均抽取出3个主因素, 其对方差的总解释率分别为56.70% (2005年) 和58.23% (2006年) 。

经过方差极大旋转后, 2005年抽取出的因素1可以命名为基础知识, 包括病理学、免疫学、生物化学、生理学、微生物、药理学, 但内科学对该因素也有较大贡献。因素2可以命名为专业知识, 包括内科学、外科学、妇产科学、儿科学, 但病理学对该因素也有较大贡献。因素3可以命名为公共知识, 包括伦理学、卫生法规、心理学和预防医学。各学科因素载荷情况见表5。

2006年抽取出的因素1可以命名为基础知识, 包括生物化学、免疫学、生理学、病理学、微生物学和药理学, 但预防医学对该因素也有较大贡献。因素2可以命名为专业知识, 包括儿科学、妇产科学、外科学和内科学。因素3可以命名为公共知识, 包括卫生法规、医学伦理学、医学心理学和预防医学。各学科因素载荷情况见表6。

从以上两年度的分析可以看出, 采用因素分析方法抽取出的主因素以及各学科的因素载荷情况基本符合临床执业医师资格考试的设计结构, 但有个别学科如内科学、病理学和预防医学的归类不甚清晰, 应进一步研究其原因。

2.2.3效标关联效度:我们以某医学院校临床医学专业2004年和2005年本科毕业生的毕业考试成绩为效标, 与这些考生分别参加2005和2006年临床执业医师资格考试的成绩进行相关性分析。该校毕业考试包括综合笔试和客观结构化临床技能多站考试 (OSCE) 两部分, 但最后按照一定权重合成为总分, 即我们所选取的效标。临床执业医师资格考试效标关联效度情况见表7。

从以上两年度的分析可以看出, 在以在校考试成绩为效标的情况下, 临床执业医师资格考试获得了较为理想的效标关联效度, 两次考试成绩的相关系数最低达到了0.7796。临床执业医师资格考试是目前我国规模最大、效力最高的医学考试, 以在校考试成绩为效标乃权宜之举, 虽然其结果较为理想, 但仅供参考。应加强对临床执业医师资格考试的效标研究和效标关联效度研究。

3结论

3.1临床执业医师资格的信度较为理想

无论是同质性信度、分半信度还是重测信度, 均达到0.85以上, 符合教育测量学要求[4]。该考试是稳定的, 其结果是可靠的。

3.2临床执业医师资格考试具有一定的效度

内容效度能够得到保证, 应继续加强工作分析, 提高命题技巧。结构效度总体上与考试设计相吻合, 但个别学科归类不清, 可能和该学科定位及命题技巧有关。效标关联效度较为理想, 但应进一步开展效标研究和效标关联效度研究。

摘要:为评价我国临床执业医师资格考试的质量, 对该考试的信度和效度进行研究。信度研究采用同质性信度、分半信度和再测信度等指标, 效度研究采用内容效度、结构效度和效标关联效度等指标。研究表明, 临床执业医师资格考试的信度良好, 具有一定效度。

关键词:信度,效度,医师资格考试

参考文献

[1]张敏强.教育测量学[M].北京:人民教育出版社, 1998;104~110.

[2]戴海崎, 等.心理与教育测量[M].广州:暨南大学出版社, 1999;69~134.

[3]温吉元, 张鸣.我国医师资格考试制度的建立与完善[J].中华医院管理杂志, 2001;17:453~455.

篇5:一般自我效能感量表的信度和效度研究

汽车制造业一直是我国国民经济的支柱产业, 但与国际汽车制造巨头相比, 我国汽车行业竞争力不足。

在汽车制造中, 总装配车间是龙头车间, 因此, 要想提高汽车制造业的竞争力, 合理设计、评价和选择总装配车间工艺布置设计方案尤为重要。评价工艺布置设计方案需要科学合理的评价指标体系。笔者已经利用层次分析法建立了总装配车间工艺布置设计方案评价指标体系, 但这些指标是否合理?是否具有足够的信度和效度?这就是本文研究的内容所在。

本文通过对总装配车间工艺布置设计方案评价指标的信度和效度的检验, 筛选出具有足够区辨力、可信和有效的指标, 作为汽车装配车间工艺布置设计方案评价的合理指标, 更好地服务生产实践。

2 研究方法与数据收集

SPSS 20.0是目前应用较广, 操作界面方便, 功能多样的统计分析软件[1]。本研究借助SPSS20.0统计软件, 采用描述性统计分析法、可靠性分析法、相关分析法和因子分析法, 对问卷进行项目区辨度、信度和效度分析, 以检验评价指标的区分度、可靠性、内容效度和结构效度。

在指标检验前, 笔者再次咨询, 走访了从事汽车装配车间工艺布置设计和管理的专家和工程技术相关人员, 就笔者先前利用层次分析法建立的评价指标体系提出建议。为了方便软件运行, 笔者对所有指标进行统一编号, 如表1所示。表1中一级指标从S1~S6编号, 二级指标从C1~C40编号。

把表1中的指标设计成调查问卷, 问卷中每个指标采用Likert式的五点记分法进行打分, 从1~5分表示设计方案满足指标程度的高低。设计方案满足指标的程度越高, 得分越高;满足程度越低, 得分越低;非常满足, 得5分, 不满足得1分, 其他满足程度得分介于1~5分之间。

本研究选择了10个汽车制造总装配车间工艺布置设计项目, 每个项目选择设计人员、业主 (或汽车制造企业装配车间使用和管理人员) 、施工人员、监理人员和相关项目管理人员进行调查。调查总共发放问卷200份, 收回问卷127份, 剔除不合格问卷, 剩余120份参与统计分析。

3 信度检验

3.1 指标区辨力的检验

对调查问卷中40个指标进行描述性统计分析, 结果显示, 标准差小于1.0的指标只有C26 (标准差0.563) , 说明这个指标不具有区辨力, 被调查者对这个指标的打分太过于集中。仔细看这个指标是“符合中国文化”, 指标概念比较宽泛, 被调查者难以判断, 所以经过区辨力的检验, 删除指标C26。

3.2 内在信度的检验

内在信度的检验用可靠性分析得到的内在信度系数克隆巴哈 (Cronbach'sα) 值来判断。Cronbach'sα在0.8以上, 认为该调查表具有较高的内在一致性;α为0.7认为调查表具有尚可的内在一致性。用区辨力检验后剩余的39个指标, 分别对所有指标总表和6个一级指标下的分表进行可靠性分析。分析结果显示, 总表的Cronbach'sα=0.938, 证明总表的可靠性很好。其他6个一级指标下分表的Cronbach'sα系数值如表2所示。

从表2的数据看, 政治、经济、技术和文化的α都超过了0.8, 具有高度的一致性, 可靠性很高。社会和生态文明的α超过0.7, 说明这两个一级指标分表的可靠性也尚可。

3.3 外在信度的检验

外在信度用重测信度来检验, 即用同一问卷在不同时间对同一对象进行重复测量, 然后计算一致性。

本研究的调查问卷在回收后半个月, 又选择了4个已被测试过的装配车间建设项目中的相同人员20人, 用同一份调查问卷对他们进行再次调查, 并再次进行内在一致性检验。重测信度检验后指标总表的Cronbach'sα=0.955, 二级指标分表检验结果如表3所示。

重测后的Cronbach'sα显示各指标具有较高的外在可靠性。

4 效度检验

4.1 内容效度的检验

采用单项与总和相关分析法来检验内容效度, 即计算每个指标得分与扣除该指标得分后总分和的相关系数, 根据相关是否显著来判断指标的内容是否有效。用SPSS20.0计算相关系数后, 相关系数小于0.3的指标有C6 (0.171) 、C15 (0.212) 和C31 (0.053) , 这3个指标是标准设备采用率、重大生产事故率和符合人体工效学。仔细分析, 在工艺设计中标准化设备采用率的高低不能绝对判断方案的好坏, 重大生产事故也很少出现, 符合人体工效学对有些调查者来讲难以理解, 所以删除这3个指标, 用剩余的36个指标重新做相关分析, 计算结果如表4所示。重做相关分析后, 所有指标的相关系数均大于0.3, 说明指标体系的内容效度很好。

4.2 结构效度的检验

再用内容效度检验后余下的36个指标进行探索性因子分析。因子分析中特征根选定为1.0, 因子的固定提取数为6 (即6个一级指标) 。因子分析后显示:KMO值为0.825, Bartlett的球形度检验近似卡方为10 248.989, 自由度df=741, 显著性水平p<0.001。KMO值超过0.7, 说明指标体系总表的结构效度很好。

公因子方差计算结果如表5所示。表5中所有指标的公因子方差均大于0.5, 说明指标体系表的结构效度很好。

经过以上所有检验, 最终得到汽车制造总装配车间工艺布置设计方案评价指标, 包括6个一级指标和36个二级指标, 一级指标是政治、经济、技术、文化、社会和生态文明。政治指标下有5个二级指标C1~C5, 经济指标下有12个二级指标C7~C19 (删除了C6和C15) , 技术指标下有6个二级指标C20~C25, 文化指标下有4个二级指标C27~C30 (删除了C26和C31) , 社会指标下有6个二级指标C32~C37, 社生态文明指标下有3个二级指标C38~C40。

5 结语

本研究在已有的汽车制造总装配车间工艺设计方案评价指标的基础上, 设计调查问卷, 深入企业和施工现场, 就工艺设计方案对相关人员进行调查。然后利用SPSS20.0统计软件进行分析检验。通过检验, 汽车制造总装配车间工艺设计方案评价指标共有36个, 这36个。评价指标具有稳定、可靠的信度和效度, 说明这些评价指标具有很强的科学性, 完全可以用于汽车装配车间工艺设计方案的实际评价。

本研究不仅检验了指标的稳定性和可靠性, 也完善了以往很多学者在工艺设计方案评价中只建立指标, 没有对指标进行检验的缺陷, 这对研究方法的完善和评价指标的理论研究做出了一定的贡献。但是, 由于受到样本数据收集局限性的影响, 导致研究过程中的某些统计分析结果不是特别理想, 也使得某些指标术语还有待改善, 这还望在今后的研究中进一步改进。

摘要:在笔者建立的总装配车间工艺布置设计方案评价指标的基础上, 把评价指标设计成调查问卷, 深入企业和施工现场对相关人员进行调查。然后利用SPSS20.0统计分析软件对问卷调查数据进行分析。通过分析, 检验了评价指标的信度和效度, 删除了4个指标, 保留了36个评价指标。保留的36个评价指标具有良好的稳定性和可靠性, 完全可以用于汽车装配车间工艺设计方案的实际评价。

关键词:汽车制造,工艺设计,评价指标,信度,效度

参考文献

篇6:一般自我效能感量表的信度和效度研究

关键词:MBA入学考试英语科目,语言测试学,应用语言学,信度,效度

在语言学中, 语言测试学是一个相当重要的分支, 而且它已经渐渐成为了一门相对比较独立的学科。而语言测试的功能总的来说可以分三块:一、用于语言教学成果的评估, 二、用于辅助语言及教学的研究, 三、用于为选拔合格的人才。笔者想要以语言测试学的理论为指导, 从信度和效度这两个方面来分析一下工商管理硕士入学考试英语科目 (以下简称MBA入学考试英语科目) 的质量。并尝试来提出一些行之有效的意见和方法来平衡该考试中信度和效度这两个重要的要素。

1 信度与效度和语言测试之间的关系

简单来说, 一项语言测试的信度就是该测试所能得到结果的质量。如果用同一份测试卷来对同一群学生进行两次或多次测试, 所得的结果是一致的, 就说明该测试的连贯性和稳定性是可以接受的, 也就说信度较高。而谈到语言测试的效度, 则是关于一套测试所检测的内容是否就是对参试者所学知识的检测。效度的高与低同样是衡量语言测试的一个重要指标, 一项低效度的语言测试是没有实践意义的。因为一般来说, 一个测试本身的第一要务就是要让学生有能力完成这个考试。

作为衡量测试质量的两个最重要的指标, 信度与效度之间是互相依存的, 同时又是互相排斥的。一般来说, 信度高的测试方式会比较多的使用客观题像单项选择题, 多项选择题, 选择填空等, 但相应的效度一般就不会太高, 也许通过一些精心安排, 可以在一定程度上提高效度, 但通常很难得到理想状态。而效度较高的测试法有翻译、作文、口试等主观题形式, 不过遗憾的是信度就不会太高, 当然, 通过一定努力, 可以提高其信度, 但同样很难达到最佳状态。所以在当代语言测试, 尤其是大规模考试一般都会尝试在信度和效度之间去找到一个最佳平衡点。

2 信度和效度在MBA入学考试英语科目中的体现

2.1 信度在MBA入学考试英语科目中的体现

首先, 从理论上说, 题量越大, 抽样越多, 信度也就会越高。根据2010年版最新的MBA考试大纲, MBA入学考试英语科目要求参加考试者在180分钟内完成包括一篇20题的完型、四篇5题的阅读、一篇新题型阅读、一篇150字左右的英译汉、以及一大一小两篇作文。所考的语言能力主要覆盖了读和写的综合运用能力。但是从题目的分布就可以看出MBA入学考试英语科目的重点是阅读理解 (占总题量的50%) , 这样就使对于其它能力的测量在某种程度上就会被削弱, 这也就会对MBA入学考试英语科目的信度产生一定的影响。其次, 我们还可以看到, 客观题 (占总量的60%) , 体现在MBA入学考试英语科目中为大量的单项选择题和搭配题) , 这些都可以用机器阅卷, 这的确在很大程度上消除了人为的不确定因素, 保证了客观性, 从这个角度来说, 其信度应该算是相当高的。然而, 这种形式的测试方法只能衡量考试者的语言识别能力, 如果只凭作文、翻译等少数的主观测试题型, 是难以很好的考察考试者应用语言的能力, 所以, 总的来说, MBA入学考试英语科目的信度又不甚理想。综上, 该考试的信度只能算是比较高。

2.2 效度在MBA入学考试英语科目中的体现

就该考试的内容效度而言, MBA入学考试英语科目确实很好的测试了MBA入学考试英语科目大纲中所规定的内容, 从而保证了测试内容的高效度。但就结构效度而言, 该考试没有能够很好的检测考试者的主观语言应用能力。其结构效度就在很大程度上被影响了。同样对于实证效度而言, 很多人认为MBA入学考试的英语科目不能很好地测试其听说能力, 及综合能力。那些高分的参试者在实际工作和学习中不一定有很好的运用能力。因此, 这个考试并没有很好的实证效度和结构效度, 有待改进。

3 如何平衡MBA入学考试英语科目的信度与效度

3.1 信度置前、效度兼顾

必须要承认的是在任何一项测试或考试中, 都不太可能达到信度与效度的绝对平衡。但是作为用人单位在提拔干部, 聘用人才时提供参照性指标, MBA入学考试英语科目必须通过更加科学、严谨的测试方法, 进行公正、公平的测试。

把信度放在优先的位置, 并不意味着就应该忽略效度的重要性。从历年考试卷中我们很容易看出, 2010年之前的试题, 客观题一直达到了总分的60%, 包括词汇、完型、阅读、而主观题只有翻译、和一篇大作文。如此高比例的单项选择题对于测试的效度则有很大损害。今年, 该考试意识到了这个问题, 增设了一篇小作文 (书信或提纲) , 新题型阅读。同时去除了词汇题。但客观题的总量仍然停留在60%。这样的改革仍然不够理想。

3.2 博采众长、引经据典

笔者认为, 想要解决MBA入学考试英语科目中中信度与效度的矛盾, 关键要建立一个有效的测试模式。 (下转第125页) (上接第116页)

首先, 我们可以适当加大这个考试中主观题的比例, 根据上文我们可以看出, 现在的MBA入学考试英语科目的信度还是确保的相当好的, 而客观题比较多只是一个因素, 只要我们想办法在评分、施测等方面去做的更加完善的话, 增加主观题所带来的信度波动时可以最小化的, 且同时考试的效度可以得到一个提升。

其次, 我们也可以借鉴一些较成功的语言考试体系, 中国的如大学英语四六级, 其信度和效度的平衡在国内可以说做的可圈可点, 至于外国的语言考试, 我们以他们的MBA入学考试如GMAT为蓝本, 规划出适合中国国情的MBA入学考试。

最后, 我们身处一个科技高速发达的时代, 可以利用开发计算机、多媒体等技术来辅助测试。我们也要更加注意利用机考的特点, 把效度融入其中, 那么才可能真正达到平衡。

参考文献

[1]American Psychological Association.Standards for Educational and Psychological Testing[M].Washington, DC:American Pyscho logical Association, 1985.

[2]Bachman L F.Fundamental Consideration in Language Testing[M].Oxford:Oxford University Press, 1990.

[3]Kramsch C.语言教学的环境与文化[M].上海:上海外语教育出版社, 1994.

[4]Hughes A.Testing for Language Teacher[M].Britain:Cambridge University Press, 1989.

[5]戴炜栋, 蔡伟良.高校外语专业教学改革理论与实践——改革教学实践[M].上海:上海外语教育出版社, 2003.

[6]桂诗春.标准化考试——理论、原则与方法[M].广东:广东高等放育出版社, 1986.

[7]胡春洞.英语测试论[M].广西:广西教育出版社, 1996.

上一篇:小学一年级上册数学课程《认识钟表》的教学反思下一篇:学期末小学班主任工作总结