PISA2015

2024-05-21

PISA2015(精选九篇)

PISA2015 篇1

2013年3月,OECD发布了《PISA2015科学框架草案》(PISA 2015 Draft Science Framework,以下简称“2015测试框架”),该框架主要包括科学素养简介及其重要性、科学素养的定义及其演变、科学素养的结构、科学素养的测试四部分。[1]本文将就2015测试框架科学素养测试内容及特点进行分析研究。

一、PISA测试中科学素养的内涵及其演变

在2000年和2003年的测试框架中,PISA把“科学素养”定义为“运用科学知识、识别科学问题、基于证据得出结论”的能力,把科学素养的内涵概括为科学过程、科学概念和科学应用情景等三个方面。[2,3]其中,科学过程包含识别科学中可以研究的问题、确定科学研究中需要的证据、得出或评价结论、交流有效的结论和展现对科学概念的理解等五方面内容。科学概念涉及物质的结构和性质、大气的变化、化学变化和物理变化、能量转换等主题。科学应用情景是指科学在生活与健康、疾病与营养、水土流失与保持等方面的应用。

在2006年、2009年和2012年的测试框架中,PISA则把“科学素养”定义为“识别科学问题、科学地解释现象、使用科学证据”的能力。[4,5,6]并进一步把科学素养的内涵概括为以下四方面:

1.能够拥有一定的科学知识,并利用这些科学知识识别科学问题、获取新的科学知识、解释科学现象、基于证据得出与科学有关的问题的结论;

2.能够理解科学作为人类认识自然、探究自然的形式,具有一定的特殊性;

3.能够意识到科学和技术是如何形成经验,培养智慧,营造文化环境的;

4.作为一个有反思意识的公民,愿意用科学的思想,参与讨论与科学有关的问题。

在以上两种定义的基础上,《PISA2015科学框架草案》指出科学素养是指作为一个有反思意识的公民能够参与讨论与科学有关的问题,提出科学见解的能力,[7]并进一步解读为以下三种主要的科学能力:

1.科学地解释现象,即认识、提供和评价对一系列自然现象和技术产品的解释;

2.评价和设计科学探究,即科学地描述、评价科学研究,提供问题解决的方法;

3.科学地解释数据和证据,即分析评价数据和各种不同方式表示的参数,并能得出恰当的科学结论。

所有理解和参与有关科学技术问题讨论的能力都需要以下三种类型的知识:

1.内容性知识(content knowledge),又称科学内容知识(knowledge of the content of science),指有关自然世界的事实、观点和理论等知识。例如,植物如何利用光和二氧化碳合成复杂分子,物质的微粒性质等。

2.程序性知识(procedural knowledge),也称为证据概念(concepts of evidence),是指关于科学家用于建立科学知识的知识。这是实证研究所依据的实践和内容知识,比如,重复测量,减少误差和不确定性,控制变量,表征和交流数据的标准程序等。

3.认知性知识(epistemic knowledge)指的是理解具体结构和规定性特征在知识建构过程的必要作用。包括理解问题、观察、假设、模型和讨论在科学研究中的功能,认识不同的科学探究形式,同行评审在建立可信赖知识的过程中扮演的角色等。

通过以上分析不难发现,随着时代的发展,PISA测试对科学素养内涵的要求在继承以往认识的基础上,也在不断地深入和细化。

二、PISA2015科学素养测试内容

为了使科学素养的测试更加具有可操作性,2015测试框架在2006测试框架的基础上,将科学素养的内涵进一步解读为背景、知识、能力和态度四个相互关联的方面,并构建了能力标准和知识类型的认知需求框架。要求学生在一定的个人、地区/国家、全球等背景中,根据自己对科学的兴趣、对科学探究方法的价值的认识以及自我环境意识等,运用内容性、程序性和认知性知识,解决生活中的科学问题,从而展现科学地解释现象、评价和设计科学探究、科学地解释数据和证据等科学素养能力(具体内容如表2所示)。

(一)PISA2015测试框架对背景的描述

PISA2015测试框架中的背景是指学生在进行科学学习过程中涉及到的知识产生和应用的情景。这里的背景主要包括健康与疾病、自然资源、环境质量等方面的科学技术在自我、家庭和个人群体(即个人),社区(即地区/国家),世界各地的生活(即全球)等相关情景中的应用(具体内容如表3所示)。

(二)PISA2015测试框架对能力的要求

美国国家研究理事会(National Research Council,简称NRC)曾在2012年出版的《K-12年级科学教育框架:实践、跨学科概念与核心概念》(A Framework for K-12 Science Education:Practices,Crosscutting Concepts,and Core Ideas)中指出,科学是社会实践和认知实践的综合。具有科学素养的人不仅能够理解科学和技术的内涵和意义,更要在社会实践中应用科学技术,解决生活问题。同时,一个15岁的孩子不可能拥有与科学家们相似的经验,因此,PISA2015测试框架所涉及的科学活动不仅仅是科学家能够完成的任务,更应该是一个具有科学素养的15岁学生能够完成的实践活动。在PISA2015测试框架中,将学生科学地解释现象、评价和设计科学探究、科学地解释数据和证据等三方面作为科学素养的能力要求。

“科学地解释现象”要求学生在给定的情景中,回忆适当的学科内容知识,并利用这些知识识别或确认恰当的表述,描述或解释自己感兴趣的日常现象。如抗生素为什么不能杀死病毒,微波炉是如何工作的,为什么气体可以压缩而液体很难被压缩等。

“评价和设计科学探究”要求学生辨别可以进行研究的科学问题,识别科学研究是否是在遵循基本理论前提下进行的,是不是非此即彼的研究,掌握科学研究的关键性特征知识,用批判的视角评价科研成果报告和调查报告。

“科学地解释数据和证据”要求学生可以恰当地使用图表或者其他表征形式,用自己的语言向指定听众解释科学证据的应用,评价基于科学证据得出的结论,使用程序性或认知性知识,给出支持或反对给定结论的原因(具体的能力要求见下页表4)。

(三)PISA2015测试框架对科学知识的解读

PISA2015测试框架中对知识的解读主要是指学生要理解以科学知识为基础的主要事实、概念和解释理论。包括自然科学知识和科技产品(即内容性知识),科学观点产生的过程(即程序性知识),理解内容性知识建立过程的基本原理和使用理由(即认知性知识)。

科学内容知识系统非常庞大,在测试过程中不可能对所有的内容进行测试。因此,确定内容性知识的选择标准显得尤为重要。PISA2015科学素养测试根据内容性知识要与真实生活情境密切相关、代表一个重要的科学概念或者持久有效的主要解释理论、符合15岁学生的认知发展水平等标准,选择了涵盖物质科学、生命科学、地球与空间科学等三大学科领域的内容性知识系统(具体内容见表5)。

科学研究通过“形成尝试性假设”和“实证调查,验证假设”等基本过程,形成对自然世界的解释。实证调查研究中需要依赖特定的概念和方法,比如,独立变量,相关变量,测量类型,误差形式等概念;控制变量,减少误差,数据获取,数据表达等方法。这些特定概念和方法是科学研究必不可少的内容,它们概括了科学数据的收集、分析和解释等过程,构成了程序性知识的主体。

认知性知识是一种结构知识,可以帮助人们理解知识的建立过程,以及知识建立过程中,理论、假设和观察的作用。认知性知识提供了科学家们进行科学研究的基本原理,概括了科学研究的结构知识和特征,也是自然世界的科学主张被信任的基础。

表6列出了PISA2015科学素养测试具体包含的认知性知识和程序性知识的内容及一般特征。

(四)PISA2015测试框架对于态度的阐释

对待科学的态度在人们对科学的兴趣、关注程度等方面起着至关重要的作用,特别是在人们对于科学问题的及时反应方面,尤为重要。在PISA2015科学素养测试中使用的态度结构参考了美国匹兹堡大学克洛普弗(L E Klopfer)教授在1976年提出的科学教育情感领域结构,[8]以及其他有关的态度研究综述。这里从以下3个维度测试学生对科学的态度:对科学的兴趣、评价科学探究方法的价值和环境意识。

选择“对科学的兴趣”作为测试维度是因为它与学生的学业成绩、课程选择、职业选择和终身学习有显著关系。有大量的文献资料证明,大多数的14岁学生已经建立了对科学的兴趣。而且,对科学和技术有浓厚兴趣的学生更有可能从事与科学有关的职业。当把这样的测试结果与通过学生、教师和学校问卷得到的大量数据进行关联后,可能会很好地解释成人学习科学兴趣下降的原因。

选择“评价科学探究方法的价值”作为测试维度是因为科学探究的方法已经非常成功地被应用到新知识的产生过程中。学生在面对与科学技术有关的生活情境问题时,需要识别和评价收集证据、创造性思维、理性推理、评判性作答和交流结论等活动的科学方法,也需要理解科学探究方法是如何起作用的,这样才能从心灵深处愿意使用科学探究方法处理生活问题。

20世纪70年代以来,“环境意识”一直是人们广泛关注和研究的主题。考虑到环境问题对地球生命的持续以及人类生存的重要性,现在的年轻人需要理解生态学的基本规律,合理安排自己的生活。

下页表7列出了PISA2015科学素养测试框架对态度测试的具体内容。

(五)PISA2015科学素养测试构建了能力标准和知识类型的认知需求框架

PISA2015科学素养测试与以往测试明显不同的是其借鉴美国威斯康辛大学教育研究中心诺曼·韦伯(Norman L Webb)教授在1997年提出的知识深度[9](Depth of Knowledge,DOK),构建了科学素养能力标准和知识类型的认知需求(cognitive demand)框架(如图1所示)。

具体的认知需求层次如下:

低:实施只有一个步骤的程序,如回忆事实、术语、原理或概念,从图表中定位一个简单的信息等。

中:使用或应用概念性知识描述或解释现象,选择恰当的、包含两步或者更多步骤的程序,如组织或展示数据,解释或使用简单的数据包、图表等。

高:分析复杂信息或数据,综合处理或评价证据、证明,推理已有的各种来源,制定计划或一系列步骤解决问题。

PISA2015年科学素养测试构建的能力标准和知识类型的认知需求框架进一步明确了知识和能力之间的关系,细化了知识和能力结构,为进行科学素养的培养与评价提供了强有力的支撑。

三、PISA2015科学素养测试特点

通过以上的分析,结合PISA2006和PISA2015测试框架(见下页图2),可以发现:

(一)PISA科学素养测试框架是一脉相承的,科学素养的内涵在继承已有认识的基础上不断深化和发展

2006年和2015年的测试框架整体构成都包括“背景”、“能力”、“知识”、“态度”四部分,并且都要求在一定的背景中,展现科学素养的具体能力,而这些能力又受到知识和态度的影响。所不同的是,在2006测试框架中,知识和态度分别影响能力,而在2015测试框架中,知识和态度共同影响能力。此外,背景中的“个人情景”和“全球情景”、能力中的“科学地解释现象”、态度中的“对科学的兴趣”等构成要素是相同的,PISA2006测试框架中的“科学知识”要素和PISA2015测试框架中的“内容性知识”要素是等同的。

PISA2006测试框架对科学素养的描述,继承了PISA2000测试框架中“基于证据得出结论”和“识别科学问题”的能力;2015测试框架继承了2006测试框架中“科学地解释现象”的能力。这是由于人们的社会生活方式和观点随着科学技术的不断更新,时刻在发生变化。为了适应未来的生活,科学素养的内涵也就需要随之改变。

(二)能力标准不断提升,既要利用证据得出结论,也要学会解释有所偏差的数据和证据;既要识别可以研究的科学问题,也要能够自己设计和评价他人的科学探究活动

对于证据的使用,在2006测试框架中是“基于证据得出结论”,而在2015测试框架中则是“科学地解释数据和证据”。一个具有科学素养的公民不应该仅仅是基于证据得出结论,更应该对实验得到的数据和证据进行科学地解释,即使是那些错误或者偏差较大的实验数据和证据,也应该得到解释。基于证据得出的结论有可能是错误的,那些错误结论的得出,不应该是一个具有科学素养的人应该具有的行为。而科学地解释数据和证据,就需要正确使用科学知识(即内容性知识),以及与科学有关的知识,包括程序性知识和认知性知识。

对于科学探究的能力标准不再停留在PISA2006测试框架中简单的“识别科学问题”,在PISA2015测试框架中提升为“设计和评价科学探究”,既要设计完整的科学探究,也要对他人的科学探究设计方案进行评价。一般认为,识别科学问题仅仅是科学探究的第一步。一个具有科学素养的人不应该只是能够识别科学问题,更应该尝试着去解决这些科学问题,即使最后不能完全解决这些问题,也应该去做。解决问题的过程,即科学探究的过程,才应该是未来公民应该体验和具备的一种基本技能。只有真正理解科学探究及其过程之后,再运用科学探究的认知性知识,才有可能设计和评价科学探究活动。

(三)对知识的考查内容更重视对科学知识建立过程(即科学本质)的认识

在2006测试框架中,将知识分为“科学知识”和“有关科学的知识”,而在2015测试框架中,“有关科学的知识”具体化为“程序性知识”和“认知性知识”。要想适应未来的生活,不仅仅需要一般的科学内容知识(即内容性知识),更需要理解这些知识的建构过程(即程序性知识),以及在知识建构过程中,理论、假设和观察等科学方法是如何起作用的(即认知性知识)。这样的划分,将以前的“有关科学的知识”具象化,使得科学素养测试更加具有可操作性,便于科学教师在教学过程中进行针对性教学改进。

(四)背景层次更加清晰,细致

在2006测试框架中,测试背景由“个人、社会、全球”3个层级构成,这样的划分体现了一定的层次性,但是,“社会”涵盖的内容太广泛了。广义上的“社会”,指共同生活的人们通过各种各样社会关系联合起来的集合,即人群共存的地方。也就是说,只要与生活有关的情景都可以称之为“社会”情景。仔细推敲之后,“个人”和“全球”情景也可以涵盖在“社会”情景中,也就没有了所谓的“个人”和“全球”情景。而在PISA2015测试框架中,对于“社会”改为了“地区/国家”,就构成了“个人、地区/国家、全球”的层级结构。最外层的“全球”就相当于我们生活的地球或者协调各国关系的联合国,个人就是指单个公民,在个人和联合国之间,就是有多人组成的群体,即国家或地区。如此细化之后,不同背景之间的交叉就会更少,背景的层次性会更加清晰、连贯。

(五)对科学探究的态度,不仅仅是简单的支持程度调查,更加注重认知上的评价

在2006测试框架中对科学探究的态度考查,只是简单的支持程度,而在2015测试框架中,则变成“评价科学探究方法的价值”。这是一种更高层次的要求,是一种本质的变革。不再停滞在简单的是否支持,而是从本质上去理解科学探究过程,评价科学探究方法的价值。只有能够评价科学方法的价值之后,才能发自内心地去支持科学探究,才有可能在未来的公民生活中愿意运用科学探究去研究科学问题,参与有关科学技术问题的讨论与决策。

(六)首次提出科学素养能力标准和知识类型的认知需求框架,为进一步细化试题评分和撰写研究报告做好铺垫

认知需求框架将能力标准和知识类型分为高中低三档,可以减少测试框架应用过程中遇到的试题难度划分问题,避免重复,可以在更宽泛的学生能力范围内进行科学素养的大范围测试。此外,这种认知需求框架的使用也可以更好地对能力标准进行描述和报告。

PISA: 德国学生进步明显 篇2

2016年2月10日,经合组织(OECD)公布了最新的一份PISA报告。该报告对2012年度PISA测试结果进行了详细分析,结果显示,德国教育虽然进步明显,然而仍然有近1/5学生的学习能力较弱:在数学学科方面,14万名15岁的德国学生在0~6级的测试中只能达到1级;其中,7万名甚至在所有学科(数学、自然科学、阅读和理解)的测试中只能达到1级水平。OECD的PISA项目总协调员安德里亚斯·施莱歇(Andreas Schleicher)解释说:“能力1级只包含了非常简单的题目。”

尽管如此,报告还是肯定了德国的进步。目前,德国在数学学科学习有问题的学生比例虽然仍高达18%,但较2003年下降了4%;阅读和理解方面有问题的学生达14%,下降了8%;自然科学方面没有明显的进步。德国学生的PISA成绩整体水平高于OECD平均值五个百分点,这是一个不小的进步。这说明德国各州文化教育部长联席会议(KMK)近些年采取的一些促进措施是有成效的,学习能力弱的学生数量有所减少。

学生的社会背景成为造成学习困难的一个决定因素。此外,施莱歇指出,帮助学生减少学习困难,要从多个环节入手,如早教、早期学习诊断、教育标准、更多的全日制学校、密集的教师培训和深造。

PISA试题赏析 篇3

农夫将苹果树种在正方形的果园里.为了保护苹果树不怕风吹, 他在苹果树的周围种针叶树.在下图里, 你可以看到农夫所种植苹果树的列数 (n) , 和苹果树数量及针叶树数量的规律:

问题1:完成下表的空格

问题2:你可以用以下的2个公式来计算上面提到的苹果树数量及针叶树数量:苹果树的数量=n2, 针叶树的数量=8n (n代表苹果树的列数) .当n为某一个数值时, 苹果树数量会等于针叶树数量.找出n值, 并写出你的计算方法.

问题3:若农夫想要种更多列, 做一个更大的果园, 当农夫将果园扩大时, 哪一种树会增加得比较快?是苹果树的数量还是针叶树的数量?解释你的想法.

【解析】本例着重考查“找规律”这一知识要点, 研究发现数学规律题的解题思想, 不但能够提高同学们的考试成绩, 而且更有助于创新型人才的培养.这类题目主要考查同学们的综合分析问题和解决问题的能力.做这种数学规律的题目, 既可以从数量入手, 也可以从图形来分析规律, 但都会涉及一个或者几个变化的量.所谓找规律, 多数情况下是指变量的变化规律.所以抓住了变量就等于抓住了解决问题的关键.最近几年全国多数地市的中考试卷都出现了找规律的题目, 所以这一类数学题要引起大家的足够重视.

PISA2006试题———成长

青少年长得更高了.下图显示1998年荷兰年轻男性和女性的平均身高:

问题1:自1980年以来, 20岁女性的平均身高增加了2.3公分, 变成170.6公分.则1980年20岁女性的平均身高是多少?

问题2:根据这张图, 平均而言, 哪一段时期的女孩身高会比同年龄的男孩高?

问题3:依据上图说明为何女孩12岁以后身高的增加率会减小.

【解析】本题从“学生的身高”这一背景出发, 着重考查“统计图”这一知识点.在数学统计中, 常用的统计图有条形统计图、扇形统计图、折线统计图和频率分布直方图等.它们都是以不同的角度清晰有效地描述一组数据的一种方式, 特点也各不相同.但不管采用哪种方法, 统计图都能直观明了地反映数据中的信息.对统计图的考查, 大多从读图、识图、用图三个方面出发, 然而不同的统计图有不同的特点, 如何从不同的统计图中找到相关的信息去分析数据、描述数据, 进而对我们生活的缤纷世界作出判断、预测和决策, 这是同学们学习统计知识时需要获得的一项能力.统计图是历年各地中考的必考知识点.统计2012年全国各地38份中考试卷, 其中33份都有统计图一类试题.这类题目涉及的内容虽然各不相同, 但考查的知识却大同小异.

【链接】学生能力国际评价PISA (ProgramforInternationalStudent Assessment) 是经济和发展组织OECD (Organization for Economic Cooperation and Development) 成员国的合作项目, 其测试旨在评估OECD成员国15岁学生 (相当于初中毕业) 在完成义务教育后, 是否掌握参与社会工作所需的知识和技能, 是否拥有终身学习所必备的基础.

PISA财经素养试题编制技术探析 篇4

财经素养与财经教育的研究在我国起步较晚,分析PISA财经素养试题编制技术,探讨如何考查年轻公民的财经素养,寻找有效开展财经教育的方式与方法,都是颇有意义的研究。本文以PISA2012财经素养试测后解密的10道样题为例,剖析其试题编制技术。

一、财经素养与测评框架

(一)财经素养的定义

根据OECD(2013)的界定,财经素养是“一种关于财经概念和金融风险的知识和理解力,以及运用这种知识和理解力的技能、动机和自信心,以便在各种金融情境中做出明智决策、提升个人和社会的财经保障,并能够参与经济生活”。该界定包括两层涵义:一是财经素养的结构和行为特征;二是发展财经素养的目的 [2]。

(二)财经素养的测评理论模型

财经素养的测评希望回答类似如下的问题:年轻一代怎样才能做好准备以应对日益全球化、日益复杂化的新兴的金融体系?根据财经素养的高低,谁才是年轻一代中的领导者?为了获得有效、可靠且可解释的数据以回应上述问题,OECD(2013)以内容(包括知识与理解力)、过程(包括认知策略与方法)、情境(即知识、技能和理解力的应用范围)三个维度构建了财经素养测评的三维理论模型,并根据参与测评的国家与地区的15岁学生共同面临的财经问题,规划了测评试题在各个维度的分布比例,如表1。

二、财经素养样题与测评指标分析

(一)财经素养样题

样题作为OECD-PISA对大众公开的题目,主要用于解释其测评理念、测评方法、测评程序和测评的有效性。因此,这些题目的题型、认知水平、内容领域、情境选择都具有典型意义。财经素养的样题共分9个单元10道题目,具体如下。

单元1 在市场

番茄可以零售,2.75元/千克,也可以成箱购买,22元/箱(10千克)。(广告图片略)

问题1.1 箱装的番茄比散装番茄价格更实惠。请给出一个理由支持该观点。

问题1.2 对某些人来说,买一箱番茄不是个明智的财务决策。请解释为什么。

单元2 消费选择

小芳与朋友合租住房。他们已工作两个月,还没有任何积蓄。他们拿的是月薪,且刚拿到薪水。他们制定了下面“待办事项”清单。

问题2 清单中哪些开销是小芳与朋友急需解决的?

在每项开销后选择圈出“是”或“否”。

单元3 摩托车险

去年,小王为他的摩托车在A保险公司购买了保险,保险内容包括赔偿摩托车因意外损坏和被盗造成的损失。

问题3 小王计划今年在A公司续保。不过去年以来小王家中发生了一些变故。表格中的这些因素可能怎样影响小王今年的摩托车保费?

在每个因素后圈出“增加花费”、“减少花费”或者“没有影响”。

单元4 银行失误

小王在西德兰银行存钱。他收到一封电子邮件。

问题4 对小王来说,以下哪个陈述是好建议?

在每个陈述后圈“是”或“否”。

单元5 工资单

小芳的老板每个月通过划账到小芳的银行账户来支付工资。下面是小芳7月的工资单。

问题5 7月31日,小芳的老板给小芳的银行账号划拨了多少钱?

A. 500元 B. 2500元

C. 2800元    D. 19600元

单元6 股票

下图是B公司12个月的股市行情图。(图略)

问题6 关于该股市行情图,下述观点哪个是对的?

单元7 新贷款

李太太在A融资公司贷款8 000元,贷款年利率是15%,她每月还贷150元。一年后,李太太仍欠贷款7 400元。

B融资公司给李太太贷款10 000元,贷款年利率是15%,每月需还贷150元。

问题7 如果李太太向B融资公司贷款,可能出现的消极财务结果是什么?

单元8 旅游经费

小兰每周在一家餐馆工作三个晚上,每晚工作四个小时,时薪10元。小兰每周还能挣80元小费。小兰每周把总收入的一半储存起来。

问题8 小兰计划存600元用于假日出游。她需要几周才能存满600元?

单元9 新银行卡

丽莎住在西德兰国。她收到一张新银行卡。(卡图片略)

问题9 第二天,丽莎收到银行卡的个人身份识别码(PIN)。丽莎应该用PIN做什么?

A. 在便签上记下PIN并放进钱包; B. 把PIN告诉朋友;

C. 在银行卡背面写上PIN; D. 记住PIN.

(二)样题的测评指标分析

按照测评模型的三个维度,结合背景信息的呈现形式、PISA2012试测考生回答的正确率,分析上述10道样题,得到表2。

10道样题的财经信息呈现形式很丰富,如:广告、图片、文字描述与说明、表单、统计图、表格等,涵盖了15岁孩子经常接触且能够理解的多种财经素材。在PISA2012试测中,考生作答正确率的跨度从40%至超过90%,较好地区分出考生财经素养的差异。

1. 关于内容。10道样题在内容维度上的分布比例为C1 ∶ C2 ∶ C3 ∶ C4=4 ∶ 3 ∶ 2 ∶ 1,与测评框架中的预设比例基本一致。

货币与交易(C1)。一是指能够理解货币的不同形式和使用目的,如:能够分辨支票与货币,理解货币用于兑换商品和服务,能够分辨个人支付与网上支付等方式的不同,认识从他方获取资金的不同方式和在人们(或机构)间的资金流动,理解向人借债与借钱给人,知道付息与获息的原因;二是指能够处理和管理简单的货币交易,如:能用现金、银行卡或其它方式购物,会用提款机取钱或转账,会正确计算汇率,会通过计算两个不同的消费项目来比较其性价比,会检查银行对账单并觉察其不合常规之处。例如:Q1.1通过比较番茄每千克单价来分辨两种购买方式的性价比;Q5通过阅读工资表单来辨认出实发工资额;Q9是使用含有PIN的银行卡时需要注意的安全措施,这三道题在内容上属于货币与交易类型。

规划与理财(C2)。一是指管理收入与消费的知识和能力,如:能识别不同的收入类型并计算收入,会通过草拟预算来安排定期的消费与储蓄;二是利用收入和其它资源提高短期和长期财经保障的知识与能力,如:懂得如何操纵预算中各种因素,评估不同消费方案的影响并能确定短期和长期的优先消费项目,会提前规划未来的支出,理解积累财富的观念、复利率对储蓄的影响、产品投资的利与弊,认识到为实现长期目标或改善环境而储蓄的好处,知道政府税收和收益怎样影响财政规划与管理。例如:Q7要求考生能审视并评估从一种贷款转向另一种贷款可能带来的消极后果,该题主要考查要点属于管理消费的知识与能力类别;Q2要求考生能够区分想要事项和必须事项,并明确需要优先处理的事项;Q8要求考生根据收入状况为未来消费(假日出游)提前规划储蓄活动。Q2、Q8两道试题的考查主要涉及利用收入改善生活、提高生活品质的知识与能力。

风险与回报(C3)。这是财经素养的核心领域,主要包括:融合管理、平衡和抵制风险的各种方法的能力,在财经情境中对可能出现的财经收益或损失的理解力。该领域有两类特别重要的风险,一是个人无法承受的财经损失,如灾难性损失;二是金融产品的固有风险,如信贷协定中利息的变化率。具体而言,C3的测评内容体现为四个方面:一是明确可以运用某些金融产品(含保险)和金融活动(如储蓄)来管理和抵消各种金融风险;二是运用风险管理方法,包括:分散投资的益处,违约支付账单的风险,签订信用协议;三是理解和管理与个人生活、经济生活和其它外在因素相关的风险与回报;四是理解与金融产品的各种衍生产品相关的风险与回报。例如:Q3涉及购买保险以抵消可能面临的灾难性损失的知识,考查考生是否了解影响摩托车保险费用高低的因素,主要归入上述四个方面的第一方面;Q6通过解读一只股票的股价年走势图来确定增长率和最佳买入时机,属于理解金融及其衍生品的回报。

财经格局(C4)。涉及金融世界的性质与特点,包括知道消费者在金融市场和理财环境中的权益和责任,理解财经合约的主要含义,了解相关的信息资源和法律规章。具体而言,C4的测评内容体现为四个方面:一是关于买方与卖方权利与责任的知识,和运用该知识的能力;二是关于财经环境的知识和理解力,包括:辨别哪些供应商值得信任,哪家产品和服务可以寻求法律保护,选择金融产品时向谁咨询,到哪里寻求金融事务帮助,知道金融诈骗并知道怎样合理预防该类事件;三是关于财经决策所产生的影响的知识与理解力;四是关于经济因素和外部因素造成影响的知识。例如:Q4放置在网上银行背景下,用电子邮件创设了可能出现的金融诈骗情境,考查学生是否知道怎样妥善处理诈骗邮件信息,主要归入C4的第二方面。

2. 关于过程。10道样题在过程维度上的分布比例为P1 ∶ P2 ∶ P3 ∶ P4=1 ∶ 4 ∶ 4 ∶ 1,基本接近测评框架中的预设比例。

识别财经信息(P1)。这一过程在个人搜索和访问金融信息资源、识别或认出其中的相关性时发生。例如:Q5需要考生在工资单这个信息源中认出与实发工资相关的数据,主要考查的认知过程属于识别类。

分析财经背景中的信息(P2)。涵盖了对提供的信息进行解释、比较与对比、综合分析等认知活动,借助这些活动将其中潜在的信息通过推断明朗化,以延伸对信息的理解。例如:Q1.1需要考生根据信息通过简单计算与大小比较说明箱装番茄价格更实惠;Q3需要考生对每种因素进行比较,将“把旧摩托车换成马力更大的摩托车”中潜在信息“由于马力增大,万一出现车祸可能导致的损失也会更大”明确延伸为“需要增加保费”,将“给摩托车换新颜色”中潜在信息“这不影响摩托车的使用”明确延伸为“对保费没有影响”,将“去年发生了两次交通事故”中潜在信息“交通事故发生率较高”明确延伸为“需要增加保费”;Q6需要考生通过比较12个月的股价得出9月股价最低的推断,并将这个推断明确表达成9月是购买股票的最佳时段,另外,还需要根据6月股价与次年5月股价计算得出股价的年增长率;Q7需要考生透过表面上B融资公司贷款年利率较低的信息,发掘出B融资公司因贷款起点高导致可能会欠更多债、还款时间更长、需要支付的利息更多等论点,并判断它们属于消极后果。以上试题均需要考生对题目给出的信息加以延伸,因此其认知过程主要属于分析类。

评估财经问题(P3)。其主要过程在于利用财经知识和理解力进行财经判断,在形成相应观点的过程中展现出批判性思维。例如:Q1.2需要考生在知道箱装番茄的价格更实惠的情况下,应考虑大量购买却难以吃完反而造成浪费、或者可能有些人负担不起大量购买的成本,从而得出成箱购买番茄不是明智决策的判断;Q2需要考生根据“是否当务之急”这个标准对所列出的开销活动进行判断;Q4需要考生首先意识到电子邮件存在金融诈骗的可能性,在这一假设下,运用相关经验逐一剖析给出的建议是否能够排除金融诈骗的可能性;Q9需要考生明确个人身份识别码(PIN)对关联的银行卡的意义,以辨别题目给出的四种方式中哪一种才能确保PIN使用的安全性。以上试题均展现出考生的批判性思维活动,因此其认知过程主要属于评估类。

运用财经知识和理解力(P4)。其主要过程在于采取计算、演算、推理等有效行动来解决财经问题。例如: Q8需要考生根据给出的条件计算出储蓄所需要的时间。该试题需要考生采取有效的行动,因此其认知过程主要属于运用类。

3. 关于情境。10道样题在情境维度上的分布比例为T1 ∶ T2 ∶ T3 ∶ T4=2 ∶ 3 ∶ 4 ∶ 1,与测评框架中的预设比例非常吻合。

教育与工作(T1)。15岁孩子开始考虑关于教育与工作方面的经济问题,例如,了解工资单,为上大学而存钱,研究申请学生贷款的益处与风险,等等。Q5的问题情境是工作环境下识别工资单上的特定信息,Q8的问题情境则是课外打零工的工作环境下计算收入所得,这两道题目的情境维度均属于T1类。

居家与家庭(T2)。与15岁孩子相关的家庭日常开支、预算与决策、购买与记录,以及与同伴外出短期合住时发生的财经事件,均归为这一维度。Q1.1和Q1.2的问题情境是在市场购买番茄,Q2的问题情境则是与室友讨论优先开销,这两道试题的情境均涉及家庭或居家生活的经济话题。

个人(T3)。个人情境包括与合同相关的事宜,如开通银行账户、购买个人消费品、支付娱乐活动等,还包括处理与大额消费相关的金融服务事宜,如信用卡、保险等。Q3涉及个人续购保险事宜,Q6与个人购买股票相关,Q7研究个人再贷款问题,Q9需要学生在四个选项中选出使用银行卡时最安全的做法,这四道试题的背景都与个人理财有关。

社会(T4)。社会情境包括知晓消费者的权利与义务、理解纳税和政府收服务费的目的、知道商业利息、考虑消费者购买力的作用等;也可以延伸到思考金融抉择,如向非盈利组织和慈善机构捐赠等。Q4涉及到金融领域的诈骗行为,属于社会情境。

三、财经素养样题的编制特点分析

财经素养测评延续PISA其它领域的测评传统,采用单元的形式设计试题,一般每个单元包含1-3道题目,这些题目共用一个财经背景材料。财经素养测评虽然2012年才正式开展,但其试题编制的方法与技术、测试材料的选取、测试重点的定位、评分方法的制定等已初显特色。

(一)严格按照测评理论模型构建试题库

与阅读、数学、科学领域的测评一样,财经素养的测评也建构了专门的测评理论模型。虽然10道样题的数量偏少,无法覆盖三个维度每种类型的丰富内涵,难以充分阐释财经素养测评的理论模型,但是这10道样题的编制仍严格按照理论模型设计,每道题目根据设计意图分属唯一的内容类型、过程类型、情境类型。这样,有利于对考生的作答进行归类,具有较强的可操作性。

(二)关联数学与阅读素养,更聚焦财经观念与意识

财经素养不仅体现为财经知识与理解力、运用能力,也与学生数学素养和阅读素养的高低密切相关。财经素养只涉及数学素养中的数量领域,如果学生受限于数量计算,那么势必影响其对财经问题的分析与理解,但该问题可以借助适当的工具(如计算器)来弥补。然而,像数感、数字多种表现形式的熟练度、心算与估算技能、对计算结果合理性的评估等与数学相关的能力,本质上也是财经素养的一部分。另外,虽然财经素养的题目陈述尽可能清晰、简短以便把对阅读能力的需求降到最低,但在某些情况下,读懂和解释财经文件或伪财经文件中的术语与措辞本身也是财经素养的一部分。公开的10道样题,都只涉及基本的加减乘除四则运算,且成功解决问题依靠的是学生的财经判断,而不是其运用计算的情况。在阅读题目素材时,Q4需要考生觉察出电子邮件自身可能是金融诈骗的一部分,Q5需要考生识别术语“实发工资”与“工资总额”的不同,Q6需要考生理解股价年增长率的意义,Q7需要考生理解贷款年利率的意义,Q9需要考生理解个人身份识别码(PIN)的意义。这些财经类的基本术语与措辞聚焦财经观念与意识,凸显了对财经素养而不是阅读素养的考查。

(三)素材多样且真实,重点考查面向未来生活的能力

关于财经素养,PISA2012和PISA 2015均同时采用两种模式:纸笔测试和计算机测试。由于财经素养不是测试主领域,且需要兼顾纸笔测试结果和计算机测试结果的等值性,因此,试题设计限于静态背景,但尽可能再现对真实生活的模拟。所以运用了包括市场购物、消费选择、续购保险、电子邮件诈骗、工资单、股票买卖、银行借贷、旅游规划、银行卡使用等15岁孩子在日常生活中经常可以遇到的各种材料。最大限度地提供未来生活中需要个人运用财经素养的场景,以突出对面向未来生活能力的考查。

(四)开放题的重点放在运用财经知识和理解力对信息进行多角度体验与分析

从问题的设计来看,财经素养的开放题设计紧密联系财经场景,文本信息、图片信息均突出财经主题。学生可以从多个角度运用财经知识和理解力来解决问题。例如:在Q7中,学生可以从四个角度来解释如果李太太向B融资公司贷款可能产生的消极后果,一是可能会欠更多的债,二是需要支付更多的利息,三是还清贷款的时间会变长,四是可能必须支付取消在A公司贷款的某些费用,凡是可以归入这四类的作答都是满分。

(五)客观化的阅卷编码规则与样例尽可能降低了阅卷者主观因素的干扰

财经素养开放题的作答情况不仅涉及到财经知识和理解力,还与学生的学习经验、生活体验、家庭影响等多种因素相关,因此作答情况非常多样,给阅卷编码者带来很大困扰。为了尽可能降低阅卷编码者主观因素对学生作答的影响,PISA制定了详细的阅卷编码指南,把每道开放题的编码规则与作答样例结合在一起,尽量对各种可能的答案给出具体描述,以使阅卷编码者更容易应对实际编码过程中的各种答案情境。这种做法已经成为PISA的良好传统和重要标志。

[参考文献]

[1]OECD(2013), PISA 2012 Assessment and Analytical Framework: Mathematics,Reading,Science,Problem Solving and Financial Literacy. P139-166.

http://www.oecd.org/pisa/pisaproducts/PISA%202012%20framework%20e-book_final.pdf

[2]邱旻玮编译. PISA财经素养测试样题[J]. 上海教育,2014(1),24-26.

[3]杨玉东,陆璟. PISA2012测试新领域“财经素养”的动向和启示[J]. 上海教育科研,2012(10),40-43.

PISA2015 篇5

一、PISA阅读素养测试阅卷程序分析

(一) 阅卷程序

为保证测试内容的公正, PISA建立了严格的命题、选题、阅卷的程序。尤其是在阅卷环节上, 致力于保证评价结果的公正性。

PISA阅卷环节可以用图1表示:

这样的阅卷程序, 体现的是程序公正的原则。

所谓程序公正, 本义是指制定和实施法律、法规、条例及其他政策时应遵循公正合理的程序 (流程) 安排, 即“正义不仅要实现, 而且要以看得见的方式实现”。将此概念借用到阅卷过程中, 目的是为了体现PISA的每一个环节都有严格的规范, 都是可控的, 是“看得见的”。这样的程序公正就能保证PISA测试结果的公正性和科学性。

(二) 程序解读

在PISA阅卷程序中, “提供评分标准”和“评分者培训”是整个阅卷环节最重要的两个组成部分。

首先看评分标准。PISA2009阅读测试的评分标准由检测的能力点 (题旨) 、评分原则的描述、参考答案、其他有代表性的符合要求的答案及错误的答案五部分内容构成。其中“评分原则的描述”是评分标准的核心内容, 不但明确了得分的具体要求, 而且对答案的开放程度也做出了规定。有些难度较高或答案开放程度较高的题目, 对正确或错误的答案依据评分原则还给出了为什么对或错的描述, 其实际意义是明确评分的临界线。由于评分标准比较复杂, 评分者需要花一定的时间进行研读。只要在培训过程中评分者真正领悟和掌握这一标准, 不同的评分者就能较高地达成评分的一致性。

PISA阅读测试评分标准的形成基础是PISA对阅读素养的界定和水平量表, “检测的能力点 (题旨) ”和“评分原则的描述”由此生成。对于阅读测试来说, 主观性试题对考查学生的阅读素养往往是不可缺少的, 因为它可以考查学生对文章的理解感悟等较高层次的心智活动, 并且能够给予学生自由表达个人阅读感受的机会, 但这种题目的使用也带来一系列问题, 例如“评分者效应”难于控制便是主观性试题的一大弊端。由于有前测, PISA测试可以在制定评分标准的过程中参考已有的学生答题情况, 并选择具有典型意义的不同答案作为评分标准的组成部分, 为评分者更好地掌握评分尺度提供清晰的参照, 从而确保了评分标准的科学性和可解释性。

其次是评分者培训。经上海市教委教研室推荐和上海PISA测试研究中心的相关测试选拔, 共确定评分专家16人, 最低教龄不少于10年, 年龄上限不超过45岁, 区教研员占80%, 高级职称占60%, 从而确保了评分队伍的高素质。负责培训的专家均在国际PISA会议上经过严格培训。为保证评分质量, 评分严格按照国际规范, 每天评分时间不超过6小时, 每两小时必须休息10分钟。整个评分过程有21天, 而评分者培训的时间就达到6天, 占整个评分时间的近三分之一, PISA对评分者培训的重视可见一斑。

在具体培训过程中, PISA测试为培训提供了《评分指南》、《国内样例》、《国际样例》和《工作坊材料》四份材料, 按照专有的程序进行培训。培训专家首先带领评分专家仔细解读《评分指南》, 《评分指南》在搜集国际国内体现不同答题思路的数量众多的样例的基础上, 按照“阅读素养的5级水平概述”量表的要求将评分标准分层、细化, 根据不同的层次或角度赋以不同的评分代码, 可操作性强。评分过程中, 《评分指南》的评分标准不可随意更改, 评分专家必须严格遵照执行;实际评分时站在考生的角度, 从答题成功的前提下尽量去理解学生的答案。当然, 因为试题来源于不同国家或组织, 各国提供的评价标准在操作时也有不完全平衡的地方, 有的标准严, 有的题目又相对比较松。

《评分指南》解读完毕, 评分专家必须研习《国际样例》、《国内样例》两套练习卷, 前者提供的是国内学生在试测过程所做的回答样例, 后者提供的则是国际学生在以往测试中的回答样例。设计这两套练习卷的目的, 是使评分专家对不同文化背景的学生所做出的最通常的回答样例, 以及那些可能接近评分等级分界线的答案, 都能做出恰当和具有一致性的评判。作为培训的总结, 评分专家必须完成《工作坊材料》中的所有例题, 并根据先前所确定的评分标准来检查各自的评分情况, 只有准确率达到80%以上才能参与正式评分。在最终确定的评分标准中, 《工作坊材料》是作为评分标准的重要补充, 它提供了各个回答水平的更加详细的描述和更多的具体样例, 是为了说明所期望的一系列回答以及学生回答主观性试题的最通常的答案。为了使评分者在具体阅卷中对答案有更清晰地认识, 练习卷中的回答样例都有明确的注释, 以此来解释给分的根本原因。

为进一步保证评分的有效性, PISA还设置了多次评分环节。16位阅卷专家依次编号, 编号最后4位的专家参与多次评分。学生答题本的封面上都贴有专门设计的表格, 内容包括评分专家编号、题目编号等, 单次评分与多次评分的题目均用不同颜色标识, 多次评分的题目组约占总题量的三分之一。在终端计算机输入时, 会及时生成某位评分专家的评分准确率, 评分监督会根据统计情况及时决定是否终止其评分资格。

通过上述分析, 我们发现, PISA测试在阅卷评分过程中, 非常重视程序的清晰性和可操作性, 在具体执行过程中, 又体现了人性化和精细化, 从而确保了测试结果的公正性和科学性。

二、上海语文中考阅卷程序分析

(一) 阅卷程序

近几年, 上海采用计算机和人工相结合的阅卷方式, 具体阅卷程序可用图2表示:

(二) 程序解读

从程序上看, 上海语文中考也同样制定了“提供评分标准”和“评分者培训”两个步骤, 但在操作的精细化方面还有待改进。

从评分标准看, 2009年上海语文中考卷阅读部分的评分标准只有测量目标、分值分配、参考答案三部分内容。而其中的“测量目标”是直接引用“考试标准”中的表述, 缺乏直接针对题目评分的原则性描述。由于缺乏对不同等级水平的具体描述, 即使命题者有心将评分原则描述得更将详尽、清晰, 也会陷于“评分原则”缺乏依据的尴尬之中。整个评价标准没有一个专门的评价量表, 只在具体的题目后面根据该题的总分值确定本题的评分建议, 对于分值低于5分的题目一般只提供一个参考答案或答题要点, 有的题目可能有部分得分情况出现, 则在参考答案后加以补充说明, 个别分值高的题目虽然也分档次评分, 但档次之间的表述比较模糊。

再看评分者培训, 由于受招生时间节点的限制, 整个中考阅卷的时间只有6天左右, 一般在考试结束第二天即开始, 因此培训时间包含在阅卷过程中, 时间不超过一天。阅卷者都是由区教研员将名额分配给各个学校, 对阅卷者的教龄、职称等都没有严格规定。

就培训过程而言, 由于缺少前测, 培训者和评分者只能依据学生的实际测试卷进行培训, 客观上给部分学生带来了评分上的不公平。培训者也不提供相关的评分指南, 虽然在培训中命题者会将命题意图作为评分原则传递给评分者, 但这种口口相传的“评分原则”由于缺乏具体的学生答题情况的参照, 评分者在面对五花八门的答案时就很难把握评分的临界线, 评分误差在分值较高的主观性试题中就难以避免, 从而造成“评分者效应”难以有效降低, 有损评分的一致性。评分者根据“参考答案和评分建议”在操作时一般采取缺陷评分的思维方式, 实行的是“找错误”的扣分制。所以学生试卷上会出现半对的情况, 但学生很难知道自己错在何处, 所以也会缺乏改进的思路和方法。

(三) 对比分析

从图2可知, 除了前两个步骤, 上海语文中考阅卷程序与PISA的阅卷程序相比, 主要差异在于“第二次评分”、“第三次评分”以及计算机参与评分。以下稍作展开。

增加“第二次评分”显然是出于对评分者掌握评分标准的顾虑, 而不是为了检测“第一次评分”的有效性, 而增加“第三次评分”则是为进一步强化其公正性。当然, “第三次评分”客观上还具有求证功能, 即求证前两次评分哪一次的信度更高。但由于“第三次评分”依然是整个评分过程中的一个环节, 其求证或检测功能实际上并不存在。

再看让计算机参与评分会出现怎样的结果。

在上海语文中考阅卷程序中, 计算机可谓“位高权重”。无论试题经历两次评分还是三次评分, 最终都要经过计算机的检验才能生成最终得分。

当设定的阈值为零, 且“第一次评分”和“第二次评分”一致时, 计算机自动生成最终得分, 并与前两次评分保持一致。在这一过程中, 计算机其实并没有起到检验的作用, 检验评分一致性的任务是由“第二次评分”提前完成了。同理, 当设定的阈值为零, 但“第一次评分”和“第二次评分”不一致时, 计算机会请求“第三次评分”, 如果“第三次评分”的阈值同样设置为零, 那么“第三次评分”就自然地承担起检验前两次评分有效性的责任。在这一过程中计算机依然是个“旁观者”。然而, 这正是计算机应该扮演的角色。

当设定的阈值大于零时, 问题就变得完全不同了。“第一次评分”和“第二次评分”的差异在阈值设定的范围之内, 计算机就充当了最后的裁决者, 快速地求得前两次评分的均值生成最终得分。这一最终得分, 既不是“第一次评分”的得分, 也不是“第二次评分”的得分, 而是计算机评出的分。那么, 计算机给出的分是否准确、公正呢?以下面的例子来说明。

2009年上海语文中考卷第19题总分为9分, 如果阈值设定为1分, 某位学生的答题“第一次评分”为8分, “第二次评分”为7分, 在设定的阈值范围内, 那么这名学生这一题的最终得分就是7.5分, 这是计算机给的分。这一评分过程中可能存在以下三种情况:第一, “第一次评分”是准确的, 在计算机参与了评分之后, 这位学生在这一题上的得分少了0.5分;第二, “第二次评分”是准确的, 这位学生幸运地在这一题上多得了0.5分;第三, 前两次评分都不准确, 真实的得分或大于8分, 或小于7分, 计算机给出的7.5分无疑是在扩大评分误差。

如果前两次评分的差异大于设定的阈值, 那么就需要“第三次评分”。假设上述的同一份试卷中的同一题, 在“第一次评分”中得9分, “第二次评分”中得7分, “第三次评分”的阈值设定同为1分, 在“第三次评分”中会出现以下四种情况:第一, “第三次评分”得9分, 最终得分为9分, 同时证明“第一次评分”是准确的;第二, “第三次评分”得7分, 最终得分为7分, 同时证明“第二次评分”是准确的;第三, “第三次评分”得6分, 就将重演上述两次评分在设定的阈值范围内的三种情况;第四, “第三次评分”得8分, 计算机会如何给分呢?是给8.5分, 还是给7.5分?

以上分析只是基于一道分值为9分, 阈值设定为1分, 而且答案相对容易界定的阅读填空题, 如果是分值更大, 阈值设定也更大的题呢?比如“写作”, 上述分析会依然有效, 而其荒诞也更加明显。

可以得出以下结论:主观性试题阅卷评分的准确性和公正性只有评分者才能做到, 也只有依靠评分者才能做得更好, 计算机只能用于处理表示分值的数字, 而不能参与主观性试题的评分。因为主观性试题评分的公正性需要一个能够“看得见”的程序, 而计算机参与评分会制造出太多“看不见”的东西。

三、结论和建议

(一) 结论

通过对比PISA与上海语文中考的阅卷程序, 我们发现貌似差异不大的程序背后蕴含的却是理念上的明显差异。

PISA重在考查学生通过阅读解决应用型任务的能力, 按照PISA的观点, 应用维度要求学生能够在特定的“情境”下来阅读文字材料, 所以PISA提供的文本必须具备情境要素。有数据显示:在已进行的三届阅读测试中, 约有45%是要求建构式反应的测试题目, 评分者在给这些题目评分时包含有较多的主观因素, 而为了保证测试结果的公平公正, 提高测试的信度和效度, 就必须形成一个切合学生能力水平的科学完善的评分标准, 这个时候一个透明公正、具有可操作性的阅卷程序就显得极为重要。

(二) 建议

上海的语文教学改革已持续多年, 在课程建设、课程实施等方面已取得了较好成果, 但在课程评价领域仍需作进一步探索。随着课改的深入, 母语教学最终应落实到“言语层面”已经成为大家的共识, 而语言学习更多的需要学习者自身的主观感悟, 在语文阅读测试中如何对此做出科学有效的评价, 目前还有很多问题亟需解决。PISA给我们提供了很好的借鉴和启示。为此, 笔者对上海语文中考提出如下建议:

评价标准方面:

(1) 制定学业水平等级量表, 用描述性的语言具体、清晰地表现各个水平标准。

(2) 评分标准的制定要与命题同步进行, 评分标准在缺乏学生前测的情况下, 可以参考相近测试中学生的表现, 准确把握学生的水平状况。

(3) 适当延长从考试到阅卷之间的间隔天数, 以利于补充具有典型性的评分样例;扩充阅卷中心组人员, 以期在最短的时间里, 在评分者培训开始之前研制出表述具体、操作性强的评分标准。

阅卷程序方面:

(1) 为评分者提供内容具体的评分标准文本;适当增加评分者培训的时间, 丰富培训内容。

(2) 利用计算机阅卷网络平台, 开发评分者评价工具, 用于检验评分的一致性和监控评分质量, 让计算机做该做的事。

(3) 适当增加阅卷时间或增加评分者人数, 有效降低评分者单位时间的工作量, 将“评分者效应”的影响降到最低。

上海的二期课改已历时十年, 如何建立科学有效的学业质量监测和评价体系, 从而进一步促进和提高课堂教学的有效性, 是当前基础教育的主要任务之一, 相信PISA测试的引入会给我们的学业评价探索注入新的活力。

摘要:本文介绍分析了PISA数学素养测试的阅卷程序, 比较了PISA与上海市初中毕业统一学业考试语文测试的异同, 认为PISA测试在“提供评分标准”和“评分者培训”两个环节上, 使测试结果具有高度的可信性和有效性, 并指出上海中考应用计算机参与评分的不足, 最后提出了改进国内语文中考阅卷程序的建议。

PISA中国独立研究房山实践 篇6

PISA是目前国际最权威的大规模的对学生学习素养进行测试的教育评价之一,对提高学生综合素养发挥着重要作用。北京市房山区参与PISA,旨在通过PISA测试结论得出客观的信息,观察和反思自身的优势和不足,为政府教育政策的制定和调整提供更为客观、 科学的依据,依托项目驱动的方式在实践中探索改进。

房山区作为独立测试区域分别于2009年、2012年参与了由教育部考试中心主持的学生能力国际评价PISA中国独立研究,并正式参加PISA2015。这种理论与学校一线教学的反复实践, 积累了资源,催生了更多的课题研究,可激活教师的研究热情,推动区域教育质量的提升。

PISA2015 篇7

小说《鲁滨逊漂流记》中,荒岛上的鲁滨逊为了生存,修建住所、制造工具、种植谷物、驯养山羊。他不断遭遇各种各样、不可预设的困境,不断地寻找解决困境的方法。我们说,没有明显解决方案的情境,就是问题。人有目标却不知如何去实现它的时候,问题就产生了。没有思考,就没有问题。但问题解决不仅仅涉及思考,问题解决是思考和在行动中学习的过程,它通常起始于以预感或直觉为基础的“启动”过程,然后探索性地与环境互动,以明晰问题,寻求可能的解决方案,接着修正行为,启动新一轮的与环境探索性互动。

事实上,现实生活中的我们就像鲁滨逊一样,每天都在解决小问题。比如在赴约的路上,手机没电了,怎么通知朋友们?可以说,在现代社会中,所有的生活就是解决问题。社会、环境和技术的改变,意味着适用的知识也在迅速变化和发展着。适应、学习、敢于尝试新事物,不断从错误中学习,是在不可预知的世界上成功的关键。

一、PISA2012评估学生问题解决能力的意义

1. 现代社会越来越需要问题解决技能

最新的“国际成人能力测评项目”(PIAAC)中,有一项关于“成人在工作情境中是否常常需要思考才能采取行动”的调研。调查结果显示,在参与调研的国家中,大多数人至少每周有一次,在工作中会遇到不超过30分钟就能找到解决方法的简单问题;有1/10的人,每天都会遇到至少需要30分钟才能找到解决方法的复杂问题。

随着计算机和智能机器的迅猛发展,很多程序化的、需要体力的简单工作都被机器代替了,人们越来越多地需要去从事一些复杂的、非程序的、不可预测结果的工作。这些工作需要人们拥有分析、判断、沟通、领导、管理等技能。

有学者(Levy and Murnane)将工作所需要的技能分为五类。首先,区别的是“常规技能”与“非常规技能”。所谓“常规技能”所对应的工作常常是需要按部就班地去重复一个固定的过程来完成的,由于这些工作是可以被认知的(通过数据输入),可以被重复的(按照既定程序),因此这些工作可以被计算机和智能机器轻松地取代。“非常规技能”所对应的工作则需要隐性知识,即需要运用一组不能被完全描述的程序才能完成的。

其次,区别的是“非常规”中的“手工操作”工作和“抽象”工作。“手工操作”的非常规工作是指需要适应情境的,运用到视觉、语言以及人际互动完成的,比如说准备一顿晚饭,当然从人类进化的角度来看,这个任务是简单的,是人类与生俱来的,但是这个任务是很难自动化的。“抽象的非常规”工作,基于信息的处理,需要问题解决能力、说服力、创造力、直觉等。

第三,“抽象的非常规”工作又分两类,即需要“分析”技能的工作和需要“人际关系”技能的工作。其中“分析”技能的非常规工作,指需要通过转换数据,分析、筛选、整理信息等,才能完成的工作。“人际关系”技能的非常规工作,指完成工作需要复杂的人际沟通,如管理一个团队、说服潜在的买家等。这两类工作的共同点是都需要人们在与情境的互动中调控行动。因而,问题解决能力是成功的人际沟通和完成非常规分析工作的一个核心要素。

2. 学校教育要促进学生问题解决技能的增长

社会对所需工作技能的变化,对教育也提出了挑战。应对变化,教育需要转型,要从完成标准课程、取得好成绩,转向帮助学生成为终身学习者;要从为学生提供大量的事实性知识、常规技能,转向帮助学生经历各种挑战,开展深入思维,在不熟悉的、没有现成策略与方法的情境中,灵活地、创造性地思考如何克服障碍,解决问题。最好的教育应该是旨在促进学生增长执行非常规任务所需要的技能,即问题解决技能。

PISA数学、阅读和科学评估中都包含有解决问题的任务,即评估学生在多大程度上能够运用他们所学习的课程知识,来应对现实生活的挑战。事实上,问题解决能力不需要开发单独的课程来教授。很多文献都指出,基于内容的方法同样有效,甚至更可取。有句话说得好:“如果你教抽象的方法,学到的仅仅是一些原则。如果你试着用一些具体的事例来教,学到的往往不是细节。”

与PISA评估项目中数学、阅读和科学不同的是,PISA2012问题解决评估关注的是学生的一般推理能力、问题解决过程中的调控能力,以及问题解决的意愿,而非某个领域的专业知识,这也使之与PISA测试中的专业素养评估项目(阅读、数学和科学素养等)区分开来。“问题解决能力测评”是PISA2003中的附加内容,随着对问题解决认识的深入,以及计算机技术为问题解决评估提供的模拟情境等机会,使得问题解决能力评估再次成为PISA2012的核心项目。

OECD的最新证据证实:PISA问题解决评估中的一般技能,与学术成就密切相关。此外,一些研究也支持这样的观点:好的教师和学校能够通过常规课程或者额外开发的课程,来培养学生的问题解决能力。

虽然学校不是唯一的培养学生问题解决能力的场所,但是高质量的课程、丰富的学科,有助于这些技能的发展。先进的教学方法,如问题式学习、探究学习、项目工作、小组学习等,可使得学生进行深度学习,并在新情境下运用所学的知识。好的教学能促进学生自主学习和多元认知发展;好的教学能帮助学生,在不熟悉的情境中,有效地推理、观察、探索,并与未知的情境互动。

所有的教师都可以创造机会来提升学生问题解决的能力。学生问题解决能力的获得不是通过一门课程习得的,而是在多样的课程中学习到的,从而更好地帮助学生解决现实生活中的问题。

二、PISA2012评估学生问题解决能力的方法

PISA2012问题解决评估的不是某个领域的专业知识,而是评估学生在问题解决这一领域所具备的特定知识和技能,在解决问题过程中所需要的思考能力,以及对所学知识的灵活运用。

1. 聚焦于问题解决中的一般认知过程

研究表明,对于真实的、非实验室环境中的问题,策略是影响问题解决的关键。在特定的专业背景下,比如说贸易,专家会使用特定的专业知识和策略来解决某些问题;而在现实生活中,当碰到专业领域之外的问题时,专家的表现可能就像一个新手。但即便如此,一些有效的问题解决者,当遇到了专业领域之外的问题,他们也能在适当的地方使用一般推理技能,去尝试解决问题。

PISA2012问题解决评估项目的名称就已经揭示了一些典型的环境,如技术设备(如远程控制、时钟、灯),陌生空间(如交通、走失),饮料或食物准备(如维他命、饮料机器)等。这些情境都是学校之外的,但也是学生在日常生活中可能会遇到的。

PISA2012问题解决评估尽可能避免了使用特定的学科知识,来解决这些与真实生活相关联的问题。比如说,问题解决过程中需要计算,那么计算器也被设置在情境中了。与此不同的是,在PISA的数学、阅读和科学评估之中,如果有问题解决的任务,那么解决问题时一定会使用相关学科领域的专门知识。

用真实的问题情境进行评估,其结果可能会减少与学校相关的特定的学科知识之间的关联。由于评估任务是嵌于现实生活情境的,一些学生可能比其他人对某些情境更熟悉,换言之,学生对于情境的熟悉程度可能会影响他们采用的问题解决的方法。但是由于不同的情境分布在不同的评估单元中,每个参与评估的学生都可能会对某些情境熟悉,某些情境不熟悉,所以既有的经验不会影响他们的表现。此外,要强调的是,面对新问题,即使在熟悉的情境中,既有经验也不一定管用。

2. 关注“在与情境互动中的问题解决”

学生在课堂上所练习的可能是考试中会遇到的需要解决的问题,其信息从一开始就呈现出来了。然而,现实生活中需要解决的问题,往往需要从问题所在的情境中,去寻找、辨别对问题解决有用的信息。

要求学生探索发现有用信息的问题情境,称为互动问题。这类问题常常出现在使用不熟悉的电器之时,如新手机、自动售货机等;也会出现在非技术环境中,如进行社会交往、培养植物或饲养动物等。互动问题在PISA2012中的出现,也反映了在现实生活中这类问题的重要性。

与PISA2003问题解决评估相比,互动问题是一个重要的创新。其根本原因在于,PISA2012问题解决评估是基于计算机的,也正因为如此,PISA2012能够评估先前无法评估的一些问题解决能力。

3. PISA问题解决能力的定义

PISA2012将问题解决能力定义为:问题解决能力是当没有明确的解决方法时,个人运用其认知以理解并解决问题的能力。这个定义中包含了以下三层含义。

第一,个人运用其认知处理来理解和解决问题的能力。具体来说,需要问题解决者能够识别具体要解决的问题,然后计划解决的方法,实施解决方案,并监控和评估整个活动的进展。在这里强调评估的是个人解决问题的过程,包括他们所运用的策略,并且这些策略会通过计算机所收集的行为数据被追踪记录。

第二,这些问题的解决方法并不是直接可知的。具体来说,解决问题的方法不是一看就知的。PISA问题解决评估关注的就是这类非常规问题,而不是常规问题(即已学到的解决步骤或能轻易解决的问题)。是否是常规问题,是由解决者对该问题的熟悉程度决定的,但PISA中那些非常规问题是新颖独特的,达成目标的方法不能被一下看穿。学生在尝试解决问题之前,可能需要对问题情况进行探索或与之互动。PISA2012采用的计算机测评形式使直接互动成为可能。比如,一个电灯不工作了,是因为开关故障、停电,还是灯泡坏了?尽管这个情境很多15岁学生是熟悉的,但解决的有效方式是“一次改变一个因素”,这个问题解决的策略在世界各地的科学课程中都有出现。在这里,PISA测试间接地要求学生使用“没有学科知识背景”的策略。

第三,包括投身这种情境的主观意愿。问题解决是个人的,问题解决者自身的知识技能在一定程度上决定了个人克服困难、找出解决方案的难易度。然而,个体对于知识与技能的应用会受到一些动机性的、情感的因素影响,比如信念(如自信心),个人对于解决问题的兴趣和能力的感觉。这是通过问卷加以反映的。

三、PISA问题解决能力的评估框架

1. 评估框架的四个方面

PISA2012问题解决评估的重点是学生在问题解决过程中,所经历的认知过程。这大概有以下四个方面。第一,探究和理解。评估的目标是学生对问题中所呈现的信息进行理解,包括通过观察、互动、搜寻信息、找到限制和阻碍等来探究问题情境;在与问题情境互动时,理解已知信息和搜集来的信息,进而表现出个人对相关概念的理解。第二,表达和构思。评估的目标是学生对问题情境建立起连贯的心理表征,具体而言就是,问题解决者如何筛选相关信息,如何组织信息,并和其他重要的知识相联系。这包括用列表、图标、符号和口头表达等方式,将问题表述出来;通过认识问题中的相关事实及其内部关系来构思假设,组织和精确地评估信息。第三,计划和执行。计划包括设定目标,设定目标又包括设计总体目标和分目标,其中包括个人所要采取的达成目标的策略或具体步骤。第四,监控和反思。监控达成目标中的每一个阶段,包括检验中间和最后结果,察觉意料之外的事件和在需要时采取的修复行动,以及从不同角度仔细地检查所作出的假设与解决方案,搜寻更多的信息和证明。

尽管推理能力没有明确提出来,但每一个问题解决的过程都涉及一种以上的推理技能。在理解一个问题情境时,问题解决者可能需要分清什么是事实、什么是想法;在构思解决方案时,问题解决者可能需要认识到变量间的关系;在选择策略时,问题解决者可能需要考虑因果关系;在表述结果时,问题解决者可能需要有逻辑地组织信息。这些过程中所要运用的推理技能与问题解决紧密相连。由于学生能在课堂上学习、模仿这些技能,所以推理技能在PISA情境中显得十分重要。

问题解决中用到的推理技能包括:演绎、归纳、定量、因果、类推、组合以及多维度的推理。这些技巧并不互相排斥。通常情况下,问题解决者会在决定采取某一技能前,尝试用多种技能来搜集信息,测试各种解决方案的可行性。推理技能会影响评估项目的难易度,因此在设计评估项目中,推理技能会得到充分的考虑。

2. 问题的背景与关注点分类

为了保证不同背景下的任务能够贴近学生生活且能引起15岁孩子的兴趣,PISA问题解决能力评估确定了两个要点,即背景(是否是科技背景)和关注点(个人还是社会)。

首先,科技背景下的问题是以科技设备的功能为基础的,例如手机、遥控器和自动售票机等。问题解决者不用了解以上设备的内部工作原理,而是在测试中被引导着去发现和理解设备是如何运作的,为使用设备和解决设备运行问题做好准备。

实例:电子表。测试时,学生将看到一块电子表,该表有四个按钮控制,但是问题一开始并没有向学生透露它们各自的功能。学生会被引导着去完成如下任务:探究电子表处于“时间”模式时,四个按钮的不同功能;完成一张说明电子表各模式之间如何转换的示意图;根据以上的了解,操控手表,设置时间。

其次,个人背景主要是指有关个人、家庭和朋友的背景。而社会背景则指社区和整个社会。举例来说,给电子表设时间属于科技和个人背景,而要建立一个篮球队花名册则属于非科技和社会背景。

例题:学生将看到一张道路的图和一份不完整的标明不同城镇之间距离的表,他们需要完成以下任务:第一,计算没有标注的两个城镇之间的距离;第二,在指定的两个城镇之间制订一条合适的旅游线路,使其满足一定的条件,如每天行进的距离不超过一定的限制等。

3. 评估的时间与分数安排

PISA2012问题解决评估的试题总量为80分钟,测试时间为40分钟。总量为80分钟的材料被均分为四组,每组耗时20分钟。像PISA其他领域的评估一样,问题解决评估的所有试题以描述问题情境为材料,被分成多个题组,刺激相同的试题为一组。为了使测试对学生阅读能力的要求降到最低,试题对材料以及任务的语言描述尽量地简明扼要,试题编写也尽可能地采用了动画、照片以及图表等形式,避免大段文字。同时,该测试对于计算能力的要求也尽可能地降到了最低,只要情况合适,试题中都提供数据,无须受测学生计算。

分数安排以问题解决过程中涉及的认知过程为根据,详见下表。为了彰显“实施问题的解决办法并使其最终成功的能力是十分重要的”,因此,“计划与执行”在评分中所占的比重最大。另外,“监控与反思”也占了10%~20%的比重,虽然相对于其他三个部分来说,比例略低,但是PISA2012问题解决框架表示“这是不可或缺的”,因此,尽管有些试题针对的是问题解决的另外三个步骤,但是也会间接地评估受测学生监控与反思的能力。

四、基于计算机的PI SA2012问题解决评估的设计

PISA2012问题解决评估以计算机为基础。使用计算机衡量问题解决能力这一方法的优点在于,有利于搜集和分析问题处理以及解决策略的相关数据,有利于中间和最终结果的获取与评分。换言之,PISA2012问题解决能力评估的一大贡献,只要编出合适的试题,计算机就能够有目的地获取一系列数据,比如,学生在解决问题时所采取的策略,与计算机系统的互动形式、行动形式、频率、持续时间以及顺序。

比如说将动态问题情境纳入评估内容。计算机模拟的一种情境是:测试中让学生发掘和掌控系统模拟出来的问题情境,如果某一操作所导致的结果(如按下遥控器上的某个键)可能无法被预先了解或推断,只有在与情境进行互动、实际操作(按下键)时,才能根据所得结果得出该按键的功用的假设。另一种情境是解决设备故障,测试中需要学生通过一定量的试验,搜集和记录引起设备故障的相关信息,进而采取一些措施。第三种情境是“无法控制的情景”,比如在使用自动售票机时,如果交易时间超过20秒,没有任何键被按下,那么机器将会重启,于是为了实现目标(购票),问题解决者必须意识到并了解这样的系统自动行为。

计算机评估的另一个优点在于,可以监控并限制学生在某一个特定试题上所花的时间。由于PISA问题解决测试的每道试题都尽可能关注问题解决的某一个阶段,因而通过某些试题能够展现学生对问题的认识,另一些则可以描述解决的方法。一些试题会要求实际的解决方法体现出效果佳、效率高的特点;还有一些则会要求受测学生评估各种现成的方案,并为任务中提出的问题选择最佳的解决方法。

计算机所搜集的这些学生在问题解决过程中的数据,能够为我们评估学生的思维品质提供证据。尽管问题解决的结果是相同的,但是学生采用的程序、方法、策略、时间等是完全不同的,透过这些呈现的是学生的思维品质。※

PISA研究助推数学教育变革 篇8

一、发现问题

参与PISA测试之前,房山区数学教师在教育教学中普遍存在的问题主要表现在以下几个方面。

首先,学生方面。房山区PISA2012与PISA2009测试结果相比较,数学成绩有了一定的提升。但通过问卷调查可以看出,学生不仅正常的校内课堂学习时间处于很高的水平,而且完成教师布置的作业和课下学习时间也远多于其他国家和地区。 除此之外,参加单独辅导或上课外班的学生,课业负担较重。在阅卷过程中,从学生答题情况可以看出,房山区学生在获取信息、解释文本、思考判断、图表处理等方面存在突出问题,缺乏创新精神和实践能力。

其次,教师方面。针对学生在数学测试中的问题,对照寻找教师在数学教育教学中的问题。通过深入调研、视导听课、 与一线教师座谈交流,我们发现,教师在数学教育教学中存在的主要问题是:缺乏对数学全面深入的认识和思考,缺乏对数学教育理论的学习,缺乏教学设计理论和方法的知识,缺乏对学生有力的前期分析、 缺乏整体优化意识,缺乏发现问题并进行设计研究的意识,缺乏运用课标的意识。 对数学育人功能认识不够,没有充分地认识到数学教育在于启迪学生心智,培养学生理性精神;对数学育人功能体现不够, 没有体现以认识问题和解决问题为核心, 以数学知识的发生发展过程和理解数学知识的心理过程为基本线索进行数学教育教学,不能挖掘数学知识所蕴含的数学思想、 思维、方法等。这些问题与学生在测试结果中的表现是一致的。

二、具体做法

1.依托项目,解决问题

根据学生PISA测试中存在的问题以及教师在数学教育教学中的问题,结合房山区实际,房山区教委提出学习课标、研究教材、优化教法、指导学法的活动,并于2013年1月启动了研究项目“借鉴PISA数学素养测试在数学教学中增强学生数学素养的培养”,寻求解决教师在数学教育教学和学生在数学学习中的问题的途径和方法。 我们的基本思考是在不改变中学数学教育教学课时的情况下,引导教师在课堂教育教学设计上下功夫,做文章,把学生的问题尽可能在课堂上解决。

(1)课题研究的问题

针对以上多个角度的分析,我们提出本课题的研究问题:数学素养的主要内容是什么?中学数学教育教学中需要对学生进行哪些数学素养的培养?中学数学教育教学中对学生进行数学素养的培养方法和途径是什么?如何对学生进行综合评价?

(2)研究的目标

对数学素养的认识方面的目标是:什么是数学素养?数学素养对学生可持续发展的重要意义是什么?在数学教学中增强数学素养的培养的内容、途径、方法上, 通过实验研究,提出在数学教学中增强数学素养培养的指导意见,并探索具有可操作性的评价方法。

(3)研究的意义、价值

1理论研究:理解数学素养的内涵与外延,其核心是我们常说的数学思维与数学能力。弄清思维与能力之间的关系,深刻认识数学素养在学生可持续发展中的重要作用。 2实践探索:探索中学数学教育教学中如何增强对学生数学素养的培养,促进学生的可持续发展。3认识数学的学科本质:学生对基本数学概念的理解对数学素养的培养有何重要意义?学生对基本数学语言的运用对数学素养的培养有何重要意义?学生对数学思维的感悟对数学素养的培养有何重要意义? 学生对基本数学工具的运用对数学素养的培养有何重要意义?学生对数学思想方法的把握对数学素养的培养有何重要意义?学生对建立数学模型的认识对数学素养的培养有何重要意义?

2.寻找抓手,解决问题

经过两年时间的实践探索,找到了一个可以解决问题的抓手—基于课程标准的数学单元型教学设计。

两年来,我们依托“借鉴PISA数学素养测试在数学教学中增强学生数学素养的培养”这一项目,以基于课标的单元型教学设计为抓手,进行研训与教学实践活动, 在很大程度上,既解决了学生在数学学习中的问题,又解决了一线教师在教育教学中的问题,同时也满足了研训工作者与一线教师实际工作的需求。

(1)基于课标的单元型教学设计的重要作用

第一,有利于教师理解课程标准的意义与功能,用好课标。经过归纳整理,我们把课程标准的意义与功能总结为:四个依据、一个基础、三个体现、三个规定、 两个建议。

1四个依据:教材编写、教学、评估、 考试命题的依据。

2一个基础:国家管理和评价课程的基础。

3三个体现:国家对不同阶段的学生在知识与技能、过程与方法、情感态度与价值观等方面的基本要求的体现。

4三个规定:规定各门课程的性质、 目标、内容框架。

5两个建议:提出教学和评价建议。

(2)有利于数学教师依法执教、依标施教、依学定教

基于课标的单元型教学设计,可以帮助教师理解课标,将课标分解成课时教学目标;可以帮助教师在充分了解学生情况的基础上,从整体上把握好一个单元的教学内容,充分认识数学符号、知识、方法、 思想、思维、能力、工具、模型等对学生学习数学的重要性;可以帮助教师设计好每一节课、每一个单元的教学内容;可以帮助教师系统地设计教学,提升设计的优化意识等,做到课标、教材、学生、设计、评价的高度一致。以基于课标的单元型教学设计为抓手,可以解决教师在数学教育教学中存在的问题和对研训工作的需求,做到依法执教、依标施教、依学定教。

(3)有利于国家课程校本化实施

房山区是郊区的教育大区,学生分布地域广,学校间差距比较明显,将国家课课程校本化的任务比较艰巨。以基于课程标准的单元型教学设计为抓手,有利于将国家课程校本化。基于课程标准的单元型教学设计,调动了教师参与研训的积极性, 在一定程度上解决了教师在数学教育教学中存在的问题,满足了一线教师对研训工作的需求,引领一线教师在研中教、教中研,减少了课堂教育教学的随意性,重视了课堂上对学生的即时评价,促进了教师教育教学水平与能力的提升。

3.初见成效

运用PISA评价理念,我们引导全区针对自己在数学教育教学中存在的问题与学生在学习中存在的问题,改进数学教育教学,使教师的教育教学行为和学生的学习行为发生了较大的变化。

教师的变化主要表现在:认识到了数学课程标准的重要性;有了研究教材、研究学生、研究教法、思考学法的意识;能够利用基于课标和学生的单元型教学设计从整体上设计数学教育教学;认识到了数学教育教学中知识生成过程和学生思维过程的重要性,能较好地处理预设与生成的关系;认识到了数学语言、思想、方法、 模型、工具的重要性,它们是培养学生数学思维能力的基础,让数学教书育人的理念更明确。

学生的阅读能力明显提升;数学学习不再只依赖老师,学生能够适时表达自己的想法;学生自学的能力提高了;学生获取信息、解释文本、思考判断、图表处理等能力明显提升,一部分学生创新精神和实践能力加强了。

此外,经过一年的研究,教师经历了研究的过程,学会了研究的方法,收获了研究的成果,体会了成功的快乐。

(1)理清了数学素养的主要内容

对基本数学概念的理解:数学概念是思维的细胞,是训练学生思维的良好载体; 对数学思维的感悟:比较、类比、抽象、 概括、猜想、验证,其中概括是数学思维方式的核心;对数学语言的运用:数学语言是数学交流与表达的工具;对数学思想方法的把握:数学思想方法是数学的精髓和灵魂;对数学工具的运用:应用数学工具解决实际问题,是学习数学的根本目的; 对建立数学模型的认识:构建数学模型是解决实际问题途径。

(2)基于课标的数学单元型教学设计与实践案例

经过一年的努力,我们已经完成了 《高中数学基于课标的单元型教学设计案例》(必修2-2,2-3)、《高中数学基于课标的单元型教学设计实践案例》《初中数学基于课标的单元型教学设计实践案例》,于2014年12月印刷成册,深受教师喜欢。

总之,在参与PISA测试长达6年的时间里,我们吸收了PISA评价的先进理念, 站在国际公认的测试评价角度,全面诊断了房山区数学教育教学,找到了区数学教育教学中的问题与不足,并且采取了相应的措施,在很大程度上解决了数学教育教学中的问题,解决了一些影响房山区数学教育教学发展的问题,使房山区数学教育由“粗放”到“激越”的发展过程中,又向前迈进了一步。

PISA数学素养测评主要结构 篇9

近年来, 数学素养越来越受到人们的关注。事实上, 数学素养这一名词对于教师而言并不陌生。2001 年《全日制普通高级中学数学教学大纲 ( 试验修订版) 》提出:使学生在高中阶段继续受到数学教育, 提高数学素养, 对于提高全民族素质, 为培养社会主义现代化建设所需要的人才打好基础是十分必要的。新世纪的课程改革, 特别是正在修订的高中数学课程标准, 数学素养则受到了更多的重视。但是数学素养到底是什么, 由于对数学教育的理解、认识以及传统, 甚至包括语言差异, 还没有能够形成完全统一的认识。

我国学者对数学素养的认识也不尽相同。张奠宙先生认为数学素养就是数学思维能力, 也就是数学运算能力、逻辑思维能力和空间想象力, 其中核心是逻辑思维能力。[1]还有学者认为数学核心素养是数学课程目标的集中表现, 在学生自主发展中发挥不可替代的作用, 是在数学学习过程中逐步形成的。数学素养包含具有数学基本特征的必备思维品格和关键能力, 是数学知识、技能、能力及情感、态度、价值观的综合体现。[2]也有学者认为, 数学素养包含数学思维、数学意识、创新意识、用数学的意识、欣赏数学的美学价值等几个方面。[3]

国际上, 由于PISA的广泛影响力, 并且2012 年的PISA测试, 数学再一次成为了主测试领域, 并修订了数学素养的定义及其测评的主要框架。这一框架在国际范围内得到了较高的认可度。PISA 2012 对数学素养的定义如下:

数学素养是个人在不同情境下用公式表述、使用和解释数学的能力。它包括数学推理能力和使用数学概念、过程、事实和工具来描述、解释以及预测现象的能力。它有助于个体作为一个关心社会、善于思考的建设性公民来识别数学在世界中所起作用及做出有根据的数学判断和决定。

这个定义指出, 数学素养是一种个人能力, 并指明是在实际情境中的核心能力。在这个定义里, 数学素养与数学建模能力很相近, 因为它的基本过程是表述数学模型, 在模型中运用数学知识和技能, 解释和评估数学结果。从这个定义中也可以看出, 不论是在具体的数学概念和技巧, 还是在一般的数学推理上, 数学的各个方面都与数学素养都是相关的。PISA中数学素养的定义突显了数学素养的功能性目的, 即增加对真实世界现象的理解, 从而有助于人们在生活的各个领域里做出正确的决定。[4]

二、数学素养的测评

PISA测试的核心是对素养的评价, 如何对素养评价是PISA中重要的内容。在PISA数学测试框架中给出了数学素养测评的主要结构以及它们之间的相互关系, 如图1 所示。最外侧的框图是表明在面对真实世界问题情境的挑战时需要数学素养, 这些挑战可以从两个方面分类:数学内容类别和真实情境类别, 每个方面又包含了四个不同的类别。其中, 数学内容类别分成了数量、不确定性和数据、变化和关系、空间和图形。[5,6]这四个内容类别与我们传统的学校课程分类可以相对应。数量的基础是大量的数字现象、数和测量, 空间与图形的基础是几何, 不确定性和数据的基础是概率与统计, 变化和关系的基础是代数与函数。虽然这四个类别与传统课程可以对应, 但事实上, PISA内容分类重视数学挑战中所关注的基础现象, 强调不同数学分支的相结合去阐明数学现象。在对PISA试题内容类别进行划分时可能会有不同的意见, 一道试题可能因为有不同的方法被划分到不同的类别, 这种情况是可以接受的。因为这种情况远比一道题不能被划分到任何一个类别中要好得多。在实际测试中, 尽量保证每个类别的题量所占比例是一样的, 所以在划分类别时会进行适当的平衡, 有争议的题目通过平衡是可以确定的。真实情境类别分成了个人情境、社会情境、职业情境、科学情境。这四个类别的基本定义如下:个人情境问题聚焦于个人日常生活的各个方面, 如个人的旅行、购物等;社会情境问题聚焦公民、地方、国家或全球, 如国家的人口普查等;职业情境问题聚焦职场, 如房屋的测量等;[7]科学情境问题要求学生运用数学知识解决自然世界的问题或和科学技术相关的问题。从2012 年开始, 科学情境也包括全部是数学结构的问题, 即纯数学问题。但是由于数学素养是功能性作用, 极少数PISA题目是数学内部问题。PISA测试中要求每个类别的题量大约占1/4。这四个类别并没有严格的定义, 在PISA试题划分时也存在着争议, 但其主要目的是保证试题的平衡, 所以这种争议是允许存在的。

中间的方框表明可用于解决所遇到的挑战的数学思想和行为。它们以三种方式呈现:数学内容、基本数学能力、数学过程。其中数学内容主要包括数学概念、知识和技能;基本数学能力有8 种, 构成了数学活动;数学过程分成了三类:数学化地表述情境 (表述) , 应用数学概念、事实、步骤和推理 (应用) , 阐释、应用、评估数学结果 (阐释) 。框架中要求一半的题目属于应用类别, 而表述和阐释各占1/4。

最里面的方框表明了如何按照数学建模活动过程解决问题。从框图中看这个过程与我们平时解题时的活动是一致的, 首先将情境问题表述为数学问题, 需要将情境中的数学内容、关系等进行转化;然后应用数学概念、事实、步骤和推理等得到数学结果, 这个过程是数学内部问题的解决;最后是对数学结果的阐释, 将其转化为适合情境的结果, 并评估是否适用于解释原情境问题。在PISA测试中, 阐释和评估合并在一起了, 这是因为在有特定限制的测试条件下, 学生需要坐在课桌前, 在短时间内解决试题, 又没有额外的资源可供参考。

三、PISA测试对数学评价的影响

中国上海在2009 年、2012 年两次PISA测试中均取得了好成绩, PISA越来越受到中国学者和广大教师的关注和重视。从PISA测评中我们能够看到其比较先进的测评理念, 这对我国自身教育测评的发展是有大借鉴作用的。

在测评和教学过程中可以多创设真实情境的问题。我们日常教学的情境多是来自生活, 但又有些脱离生活的。PISA测试中试题几乎都是有一个真实的情境的, 这种情境是来自于生活实际, 也完全符合现实规律的。比如, 同样是买东西的问题, 我国的题目为了便于计算, 题目中的数据都会有适当的修正。但PISA试题中的数据是来自生活实际的, 这样的题目能够让学生更了解生活, 有助于学生更好地理解真实情境。这种情境的题目能够让我们的学生将书本与实际生活更好地结合起来。PISA测试对学生掌握的知识加以考查, 但不限于知识本身, 同时也借助题目关注学生的能力。我们在测试和教学的时候可以借鉴这一点, 尽管近年来都要求培养学生的数学能力, 提高学生的数学素养, 但如何落实到考试评价中, 是我们需要思考的问题。在平时的教学过程中对数学素养的倡导加以落实, 教师在日常的教学中, 可以加强对学生基本能力的训练, 学生能力的提高比分数的增长更具有长远意义。分数的增长是一时的, 而能力的提高则能让学生终身获益。在平时对学生进行测试的时候, 教师可以参照PISA对数学素养测试的题目独创符合我国课标中数学素养的测试题目, 从多个维度考查学生, 这样既能落实教学目标, 有利于教学的进行, 又有利于对学生的数学素养的培养, 同时也对我国自身考试体系的发展起到推进作用。

参考文献

[1]张奠宙等.数学教育学导论[M].北京:高等教育出版社, 2004.

[2]桂德怀, 徐斌艳.数学素养内涵之探析[J].数学教育学报, 2008, 17 (5) :22-24.

[3]王子兴.论数学素养[J].数学通报, 2002, (1) .

[4]Kaye Stacey, Ross Turner.Assessing Mathematical Literacy——The PISA Experience[M].Springer, 2014.

[5]http://www.oecd.org/pisa/pisafaq/ (PISA官网) .

[6]http://www.cnsaes.org/homepage/html/SHPISA/.

上一篇:涉外业务下一篇:20世纪50年代