《搜索网络信息》说课稿

2024-04-26

《搜索网络信息》说课稿(通用9篇)

篇1:《搜索网络信息》说课稿

一、教材分析

本节课是第二单元《网上冲浪》第二节课的内容。上一节课《网络浏览》学生已掌握了在因特网浏览信息的基本操作方法,如:浏览器的打开,网址的输入,链接等操作,学生已经具备了深入学习的基础。本节课是在此基础上设立的高层次的学习任务,目的是让学生学会在因特网上搜索和捕获信息的方法,掌握了本节课,也为以后几课的学习如:在因特网上下载、交流信息和管理资源打下了良好的基础。

二、课时安排

1课时。

三、教学目标

1.知识与技能:

①使学生了解在因特网上搜索信息的意义,了解搜索信息的基本方法。

②掌握利用简单的关键词搜索信息的操作方法。

③培养学生的主动探究、自主学习、团结协作和实践的能力,初步培养学生信息的搜索、捕获的能力。

2.过程与方法:

通过学生交流、师生交流、人机交流、学生操作等活动形式,提高学生利用信息技术的综合素养。

3.情感态度与价值观:

通过小组合作和主题探究活动,培养学生的创新意识,让学生自我展示、自我激励、体验成功,在不断尝试中激发求知欲望,在不断探索中陶冶情操。

确定以上目标的原因:

本节课的课题是《搜索信息》,因而最基本的要求就是要使学生掌握如何在因特网上用最快的方法搜索到自己需要的信息。通过学习和具体实践,来培养学生的自主学习、相互合作的团队精神和动手操作的能力,提高信息处理的水平。另外,由于每个学生知识水平和能力有差异,有些学生可能已经具备了一定的查询信息的能力,为了能使学生共同进步,创设一个和谐、轻松的学习氛围,让学生们相互帮助、相互学习是很有必要的。

四、教学重点与难点

1.重点:使用分类目录型搜索引擎搜索相关信息和利用关键词搜索相关信息的方法。

2.难点:关键词搜索的方法。

五、教学思路

根据建构主义和人本主义思想,我采用了“提出任务──教师演示──学生分组实践──评价总结──练习巩固”的教学方式,将学生每四个分成一组,对简单的任务直接演示,学生同步操作,对复杂问题分步解决。学生通过自主探究,小组合作的方式进行学习,培养自主学习的能力和团队精神。

六、教学方法

(一)教法设计

1.任务驱动法

知识和技能的`传授应以完成典型任务为主。结合《信息技术》的学科特点,根据本节课的具体教学内容和学生的实际情况,在教学过程中我采用了“任务驱动”法组织教学,学生带着任务学习有助于理解和掌握知识。任务的完成就标志着学生实践能力的提高,同时学生也能体会到任务完成后的成就感,从而激发他们进一步学习的兴趣和积极性。

2.直观演示法

采用直观演示法组织教学,可以增强教学内容的直观性、可操作性。课堂上我将教师演示与学生跟着教师同步操作相结合,通过教师手把手的教,教师的演示操作完成了,学生也掌握了操作要点,效果事半功倍。

(二)学法指导

1.尝试操作法:教师演示时,学生跟着教师同步操作,以及学生根据老师提出的任务主动尝试操作。

练习巩固法:学生每学完一种操作,马上跟上一个巩固练习。

2.主动探究自主学习法

教师为学生布置主题任务,学生在任务驱动下,角色从“让我学”变成“我要学”,教师引导学生自主探究,完成学习任务。

七、教学过程

钻研教材,研究教法与学法是教学的前提和基础,合理安排教学程序则是教学成功的关键一环。为了使学生学有所获,我设计了以下五个教学环节。

一、激趣导入:上课之前我们先来欣赏一首非常好听的歌曲。

播放歌曲:May it be.

刚才我们听了一乎非常优美动听的英文歌曲,这首歌是电影指环王的插曲,歌名叫做May it be,同学们知道这首歌的中文名和它的歌词吗?

我们今天就借助于互联网的帮助,利用互联网上的搜索引擎,找到自己所需要了解的资料。

二、实践探究,学习新课。

(1)、认识搜索引擎:英特网上的信息浩瀚万千,而且毫无秩序,所有的信息都分布在互联网上的各台主机上,而网页链接是各种信息之间纵横交错的桥梁,而搜索引擎,则可以为你绘制一幅一目了然的信息地图,供你随时查阅:

搜索引擎工作的三个过程:

I、在互联网中搜索、发现网页信息。(利用蜘蛛系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。)

II、对信息进行提取和组织索引库。(由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。)

III、接受查询。(当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。)

(2)搜索引擎一般提供分类目录型检索和关键词索引检索两种服务方式。

分类目录型检索是将因特网上的信息资源形成分类目录,搜索者依据分类目录层层查找自己所需要的网址。(www.sogou.com)。

关键词索引型检索是搜索者输入某一信息的关键词,搜索引擎服务器根据这些关键词寻找所需资源的网址,反馈给搜索者。(www.baidu.com)。

常用的搜索引擎主要有以下几个:

百度:www.baidu.com

谷歌:www.google.com

雅虎:www.yahoo.com.cn

搜狐:www.sohu.com

中搜:www.zhongsou.com

一搜:www.yiso.com

搜狗:www.sogou.com

搜索功能并非是完全独立的,只是通过区分不同的媒体形式来分别学习而已。例如,在搜索文字时,有时搜索到的网页里面也有相关的图像,要善于综合应用。

1、搜索文字信息。搜索网页练习任务:

(1)搜索中国最早的文字。(2)搜索中国最早的史书。(3)搜索世界最大的湖泊。

拓展:找不到合适的信息时,可以根据搜索引擎的建议更换关键词。

在找不到合适的信息时,可以根据搜索引擎的建议更换关键词。

操作过程:

(1)指出哪一个建议关键词是更准确的?

(2)更换关键词后,你找到相关信息有多少条?

(3)你认为哪条信息是准确的?

探究:比较网页快照在链接速度、阅读形式上的不同。

这部分搜索中,要注意以下几个问题:

①使用通配符可以代替不确定的字。

②使用多个关键词来缩小搜索范围,更准确、更快地找到所需信息。

③链接失效时使用网页快照查看网页内容。

2、搜索图片信息。搜索图像练习任务:

(1)搜索中国最早文字的图片。(2)搜索世界最大湖泊的照片。操作过程:

(1)你当时找到的相关图片有多少幅?(2)你认为哪张的质量较好?

(3)如何操作能看到原始的图像?(4)如何进入到图像所在的网页?

拓展:在教师的指导下使用google地图功能或Sogou地图功能搜索地图,以此了解有关的城市、山脉、交通等地图信息。

探究:如何搜索漫画、墙纸等专题图片?如何搜索动态的gif图片?

探索图片时,要注意以下问题:

①搜索到的是预览图,单击之后获得原始图像。

②图片的分辨率决定了清晰度,但有时小图对插图等也很有用。可以选择大、中、小图像搜索选项,来查找适合的图像。

3、搜索其他信息。可以让学生尝试音乐、动画等其他信息的搜索。注意以下问题:

①搜索到的音乐可以在线播放,但要求有相应的多媒体设备支持。

②搜索到的动画可以在线观看,只要IE是5.0以上的版本,或者已经安装过Flash播放器插件。

3、实践巩固

1.想想搜索下列信息的最佳关键词,并在互联网搜索引擎上找到答案:

(1)沙尘暴形成的原因。单一关键词是(沙尘暴),多个关键词是(沙尘暴形成原因) 。

(2)张学友主演的歌剧有哪些?单一关键词是(张学友),多个关键词是(张学友歌剧) 。

(3)第一次世界大战的前因后果。单一关键词是(第一次世界大战),多个关键词是(第一次世界大战前因后果)。

2、翻开书57页,用你比较喜欢的搜索引擎把书上试一试中你感兴趣的内容找找答案。

四、小结本课内容,展示学生成果。

五、组织学生下课。

八、教学反思

我觉得,本节课是对任务驱动和基于因特网资源型学习信息技术课的一次尝试,学习的主要资源不再是单一的课本,而是因特网这一拥有相对无限信息的资源,授课中我以“学生动手实践为主线”,把学习的主动权教给学生,让学生“在做中学,在练中巩固”。我的主要任务是适时对学生加以组织调控,为学生设置一个个的学习任务,引导学生尝试操作,以最快的速度,查找最准确的信息。根据学生能力的不同,对接受能力强的学生我让他们自主探究,完成任务后要在组内开展互帮互学,带动能力稍差一点的学生,使他们共同提高。在引导学生学习过程中,既要重视学生知识的学习,又要注重学生能力的培养,包括动手操作,技术应用、创新实践的能力,尽量留给学生最大的空间,让学生勤尝试、会尝试、乐尝试,勤于实践,大胆动手操作,促进学生应用信息技术能力的不断提高。

篇2:《搜索网络信息》说课稿

大家好!今天我说课的内容是《中国人要不要过圣诞节——信息搜索进阶》。这一节的内容主要是学习信息搜索。下面,我将从教材分析、教法学法分析、教学流程、设计理念等方面阐述这节课的教学设计和理论依据。

一、教材分析

1、教材的地位和作用

《中国人要不要过圣诞节——信息搜索》是华师版初中《信息技术》第二册第一章第二节的内容。

本章的主要内容是信息搜索与交流的基本概念与方法。这次课是在上一节课《信息就在你指尖——信息搜索入门》的基础上对信息搜索的进一步的学习。本节内容是第一节内容的深化,同时为本章第三节(下载软件)内容的学习奠定基础。

在网上搜索自己所需要的信息,是我们获取信息的基本途径之一。学习本节,对于提高学生信息素养,提高学生自我学习、自我探究的能力具有十分重要的意义。

2、教学目标的确定及其依据

根据《中小学信息技术课程指导纲要》,信息技术课程的主要任务是通过信息技术课程使学生具有获取信息、传输信息,处理信息和应用信息的能力,培养学生良好的信息素养的理念,确定以下“知识与技能目标”

⑴进一步熟悉不同的“搜索引擎”。

⑵能正确使用各种符号缩小搜索范围,准确搜索信息。

根据《指导纲要》中:要教育学生正确认识和理解与信息技术相关的文化,伦理和社会等问题,负责任地使用信息技术。注重培养学生创新精神和实践能力,确定以下“情感态度价值观目标”

① 增强学生在信息交流中的责任心和道德观。

② 培养学生自主学习和合作探究学习的意识。

③ 在学习活动中,增强学生的集体荣誉感。

教学重难点:培养学生运用恰当的方法,快捷而准确地搜索信息的能力。能灵活运用搜索策略。

二、学情分析及学法指导

学情分析:学生目前已掌握了计算机操作基本知识,也具备了一定的逻辑思维能力,单从本节课知识性内容来看,并不复杂,学生能较快的掌握。但从信息技术的工具性及课程的实践性来看,给学生“自主实践”的机会是关键。为此:我将本课的学法指导设计为:

1、问题联想、自主学习。利用“该不该过圣诞节”的辩论,指导学生发现生活中的问题,能运用信息技术解决问题。

2、综合实践、能力牵引。信息素养涉及到不同学科、不同知识。本节课借“过圣诞节”这一青少年学生中的“新文化现象”展开辩论,使语言文字表达能力、数字逻辑推理能力、地理历史中的试记能力、政治、美学中的不同文化的鉴赏能力,牵引到信息收集、整理、鉴别、发布等信息素养上。让学生在实践中自觉整合各学科知识和能力。

3、自主探究、贯穿练习。本节“辩论”必定涉及原有的计算机基本操作、涉及对上一节的“搜索工具”的应用。以及以后各章节的信息下载、信息发布等内容。指导学生对已经学习内容的应用以及没有接触的知识的探究是重要的学法指导之一。

三、教法分析

为适应信息课具有的发展性、综合性、实践性、创造性等特点,培养学生良好的信息素养,考虑到学生层次的个体差异,结合初中学生对外来文化的好奇心理,勇于竞争的博异心态,基于对教材的分析和对学科特点的理解,我采用了如下教学方法。

① 情境激趣法:如动画导入,激发兴趣等。

② 任务驱动法:本节课以“中国人要不要过圣诞节”为“任务”主题,整节课以一场“辩论赛”为活动主体,在辩论的过程中,正反两方会不断生成不同的“任务”。

③ 评比激趣法:“辩论”需要有说服人的材料,材料来自信息的“准确搜索”,辩论的过程就是评比的过程,只是评比的裁判不是老师,而是同伴、是对手、是学生。

④ 合作探究法:正反两方的小组,只有通过组员的全力合作,才能在网络上搜索到有利于胜辩对方而不重复的材料。

四、教学流程分析

㈠情境激趣,导入新课.播放关于圣诞节的动画,激发兴趣,引导学生简单讨论:中国人要不要过圣诞节?从而导入新课。

设计意图:动画导入,能激发学生兴趣,营造良好的课堂氛围。

㈡教师引领,知识导航.教师简要讲解本课知识点:

⒈ 阅读搜索结果的前几条信息.⒉ 缩小搜索范围.① 合理运用关键词.② 运用高级搜索.③ 使用逻辑操作符AND.④ 使用引号连接字符.⑤ 利用“+” “-”起限定作用。

设计意图;紧紧扣住学生感兴趣的话题展开学习活动,引导学生主动探求知识。老师的讲解伴随着示范,让学生更快的了解相关方法。为后面的自主探究作铺垫。

㈢自主探究,展开辩论

⒈分组合作,搜索素材

教师分发信息记录卡,并在大屏幕上示范“如何合理运用关键词”。

学生根据老师的讲解,就本节课的话题,自己练习搜索。学习用不同的方法搜索信息。

设计意图:以知识导航,让学生对准确搜索的方法有所了解;教师起示范引导作用,学生练习为下面的自主探究做铺垫。

⒉理性思考,各抒己见

学生加工整理搜集的信息,理性思考,得出观点;教师适时评价点拨,把握学生辩论的方向。

本环节是学生展示自己才华和能力的关键环节,学生会争先恐后的发言,教师特别要注意引导。帮助学生进行针锋相对的辩论,学会根据对方的辩词及时开始新的搜索,明确活动中生成的新任务。并能快速应对。

特别重要的是:提醒发言的学生说明信息的来源及其搜索方法。

设计意图:以辩论会的形式展开活动,可以提高学生的搜索热情,激发他们的集体荣誉感。且正反两方各有合作,学生互帮互学,反复练习,有助于他们生成能力。教师要求他们说明信息来源及方法,可以帮助巩固知识,也可以进行信息技术道德观的教育。全面提高他们的信息素养。

㈣归纳小结,自主完善

请学生从本课的辩论话题和本课的学习内容两方面作小结,用一句话谈谈自己的收获。

设计意图:对话题的小结关键是从价值观的角度给学生一个正确的引导;学生谈收获,实际上是小结了本课的知识,起到巩固知识点,实践与理论相结合的目的。

㈤拓展延伸,关注生活

设计一项课外作业:在中外节日中,任选一个你感兴趣的节日,搜索其由来、特色、风俗等,制作成一份电子板报。

设计意图:给学生一个空间,继续巩固搜索的相关知识,同时锻炼学生的创造性思维。引导学生把信息技术与生活实践结合起来,把信息技术作为支持终身学习和合作学习的手段。

五、设计理念

在设计这节课的时候,我比较注重体现以下几个思想:

⒈坚持“以学生为主体”的原则。让学生在主动探究中反复练习,生成能力。

⒉坚持“情景与任务驱动相结合”的原则,创设了要不要过圣诞节的情景,让学生在参与辩论的热情驱使下主动积极去搜索。

⒊坚持“自主探究与合作学习相结合”的原则。在辩论中,学生既要自主独立完成,又要根据辩论的内容,不断调整搜索内容,操作能力强的学生帮助能力较弱的学生,达到共同进步的目的。

篇3:网络信息搜索引擎的发展研究

关键词:信息检索,搜索引擎,网络,趋势

1 搜索引擎的原理

搜索引擎是对www站点资源和其他网络资源进行组织和检索的一类检索机制。其机制一般包括数据采集和标引机制、数据组织机制、用户检索机制。其中, 数据采集机制按照一定规律和方式对网络上www站点进行搜索。并将搜索到的www页面信息存入搜索引擎的临时数据库;搜索引擎的数据组织机制对www页面信息进行整理以形成规范的页面所以, 并建立相应的索引数据库, 搜索引擎的用户检索机制帮助用户以一定方式检索引擎的索引数据库, 以获得符合用户需要的www站点或页面。

2 根据搜索引擎提取数据的方法, 可将搜索引擎系统可以分为三大类

2.1 目录式搜索引擎:

是一种网站级搜索引擎。目录式搜索引擎由分类专家将网络信息按照主题分成若干个大类, 每个大类再分为若干个小类, 依次细分, 一般的搜索引擎分类体系有五六层, 有的甚至十几层。先由程序自动搜集信息, 然后由编辑员查看信息, 人工形成信息摘要, 提供目录浏览服务和直接检索服务。由于目录式搜索引擎的信息分类和信息搜集有人的参与, 因此其搜索的准确度是相当高的, 缺点是需要人工介入、维护量大、信息量少、信息更新不够及时。Yahoo就是这类搜索引擎的代表。

2.2 机器人搜索引擎:

由一个称为蜘蛛 (Spider) 的机器人程序以某种策略自动地在互联网中搜集和发现信息, 由索引器为搜集到的信息建立索引, 由检索器根据用户的查询输入检索索引库, 并将查询结果返回给用户。服务方式是面向网页的全文检索服务。但是该类引擎返回信息过多, 有很多无关信息, 用户必须从结果中进行筛选

2.3 元搜索引擎:

这类搜索引擎没有自己的数据, 而是将用户的查询请求同时向多个预先选定的独立搜索引擎递交, 将返回的结果进行重复排除、重新排序等处理后, 作为自己的结果返回给用户。元搜索引擎的搜索效果始终不理想, 所以没有哪个元搜索引擎有过强势地位。

3 搜索引擎的局限

因特网搜索引擎的结构及工作方式的缺陷, 没有一个搜索引擎包含的WWW页超过了全球总WWW页面的16%, 而对因特网资源的覆盖面还明显下降, 也受限于数据库更新的速度, 可能导致搜索引擎有价值的信息。

搜索引擎自动巡视软件在搜集因特网信息时, 通常要将网页内容全部或部分下载到本地, 然后才能进行索引处理, 下载的页面中有许多无用或暂时的信息, 影响索引速度, 也浪费系统通信资源。各种搜索引擎使用的检索符号和对检索式的要求不一样, 给用户检索带来了困难。搜索引擎的局限性还主要表现在信息丢失、返回过多无用信息及信息无关等方面。造成现状的原因在于传统搜索引擎队要检索的信息仅采用机械的关键词匹配, 缺乏知识处理能力和理解能力, 即使搜索引擎无法处理用户看来非常普通的常识性知识, 更不能处理个性化知识, 因地区不同的区域性知识, 因领域不同的专业性知识。

还有原因在于整个检索过程中, 客户端的计算机知识起着一个终端的作用, 强大的运算能力和存储空间无法发挥作用, 就造成以下的问题:搜索结果很难精确匹配;无法对检索结果进行提炼;无法对不同的搜索引擎的结果进行综合比较与提炼;搜索引擎使用方法不同造成用户理解和使用困难;搜索结果手工下载效率低下;增加用户的网络通信费;搜索结果中的匹配文档不可能快捷地下载。

4 搜索引擎发展趋势

智能搜索引擎:智能搜索引擎是结合了人工智能技术的新一代搜索引擎, 它使因特网信息检索从基于关键词提高到基于知识或概念, 并对知识有一定的理解和处理能力, 能够实现分词技术、同义词技术、概念搜索、短语识别及机器翻译技术等。比如在表单中输入的问题, 返回的答案, 这样就要把所有的问题全部添加到数据库中, 每当用户提问的时候, 数据库将会在数据库中检测查询结果, 百度知道就是把用户的问题和正确答案添加到数据库中了, 当你在知道中查询答案, 那么将会检测到相关的词汇。智能搜索引擎实现数据挖掘、知识发现、智能代理等。智能搜索在研究机器翻译 (MT) 的领域中, 使用户可以用母语搜索非母语的网页, 并以母语浏览搜索结果。检索机制:垂直化专业领域搜索、关联式的综合搜索、检索结果自动聚类。垂直搜索是针对某一个行业的专业搜索引擎, 是搜索引擎的细分和延伸, 是对网页库中的某类专门的信息进行一次整合, 定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取, 也就是将网页的非结构化数据抽取成特定的结构化信息数据, 好比网页搜索是以网页为最小单位, 基于视觉的网页块分析是以网页块为最小单位, 而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库, 进行进一步的加工处理, 如:去重、分类等, 最后分词、索引再以搜索的方式满足用户的需求。整个过程中, 数据由非结构化数据抽取成结构化数据, 经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。垂直搜索引擎的应用方向很多, 比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎关联式的综合搜索。关联式综合搜索, 就是这样一种一站式的搜索服务, 它使得网民在搜索时只需输入一次查询目标, 即可在同一界面得到各种有关联的查询结果。这项服务的关键在于有一架构在XML基础上的整合资讯平台自动聚类可对检索结果进行自动聚类并构建树状结构, 以构建企业知识地图、检索者快速定位所需信息。应用中可实现对新闻稿件或大数据量文档的自动聚类, 实现辅助专题制作等。类似方正智思知识管理平台软件那样特色搜索引擎: (包括可视化检索和多媒体信息检索的综合运用) 检索结构可视化方法实现检索结果可视化。搜索结果的呈现方式, 结果可视化, 可以先看到每个网页长什么摸样, 再决定是否访问它。多途径的多媒体检索、多种媒体信息库的结合、多特征的综合检索、采用相关反馈和自动标注技术、高维索引技术、用户查询接口实现多媒体信息综合检索在网络信息多样化和网络用户多样化的呼唤下, 人们希望在网络上找到更丰富更实用的资源, 不再漫无目的地查找, 特色搜索引擎便应运而生了。

(1) 图像搜索引擎。图像搜索引擎虽然还没有成熟的产品, 但是这项研究工作却紧锣密鼓的进行着。据称, 美国Purdue大学的研究人员已经开发出了一种新的搜索引擎, 这种搜索引擎不再使用关键词文本进行搜索, 而是使用图像或者草图进行搜索。不就的将来, 用户自己画一幅草图, 搜索引擎就可以对数据库进行搜索, 并找到所有与草图类似的图像。不过, 这要求图像搜索引擎能够快速处理超大容量数据库。这种技术不仅为网民提供了方便, 在生物、化学、医学等领域都可能发挥极大的作用。

(2) 多媒体搜索引擎。FAST是国外著名的多媒体搜索引擎, 很多同类搜索引擎都会引用此引擎的内容。在FAST搜索多媒体文件, 可以同时搜索图像、音频、视频等多种格式的多媒体文件, 图像支持JPEG、GIF、BMP三种格式, 音频支持MP3、Wave、AIFF、RealAudio、MIDI五种格式, 视频支持AVI、DivX、QuickTime、MPEG四种。FAST为每一个搜索结果提供预览和说明, 同时还有下载的直接链接, 以及该文件所在网站的地址。

(3) 搜索在线摄像头监视画面:众所周知, 如果要与对方通过摄像头进行连接的话, 必须对方同意才可以。但是利用Google却可以突破这个限制, 因为它可以搜索网络上未经加密的网络摄像头 (机) 监视到的画面。

(4) 房产地图搜索引擎。房产地图搜索引擎是结合地理信息系统 (GIS) 、数据库系统 (DBMS) 和动态Web软件技术开发研制, 可以通过智能化地理信息分析查找特定范围内的特定目标。例如用户可以选择购房愿望:价格、面积、户型、房屋布局、地理位置、周边商业、交通、自然环境、小区状况等, 在互联网上进行查询。引擎立即会将所有满足条件的房源显示出来, 并可以任意放大、缩小、移动房源地图。

总之, 随着计算机技术和网络技术的不断发展, 网络检索将逐步朝着简单化、人性化方向发展, 检索界面会越来越简洁友好。用户可以很容易地进行网上自动标引、自动文摘、自动跟踪、自动漫游、机器翻译、多媒体检索、动态连接、数据挖掘等操作, 方便、及时、准确地获得所需信息。

参考文献

[1].徐谦.网络信息检索的智能化趋势[J]图书馆理论与实践2006, 2:63-65

[2]柳群英.网络信息检索技术现状及发展趋势[J]情报探索2005, 4:66-68

篇4:《网络搜索》说课稿

一、说教材

1.本节课地位和作用

本节课内容选自高中《信息技术》课的第三章第三节《网络查询与交流》第三部分,属于信息素养中信息获取范畴的内容。学会运用信息工具网络搜索已经成为人们生活和工作中不可缺失的工具,他对学生今后的发展起着极其重要的作用。

2.教学目标

知识目标:掌握常用搜索引擎网址,能根据需要选择不同的类别,最终找到最贴近的相关信息。

能力目标:帮助学生理解、认识所使用的搜索引擎的机制,针对不同的搜索目的,选择不同的搜索策略,通过学生动手、动脑,培养学生处理信息的能力,养成良好的动脑和动手的习惯。

情感目标:主要培养学生的严谨的逻辑思维和处理信息能力,及对网络技术的兴趣,并在学习过程中不断积累和总结经验,体验成功的喜悦。

3.重点难点

重点:①常见的搜索方法。②搜索语法的运用。

难点:搜索策略和搜索语法的灵活运用。

二、说学情

学生在初中已经对一般的搜索方法有所了解,但却是片面的,但如果让他们去搜索更加复杂和深度的信息,就会变得有些不得法,所以除了需要他们灵活掌握常见搜索方法外,还要学会针对不同情况,使用不同策略,掌握更有深度的一些技巧和语法规则。

三、说教法

对于信息技术教学,我注重更新教学观念和学生的学习方式,化学生被动学习为主动愉快学习。为了更好地突出本节课重点、难点,我采用的教学方法是:

1.任务驱动法

当学生对本节课知识点有初步了解后,利用事先设计好的由易到难的任务,驱动他们去完成,让他们在完成任务的同时,掌握新课的内容,解决重点难点。 例如普通网页搜索、图片搜索、区域搜索,然后到语法的应用,层层任务,由浅入深。

2.提问引导法

在完成任务的过程中,我通过更复杂的问题来启发诱导学生,让学生的学习兴趣一直不减。带动学生去分析问题、思考问题,然后我会给他们讲解更深奥的知识,变学生“想学”为“积极地去学”。例如,区域搜索、站内搜索、文件搜索等等。

四、说学法

搜索引擎涉及到的内容很多,技巧也灵活多样,一字之差,结果差之万里,方法决定着成败。而且随着搜索引擎技术的发展,技巧和方法可谓天天在增加,所以我只能选择最典型、最常用的技巧,层层深入,具体采用如下方法:

1.示范促进法。例如普通的搜索操作,我在简单讲解后会叫那些优秀的学生去示范操作,教师变成学生间的桥梁,并形成全体学生相互促进的学习氛围。

2.探究法。随着问题的深入,终究要有老师去讲解。例如我说你们谁能在百度中搜索下河北省发生了的最新新闻。大家感觉不难,但我会进一步提出,那么我们秦皇岛的最新新闻呢?然后向某些学生提问,估计很多人用的方法比较“落后”,只是用简单的网页搜索,而不是地区搜索,经过讲解后,经过学生独立尝试操作,自行分析问题,加深方法的理解,让学生从“陌生”到掌握。

五、说教学程序

1.激情引趣,导入新课

开场白:吟诵古诗“众里寻他千百度,蓦然……”,等待其他同学随我一起背完。“你们想知道今天的爆炸性新闻吗?你想知道奥运会金牌一共产生多少块吗?你想找和你同名的人是哪里的吗?你想知道什么,百度全能告诉你。百度,相信大家已经不是很陌生,这节课我们就以百度搜索为例,讲一下本节课的知识——网络搜索。首先给大家讲一下搜索的相关基础知识……”好的开始是成功的一半。通过幽默的开篇,自然引出本节课的内容,明确学习任务,并激发学生求知欲,提高学习兴趣。

2.层层深入,任务驱动

①首先讲解概念性的知识。例如什么是搜索引擎?搜索引擎常用网址有哪些。(基础知识)

②以百度网站讲解下面的知识。

“你想知道今天的爆炸性新闻吗?我告诉你答案”通过这个环节讲解分类搜索,如新闻、网页、图片、音乐。

为了增加本课的趣味性,我准备增加以下两个有趣的搜索——翻译和算数。

“碰到不认识的单词怎么办?”

“难道百度还有线上英汉互译词典?”众多同学肯定有这样的疑惑。

“没错!”。

通过演示,随便输入一个英语单词,留意一下搜索框上方多出来的词典提示。如,搜索“high”,点击结果页上的“词典”链接,就可以得到高质量的翻译结果。

“百度还会算数,你们信吗?”通过演示一个复杂的算式,例如log((sin(5))^2)-3+pi,结果很容易出来了。我相信通过以上的演示肯定会让所有的学生惊叹不已,继而把所有同学的兴趣调动起来。

③继续不断加深知识难度。问“你们谁能查阅下最近一段时间有关河北区域的新闻或者咱们秦皇岛的新闻呢?”学生肯定會用上面的普通方法继续查找。此时我会引出技巧搜索方法——区域搜索。

通过这个例子,可以起到抛砖引玉效果。学生知道了河北的,那么通过启示就会了所有区域的方法。

④学生查到了新闻,那么我可以通过某新闻网站继续提问,以引出后面更加复杂的知识——语法篇。

站内搜索,就是如何在“某一个网站内”查找“某些信息”。

语法规则:site:Urlkeywords

这些地方都是学生第一次接触,而且内容新颖有趣,所以,学生必定感觉很惊奇,所以他们会很投入。然后趁此机会,引出下一个知识点。

⑤文件类型的搜索。

搜索除了网站给我们提供分类外,还可以通过语法进行分类搜索。

例如搜索word文档、ppt文档、pdf文档等等。

老师通过讲解语法和演示,学生通过思考,学会举一反三,达到了学习的真正目的。

语法规则:filetype:doc/ppt/allkeywords(老师讲解)

演示:查找2008年的高考语文试卷(老师演示)

本节课从开始到结束讲解知识虽多,却一直体现着新奇的味道,整节课学生的兴趣一直高涨不减,同时,教师一直掌控着整个课堂的氛围,使整个课程讲解顺畅、自然,学生学习效果良好。

3.归纳总结

这个环节不容忽视,通过总结让学生回顾本节课学到了什么,有什么收获。通过回顾,使学生对自己所学知识有个梳理过程,加深对本节知识的理解和掌握。

六、板书设计

1.常用网络搜索引擎网址

2.区域网址搜索语法规则

3.站内搜索语法规则

4.文件类型的搜索语法规则

七、本课亮点

篇5:《搜索网络信息》说课稿

1、概念:搜索引擎其实也是一个网站,只不过该网站专门为人们提供信息搜索服务,它使用特有的功能把因特网上的所有信息归类以帮助人们在浩如烟海的信息海洋中搜寻到自己所需要的信息。

2、常用搜索引擎:

百度:http://

GOOGLE:http://

3、操作步骤:

①输入搜索引擎网址

②在检索框中输入关键词

③在搜索返回结果中选择查看

二、搜索技巧

1、合理选取关键词

2、使用多个关键词

3、使用不同关键词

三、搜索竞赛

四、课堂小结

(1)搜索引擎的使用

(2)搜索技巧

五、课外作业

篇6:《美食搜索计划》说课稿

二、分组制定《美食搜索计划》

单元格的合并和拆分

三、建立“小组文件夹”及相关“子文件夹”

篇7:说课 搜索需要的信息教学设计

一、 说课标

信息技术教育的目标是培养学生良好的信息素养,包括信息意识、信息伦理道德、信息技术基本知识和技能,以及获取信息、传输信息、处理信息和应用信息的能力。教育学生正确地使用信息技术,把信息技术做为支持终身学习和合作学习的手段,为适应信息社会学习、工作和生活打下基础。

二、说教材

《搜索需要的信息》是海南省出版社出版的信息技术第二册第二章《网络基础及其应用》的第二节内容。这节课是在学生学会了拨号上网及网上浏览信息的基础上学习的,通过这节课的学习使学生了解并掌握在互联网上搜索信息的基本方法,为学生今后的学习和生活奠定基础,也给学生提供了一个“将我所学,为我所用”的辽阔空间。

三、 说学情

本节课的教学对象是八年级的学生,从认知水平来说,经过七年级一年的学习,有了一定的知识水平;从心理特征来说,主要表现为:好玩、好学、好问、好胜,但学习积极性与短暂性直接挂钩,容易失去学习兴趣和学习积极性,因此在教学过程中应注重培养学生的学习兴趣,从而调动学习积极性。

四、 说教学目标

根据信息技术课程标准的要求,结合本学科的特点及授课学生的情况,关注学生的兴趣和生活经验,,为了培养学生自主学习的习惯和创新能力,制定本节课以下的三维目标:

1.知识与技能目标

①通过寻找海南有哪些旅游景点,掌握搜索信息的基本方法。

2.过程与方法目标

①教师指导学生通过网络收集有关海南旅游景点的文本、图片、影像资料等,进一步了解我的家乡海南。在这个过程中培养学生收集、整理、分析及处理信息的能力。

②指导学生学会利用网络进行自主学习、合作学习的能力。

③利用演示文稿来展示经过处理后的信息,温习并巩固了第一章的学习内容,也培养了创作精神和创新精神。

3.情感与价值目标

①通过寻找海南有哪些旅游景点,培养学生热爱家乡的情感。

②通过收集、整理海南旅游景点的资料,提高了学生的审美情趣,激发学生创作兴趣和热情。

③引导学生正确使用网络,让网络发挥其应有的作用。

4.教学重点、难点

重点:搜索需要的信息

(依据:以培养学生的信息素养,提高学生从大量未知的信息中寻找摄取自己所需要的信息的能力,因此将搜索需要的信息作为重点。因为在茫茫的网络海洋中,通过自己的能力找到所需要的信息对于每一个网络游民来说是最基本也是最关键的能力,而通过任务的完成来突出重点。)

难点:搜索信息的基本方法

(依据:以培养学生自主学习和协作学习,提高学生高速有效的摄取信息的技能,为此将搜索信息的基本方法作为难点。根据学情,在教学过程中通过学生探究、实践来突破难点。)

五、 说教法

根据新课改理念,教材教学目标及重难点的分析,我采用以“任务驱动教学法”为主,”创设情境法” “设疑法”“自主探究法” “操作练习法”“演示法”“赏识教育法等为辅的教学方法。以此引发学生的自豪感和好奇心,激发学生的学习兴趣;从而培养学生自主学习、协作学习的能力;进一步增强学生的自信心。

六、 说学法

根据新课程理念,培养学生的实践能力和创新能力,发挥学生的主体地位和教师的主导作用,变灌输者为信息加工主体。在学法指导上,我采用的是自主探索、协作学习的方法,在这节课中,我始终引导学生带着浓厚的学习兴趣和强烈的求知欲来操作,通过自主探索、相互协作,获取知识和技能。

七、 设计思路

根据新课程的理念,围绕教材,坚持以搜索处理信息为主线,以学生为中心,以任务为载体,以操作为手段,以发现为宗旨,以感悟为目的。注重培养学生对信息技术的兴趣和意识,让学生了解和掌握信息技术基本知识和技能,使学生具有获取、加工、处理和应用信息的能力,培养良好的信息意识和信息素养,为适应信息社会的学习、工作和生活打下基础。

1.通过创设情境,引发学生自毫感和好奇心,激发了学生的学习兴趣。

2.信息技术教学是师生之间、学生之间交往互动与共同发展的过程。根据学生的生活实际设计了教学任务,以任务为明线,学习搜索信息的方法为暗线,让学生带着问题去完成任务,培养了学生自主探究、主动参与的学习习惯,通过任务的完成激发学习信息技术的兴趣。

3.通过作品展示,以赏识激励的评价增强学生的自信心,调动学生的学习积极性,让学生们体验到成功的乐趣。

八、 教学过程

根据设计思路和本课教学内容以及信息技术课程学科特点,结合八年级学生实际水平和生活情感,设计以下教学流程:

1.创设情境,导入新课

俗话说“好的开头,就是成功了一半” 首先我展示制作好的名为《我的故乡——美丽的文昌》的一个图文并、声色俱全的演示文稿。当学生沉浸在这优美的意境中时,我紧接着问:“同学们想不想也制作一个如此优美的演示文稿向远在海外的亲朋好友们介绍海南的旅游景点呢?(想)哪你们知不知道这些美丽的图片和优美的音乐从哪里来呢?(网上)通过互联网络,我们可以查找到所有的信息。

在因特网上有丰富多彩的信息资源,就像浩瀚的海洋,这些信息资源是动态的,每天都在添加。想要查找需要的信息,如果没有一个正确的方法,无疑是大海捞针。那我们怎样才能在互联网上查找到想要的信息呢?

引出课题《搜索需要的信息》

此环节设计通过展示故乡文昌的美景,让学生从内心产生一种自豪感,引发好奇心,激起学习兴趣。使学生在情景中主动积极接受任务。另一方面也培养了学生对美丽家乡的热爱,激发情感,引入新课。

2.动手操作,完成任务,学会搜索信息的基本方法

为了实现教学目标,完成教学任务,突出重点、突破难点,驱动学生自主学习、协作学习的能力培养。在这个环节我采取了以“驱动教学法为”主,“设疑法”、“自主探究法” “操作练习法”“演示法”“赏识教育法“等为辅的教学方法。以向远在海外的亲朋好友介绍“海南家乡的旅游景点”为任务明线,搜索信息的基本方法为暗线,通过任务的完成来驱动搜索方法的学习,(思起于疑,为了引发学生好奇心,调动学习积极性)在教学中,我首先设疑:我们已懂得利用确定的网址搜索信息的方法----将网址输入到浏览器地址栏里,点击搜索即可。如果不知道确定网址,我们又将如何搜索想要的信息呢?

接着出示任务:搜索海南的旅游景点

要求学生带着任务来搜索需要的信息。在学生自主操作过程中,我巡视并指导基础较差的学生,提示并演示在地址栏中输入要查找信息的相关文字,进行搜索。如想搜索海南四大名菜,则将在地址栏中输入“海南四大名菜”即可。

然后,让学生们针对如何搜索到需要信息的方法进行体会交流。并提问学生使用这种方法搜索信息应注意几点?

老师小结:搜索信息有两种基本的方法:①在浏览器地址栏中输入确定的网址;②利用搜索引擎进行搜索,常用的搜索引擎有ggle中文简体(ggle.c)搜狐 (shu.c.cn)但在使用第二种方法时,应注意以下三点:A:在搜索引擎的输入框中输入相关的文字 B:对搜索到的信息进行筛选C:保存搜索到的信息,利用学过的复制、粘贴方法。

以任务驱动法为主,以演示法、操作法、讨论法为辅的教学方法,控制和参与整个教学过程,让学生结合“任务“进行自主探究学习, 完成自主建构自己的知识体系。培养学生分析判断,解决问题的能力,在这个环节中通过任务的完成来突出重点,搜索方法的掌握突破难点。

3.温习巩固、提高使用能力

①分小组进行活动,将收集到的资料进行处理并制作成演示文稿。

②展示作品

此环节的意图:在活动中激发学生的学习潜能,引导学生积极开展小组合作学习,同时进一步培养学生的.创新精神、思维能力以及团结协作的思想。在学生操作时,我以平等的身份参与进来,不仅能拉近师生间的距离,也便于及时解决学生在操作中遇到的问题。通过演示文稿的制作,复习了第一单元的学习内容,培养了学生分析处理信息的能力,以及培养了学生相互协作交流的能力。

③作品评价,体验成功

我对部分同学制作的演示文稿给予点评,对学生的“亮点”要给予充分表扬,对不当之处及时纠正。在教学过程中我利用丰富的激励性语言让信息技术的学习成为一个充满快乐、富有成就的趣味性活动。比如当学生表现好了,我会对他们说“做得真不错”“某某同学做的真好”“大家可以向他学习”等等,用这些激励的语言给学生以充分的自信,将会收到良好的学习效果。

此环节的意图: 以欣赏的眼光看待每位学生,善于发现他们的闪光点,表扬或鼓励他们,增强他们的自信心。可以充分调动学生的积极性和主动性,拓展思维,我点评时多采用赏育法,学生完成任务的作品要多肯定,可以培养学的观察、分析能力及口头表达能力,提高审美情趣。

4.小结

这节课我们学会了在互联网上如何搜索到想要的信息,在这节课中我们学会了搜索信息的基本方法①在浏览器地址栏中输入关键字②利用搜索引擎搜索。

5.作业布置

通过这节课的学习,我们掌握了搜索信息的基本方法。元旦就快到了,每个班都在准备学习园地的制作。同学们可以利用互联网上的丰富资源,制作一个电子刊物,题目为“我们的学习园地”。

评委点评:

本说课中,教学目标、教学难点设置比较恰当。教师能够关注学生的学习状态,并根据教学实际选用教学方法,“以任务为明线,学习搜索信息的方法为暗线,让学生带着问题去完成任务”,任务设置比较合理,并能够注意教学设计依据的说明和呈现。

篇8:《搜索网络信息》说课稿

网络商品信息的提取技术[1 - 3]是随着网络的普及以及网络购物的发展而发展起来的。在整个2011 年度我国网购规模达到8090 亿元, 占到了全国社会商品零售总额的4. 4% , 网购人数达到2. 12 亿, 网上购物在网民中的渗透率提高到41. 3% 。网络购物人们生活中占据了重要地位。随之而来的, 网络商品信息提取技术越来越受到人们的重视。

网络商品信息的提取可以细分成两个方面, 即网页搜索以及信息抽取: 网页搜索技术主要包括目录搜索、全文搜索和元搜索[4]三种; 信息抽取又分为人工抽取规则、通过标记样本抽取规则、自动抽取规则如RoadRunner、MDR、Find DR等。

本文基于网络商品信息特点的基础上, 对元搜索技术的网页搜索和信息提取两方面进行研究, 设计一种新的网络商品引擎。使用两个元搜索引擎, 实现购物网站信息的自动采集, 并在Find DR算法的基础上设计了一种改进算法提高信息抽取的效率。

1 网络商品引擎

1. 1 网络商品信息特点

网络商品信息与一般的网页信息相比有如下特点: 其一, 商品信息结构性很强, 尤其是同一个网站上的商品信息; 其二, 网络上的商品信息高度集中, 主要在各大购物网站中, 尤其是淘宝等知名网站; 最后, 网络商品信息提取对信息的安全可靠性要求极高。

基于此可以使用元搜索技术进行网页抓取, 使用Find DR改进算法信息抽取, 实现对网络商品信息的搜索。

1. 2 系统总体设计

系统可分为如下三大模块:

1) 元搜索模块[5], 该模块的功能主要是根据抓取范围限定模块采集到的购物网站信息将用户提交的搜索请求封装并转发给子搜索引擎, 即各大购物网站的站内引擎, 根据抽取规则库抽取搜索结果中的商品信息, 最后将商品信息集进行汇总、排序并显示给用户。

2) 搜索范围限定模块, 该模块的目的是实现元搜索子引擎的自动维护, 元搜索引擎是通过子引擎进行网页搜索的, 对于子引擎的网址、传递参数名等信息往往需要进行人工维护, 增加了系统使用成本。设计一种“双层元搜索引擎”, 通过百度对购物网站信息进行采集实现了对子引擎的自动维护。

3) 网页分析模块, 功能是对网页进行信息提取, 它通过对元搜索模块搜索到的网页样本的分析, 自动地生成抽取规则。网络商品引擎的核心流程如图1 所示。

系统的查询范围库初始为空, 可以人为地设定初始查询范围或运行搜索范围限定模块自动添加或更新查询范围。该模块通过预设定的搜索词在百度搜索购物网站, 提取其中的购物网站信息添加到查询范围库中。

当收到用户的请求时, 系统的元搜索模块根据查询范围库中信息抓取网页, 并由网页分析模块抽取页面中的商品信息, 排序返回给用户。

2 系统设计

2. 1 元搜索模块

1) 模块功能分析

元搜索模块最终目标是实现网页抓取, 与全文搜索中的网络爬虫相似, 它的主要工作如下:

1 接收用户的搜索请求。

2 将用户的搜索请求封装并转发给元搜索引擎的子引擎, 即各大购物网站的站内引擎。

3 抓取购物网站的搜索结果, 提交给网页分析模块进行后期的信息抽取。

4 对网页分析模块抽取的商品进行汇总、排序并显示给用户。

2) 元搜索原理和优势

元搜索的原理是将用户的查询请求转换成搜索引擎能够理解的底层数据格式然后同时向多个搜索引擎递交请求, 在将返回的结果进行重复排除、重新排序等处理后, 作为自己的结果反馈给用户[6]。

最早的元搜索引擎名为Metacrawler , 1995 年由Washington大学硕士生Eric Selberg和Oren Etzioni所发明, 元搜索引擎是为了弥补全文搜索引擎不足而发明与全文搜索引擎相比具有搜索效率高、成本低、搜索信息全面、信息的更新速度快等优点[7,8]。表1 是对全文搜索和元搜索的性能比较。

3) 元搜索模块设计

根据元搜索技术的核心思想设计元搜索算法的如下:

1 用户输入搜索词W并选择搜索条件集T = { T1, T2, …, Tn} , 转向2。

2 使用封装器对搜索词W和搜索条件Ti ( Ti∈ T, 且i的初值为1) 进行封装, 转发给对应的购物网站, 并得到搜索结果Pi, 转向3。

3 将搜索结果Pi提交给网页分析模块, 返回商品信息集I= { I1, I2, …, Im} , 并转向4。

4 对商品信息进行排序, 若搜索条件集T中的所以网站搜索完毕即i = n转向5。否则i自增1 并转向2。

5 将4中的排序结果显示给用户。

算法中涉及到封装器的使用, 对封装器描述如下: 封装器的目的是将用户的搜索请求封装底层数据格式同时向多个搜索引擎递交请求。系统接收到用户的请求和将用户请求封装到URL中。令URL为某购物网站站内引擎地址, NAME为传递参数名, W为搜索词, 封装后结果为URL? NAME = W。以淘宝为例, 搜索“大衣”URL为: http: / /s. taobao. com/search? q = % B4%F3% D2% C2。

2. 2 抓取范围限定模块

1) 模块功能分析

元搜索引擎是通过子引擎进行网页搜索的, 根据之前分析元搜索模块对用户请求的封装使用了URL和NAME两个参数, 但不同的购物网站URL和NAME是不同的, 这就涉及到元搜索子引擎自动维护的问题。抓取范围限定模块就是为了解决这一问题而设计的。

该模块的思想是使用元搜索技术将事先准备的一些搜索词封装并提交给百度搜索引擎, 然后对百度的搜索结果页面集中包含的购物网站搜索引擎地址进行抽取, 这相当于使用一个简单易于维护的元搜索引擎对系统的元搜索引擎进行维护。

2) 抓取范围限定模块设计

抓取范围限定模块需要解决三个问题: 一是, 使用元搜索技术获得百度搜索的结果页面集, 目的是实现对百度搜索的结果页面集进行自动抓取。二是, 百度搜索的结果页面集中网址的提取, 该问题的关键是如何从搜索的结果页面中正确地提取网址。三是, 对抽取出的网址的筛选和提取目标信息, 无论网址提取中采取的算法多么严谨都不可避免地将一些无用网页提取出来, 而且, 系统的最终目的是提取购物网站的搜索引擎网址和传值参数的参数名, 因此需要判定之前抽取的网址是否符合要求, 并提取最终目标。

算法如下:

网址集T = { url1, url2, …, urln} 是对搜索结果页面集提取到的网址集合, 对候选网址集T的每一个网址进行如下操作:

1 打开网页urli ( i的初始值为1, 1 ≤ i ≤ n ) ;

2 判断网页的编码方式, 将网页转换为字符串, 并使用htmlparser创建网页的DOM树;

3 提取网页源代码中的form表单, 若存在转到5, 否则转到4;

4 判断网页中是否含有text属性的input标签, 将网址保存到本地的txt文档中, 由手工提取, 否则转到8;

5 判断form表单是否符合要求, 有且仅有一个submit属性的input标签和一个text属性的input标签, 若是进行下一步, 否则, 转到8;

6 判断form的传旨方式, 如果为post方式, 将网址保存到本地的txt文档中, 转到8。否则转到7;

7 提取form表单中的action属性和text属性的input标签中的name属性, 并将其保存到查询范围库, 转到8;

8 i + +, 若i > n程序结束, 否则转到1。

抓取范围限定模块的输出结果是查询范围库, 它包括购物网站的URL和NAME等信息, 它要尽量保证购物网站信息是正确可靠的, 但抓取范围限定模块并不能完全地保证提取的每一条信息都是正确的。

2. 3 网页分析模块

1) 模块功能分析

网页分析模块的目标是对元搜索模块的搜索结果进行分析, 提取网页中商品信息按照指定格式输出给用户。

2) Web信息抽取算法分析

网页分析模块是通过Web信息抽取实现信息抽取[9,10], 根据规则获取方式分为三类:

1 人工制定规则: 早期的信息抽取都是通过手工抽取规则的方式进行信息抽取的, 这种方法是指提前制定好抽取规则, 系统按规则直接抽取, 比如对网页中标题进行抽取, 可以直接设定规则对每一个抓取到的网页抽取title标签中信息。这种方法的优点是简单、准确率高。但是规则的制定往往需要一定的相关知识水平人工消耗大, 而且无法满足对快速变化的网页结构进行抽取。每当网页结构发生变化, 就需要人工的重新制定规则。

2 利用标注好的样本抽取规则: 这种方法是指对已经标记好的样本进行分析, 通过一定规则自动生成对这类样本的抽取规则。这种方法的优点是实现了一定的自动化, 但由于需要对样本进行人工标记需要消耗一定的时间, 适用于大量相似结构网页信息的提取。

3 完成自动的提取规则: 这种方法通过对网页信息之间隐含结构的研究制定一套方案, 完全自动地提取网页信息。该方法的优点是适应能力强, 无需人工干预, 但抽取效率相对较差, 而且只能对特定的信息进行抽取。代表的算法有RoadRunner、IEPAD、MDR、Find DR等。

3) 购物网站页面结构分析

对网页中信息进行抽取首先对购物网站页面结构分析, 图2 ( 搜索结果页面) 和图3 ( 商品展示页面) 是购物网站中的两类包含商品信息的网页, 比较两者可以发现, 搜索结果页面包括了商品展示页面中的主要内容, 而且更利于元搜索的提取。因此对搜索结果页面进行分析, 发现其具有如下特点:

1 一个搜索结果页面显示多件商品, 一般为十件以上甚至更多, 以淘宝为例, 淘宝的搜索结果页面包含44 件商品。

2 搜索结果页面对每件商品的描述格式大体相同。

3 搜索结果页面对每件商品信息可以分为商品名、商品价格、其它信息三部分。其中其它信息由多条信息组成是对商品的具体描述。

4) Find DR改进算法

首先定义两个概念数据区域和重复度。

定义1数据区域

由两个或两个以上满足以下所有条件的结点的集合: 1 集合中相邻结点相似度大于某个阈值。2 对于集合中任意结点Ti至少存在一个结点Tj与该结点相邻。3 所有结点存在一个相同的父节点。

定义2 重复度

某数据区域的重复度为N, 表示该数据区域N个结点。

Find DR改进算法描述如下:

算法中Snode.Flag表示包含搜索词W的结点集, Snode.DataRegion Set保存目标数据区域。下面对算法中包含的三个函数进行描述。

Contains (Snode, W) :该函数的目的是求以Snode为根结点的树中包含搜索词W的结点集, 函数首先从根节点开始遍历DOM树, 将遇到的每一个包含搜索词W的结点添加到Snode.Flag中。

Identity DR (Flag, P, N) :该函数求符合如下条件的数据区域, 1该数据区域中包含结点Flag或结点Flag的祖先结点;2该数据区域的重复度大于N。函数首先求结点的父节点是否含有符合要求的数据区域, 若存在则结束, 否则, 求父节点的父节点是否含有符合要求的数据区域, 以此类推。为减少重复运算, 对结点的所有求解过的数据区域的祖先结点加标记。结点的相似度阈值由简单树匹配算法获得。如下所示:

5) 简单树匹配算法

定义3树匹配

假设A、B为两棵树, , 对于, 满足如下条件, 则M为A到B的一个匹配。

1 若Ai= Bi, 则Aj= Bj。

2若Ai为Aj的祖先, 则Bi为Bj的祖先。

3若Ai在Aj的左边, 则Bi在Bj的左边。

4 存在 ( parent ( Ai) , parent ( Bi) ) 和 ( parent ( Aj) , parent ( Bj) ) ∈M。

简单树匹配算法就是寻找树A和B的最大匹配数目, 记作Max Match ( A, B) 。设A = { Root A, A1, A2, …, Am} , B = { Root B, B1, B2, …, Bn} 为两棵树, 其中Root A和Root B为A和B根结点, 其余为根结点的子树, m和n为A和B的孩子数。A和B树的最大匹配为Max Match ( A, B) = M ( A, B) + 1, 其中M ( A, B) 为< A1, A2, …, Am> 和< B1, B2, …, Bn> 的最大匹配。M ( A, B) 可通过动态划分的方法计算:

1 若Max Match ( Am, Bn) > Max Match ( Am, Bi) , i = 1, 2, …, n - 1 。M ( A, B) = Max Match ( < A1, A2, …, Am - 1> , < B1, B2, …, Bn-1>) +Max Match (Am, Bn) 。

2 否则, M ( A, B) = Max ( Max Match ( < A1, A2, …, Am> , ) , Max Match (, ) ) 。

由1和2可得M ( A, B) = Max ( Max Match ( < A1, A2, …, Am>, ) , Max Match (, ) , Max Match (, ) +Max Match (Am, Bn) ) 。

算法实现如下:

3 实验结果

由于元搜索模块的搜索结果取决于抓取范围限定模块提取的网站信息准确率, 所以只对抓取范围限定模块和网页分析模块进行实验分析。

1) 抓取范围限定模块

抓取范围限定模块对使用get方法的购物网站进行信息采集, 只有采用合理的正则表达式, 抽取结果的召唤率为100% , 也就是说不考虑网页传输错误等情况下, 可以将百度搜索结果中包含的get方法的购物网站全部抽取出来, 但是并不是所有的抽取结果都是购物网站, 表2 是抓取范围限定模块抽取结果。

表2 中搜准率表示, 抽取结果中正确结果所占比例, 指标F为调和均值[11], 召唤率R为100% 。

实验结果表明:

1 抓取范围限定模块具有很好的召唤率和搜准率, 但不可避免地被非购物网站搜索出来, 如购物论坛等。

2 不同的搜索词对抽取结果有一定的影响, 因此要尽量选取更准确的搜索词。并可以对多个结果进行汇总, 不过在得到更多抽取结果的同时也会降低搜准率。

2) 网页分析模块

使用Find DR改进算法对购物网站进行信息抽取实验, 表3为部分网站的信息抽取结果, 表中的六个网站都可以抽取出其中的商品信息, 但是淘宝、亚马逊、凡客三个网站信息抽取结果不全, 淘宝和亚马逊对部分结果单独显示, 这两个网站将搜索结果中的前几件商品与其它商品放在不同的区域中。凡客则是由于页面的数据区域不明显。

4 结语

为解决自动地对网络上商品信息的搜索、提取, 本文结合了现有网络商品信息搜索的相关技术基础上, 设计了一种商品信息提取模型。该模型采用元搜索技术和统计与模板的网页分析方法实现了对网络商品信息的高效抽取。

摘要:在分析网络商品信息特点的基础上, 改进现有的Web信息提取技术, 设计一种基于元搜索技术的网络商品信息提取模型, 实现对搜索范围的自动确定、网页搜索、以及商品信息的自动抽取。通过大量商品信息的搜索测试, 在抓取范围的自动确定和商品信息的自动抽取上取得了很好的效果。

关键词:Web信息抽取,元搜索,提取模型

参考文献

[1]Jorge R, Gómez A.A Fuzzy Logic intelligent agent for Information Extraction:Introducing a new Fuzzy Logic-based term weighting scheme[J].Expert Systems with Applications, 2012, 39 (4) :4567-4581.

[2]Doug D, Etzionib O.Analysis of a probabilistic model of redundancy in unsupervised information extraction[J].Artificial Intelligence, 2010, 174 (11) :726-748.

[3]TakLam W, Lamb W.An unsupervised method for joint information extraction and feature mining across different Web site[J].Data&Knowledge Engineering, 2009, 68 (1) :107-125.

[4]曹林, 韩立新, 吴胜利.元搜索引擎排序技术综述[J].计算机应用研究, 2009 (2) :411-414.

[5]朝乐门, 张勇, 邢春晓.面向跨领域海量信息资源的元搜索引擎研究[J].中国图书馆学报, 2011 (2) :19-29.

[6]王新, 刘晓霞.基于关联规则挖掘的垂直元搜索引擎研究[J].计算机工程, 2011 (4) :76-77, 80.

[7]韩宇彬, 薛贺.元搜索引擎结果集成算法[J].微处理机, 2008 (5) :104-107.

[8]孟星, 丁振国.个性化元搜索引擎模型研究[J].计算机工程与应用, 2008 (36) :150-152.

[9]顾韵华, 田伟.基于DOM模型扩展的Web信息提取[J].计算机科学, 2009 (11) :235-237.

[10]张树壮, 罗浩, 方滨兴.面向网络安全的正则表达式匹配技术[J].软件学报, 2011 (8) :1838-1854.

篇9:小学信息技术《可爱的家》说课稿

《可爱的家》是西南师范大学出版的小学信息技术教材三年级下册的内容。它是教材关于画图板块中重要的组成部分。本课主要是让学生认识“矩形”“椭圆”“圆角矩形”工具,并能灵活运用工具绘制“可爱的家”。学生通过前几节课关于画图软件的认识、操作,已经有一定的绘画基础,并能运用一些常用工具绘制一些简单的图画。本节课教材首先通过对优秀作品的欣赏,激发学生利用计算机画图的兴趣,调动学生的积极性,在教学画图模块时,学生感知实践信息技术和美术的有机融合,达到运用工具绘制自己“可爱的家”的目标,逐渐培养学生的信息素养。

二、教学目标

认知目标:通过教师引导,学生动脑思考、交流与实践操作的学习过程,体验和感悟探究的一般过程,让学生认识、了解、掌握“矩形”“椭圆”“圆角矩形”三个工具的作用。

能力目标:通过欣赏美、创造美的劳动,使学生获得审美的体验和享受成功的愉悦,激发学生的学习兴趣,奠定终身学习的基础,培养学生的实际操作和创新能力。

情感目标:学生通过自主、合作、探究学习的方式,提高获取信息、处理信息和应用信息的能力;在不断尝试中激发求知欲,逐渐提高信息素养。

三、教学重点与难点

教学重点:“矩形”“椭圆”“圆角矩形”三个工具的使用。

教学难点:灵活运用辅助工具栏中的设置,绘制出不同的样式。

四、教法、学法

教学前需要准备好多媒体网络教室,有网络教室软件,学生机具有Office Word 2003软件,学习机上有准备好的本课素材。本课主要采用“任务驱动法”。通过教师启发、引导,学生已经掌握了画图中的基本工具,设置一个个任务,让学生在学习的过程中独立思考,自己动手,灵活运用画图的各种工具,以任务驱动的方式,教学内容合理流动,水到渠成。

学生在教师的启发引导下,自主产生疑问,四人小组合作探究,采用试一试、画一画、练一练、想一想的学习方法,学生以练为主,通过动脑、动手来获得新知。

五、教学过程

根据我校启导课堂小组探究教学模式,结合三年级学生的认知水平和生活情感,此课设计教学流程如下:

(一)创境激趣

展示一组主要用“矩形”“椭圆”“圆角矩形”工具绘制的图画,让学生感受到利用绘图中的工具就能绘制出丰富多彩的作品。当学生惊叹时,教师要抓住时机提出问题:同学们,这些漂亮的图画如果让我们自己绘制,你觉得主要是用到画图软件的哪些工具呢?通过欣赏、提问,既调动了学生的积极性,又提出了明确的任务,激发了学生的学习兴趣,使学生在情景中主动、积极地接受任务,并带着问题去思考。

(二)启学生疑

在创设了情境,明确了学习任务后,让学生带着问题,一步步地在实践中摸索来获取新知。

1.自学教材:教师安排一定的时间让学生阅读教材,让学生了解教材是实现我们目标的途径和方法。

2.四人小组讨论:学生自学教材后,在对过程有一定了解的基础上,通过四人小组讨论,拟定出小组的思路、方法和步骤,并在计算机上试探性地绘制《可爱的家》。学生把教材、同学、老师都作为学习的帮助者,从而让学生逐渐明白获得新知的途径可以是各种各样的。

小贴士:如果想画出一个正方形或者圆角正方形,只要在拖动鼠标时按住上档键就可以了!

(三)导探释疑

教师通过巡视观察各小组的操作,及时发现各小组的操作情况,教师演示绘制“可爱的家”的一般步骤。在演示的过程中教师要解决各小组在操作过程中普遍遇到的难点,介绍各小组一些创新的方法,各小组通过观摩教师的演示过程后,会有一种跃跃欲试的操作动机,这时教师应抓住这个时机,立即让各小组结合老师演示的思路和方法绘制“可爱的家”。

小贴士:

在辅助工具栏中选择不同的样式,画出来的椭圆也不一样。

(四)反馈拓展

学生在绘制过程中,教师及时巡视,找出有代表性的作品,和学生一起分享、评价作品。鼓励各小组借鉴别人的方法,可以用不同的工具、不同的方法绘制自己想象中的家,这个作品可以是教材提供的,也可以发挥自己的想象,综合运用所学工具绘制“可爱的家”,每一个学生把自己的得意之作传到班级群里分享,下一次课的时候教师再组织大家一起欣赏作品。

试一试

1.使用矩形和椭圆工具,接着创作你们的作品。如图所示:

2.使用今天学习的工具,还能画些什么?看看下面这位小朋友的画,你受到启发了吗?快快动手试一试吧!

我的记录

上一篇:普惠制产地证书FORM A下一篇:我的月球之旅作文500字