信息海洋网络搜索

2024-05-23

信息海洋网络搜索(精选6篇)

篇1:信息海洋网络搜索

《信息海洋,网络搜索》教学设计

一、教案背景

本节课是学生在掌握了互联网信息浏览基础知识上的一个提高课,主要学习利用搜索引擎在互联网上查找信息,寻找有关问题的答案,让学生体会使用搜索引擎带来的快捷与方便。

二、教学课题

生活中的“开心辞典”——信息海洋网络搜索

三、教材分析

本节课选用的教材是华中科技大学出版社出版发行的《网络技术应用》九年级上册第2课《信息海洋网络搜索》。本节课主要教学内容是使用搜索引擎在互联网上查找自己所需要的信息,包括搜索引擎的相关知识和使用技巧。这节课是学生利用网络进行探究学习的必备知识,也是以后更进一步学习分类下载的基础。

四、教学目标

1、知识与技能:了解搜索引擎的相关知识,掌握多种条件搜索的相关技巧。

2、过程与方法:以游戏方式引入使用互联网搜索答案,布置任务让学生以小组合作的形式共同完成学习任务。

3、情感态度与价值观:以解决生活中问题为切入点,培养学生使用搜索引擎自主探究学习的良好习惯。树立正确的上网意识,引导学生正确认识互联网带给我们的快捷。

四、教学方法

引导式教学、任务驱动法、自主探究

五、教学重难点

教学重点:认识搜索引擎的概念及使用方法

教学难点:使用多条件关键字查询,筛选出合适的信息

六、教学过程

(一)、教学导入

同学们都听说过“开心辞典”吧,今天我给大家也组织一次“开心辞典”,看同学们知识积累的怎么样。发送“开心辞典”题目到学生桌面上,让学生自己完成其中的答案。

教师提出问题:生活中遇到这些形形色色的问题,我们如何找寻答案? 学生:可以请教同学,家长,老师,可以查询相关书籍,上网搜索等等。。

(二)、信息搜索的方法

1、提问:“刚才有同学提到在网上搜索,那么如何在网上搜索出自己想要的答案呢?用的什么工具?”学生思考回答

2、介绍搜索引擎。

搜索引擎是帮助我们查询网上信息的服务网站,它的作用相当于我们生活中的114查询台一样。

常用搜索引擎:百度,谷歌,搜狐„„

3、演示搜索“蚂蚁传递消息依靠什么”问题的答案 方法:①打开百度网站,选择“网页”分类 ②在搜索框内输入关键字“蚂蚁” ③点击“百度一下” ④显示查看搜索结果

此时,百度会显示出很多相关网页,如何筛选自己想要的信息? 学生思考后总结进一步添加关键字。

4、学生动手完成课本第34页的10个问题,通过网络搜索找到答案,总结搜索的方法。

(三)、学生登录e21教学网站进一步学习总结搜索的各种方法:总结常见的搜索方法,比较几种方法的区别,然后完成“搜索方法对比表”(通过网站学习培养学生自主探究学习的习惯)。

(四)、布置任务:

组织去武汉春游,大家在网上搜索下去的路线,费用。分组进行搜索,完成任务。任务完成后派代表展示搜索出的成果,并一起交流。

(五)课堂小结

师生共同总结搜索的方法,特点和技巧。

七、教学反思

本节课教学中充分利用了网络资源,通过教学网站这个互动平台为学生的自主学习,协作学习,整个教学过程比较顺利,基本完成了教学目标,通过游戏的方式引入课题,激发学生学习兴趣,调动了学生的学习积极性,通过引导提问的方式锻炼了学生积极思考,自主探究的习惯。

篇2:信息海洋网络搜索

答 案

一、选择题

1.2005年“芙蓉姐姐”的出现带动了对此现象的研究热潮,在CNKI—中国期刊全文数据库中,2005年至20007年间以”芙蓉姐姐”为主题的相关文献大概有(A.100多篇 B.200多篇 C.300多篇 D.400多篇

2.下列哪篇文章为《红树植物桐花树叶中氨基酸和微量元素的分析》的共引文献?(B)A.徐佳佳,龙盛京.桐花树化学成分及其生物活性作用的研究进展[J]时珍国医国药, 2006,(12).B.李春艳,李丹彤,银学祥,常亚青.真海鞘营养成分的分析与评价[J]大连水产学院学报, 2007,(05).C.奚刚.日粮营养成分对动物基因表达的调控[J]动物营养学报, 2000,(01).D.王继栋,董美玲,张文,沈旭,郭跃伟.红树林植物桐花树的化学成分[J]中国天然药物, 2006,(04).3.改革开放以来,中国科技的发展取得了长足的进步,根据Science Citation Index Expanded(SCIE)的统计,2007年收录的中国作者的论文是(B)。A.50800多篇 B.98700多篇 C.13900多篇 D.18700多篇

4.Cambridge Scientific Abstracts数据库中,检索项TI=和PD=分别代表(D)。

A)。A.题名和摘要 B.题名与作者 C.摘要与全文 D.题名与出版日期

5.在Web of Science 数据库中检索作者王思敏的文章,在检索框中输入作者名字的正确格式应是(C)。A.wang simin B.wang si-min C.wang sm D.wang s-m

6.世界上最早的网络搜索引擎是(A)。A.Archie B.Google C.Yahoo D.Excite

7.利用现代信息技术,改变传统的网络信息搜索模式,通过人找人、人问人、人碰人等方式实现搜索的虚拟与现实的对接,揭露事情真相,变枯燥乏味的查询过程为“一人提问、八方回应”的人性化搜索体验,这种前卫的搜索模式被称为(C)。A.肌肉搜索 B.狗狗搜索 C.人肉搜索 D.黄页搜索

8.在我校图书馆馆藏书目检索系统中查找,金庸代表作《射雕英雄传》的索书号是(B)。A.I247.58/W741c B.I247.58/J678 C.I246.58/J678 D.I247.58/G654

9.2002年美国麻省理工学院启动将本校课程资源放在网上免费使用的Open Course Ware(OCW)计划,之后世界各大高校纷纷响应,下列高校属于OCW联盟的是(ABCD)。(多选题)A.美国-约翰霍普金斯大学(John Hopkins University)B.日本-早稻田大学(Waseda University)C.澳大利亚-南昆士兰大学(The University of Southern Queensland)D.英国-开放大学(The Open University)

10.下面关于网络暴力的表述正确的是(BCD)。(多选题)A.破坏通信电缆、交换机等网络设备的行为。

B.网民借助网络舆论的力量在网络上肆意攻击他人的狂热行为,是社会暴力在网络上的延伸。

C.通过网络视频、公告等手段侮辱谩骂当事人及其亲友。D.在网上公开当事人现实生活中的个人隐私。

11.根据US News & World Report,美国大学2008年排名中,化学(chemistry)专业研究生课程排名第一的大学是(C)。A.布朗大学(Brown Univeristy)B.康奈尔大学(Cornell University)C.斯坦福大学(Standford University)D.耶鲁大学(Yale University)

12.目前主流的电子图书格式有(ABCD)。(多选题)A.TXT B.PDF C.CHM D.HTM

13.“三鹿”奶粉事件将公众的视线集中到了食品质量上。而对于食品质量进行规范的就是各种行业标准。在万方数据库中以“奶粉”为标准名称可检索到(A.20 B.40 C.60 D.80

14.小沈阳在春晚的暴红引起了公众对二人转的兴趣。二人转至今有300多年的历史,师承关系可以追溯至清嘉庆年间,而且有多种别名,如蹦蹦,小秧歌等。直到(C)多条行业标准。

C)年,在北京举行的第一届全国民间音乐舞蹈大会上,东北代表团的二人转节目正式参加演出,从而二人转这个名字首次得到全国文艺界的承认。A.1951 B.1952 C.1953 D.1954

15.AIDS是人类面临的最为危险的疾病之一,各国都投入巨大人力与财力进行研究。通过检索Web of Science 数据库得知,截止2007年,以AIDS为主题,按研究结果数量由多至少排名,前两位的研究机构是(A)。

A.哈佛大学与约翰霍普金斯大学(Harvard University & John Hopkins University)B.杜克大学与哥伦比亚大学(Duke University & Columbia University)C.埃默里大学与德克萨斯大学(Emory University & Texas University)D.加利福尼亚大学洛杉矶分校与北卡罗纳大学(California University-L.A.& The University of North Carolina)

二、是非题(正确填T,错误填F)

1.想了解某种期刊的出版信息或在某期刊内检索文献,可利用CNKI-中国期刊全文数据库中的“期刊导航”检索方式。(2.期刊《acta biologicae experimentalis sinica》是数据库Science Citation Index Expanded(SCIE)的源期刊。(3.在维普――中文科技期刊数据库的传统检索界面中,设置了“同义词”功能,勾选它的作用是缩小检索范围。(4.使用Web of Science既可以追溯一个课题的基础和起源,也可以跟踪一个课题的最新进展情况是怎样。(T)

5.1999年12月,Jorn Barger运行的“Robot Wisdom Weblog”第一次使用weblog(博客)这个正式的名字。他将log的意义从接近航海日志那种无人称、拟客观、机械式写作,转换成较接近旅游日志的“有人称、有个性”的自由书写。(T)

F)

F)

F)

三、简答题

1.热门美剧《英雄》中各位英雄的超能力令人炫目,其中能够细胞再生,有不死之身的是谁?

克莱尔·本奈特(Claire Bennet)

2.百度是目前最大的中文搜索引擎。“百度”一词来源于哪位诗人的哪句诗词?

辛弃疾,众里寻他千百度

3.我校一位教师引用了《5种药物对方斑东风螺面盘幼虫的急性毒性》为参考文献,请为他补全这篇文章的作者、刊名和发表时间等信息。

作者:李雷斌,刘志刚 刊名:广东海洋大学学报 发表时间:2008年6月

4.北京奥运会四乘一百米接力赛中,世界头号劲旅美国队出现掉棒现场,在预赛出局,成为大冷门之一。请问是哪两位队员交棒时出现失误?

多克·巴顿,泰森·盖伊

5.MP3的英文全称是什么?

篇3:信息海洋网络搜索

1.面向学生:中等职业学校□中学□小学

2.学科:信息技术课

3.课时:2课时

4.学生分析:

该课程面向中专三年级学生, 字处理软件的基本操作知识已熟悉, 缺乏综合实践机会, 同时此年龄段的学生缺乏团队合作精神以及网络环境下信息的搜集、处理及应用等能力, 对是非判断、人生价值等有待正确引导。希望通过本次课能够培养学生信息素养的各种能力, 通过了解相关专业的职业类型及人才需求类型, 激励自身与同伴有目标的进行现阶段的学习, 并树立终身学习和合作学习的思想观念, 逐渐建立正确的人生观与价值观。

5.学生课前准备:

(1) 了解该项目活动的目的、过程及任务;

(2) 请教专业教师了解有关药学专业的职业信息;

(3) 思考和交流对职业的看法, 写出几个所知道的职位;

(4) 参看各种宣传手册及简报的设计;

(5) 构思自己的简报风格。

●教学课题

1.知识目标

(1) 利用百度搜索引擎搜集药学专业相关的职业信息;

(2) 掌握相关搜索技巧;

(3) 了解辨别信息的常用方法;

(4) 能够下载所需的素材, 并进行统一管理;

(5) 利用字处理软件将素材整理制作成电子版的宣传简报及手册。

2.能力目标

(1) 搜集、处理、应用信息的能力;

(2) 提升发现问题、解决问题的能力;

(3) 锻炼组织协调及语言表达沟通能力;

(4) 培养创新能力的提高。

3.情感目标

(1) 体验自身及团队的成就感;

(2) 加强团队合作精神及个人创造力的展示;

(3) 逐渐建立终身学习的思想观念;

(4) 增强自信心, 做好将来职业的引导。

●教材分析

教材选用的是中等卫生职业学校护理、药剂、影像技术等专业适用的《医学计算机与信息技术基础》, 本案例设计选取的教学内容是第七章计算机网络应用基础的第三节Internet的应用。

该节内容共分为浏览器的使用、电子邮件的使用、搜索引擎的使用、即时信息工具以及博客等五部分, 鉴于学生的实践应用基础和学校硬件等方面的客观原因, 特将本次课程的教学内容定为搜索引擎的使用、资源下载和博客的访问。

搜索引擎在今天这个信息时代可以说与我们的学习和生活息息相关, 教学重点定为搜索引擎的使用方法, 教学难点是有关搜索技巧的灵活运用以及如何辨别所搜集信息的真伪、价值等。

教学之前, 首先, 通过调查问卷了解学生目前关于文字处理等软件的操作掌握情况、创业与就业课程的学习情况以及对目前和将来职业的想法等;第二, 利用百度搜索引擎在网上搜索有关医学的相关职业的信息, 认真总结百度的搜索技巧整理后选取适用的内容作为教学重难点;第三, 利用百度查看相关图片等宣传手册的排版素材, 全面考虑学生将遇到的搜索及下载的相应问题;第四, 与经验丰富的有关教师交流项目教学法的实施与注意事项, 精心设计学生的活动任务表。

●教学方法

针对处于中专面临毕业就业的学生, 他们对网络的基本使用具备一定的生活经验, 比较现实, 建立起的人生观和价值观较模糊, 所以我从学生的特点出发, 结合学生所开设的《创业与就业》课程, 采用情境导入法和行为引导教学法中的项目教学, 同时融入了自主学习和协作学习等方法, 将电子版职业宣传手册定为项目活动的结果。

在中等职业学校引入项目教学, 一方面会激发学生的学习兴趣, 满足学生成就感的体验;另一方面学生的自我控制及合作等能力较差, 针对这一情况, 我协助学生制作了任务活动一览表, 学生可以在活动流程的指引下, 树立目标, 灵活安排小组的活动计划, 保障了教学的顺利实施。

为了尽可能的让每个学生的能力得到相应的提高, 在活动过程中, 积极发现学生的优势与劣势, 鼓励引导个别学生, 给予展示的机会, 锻炼其表达能力, 以便今后更好的参与到活动中来。

在评价方面, 关注过程评价、自我评价及学生互评, 要求学生总结本次课的收获, 将反思内容发表在班级博客中, 并将此作为评价的一部分。

●教学过程

【情景导入】

1.你长大了想干什么?通过对比童年和青年的不同答案, 引发学生对职业相关的思考。

2.举例招聘会上应聘所有招聘岗位的毕业生, 引导学生进行职业定位, 必须了解自己, 了解职业。

3.目前新兴的职业有很多, 每种职业还有多种的职位, 今天这节课, 让长大了的我们, 通过网络与信息技术来DIY职业导航。

[学生活动]请个别学生谈谈自己儿时和今天的理想。

【教学点】

1. 打开活动任务一览表, 按照表中步骤介绍本次课的活动任务 (28分钟)

(1) 简要叙述小组及职业方向的确定

(2) 信息的浏览、识别与下载

提问:Internet上的信息浩瀚万千, 而且毫无秩序, 我们如何能够快速的找到所需要的信息呢?

大家了解到的医学专业有哪些新兴职业?

[学生活动]个别学生回答所知道的医学职业。

以学生较为关注的职业为搜索内容来激发学生的学习兴趣。

打开百度网站的首页, 介绍搜索引擎的概念以及全文索引百度的特色之处。

针对学生所提的关键词“医药代表”, 按照网页和百科进行搜索, 地址如:

解释搜索结果, 既有医药论坛, 也有百科介绍, 还有招聘网, 等等, 信息繁多。启发学生在明确要搜索的信息主题涵义前提下, 提炼关键词, 细化搜索条件, 可以利用空格键或者使用逻辑命令“+”号和“-”号或者利用中文双引号等搜索技巧, 例如我们想寻找职位的描述信息, 那么将关键词变为“医药代表职位描述”, 请学生对比搜索结果的不同。

启示:限制某地区的职位描述如何实现。

提问:网络海洋中的信息有多少可信度呢?建议学生重视信息筛选、加强信息理解、学会信息归纳, 进行信息的综合, 总结医药代表这个职位所需的知识及能力。

启示:利用百度搜索网络信息的筛选及如何辨识有效招聘信息。

以医药代表职位描述的某网页为例, 介绍文字的下载与保存方法, 筛选信息并整理相关资料的文件夹。

提问:如何快速的在百度中找到需要的图片素材。

[学生活动]个别学生回答百度图片的使用。

根据学生的关键词进行某示例图片的搜索与下载。

(3) 宣传简报的制作注意事项

我们下载的资料如何展现, 能美观、人性化从而起到职业导航的作用吗?可以利用文字处理软件将自己的资料文档设计成一份简报, 提示文档排版需注意的问题。

2. 学生操作 (45分钟)

以小组为单位, 设计小组的行动计划, 按照大家感兴趣的专业通过百度搜索引擎搜集相关职业信息和排版素材, 并建立个人资料目录, 设计自己的个人作品。

教师作为各小组的协作人, 随时观察各小组的活动情况, 记录过程评价, 确保活动的顺利进行。

[学生活动]以小组为单位, 按照任务活动一览表开展活动。

3. 评价 (15分钟)

任意抽取两个小组的成员介绍个人或小组的作品, 要求说出使用的关键词、如何进行的信息筛选以及作品的特色之处, 以此锻炼学生对本次课的宏观把握以及语言表达能力。

[学生活动]个别学生为大家演示介绍作品及制作过程。

将自己的作品或资料表格、小组作品发送至教师机相关目录, 并访问教师博客, 回复自评与学习总结日志。

博客地址为:http://blog.sina.com.cn/growing0with0you。

4. 作业 (2分钟)

课下希望学生用自己的方式宣传自己的电子作品, 让我们大家都能建立起职业引导意识、进行职业定位;通过图书馆等渠道搜集一下关于求职信如何撰写的资料。下次课我们动手设计个人求职信。

●教学反思

该教案的最初设计已经应用于实际教学中, 发现“搜索引擎的使用”这一教学内容比较灵活, 教学过程设计的是否充分会影响到学生的课堂学习效果, 以往的课堂中仅仅涉及各种搜索引擎的使用方法, 没有考虑到学生面对纷繁的信息会不知所措, 往往事与愿违, 出现教师说不到5分钟, 学生在信息海洋中已不见踪影的结果。

经过反思, 我认为既然将教学内容与所学专业相结合来激发学习兴趣, 教师首先要做到对所结合专业知识的了解, 可以通过专业教师和学生、网络、图书馆等渠道;其次在本案例的设计中增添了搜索技巧及信息价值判断的内容, 并作为教学难点来讲授, 应强调与明确任务活动的时间安排, 根据学生的活动情况应适当规定信息搜集的时间。

篇4:信息海洋网络搜索

关键字:文本特征;自编码神经网络;深度学习;Matlab

中图分类号:TP391.1        文献标志码:A

Information search model based on auto-encoder neural network

Yi Wan,Luo Jing,Li Yong,Guo Shaoying

(College of computer science and Information Engineering, Tianjin University of Science & Technology,

Tianjin 300222, China)

Abstract: According to user search history, the user information of interest by Title Classification, the auto-encoder neural network feature extraction value. Set the learning sample heading up to 25 Chinese characters, coding mode is adopted Chinese characters machine code (GBK code). Use the MATLAB tool for deep learning, will feature in the original space representation is transformed into a new feature space.

Key words: Text feature; The auto-encoder neural network; Deep learning; Matlab

基于自编码神经网络建立搜索信息模型的目的是根据用户搜索信息的历史,推断出网页中的内容是用户关注的信息并即时显示。首先将用户关注的历史信息按标题分类,通过自编码神经网络建立标题特征值数据库。当自编码神经网络搜索信息模型工作时,按照用户提供的关键词顺序,打开用户经常浏览的网页,读入标题文本,若具有数据库中的标题特征,则将该标题的文本内容即时显示。

直接解析网页中的标题文本,面临的基本问题是文本的表示。如果把标题文本所有的词都作为特征项,那么太多的特征向量维数导致计算量太大。例如50个标题,每个标题25个汉字,特征项将有50×25=1250个。如果将标题中的某个关键词作为特征词,将会有几千个包含关键词的标题,从而导致读入分析量过于巨大。本文采用自编码神经网络,用映射变换的方法把原始文本特征变换为较少的新特征,提高信息搜索效率。

1  自编码神经网络

1.1  自编码神经网络理论

Auto-Encoder(自编码)[1],自编码算法是一种基于神经网络算法的无监督学习算法,与神经网络算法的不同之处是将输入值作为输出节点的输出。自编码算法的另一个特征是隐藏层节点的个数一般少于输入输出节点的个数。这样的意义是将输入的特征通过神经网络的非线性变换到节点数更少的隐藏层。因此,可以通过自编码神经网络对给定的样本进行训练学习,从而得到输入数据降维后的特征,即为隐藏层的节点数,省去了人工特征提取的麻烦。

自编码神经网络结构示意图如图1所示[2]。这是一种深度学习的神经网络,包含了多个隐含层,整个网络是一种对称的结构,中心层的神经元的个数最少。网络通过对样本的训练可以得到一组权值系数,而输入数据通过这组权值系数表达成低维形式,从而达到了用降维后的特征表示出输入的数据。

图1  自编码神经网络的结构

Fig.1   The structure of auto-encoder neural network

1.1.1 预训练

(1) 输入参数的确定:标题是作者给出的提示文章内容的短语,标题一般都简练、醒目,有不少缩略语,与报道的主要内容有着重要的联系。如登陆我的钢铁网站,搜索钢管热点资讯,显示的标题有“我国自主研制*****油管成功替代进口”,学习样本选择50组标题,每个标题不超过25个汉字,如表1所示。

表1  学习样本

Tab. 1  Learning samples

1

我国自主研制高端耐热钢无缝钢管成功替代进口

2

我国自主研制K55石油套管成功替代进口

3

我国自主研制J55稠油热采套管成功替代进口

4

我国自主研制专用耐高温防火船舶用套管成功替代进口

5

我国自主研制20G高压锅炉管成功替代进口

6

我国自主研制特殊用途低温用管成功替代进口

7

我国自主研制起重机臂架无缝钢管成功替代进口

8

我国自主研制精密合金4J36船用管材成功替代进口

9

我国自主研制高强韧性高抗挤毁套管成功替代进口

10

我国自主研制三种极限规格管线管成功替代进口

……

50

我国自主研制医药化工用管成功替代进口

(2) 语句预处理[3]:学习样本句子进行预处理是把句子中的每一个汉字变换成自编码神经网络模型能接受的数字化形式。为了使神经网络能接受外部数据,首先要对句子中的汉字进行编码,编码方式是采用汉字的计算机内码(GBK码)。每个汉字机内码有16位二进制,如:“我国自主研制”的二进制码为

1100111011010010 我(GBK码)

1011100111111010 国(GBK码)

1101011111010100 自(GBK码)

1101011011110111 主(GBK码)

1101000111010000 研(GBK码)

1101011011000110 制(GBK码)

将16位二进制数转换为十进制数并进行线性变换,映射到实数[0 1]之间,作为输入神经元初值。变换公式如下:

式中:maxi和mini;tmax和tmin分别为x(p)i,t(p)量程范围的最大值和最小值。

(3)预训练:几个独立的RBM构成“堆栈”构成了预训练部分,而RBM是BM (boltzmannmachine)的一种特殊连接方式。图2即为RBM的网络构成。它是一种隐含层神经元无连接,并且只有可见层和隐含层两层神经元。

图2  RBM网络构成

Fig. 2  Construction of restricted boltzmannmachine

BM的权值调整公式为[4]

(1)

式中:在第t步时神经元i、j间的连接权值为wij(t);η为学习速率;T为网络温度;<uihj>+、<uihj>-分别为正向平均关联和反向平均关联。

在RBM中,可见层神经元的输出和隐含层神经元输出的乘积即为平均关联。系数ε由η和T统一合并而成,迭代步长即由权值调整公式ε表示。

图3  RBM网络结构图

Fig. 3  RBM network  structure  diagram

(4)MATLAB实现:

本文建立的BP神经网络模型结构为

[25,15,25],[15,12,15],[12,10,12],[10,8,10],[8,5,8]

设定网络隐含层的激活函数为双曲正切S型函数tansig,输出层的激活函数为线性激活函数purelin,网络的训练函数为Levenberg-Marquardt算法训练函数trainlm。因此对应的MATLAB神经网络工具箱的程序语句为

net=newff(minmax(P),[25,25],{‘tansig,purelin}, trainlm);

net=newff(minmax(P),[15,15],{‘tansig,purelin},trainlm);

net=newff(minmax(P),[12,12],{‘tansig,purelin},trainlm);

net=newff(minmax(P),[10,10],{‘tansig,purelin},trainlm);

net=newff(minmax(P),[8,8],{‘tansig,purelin},trainlm);

设定学习速率为0.01,最大训练步数为300,目标误差为0.00001。

(5)预训练结果:

预训练结果如表2所示。

表2  预训练结果

Tab. 2  The results of pre training

误差

学习速率

步长

[25,15,25]

0.003248

0.01

150

[15,12,15]

0.0022809

0.01

125

[12,10,12]

0.0025866

0.01

100

[10,8,10]

0.0039575

0.01

75

[8,5,8]

0.013529

0.01

50

1.1.2  展开

如图4所示,将各个RBM连接,得到自编码神经网络。预训练所得到的权值,将作为整个自编码神经网络的初始权值,参与整个网络的微调训练。

图4   RBM展开图

Fig. 4  Development of RBM network structure

1.1.3  微调

微调训练是在预训练得到初始权值的基础上,对权值进一步调整。采用以交叉熵为目标函数[5]的BP算法完成网络的微调训练。交叉熵是用来度量两个概率分布间差异性的,它是一个非负数,两个分布越相似,其越小。原始的交叉熵定义为

(4)

式中:x为随机变量;q(x)为已知概率分布;p(x)为估计概率分布。

对于随机变量x,当用q(x)估计p(x)时,通过调整受x影响的p(x)来最小化交叉熵D(p‖q),用于自编码神经网络权值调整的BP算法交叉熵函数形式为

(5)

式中:ti目标概率分布;yi实际概率分布。

整个网络训练的目的是调整权值以使交叉熵函数达到最小,权值调整公式为

根据上面的权值调整公式,可以完成网络的微调训练。训练结果如表3所示。

表3   微调训练结果

1.1.4 特征提取

50组标题(每个标题不超过25个汉字)的学习训练,通过自编码网络的逐层特征变换,将样本数据约1250(50×25)个汉字编码,在原空间的特征表示变换到一个新特征空间。其中网络最深隐含层的输出值(5个)和权值矩阵W6(5×8=40个),共计45个,为提取标题文本1250个汉字编码的特征值。

2  实  例

本文选取10组标题文本见表4,分别输入自编码神经网络。预测结果表示基本符合要求。

表4  预测结果

Tab. 4  The prediction results

序号

样本输入

结果显示

1

我国自主研制的蛟龙号深水探测器成功替代进口

2

我国自主研制首台3.6万吨垂直挤压机挤合格钢管成功替代进口

我国自主研制首台3.6万吨垂直挤压机挤合格钢管成功替代进口

3

我国自主研制的超级计算机系统成功替代进口

4

我国自主研发的1000MPa高压共轨管成功替代进口

我国自主研发的1000MPa高压共轨管成功替代进口

5

我国自主研制超临界电站无缝钢管T92、P92成功替代进口

我国自主研制超临界电站无缝钢管T92、P92成功替代进口

6

我国自主研制重载火车头下线成功替代进口

7

我国自主研制成功特高压交、直流套管成功替代进口

我国自主研制成功特高压交、直流套管成功替代进口

8

我国自主研制的Q355GNH系列耐候钢成功替代进口

我国自主研制的Q355GNH系列耐候钢成功替代进口

9

我国自主研制的涡桨支线飞机成功替代进口

10

我国自主研制钒微合金L290管线钢成功替代进口

我国自主研制钒微合金L290管线钢成功替代进口

3  结  语

本文按照标题文本分类检索信息,解决了直接按照关键词搜索信息,网页中经常显示几千条包含关键词内容的标题本文,从而导致读入分析信息量过于巨大的问题。通过自编码神经网络提取文本特征,在不损伤文本核心信息的情况下尽量减少要处理的单词数,以此来降低向量空间维数,简化计算,提高了文本处理的速度和效率。

参考文献:

[2] 赵杜娟, 刘高平, 黄华, 等.自编码神经网络车牌字符识别研究[C]//多媒体学术会议(NCMT2009). 西安:清化大学出版社, 2009: 113-119.

[3] 吴芬芬. 信息抽取算法研究. 吉林大学硕士学位论文, 2006.

[4] 刘高平, 赵杜娟, 黄华.基于自编码神经网络重构的车牌数字识别[J].电子激光, 2011, 22(1): 144-148.LIU

[5] ZHANG Jian, FAN Xiaoping, et al. Research on characters segmentation and characters recognition in intelligent LPR system[C]//Proceedings of the 25th Chinese Control Conference. Harbi: Beihang University Press, 2006: 7-11.

篇5:信息海洋网络搜索

班级 市场营销1103 姓名: 刘天 实验时间:2014年 11月21 日 指导教师:陈智洁

一、实验目的

1.学习在网络上有目的查询信息的方法 2.学会常用搜索引擎的使用方法 3.理解不同搜索引擎的特点

二、实验内容

1.比较百度、搜狗、新浪爱问、中国期刊网和学生之家5种搜索引擎的异同点。

2.在网上查找有关“武汉纺织大学管理学院”的内容,阅读后写出综述。3.在网上查找你最关注的人的信息,记录查询结果,并对使用的查询方法给予评价。

三、操作步骤

1双击打开IE浏览器,分别输入百度、搜狗、新浪爱问、中国期刊网和学生之家的网页,他们都是利用中文联想搜索引擎,前三个网站侧重综合搜索,后二个比较侧重期刊和学习资料。在百度搜索武汉纺织大学管理学院,阅读前三条,得出综述武汉纺织大学管理学院始创于1985年,1988年组建管理工程系,1999年正式成立经济管理学院,2011年更改为管理学院。学院拥有2个一级学科硕士点、1个二级学科硕士点和4个专业硕士点:2003年取得管理科学与工程一级学科硕士学位授予权,2005年取得企业管理二级学科硕士学位授予权;2010取得工商管理一级学科学术硕士点; 同年获得工商管理(MBA)专业硕士点、项目管理(MPM)专业硕士点、物流工程专业硕士点和工业工程专业硕士点。

3在百度搜索习近平,男,汉族,1953年6月生,陕西富平人,1969年1月参加工作,1974年1月加入中国共产党,清华大学人文社会学院马克思主义理论与思想政治教育专业毕业,在职研究生学历,法学博士学位。现任中国共产党中央委员会总书记,中共中央军事委员会主席,中华人民共和国主席,中华人民共和国中央军事委员会主席。[1] 百度查询,信息快捷方便全面

四、实验收获和建议

篇6:信息海洋网络搜索

《网络信息获取技巧———搜索引擎》教学设计

一、教学设想

如何应用网络、查询网络信息是中学生利用网络这一工具开展学习的一种重要技能。教学设计中要充分利用信息技术有效整合相关的教学资源、创设情景,激发学生强烈的求知欲,引导学生循序渐进地认识网络应用的重要意义及使用方法,培养利用网络开展自学与探究学习能力。

二、教学目标

1.让学生了解网络信息资源及其特点。

2.了解搜索引擎的种类和使用技巧,学会巧妙运用搜索策略。

三、教学重点

掌握常用搜索引擎的搜索技巧。

四、教学难点

让学生掌握利用关键词搜索的技巧获取信息。

五、教学环境

多媒体网络教室,Internet 网络。

六、教学过程

(一)情境导入,引出课题

师:我们再来感受一下神七飞天这一完美的历史瞬间(学生机屏幕播放《神七飞天全程模拟动画》)学生们神情专注,边看边感叹,播放完毕,有的学生问:“老师这个片子哪来的? ”

师:是昨天在网上搜索到的。生:搜索? 怎么搜索啊?

师:搜索可是网络信息获取的一种重要方法,今天我们的学习目标就是来认识搜索引擎,一旦大家掌握了搜索引擎的使用技巧,那么获取网络上的各种有用信息就得心应手了。

生:老师快教教我们吧!(学生急不可待的样子)

(二)体验中感知,网络上验证

师: 要想掌握获取网络信息的方法,首先让我们来了解一下有关网络信息资源的知识。网络信息资源是指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷型的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源。具有数量庞大、内容丰富、覆盖面广、共享程度高、交互性强等特点。

生:老师,网络真是太好了,几乎什么信息都有,可以利用网络学到很多知识。

师:是啊,有价值的网络信息丰富多彩,但是要查询到我们需要的信息可要掌握一定的技巧才行。

一般获取网络信息可以通过什么途径呢? 共有三种:直接访问网页、使用搜索引擎、查询在线数据库,其中搜索引擎是我们习惯采用的。

1.常用的搜索引擎有如下几种: 百度、Google(谷歌)、搜狐、新浪、网易、雅虎。

2.常用搜索引擎的使用技巧:

(1)简单查询:在搜索引擎中输入关键词,然后点击“搜索”就行了,使用方便,但是查询的结果却不准确,可能包含着许多无用的信息。

(2)使用双引号(“?”):给要查询的关键词加上双引号(半角的),可以实现精确的查询。

(3)使用加号(+):在关键词的前面使用加号,同时满足两个以上条件的。

(4)使用减号(-):在关键词的前面使用减号,也就意味着在查询结果中不能出现该关键词。

(5)使用通配符(* 和?):通配符包括星号(*)和问号(?),前者表示匹配的数量不受限制,后者匹配的字符数要受到限制,主要用在英文搜索引擎中。

下面我们来搜索一下“神七”或“神舟七号”(演示:打开浏览器—地址栏输入百度网址—在搜索栏输入关键字—点百度一下),涉及神七的各种信息立刻出现在眼前,点击查询的条目就可以了解具体信息了。这就是查询网络信息最简单的步骤,自己体验一下吧。

(学生按照操作步骤专注操作)

(教师到学生身边边看边适时给予指导,有的学生网址输入错误打不开搜索网页)生:老师我学会了,可是这样搜索出来的信息太多了,怎么找到你播放的这个动画呢?

师:嗯,关键词很重要,通常搜索信息的时候可能有一个或多个限制条件,条件越多查找到的信息就越精确,利用刚才介绍的搜索技巧加入“动画”或者“全过程”,再来试一试。

学生很快就找到刚才播放的《神七飞天全程模拟动画》视频了,个个欣喜若狂。

师:请大家思考一下:怎样利用最短的时间获取到最准确、最有用的信息呢?

事实上是要掌握搜索策略和技巧的。(1)首先确定提供相关信息的来源。(2)检查信息来源所提供的信息量是否合适。

(3)研究信息来源所提供的搜索命令、搜索方法,确定搜索任务。

(4)准确运用关键词,结合搜索引擎的使用技巧,缩小搜索范围,提高搜索效率。

(5)不要局限于一个搜索引擎,如遇到困难,可求助于搜索引擎的帮助系统。

(三)认识中感悟,实践中提高

师:大家打开百度和Google 的搜索页面,观察并熟悉它们各自的用法与功能及各自的帮助系统。

选取原则是哪种搜索引擎好用就用哪种。下面结合搜索技巧以小组为单位搜索以下信息,完成任务的可以做其他组的任务或搜索自己感兴趣的信息。

1.A 组搜索2008 年奥运会的图片、歌曲“北京欢迎你”(mp3 格式)。

2.B 组搜索“神七”的视频、“5.12 地震”的新闻。3.C 组搜索Office 2000 软件下载网页。4.D 组搜索迁安的地图、李晓鹏的教育博客。

(任务设置意图:通过不同任务的设置,让学生亲身感受一下百度和Google 的所具有的特点,满足学生的好奇心与求知欲,注意了知识的拓展。)

七、小结与反思

上一篇:静听秋声散文下一篇:某酒业有限公司税收筹划分析