数据库信息检索

2024-05-08

数据库信息检索(共8篇)

篇1:数据库信息检索

数据库信息检索上机说明

实习目的:

1.请先熟悉图书馆主页,了解信息资源以及提供的服务内容。

2.完成实习报告。

实习报告说明如下(按题号顺序说明)

一 中外文图书的检索与使用

1.通过校园网可以访问到哪几种电子图书数据库?中文、英文各列出三个。

略,了解其他数据库资源可从图书馆主页“资源检索”下的“电子资源/数据库”看到各数据库的概要说明。

2.请自行设计检索课题在超星数字图书馆中进行检索,注意检索课题与检索结果之间的相关性,完成以下内容。

检索课题:即要查找的内容,如查找某位作者的图书或查找某一主题方面的图书等。检索字段:即检索途径或检索入口、检索项等,各数据库中说法不一。就是你选择从“作者”途径、“书名”途径、还是其他途径进行检索。

二 中外文期刊的检索与使用

1.通过校园网可以访问到哪几种期刊全文数据库?中文、英文各列出三个。

可从图书馆主页“资源检索”下的“电子资源/数据库”看到各数据库的概要说明

2.请自行设计课题并分别在指定数据库中进行检索,完成以下内容。在检索结果中选相关度最高的一篇文章并参照以下格式著录: 检索过程:包括检索方式、检索字段、检索词、检索式等,建议进行多字段、多检索词的组合检索,组合检索可以用文字叙述,也可以用检索式表达。同时检索的限定条件也要写清楚,如时间限定、期刊范围限定等。外文数据库检索时请注意使用截词等检索技术。检索结果:严格按照报告中给出的范例格式书写。范例如下:

姚东金.金融业计算机系统的安全性.金融电子化,2000(4): P.19-23.三 请利用万方《中国学位论文全文数据库》自命课题进行检索,写明检索过程。略

四 简述布尔逻辑检索技术并与所学数据库结合说明如何使用。

布尔逻辑检索技术包括什么,分别说明其功能。并结合数据库给出具体实例说明如何使用。

五 请利用搜索引擎在互联网上查找一份本专业的文献,将检索过程与检得文献的URL列在下面。

URL:统一资源定位符(Uniform Resource Locator),如需说明用的什么搜索引擎,查找什么内容,并把过程和结果写清楚。

篇2:数据库信息检索

学 院: 专业名称:

学 号: 姓 名:

信息科学与技术学院 计算机应用技术

指导教师: 时 间:

大数据的概念、技术与挑战

【摘要】计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数据时代正式到来.数据从简单的处理对象开始转变为一种基础性资源,如何更好地管理和利用大数据已经成为普遍关注的话题.大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,数据管理方式上的变革正在酝酿和发生.对大数据的基本概念进行剖析,并对大数据的主要应用作简单对比.在此基础上,阐述大数据处理的基本框架,并就云计算技术对于大数据时代数据管理所产生的作用进行分析.最后归纳总结大数据时代所面临的新挑战.

【关键词】大数据,技术,挑战,数据分析,云计算

近年来,伴随着物联网、云计算、移动互联网等新技术的迅猛发展,数据正以前所未有的速度不断增长和积累,大数据时代已经到来,这引起了产业界 学术界 科技界和政府机构的广泛关注。

大数据的火热并不意味着对于大数据的了解深入,反而表明大数据存在过度炒作的危险.大数据的基本概念、关键技术以及对其利用上均存在很多的疑问和争议。

一、大数据的基本概念及大数据时代产生的必然

数据是云计算技术的延伸,更是社会进步和发展的必然结果,大数据时代的到来引领了未来IT技术发展的战略走向。在信息和网络技术飞速发展的今天,越来越多的企业业务及社会活动实现了数字化,特别是随着数据生成的自动化及数据生成速度的加快,数据量也随之快速增长。同时,随着存储设备、内存、处理器等电脑元件成本的稳定下降,使得之前较昂贵的大规模数据存储和处理变得十分经济,也使得大数据的存在成为可能。传感器数据也是大数据的主要来源之一。在物联网时代,成万上亿计的网络传感器嵌入在数量不断增长的智能电表、移动电话、汽车等物理设备中,不断感知、生成并传输超大规模的有关地理位置、振动、温度、湿度等新型数据。

二、大数据的特点及关键技术分析

1.大数据的特点

大数据不是一种新技术,也不是一种新产品,而是一种新现象,是近来研究的一个技术热点 大数据具有以下4个特点,即4个V:(1)数据体量(Volumes)巨大大型数据集,从TB级别,跃升到PB级别;(2)数据类别(Variety)繁多 数据来自多种数据源,数据种类和格式冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据;

(3)价值(Value)密度低 以视频为例,连续不间断监控过程中,可能有用的数据仅仅一两秒钟;

(4)处理速度(Velocity)快 包含大量在线或实时数据分析处理的需求,1秒定律。

随着互联网技术的不断发展,数据本身就是资产云计算为数据资产提供了保管访问的场所和渠道,但如何盘活数据资产,使其为国家治理企业决策乃至个人生活服务,是大数据的核心议题,也是云计算的灵魂和必然的升级方向。

2.关键技术

2.1云计算;大数据的基础平台与支撑技术

如果将各种大数据的应用比作一辆辆“汽车”,支撑起这些“汽车”运行的“高速公路”就是云计算.正是云计算技术在数据存储、管理与分析等方面的支撑,才使得大数据有用武之地.文件系统是支撑上层应用的基础。原始的数据存储在文件系统之中,但是用户习惯通过数据库系统来存取文件.因为这样会屏蔽掉底层的细节,且方便数据管理.直接采用关系模型的分布式数据库并不能适应大数据时代的数据存储。据查询是数据库最重要的应用之一,而索引则是解决数据查询问题的有效方案。而数据分析技术是最核心的业务。

2.2大数据处理工具

关系数据库在很长的时间里成为数据管理的最佳选择,但是在大数据时代,数据管理、分析等的需求多样化使得关系数据库在很多场景不再适用.而HadOop是目前最为流行的大数据处理平台.而Hadoop最先是Doug Cutting模仿GFS,MapReduce实现的一个云计算开源平台,后贡献给Apache.Hadoop已经发展成为包括文件系统(HDFS)、数据库(HBase、Cassandra)、数据处理(MapReduce)等功能模块在内的完整生态系统(Ecosystem).某种程度上可以说Hadoop已经成为

大数据处理工具事实上的标准.

三、大数据时代面临的机遇与挑战

综上所述,大数据时代的数据存在着如下几个特点:多源异构;分布广泛;动态增长;先有数据后有模式.正是这些与传统数据管理迥然不同的特点,使得大数据时代的数据管理面临着新的机遇与挑战。

(一)大数据带来的机遇

1.大数据的挖掘和应用成为核心,将从多个方面创造价值。

大数据的重心将从存储和传输,过渡到数据的挖掘和应用,这将深刻影响企业的商业模式 据麦肯锡测算,大数据的应用每年潜在可为美国医疗健康业和欧洲政府分别节省3000亿美元和1000亿欧元,利用个人位置信息潜在可创造出6000亿美元价值,因此大数据应用具有远超万亿美元的大市场。

2.大数据利用中安全更加重要,为信息安全带来发展契机。

随着移动互联网物联网等新兴IT技术逐渐步入主流,大数据使得数据价值极大提高,无处不在的数据,对信息安全提出了更高要求 同时,大数据领域出现的许多新兴技术与产品将为安全分析提供新的可能性;信息安全和云计算贯穿于大数据产业链的各个环节,云安全等关键技术将更安全地保护数据 大数据对信息安全的要求和促进将推动信息安全产业的大发展。

3.大数据时代来临,使商业智能信息安全和云计算具有更大潜力。大数据产业链按产品形态分为硬件基础软件和应用软件三大领域,商业智能信息安全和云计算主题横跨三大领域,将构成产业链中快速发展的三驾马车就国内而言,商业智能市场已步入成长期,预计未来3年复合年均增长率(CAGR)为35%,十二五期间潜在产值将超300亿元;信息安全预计未来3年CAGR有望保持35%~40%的快速增长,十二五期间潜在产值将超4000亿元;云计算刚进入

成长期,预计未来5年CAGR将超50%,2015年产业规模预计将达1万亿元。

(二)面临的挑战 1.大数据集成

数据的广泛存在性使得数据越来越多地散布于不同的数据管理系统中,为了便于进行数据分析需要进行数据的集成.数据集成看起来并不是一个新的问题,但是大数据时代的数据集成却有了新的需求,因此也面临着新的挑战.

1)广泛的异构性.传统的数据集成中也会面对数据异构的问题,但是在大数据时代这种异构性出现了新的变化,大量出现的各种数据本身是非结构化的或弱结构化的,如留言、博客、图像、视频数据等,如何将这些数据转化成一个结构化的格式是研究者面临的一项重大挑战.

2)数据质量.数据量大不一定就代表信息量或者数据价值的增大,相反很多时候意味着信息垃圾的泛滥.2.大数据分析

大数据最为严重的风险存在于数据分析层面。数据量的增大会带来规律的丧失和严重失真。传统意义上的数据分析主要针对结构化数据展开,且已经形成了一整套行之有效的分析体系.首先利用数据库来存储结构化数据,在此基础上构建数据仓库,根据需要构建数据立方体进行联机分析处理(online analytical processing,OI。AP),可以进行多个维度的下钻(drill一down)或上卷(roll—up)操作.对于从数据中提炼更深层次的知识的需求促使数据挖掘技术的产生,并发明了聚类、关联分析等一系列在实践中行之有效的方法.这一整套处理流程在处理相对较少的结构化数据时极为高效.但是随着大数据时代的到来,半结构化和非结构化数据量的迅猛增长,给传统的分析技术带来了巨大的冲击和挑战。据阿里巴巴称,虽然其各类业务产生的数据为数据分析创造了非常好的基础条件,然而却招聘不到合适的数据科学家而影响了研发进展。

3.大数据的隐私问题

隐私问题由来已久,这基本也是大家最关心的问题。计算机的出现使得越来越多的数据以数字化的形式存储在电脑中,互联网的发展则使数据更加容易产生和传播,数据隐私问题越来越严重.

大数据高度依赖数据存储与共享,必须考虑寻求更好的方法消除各种隐患与漏洞,才能有效地管控安全风险。数据的隐私保护是大数据分析和处理面临的重要问题,既是技术问题也是社会学问题。如果对私人数据使用不当,尤其是泄漏有一定关联的多组数据,将导致用户的隐私泄漏。

4.大数据能耗问题

在能源价格上涨、数据中心存储规模不断扩大的今天,高能耗已逐渐成为制约大数据快速发展的一个主要瓶颈.从小型集群到大规模数据中心都面临着降低能耗的问题,但是尚未引起足够多的重视,相关的研究成果也较少.在大数据管理系统中,能耗主要由两大部分组成:硬件能耗和软件能耗,二者之中又以硬件能耗为主.理想状态下,整个大数据管理系统的能耗应该和系统利用率成正比.但是实际情况并不像预期情况,系统利用率为0时仍然有能量消耗。

5.大数据处理与硬件的协同

硬件的快速升级换代有力地促进了大数据的发展,但是这也在一定程度上造成了大量不同架构硬件共存的局面.大数据处理必须要有舍才有得。可以通过舍弃一些不必要的性能和精确性来获取更为重要的性能和精确性。.

6.大数据管理易用性问题

从数据集成到数据分析,直到最后的数据解释,易用性应当贯穿整个大数据的流程.易用性的挑战突出体现在两个方面:首先大数据时代的数据量大,分析更复杂,得到的结果形式更加多样化.其复杂程度已经远远超出传统的关系数据库.其次大数据已经广泛渗透到人们生活的各个方面,很多行业都开始有了大数据分析的需求.

7.性能测试基准

数据库产品的成功离不开以TPC系列为代表的测试基准的产生.正是有了这些测试基准,才能够准确地衡量不同数据库产品的性能,并对其存在的问题进行改进。在过去20年里,产业基准起到了很大的作用。在制定行业的标准时,性能、持有成本和能源效率是成功的三大关键。产业界标准的基准都扮演了非常重要的作用,进一步推动了计算机产业科学的发展【33】。

四、结果和结论关系

像互联网、云计算以及物联网等技术一样,大数据时代的到来势必会再次让

信息技术领域焕然一新。大数据时代下,每个个体都是数据的产生者,企业的任何一项业务活动都可以用数据来表示,如何保证大数据的质量,如何建模、提取并利用隐藏在大数据中的信息以提升企业信息系统绩效、提升企业决策能力,成为摆在业界和学术界面前的重大难题。

总的来说,目前对于大数据的研究仍处于一个非常初步的阶段,还有很多基础性的问题有待解决.大数据的几个特征中究竟哪个最重要?面对大数据管理我们需要的是简单的技术上的演变(evo1ution)还是彻底的变革(revoIution)?不同学科的研究者之间怎样协作才能更有利于大数据问题的解决?诸如此类的问题还有许多,要解决大数据问题仍有很长的路要走。

感谢:

郭彦红老师给予的的指导和提供的课件,以及所参考的文献的所有作者。

【参考文献】

[1]孟小峰,慈祥: 大数据管理:概念、技术与挑战。计算机研究与发展[146-169,2013] [2]朱志军,闰蕾,等.大数据——大价值、大机遇、大变革[M】.电子工业出版社,2012.

篇3:专题数据库网络信息检索与评价

关键词:网络信息,检索策略,专题数据库,解放,海南

对于海南岛地理位置和在国防战略上的重要地位,王会均曾将其比喻为人的“右眼”、“右拳”,渡海解放海南岛战役是为争夺海南岛而展开的,1949年12月至1950年5月1日,中国人民解放军第43军和第40军在琼崖纵队以及当地群众的积极接应配合下,与退守海南岛的国民党军进行艰苦战役,最终打败了国民党军,解放了海南岛。这次战役的胜利创造了世界战争史上的奇迹,是解放军战士、琼崖纵队及当地群众克服千难万险的革命斗争精神的伟大胜利。今天回顾这段历史,有弘扬爱国主义精神、纪念革命烈士、鼓舞团结人民群众建设美好明天、记录历史、总结军事经验、完善军事理论等重大意义。

“渡海解放海南岛战役专题数据库”是海南师范大学图书馆几位工作人员根据读者需要创建的海南地方特色专题数据库,网址是http://210.37.2.188/libary/index.asp,收集的是与渡海解放海南岛战役有关的纪实性文献。迄今为止,与这段历史相关的文献资料经过了60年的积累,数量非常多,而且,每年五、六月份,海南各媒体都会有关于战役的新信息报道出来,海南当地有关社会实体组织、政府网站等都有大量相关信息发布。本专题数据库要做的就是收集、组织这些文献信息,对其进行二次开发,以丰富地方文献特色馆藏,便于读者快速、系统地获取这些信息。为了收集这些文献信息,本课题组成员查阅了部分纸质史料,实地寻访红色遗迹,采访党史专家及英烈家属,收集知情者的“口述历史”。在文献资料收集的过程中,作者发现与本专题密切相关的网络信息非常丰富,但分散、无序。如何从分散无序的网络信息中,找到符合本专题需要的文献资料,本文从以下几个方面进行探讨。

一、渡海解放海南岛专题数据库网络信息的特点

1. 数量庞大。

经过六十多年的积累,目前相关信息已经相当丰富,而且绝大部分已经数字化、网络化,仅仅Google图书搜索一项,就可以检索到287条密切相关书目。

2. 分布分散。

除了专题文献信息数据库之外,我们知道,在对网络信息进行检索的时候,可以使用的检索工具很多,而且利用不同检索工具检索出的数据重复性并不大,这些文献分布相当分散。

3. 排列无序。

与本专题相关的网络信息数量庞大,载体形式及文体类型多样,包括图书、视频、音频、图片、论文、新闻报道等。这些文献信息在网络上呈无序状态排列,查找起来无迹可寻,需要花费大量时间,很不方便。怎样全面、准确地将如此海量,但分散、无序的网络数据收集起来?

二、根据要收集文献的不同类别选择不同的检索工具

我们常用的检索工具有两大类,一类是搜索引擎,一类是数字图书馆或数据库。人们习惯于使用搜索引擎,虽然搜索引擎不断改进技术,但是它的发展还是落后于网络的发展,在识别和索引数字图书馆或数据库这些非文本信息方面还是无能为力。所以为了检索到更多的有效网络信息,除了搜索引擎,我们必须选择数字图书馆或数据库作为检索工具。

经过分析,本数据库文献收集的信息检索工具分为以下六大类: (1) 图书书目类。这类文献的检索工具主要用到了以下六个:海南省教育科研数字图书馆、国家图书馆、中科院联合目录、CALIS联合目录、Google图书搜索和OCLC的WorldCat (Online Computer Library Catalog,世界上最庞大的图书馆目录)。 (2) 研究论文及论著类。这类数据的检索主要用到的数据库有:读秀学术搜索引擎、超星电子图书、中国知网(CNKI)、重庆维普、开世览文(CASHL)和海南省教育科研数字图书馆六个。 (3) 视频信息类。主要用到了百度视频、优酷视频、土豆网视频、酷6网视频和56网视频。 (4) 图片信息类。使用“解放*海南”在百度图片进行检索,仅此一个数据库,就得到数量非常丰富的图片信息,其中有历史照片、纪念章、纪念碑、新闻图片和影视剧截图等。 (5) 海南各家新闻媒体等实体单位及其网站类信息。这类检索工具:包括海南广播电视台、海南日报社、海口晚报社、海南特区报社、南国都市报社、海南海南省档案馆、海南省史志办、海南省党史办、海南省博物馆、海南军事博物馆、海南省各市县史志办、海南各大报纸刊物以及电视新闻媒体等各实体单位及其网站。 (6) 外文文献类。本专题选择的外文文献数据库有CASHL(中国高校人文社会科学文献中心)数据库、海南省教科研数图外文搜索(即读秀外文数据库检索)和CADAL(大学数字图书馆国际合作计划)数据库。

三、根据网络信息的内容特点提炼恰当的检索词

检索词的选择很关键。怎样有效地提取检索词,各个专题有不同的做法,本专题认为,选择检索词首先要熟悉网络信息内容的特点,根据信息内容提炼恰当的检索词。其次,在计算机检索系统中,检索词一般有规范词、规范化的代码和自由词三种形式,“选择检索词的时候,如果所选数据库具有叙词表或主题词表应优先选用叙词或主题词作为检索依据,联机检索的检索用词一般来源于系统词表”。如果选择的检索工具没有词表可查,可以使用自由词作为检索词,注意从专业角度出发选择自由词,尽量不使用一词多义的词。本文抽取检索词的时候主要考虑到了以下几个方面: (1) “渡海”有“跨海”“横渡”等同义词,应当用逻辑或组配; (2) “海南”是一个地域的限制词,下属有十多个市县,因此相对来说海南是个上位词,下属市县如儋州、文昌等为下位词,应当用逻辑或组配; (3) 历史时期的“海南”还称为琼州,这属于同义词,应当用逻辑或组配; (4) “战役”有“作战”“战斗”“战争”等同义词,应当用逻辑或组配; (5) 本战役中,四次重要的登陆点为儋州白马井镇超头海滩、文昌赤水港、临高角、玉包港,在数据库中具有非常重要的意义,所以,这四个词也必须是检索词,和“海南”一词之间用逻辑或组配; (6) 有若干有名的历史事件和历史人物,在这次有名的战役中占有重要地位,有的成了这次战役的专有名词,这些词有“中国人民解放军第四野战军、40军、43军、邓华、赖传珠、洪学智、琼崖纵队、木帆船、伯陵防线、儋州白马井镇超头海滩、文昌赤水港、临高角、玉包港、薛岳、世界海战史”,在检索的时候应该特别关注; (7) “毛泽东”是指挥这次海战的最高指挥官,检索时应当给予特别关注。

四、根据检索结果随时调整检索式

在检索过程中,需要根据各个检索工具的资源情况,对检索工具中设定的相关字段和本数据库设计的检索词进行全程匹配,不断调整检索式,以达到满意的检索效果。“在联机检索中……通常要对检索提问式进行‘预检’,采用‘扩检’或‘缩检’等措施,优化检索提问式。”本专题采用的就是这种做法。例如,先使用“海南*渡海*战役”在读秀学术搜索中进行预检,得到的检索结果过于庞大,就将检索式调整为“海南*渡海*战役*登陆点*白马井”,加上“登陆点”和“白马井”两个检索词进行缩检,就得到了检全率和检准率都比较高的869条数据。这样,就扩大和提高了渡海解放海南岛战役纪实数据库信息收集的广度和深度。

五、检索结果分析与评价

本文针对本专题数据库的需要,仅就评价指标中比较重要的个别点进行论述,比如信息覆盖面和范围(即检全率)、信息来源、信息真实性、权威性(即检准率)和检索工具的可检索性、易用性。

1. 渡海解放海南岛战役书目的检索结果。

首先,由于本专题信息属于海南地方文献,所以海南本地的馆藏资源———海南省教育科研数字图书馆体现出了明显的优势;其次,由于Google图书搜索是在全文范围内检索,检全率明显提高了,但相对来说检准率有所下降,所以在编写检索式的时候,要加上特殊关键词“白马井”对检索结果加以限制,否则,检索到的数据就有5680条之多,要逐一对其进行筛选,挑选出密切相关数据,需要花费很大精力。

2. 研究渡海解放海南岛战役文献的检索。

首先,特别推荐读秀学术搜索引擎,由于是全文检索,检索结果检全率非常高,故此,笔者编写的检索式为“海南*渡海*战役*登陆点*白马井”,除了多加了关键词“登陆点”作为限制之外,又增加了关键词“白马井”来限制检索结果,这样,检准率也就有了一定保障,得到的869条数据均为密切相关的文献,证明该检索工具可以做到高检全率与高检准率兼备,非常不错;其次,作为电子图书检索工具,超星电子图书也是非常不错的,在超星电子图书进行检索时,编写了五个检索式分五次进行检索,在检全率很高的情况下,笔者分别添加了“登陆点”、“登陆*伯陵防线”、“登陆*琼崖纵队”、“毛泽东*韩先楚”、“邓华*叶剑英”这些关键词进行限制,也得到了较多的检索结果,在没有排重的前提下,总数据量为465条,当然,在同一检索工具中利用不同检索式检索,得到的结果预计有一部分是重复的,需要排重。

3. 视频信息检索。

首先,百度视频的检全率与检准率最高,经过检索,得到300多条密切相关信息,其中包括影视剧、新闻访谈录、新闻纪录片等。其次是56网视频,在得到的64条数据中,44条都是密切相关数据,检全率与检准率都比较高。

参考文献

[1]王会均.海南文献资料索引[M].文史哲出版社, 1987.

[2]夏淑萍, 邓珞华.计算机文献检索[M].武汉大学出版社, 2005.

篇4:数据库信息检索

关键词:数据库;信息检索;发展趋势;检索方式

中图分类号:TP391.3

计算机的诞生,直接作用于现代社会的发展,并推动了行业前进。21世纪初,由于美国数据库进行了革新,所以对数据也进行了重新的整理,美国研究人员对其数据进行系统的分析,形成比较有代表性的Lowell报告,其内容为:数据库在对数据进行整理的时候,必定会与现代网络技术产生相互影响,能够使其数据库更加全面,为人类的发展、计算机的发展带来前所未有的信息革命风暴。

1 数据库

1.1 数据库技术

作为数据库的核心,数据模型有着极其重要的存在意义,并且数据模型还是整个数据库系统的一个重要运行基础。数据库技术在发展的过程中,也经历了三个阶段,第一个阶段就是格式化数据库,第二各阶段就是关系数据库,那么最后一个阶段就是面向全体对象的数据库,这三个数据库技术发展的阶段有效的反映了其发展的过程,以及技术从简单到复杂的升级过程。伴随着现代信息技术的不断改进,例如数字图书馆技术的出现、元数据技术的开创等等。这都标志着现代数据库技术应该迈向更加成熟的发展阶段。对此,数据库技术也发生了改变,其中XML技术的出现就是最好的证明,这种模式的出现将数据库技术分为了四个阶段。在数据库技术发展的过程中,还与其他各种各样的技术进行了结合,从而衍生出更多更符合时代发展的技术,例如并行数据库系统、多媒体数据库等等。

1.2 数据库结果

1.2.1 C/S结构。具体分析数据库系统(从属于C/S结构),其将DBMS功能、应用二者之间进行有效的划分,同时利用网络节点专门进行功能的执行处理工作,这种系统被称之为数据库服务器。数据库在运行的过程中,客户机如果想要对某些问题进行搜索,就会将请求通过网络传送到数据服务器当中,数据库在接到请求后,会及时的对请求进行处理,最后将所搜索到的结构回传给客户机,在回传的过程中,所传送的只是搜索的结果,不包括整个数据。这样就可以大大的降低网络的压力,从而提高了系统的性能。C/S结构是一个开放式的系统,客户和服务器之间可以不存在联系,可以不在同一个计算机当中,同样还支持不同的数据开发,这样的开放式,可以提高其工作的效率,保证工作的质量。

1.2.2 分布式系统。由于网络通讯技术的不断发展,使得网上的信息资源共享已经不再是什么难题,在数据系统中,分布结构伴随着这样的发展,出现在人们的视野当中。这种形式的数据库系统,是将网络中的数据通过分散的方式分布于很多台的计算机当中,这些数据虽然是分散存在的,但是其在使用的过程中,还是存在着一定的联系的,并且这种联系的数据最后还会成为一个完整的集。分散式的数据系统是时代发展的产物,也是信息化发展的产物,更是网络技术发展的产物。这种信息的分布方式是现阶段最为理想的一种分布方式,这些数据在使用的过程中,每一个独立的节点都可以独立的运行,并独立的对数据进行处理,从而大大提高可靠性,减少成本,最终保证信息数据的高使用率。

2 数据库检索技术

由于信息技术的快速发展,使得整个数据库技术也在发生着变化,这种变化可以凸显在两个方面,也可以说这是该技术的两个发展方向:第一就是在管理深度上提高信息的组织能力。第二个就是在管理的广度上提高信息的组织能力。这两方面的发展方向是依据现阶段社会科技发展的要求所定的。数据在分布的过程中,呈现的是一种网络化的状态。对此,网络中众多的信息数据资源在进行利用、检索的过程中,需要拥有更好的方法完成。在实际的应用过程中,连接检索、相似检索等都已经成为了主要的信息检索方式,并且现阶段信息的检索技术也已经成为了重要的课题。

2.1 内容检索

数据库在信息检索的过程中不断的兴起了一种技术,就是基于内容的检索,其主要就是借助多媒体数据库,从中直接取出对象,并且根据对象的特征和语义进行检索,其中数据对象的特征非常多,例如:图像的形状、图像的颜色、图像的纹理、视频中出现的场景、声音、声调等等。根据大量的信息进行仔细的查找,从而检索出具有相似性的媒体数据。

2.2 聚类检索

在进行文献收索的过程中,进行自动标引后再通过聚类的方法计算相似的文献,并从中选出相似度最高的文献,最终形成文献类的检索技术,这种检索技术能够有效的提高工作效率,减少人为手工分类的劳动力。

2.3 语言检索

在检索时主要利用自然语言中的一些文字以及词语代替整个句子进行检索。伴随我国科学技术的全面覆盖,以及网络化的普遍应用,使得各类专题的数据库实用效果非常明显,从一定角度上看,互联网的应用已经是现阶段社会发展的必然趋势,因此现阶段网上数據库的检索与之前传统的数据库检索还是存在一定差异的。

其差异主要展现在以下几点:首先,就是其用户群存在着区别。对于传统专题的数据库其使用的人群范围十分的小,而且这些用户都非常的固定,这些用户对于数据都比较熟悉,但是在科技与网络不断深入的过程中,网络上的用户也不断的增加,使得很多的网络用户在使用数据库的过程中对于专题数据库并不熟悉。其次,就是现阶段的数据库检索与传统的数据库检索在方式存在区别。对于传统的数据库检索来说,都是由用户提出检索的具体要求,然后再借助专业情报人员重新进行检索,专业人员在进行具体的检索之前也需要对客户的实际要求加以考虑。与之相对比,网络用户的检索缺乏专业性,直接影响检索效果。因此,对于网络用户来说,应该不断的规范传统网络用户的语言,让用户可以使用较为规范的语言进行检索,从而提升检索的准确性。

2.4 跨语言相似的检索

近年来,我国的信息技术不断的趋于全球化,互联网中对于信息资源已经不仅仅只局限于原有的几种语言模式了,现阶段互联网语言越来越多,对于一些对外语不精通的用户而言,在进行相关的检索过程中,只能通过母语进行查询,然后再借助一些相关的翻译工具进行检索,这样就会使检索变得容易一些。在互联网的不断发展过程中,对于跨语言的相似检索是目前迫切需要的,这种检索可以在一定程度上满足信息面向全球发展的需求。

3 结束语

近年来,伴随我国社会经济的不断进步与发展,信息技术已被人们广泛的应用于生活中去,在信息化技术的不断使用过程中人们对于数据库的使用也不断的加强。数据库技术是信息技术的重要组成部分,其直接决定了检索技术的发展,数据库在信息检索中占据着重要的主导地位,其为检索技术发展提供了稳定的基础。

参考文献:

[1]张俊,高燕,于素华等.模糊逻辑在数据库信息检索中的应用研究[J].计算机科学,2013(10).

[2]花常琪.实用的私有信息检索及其应用研究[D].安徽大学,2012.

[3]沙则勋.数据库及其在信息检索中的发展趋势[J].牡丹江师范学院学报(自然科学版),2013(04).

[4]陆桑璐,周晓方,陈贵海等.空间信息检索及其数据库概化技术[J].软件学报,2012(08).

[5]缪融.基于外文数据库的交叉语言信息检索系统的探讨[J].情报杂志,2012(03).

作者简介:方鹏(1974.02-),男,湖北武汉人,教师,副教授,研究方向:数据库技术及应用、信息系统开发应用等。

作者单位:长江职业学院,武汉 430074

篇5:数据库信息检索

一、实习目的:学会利用馆藏电子期刊数据库,查找所学专业的学术论文。

二、实习内容:

《CNKI中国知网》、《维普期刊全文数据库》、《读秀知识库》、《北大法意网》

三、实习要求:

1、写出所需要检索的《课题名称》

(选题:结合其它课程的要求选择相应的题目;或按学号尾号选择对应的【参考课题】。)

2、分析课题

(根据课题要求写明检索课题的时间范围、地域范围、学科范畴、主题概念等。)

3、选择检索工具

(写明所选用的数据库名称,至少在实习内容中选择2个数据库进行课题检索。)

4、检索途径(描述整个检索过程,不得删漏。)

5、检索结果列表(将检索结果按照题录的形式列出,题录数量不得少于5条。)

6、获取原文(选取1条题录获取原文,并下载复制粘贴部分内容。)

7、当堂完成实习报告,【参考课题】:

0、市场经济下的法律体系的建设

1、对于未成年人刑事犯罪案件暂缓起诉的思考

2、网络侵权案件管辖权初探

3、合同权利的诉讼保护与诉讼时效

4、数字图书馆信息资源建设过程中知识产权研究

5、论我国刑法中的犯罪客体

6、论人身权的法律保护

7、我国房地产价格评估中介行业的法律制度建设研究

8、有关建立健全我国反垄断法的研究

篇6:中文数据库检索报告

班级:姓名:学号:

一、利用“中国期刊全文数据库”

(1)使用初级检索找出2004年以后出版的,按时间排序的,有关研究“旅游”方面的论文,统计题录条数,并摘录第5条目录。

(2)使用高级检索找标题含“计算机”,不包含“仿真”、“模拟”、“系统”的2008年的期刊论文统计题录条数,写出检索过程,并摘录第5条目录。

(3)使用专业检索找标题含“船舶”,或关键词含“机械”,单位是“浙江大学”的期刊论文统计题录条数,写出检索过程,并摘录第1条目录。

二、利用“万方数据库”的高级检索,查找出署名为冰河的作者在2003年上发表了几篇论文?请写出检索过程,并摘录第5条目录。

三、利用“中文科技期刊数据库”

(1)使用初级检索找出2008年以后出版的,有关研究“高等教育”方面的论文,统计题录条数,并摘录第5条目录。

篇7:实习一 中文数据库检索实习

1.利用SinoMed检索中国医学科学院院长、中国协和医科大学校长刘德培近10年来以第一作者发表的献(写出检索流程和检索结果)。

1: 新乡医学院图书馆 中文数据库 中国生物医学文献服务系统sinomed 2:检索入口 作者 刘德培 出版时间 2002—2011年 选择中文库 检索

3:中国生物医学文献数据库 作者检索 4:刘德培 第一作者 5:共检索有关文章22篇

2.利用中国知识资源总库检索2000年以来发表在核心期刊上有关肝癌基因治疗方面的文献(写出检索流程和检索结果)。1:新乡医学院图书馆 中国知识源总库CNKI 2:关键词 肝癌 基因治疗 从2000年—2011年 核心期刊 3:精确检索

4:结果 共194条

3.利用维普数据库检索近5年发表在《中国组织工程研究与临床康复》上除白血病以外的脑出血方面的文献(写出检索流程和检索结果)。1:中文数据库 中文科技期刊数据库-维普 2:高级检索

3:J=刊名 中国组织工程研究与临床康复 K=关键词 脑出血

不包括K=关键词 白血病

扩展检索条件 时间2006年—2011年 4:检索

5:检索20篇文献

4.利用万方数据医药信息系统医药期刊检索尼群地平治疗高血压方面的文献(写出检索流程和检索结果)。

1:中文数据库 万方医学全文库 2:跨库检索 关键词 尼群地平

关键词 高血压

点击医药期刊 3:检索

4:共找到106篇有关文献

5.利用国家知识产权局专利数据库检索“华兰生物工程股份有限公司”的专利。(写出检索流程和检索结果)。

1:百度 中华人民共和国国家知识产权局

2:高级检索

3:专利人

华兰生物工程股份有限公司

检索

篇8:数据库信息检索

国内三大期刊全文数据库:中国知网-中国期刊全文数据库、维普-中文科技期刊数据库、万方-学术期刊全文数据库, 在国内学术文献信息运用中利用率最高, 影响范围最广, 市场占有率也是最大。这三大期刊全文数据库已经成为高等院校图书馆中电子资源的重要组成部分, 也是高校师生从事教学、科研和学术研究的重要信息来源。

1.1 研究背景与意义

三大期刊全文数据库的信息检索运用, 在高校图书馆中, 也是用户运用最广, 使用率最高。以我校为例, 在每年的图书馆读者问卷调查中发现, 用户使用电子信息资源在逐年上升。截止2012年底, 我校共有35种中外文数据库, 其中这三大期刊全文数据库, 点击率最高, 运用也最多。对我校用户的统计, 以“知网”为例, 在2007年全年的下载量为798360次, 到2012年时全年下载量为1192538次, 五年的增长高于49%。统计结果显示, 用户需求增长很多。为此, 本文对这三大期刊全文数据库的信息检索, 从检索途径、检索功能、检索效果进行比较分析研究, 找出这三大期刊全文数据库的优势, 对其不足之处提出改进建议。以期为用户的信息检索选择更佳途径, 为用户利用数据库时提供有效的参考。

1.2 研究文献综述

笔者以2003年至2012年为时间段 (2012年12月31日检索) , 按“三大期刊全文数据库的信息检索”为“题名或关键词”在三大期刊全文数据库进行检索, 共检索出论文13篇, 因有重复, 实际上是9篇。又在其中的引文中检索出三篇, 共计12篇。

在这12篇文献中, 有7篇文献是对三大期刊全文数据库的比较研究, 分别从三大期刊数据库的基本情况、检索功能、检索结果和效果、用户使用评价等方面进行了比较分析研究。其中王平南等的论文《国内三大期刊全文数据库优势与特色评述》 (2008/05) , 对三大期刊全文数据库的收录内容、检索功能进行分析评价, 文中认为“《中文科技期刊全文数据库》、《中国期刊全文数据库》、《万方数据库》是我国三大权威数据库, 这三种数据库在我国高校和科研院所中发挥着十分重要的作用。”最后指出“这三大数据库学科范围涉及广阔且相互交叉, 具有许多共性, 但又各具其特色, 也同时存有诸多不足之处”[1]。还有五篇文献是对清华同方和重庆维普的两种期刊全文数据库的比较研究, 分别从两种期刊数据库的收录内容、检索方式、界面设计、检索功能、检索系统等方面进行了比较分析研究。其中李玲等的论文《我国两大中文期刊全文数据库之比较研究》 (2004/05) , 对两大期刊全文数据库的基本情况、检索功能、检索效果, 以及输出功能等方面进行了比较, 并认为“这两个数据库有许多共同之处, 但在收录范围和检索功能上各有特点和优势”[2]。

上述12篇文献, 作者主要从三大期刊数据库的基本情况、收录内容、检索功能、检索结果和效果、界面设计、用户使用评价等方面进行了详细的比较分析研究, 但唯独没有涉及到检索途径。本文主要从检索途径角度进入, 对三大期刊数据库的信息检索进行比较分析研究, 同时在已有的研究成果基础上, 继续在检索功能和检索结果上进行深入的比较分析研究, 丰富其研究成果, 使其更具有现实的指导意义。

1.3 研究目的与方法

本文将对这三大期刊全文数据库的信息检索, 从检索途径、检索功能、检索效果进行比较和分析研究, 通过对三大期刊全文数据库的信息检索进行比较分析和研究, 找出这三大期刊全文数据库的优势, 给高校各类读者的信息检索提供一些方法或一些有效的建议和帮助, 以期提高用户的信息检索效率。

研究方法采用比较研究法, 查找文献资料作为比较分析, 在网上对三大期刊全文数据库进行定量的比较研究。

2 三大期刊全文数据库概述

2.1 中国知网 (CNKI) —中国期刊全文数据库基本情况

中国知网 (http://cnki.net) 由清华大学、清华同方公司于1999年6月共同发起建设, 其中中国期刊全文数据库是目前世界上最大的连续动态更新的中国期刊全文数据库, 收录国内9800多种重要期刊, 以学术、技术、政策指导、高等科普及教育类为主, 同时收录部分基础教育、大众科普、大众文化和文艺作品类刊物, 内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域, 目前全文文献总量达3720多万篇。文献来源于中国国内9800多种综合期刊与专业特色期刊的全文。其产品分为十大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、政治军事与法律、教育与社会科学综合、电子技术与信息科学、经济与管理;十大专辑下分为168个专题和近3600个子栏目。该库收录各期刊1994年至今的全文内容, 部分刊物回溯至其创刊号。更新频率最快, CNKI中心网站是每日更新[3]。

2.2 维普 (VIP) -中文科技期刊数据库基本情况

维普 (http://www.cqvip.com) 中文科技期刊数据库源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》, 其全文和题录文摘版一一对应, 经过二十余年的推广使用和完善, 全面解决了文摘版收录量巨大但索取原文繁琐的问题。全文版的推出受到国内广泛赞誉, 同时成为国内各省市高校文献保障系统的重要组成部分。海量数据:包含了1989年至今的12000余种期刊刊载的3000余万篇文献, 并以每年180万篇的速度递增。覆盖范围:涵盖社会科学、自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的12000余种中文期刊数据资源。分类体系:按照《中国图书馆分类法》进行分类, 所有文献被分为8个专辑:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。8大专辑又细分为29个专题[4]。

2.3 万方 (WANFANG DATA) -学术期刊全文数据库基本情况

万方数据知识服务平台 (http://www.wanfangdata.com.cn) 是由北京万方数据股份有限公司1997年8月创办的。其中学术期刊全文数据库收录自1998年以来国内出版的各类期刊7千余种, 内容涵盖哲学政治、社会科学、经济财政、教科文艺、基础科学、医药卫生、农业科学和工业技术等各个学科领域。其中核心期刊2800余种, 论文总数量近两千万篇, 每年约增加200多万篇, 该库每周两次更新[5]。

从三大期刊数据库的收录内容及基本情况来看, “知网”更新频率最快, 含有新事物新课题;“维普”收录期刊最多, 内容较为丰富;“万方”收录核心期刊最多, 质量最高。三大期刊数据库各具特色, 相互补充。

3 三大期刊全文数据库在信息检索中检索途径的比较

信息检索是从大量相关信息中利用人机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程[6]。信息检索中检索途径的选择极为重要, 用户使用信息检索, 一般常用四种检索途径:“题名途径”、“责任者途径”、“主题途径”、“分类途径”。

3.1 三大期刊全文数据库中“题名途径”的现状与比较

“题名途径”是选择“篇名”或“刊名”作为检索项, 这三大期刊全文数据库中都有设置, 使用都很方便。

3.2 三大期刊全文数据库中“责任者途径”的现状与比较

“责任者途径”是按“作者”或“主编”责任者作为检索项, 这三大期刊全文数据库中也有设置, 使用也很方便。其中“维普”有“第一作者”作为检索项, 这是一大特色, 特别方便用户查找, 查准率要高。

3.3 三大期刊全文数据库中“主题途径”的现状与比较

“主题途径”是按“主题词”或“关键词”等作为检索项, 这三大期刊全文数据库中都有设置, 只是“万方”的检索项不在主页。

3.4 三大期刊全文数据库中“分类途径”的现状与比较

“分类途径”是按“各个学科分类”作为检索项, 这三大期刊全文数据库中都在“期刊导航”中有设置, 打开“期刊导航”按所需学科进行查找。

总之, “题名途径”、“责任者途径”、“主题途径”、“分类途径”这四种检索途径, 三大期刊全文数据库中都有设置, “知网”、“维普”的主页在“检索项”都有下拉菜单提示, 相对一目了然, 用户使用很方便。“万方”的主页没有下拉菜单提示, 初次使用的用户可能不太清楚, 不便使用。

4 三大期刊全文数据库在信息检索中检索功能的比较

在使用全文数据库信息检索中, 检索途径要选择好, 同时还要全文数据库检索功能的支持, 才能快速实现信息检索, 找到所需的信息。检索功能主要表现在三个方面:“检索方式”、“检索导航”、“检索结果”。

4.1 三大期刊全文数据库中“检索方式”的比较

由表1中可以看出, 在三大期刊全文数据库中, “知网”的检索方式最多, 一共有七种。前三种是根据用户对检索技能的掌握程度, 以及检索需求的复杂程度由低到高给出的检索方式, 即基本检索、高级检索、专业检索。后四种是根据用户的检索需求给出的明确检索对象的检索方式, 即作者发文检索、科研基金检索、句子检索、来源期刊检索。“维普”和“万方”根据用户使用数据库的习惯, 以及对检索技能的掌握程度的检索需求的复杂程度分别提供了四种检索方式。从中比较, 在检索方式的分类上, “知网”更胜一筹[7]。

注:数据来源于参考文献[3]—[5]2013年1月30日的相关网页。

4.2 三大期刊全文数据库中“检索导航”的比较

三大期刊全文数据库都提供了学科导航和期刊导航, 这就便于用户根据自己需求按学科或期刊的内容分类检索文献。

由表1中显示, 从学科导航来看“知网”的分类较细, “维普”和“万方”的相似。从期刊导航来看, “知网”的期刊导航类型较多, “维普”的期刊收录量最多, “万方”的期刊检索项较丰富, 所收录的核心也期刊最多;三大期刊都有“首字母导航”和“核心期刊导航”。

4.3 三大期刊全文数据库中“检索结果”的比较

从三大期刊全文数据库的“检索结果”表现比较, 如表1所示:对论文检索结果显示, “知网”的显示内容要丰富, 有14种, “维普”和“万方”显示内容相对少些, 各有10种;对期刊检索结果显示, 三大期刊比较相近。

5 三大期刊全文数据库在信息检索中的检索效果的比较

使用三大期刊全文数据库最重要的是, 要看三大期刊全文数据库的检索效果如何, 这里进行比较。

5.1 从“检索途径”看三大期刊全文数据库检索效果

从“检索途径”看三大期刊全文数据库检索效果, “知网”和“维普”提供的“检索途径”比较丰富, 能够满足各种检索需求。“万方”提供的检索途径比较少, 没有第一作者的限定, 对于检索某位作者的文献来说有些不便之处[8]。

5.2 从“检索功能”看三大期刊全文数据库检索效果

从“检索功能”看三大期刊全文数据库检索效果, “知网”对于“检索功能”的构建比较细致, 几乎从各个方面对文献建立了检索入口, “维普”的检索入口也比较丰富, “万方”是进入“检索导航”检索方式才更加灵活和智能, 检索的文献也较准确。

5.3 从“检索结果”看三大期刊全文数据库检索效果

在三大期刊全文数据库, 按相同的“检索途径”进行检索, 看所得结果数量进行比较分析, 如表2所示。

根据表2中的统计数据 (2013年2月20日统计) , 可以看出三大期刊全文数据库所收录的各有特点, 其中按“篇名”检索, 维普收录量的最多, “万方”次之, “知网”相对少些。按“作者”检索, 管兆勇教授是从事气象学研究, 所著论文是科技方向, “万方”收录的最多, “知网”和“维普”收录的较少。按“关键词”检索计算机, “维普”收录的最多, “知网”和“万方”收录的少些。按“分类”检索高等教育理论, “知网”收录的最多, “万方”次之, “维普”要少些。从这个对比中可以看出, 三大期刊全文数据库中综合性最强的是“知网”, 收录科技信息文献多的是“维普”和“万方”[9]。

总的来看, 三大期刊全文数据库的检索效果, “知网”的“检索途径”和“检索功能”要相对完善, 使用方便;但是“查准率”低。“维普”的“检索途径”和“检索功能”相对也完善, 但是“文档的清晰度”不够。“万方”的“检索途径”和“检索功能”不太方便使用, 但是“文档的清晰度”好、“查准率”也高。

6 对三大期刊全文数据库提出改进建议

通过对三大期刊全文数据库的“检索途径”、“检索功能”、“检索效果”进行比较分析与研究, 提出一些改进建议。

6.1 对中国知网-中国期刊全文数据库的建议

中国知网-中国期刊全文数据库, 应加强智能检索, 提高查准率, 以节省用户时间。如:可考虑增加同义词库和同名作者库智能选词功能, 以便提高系统的查全率和查准率[10]。

6.2 对维普—中文科技期刊数据库的建议

维普—中文科技期刊数据库“检索速度”再快些, 提高查阅率;页面清晰度再亮些, 给人视觉观感要好些。

6.3 对万方—学术期刊数据库的建议

万方—学术期刊全文数据库“检索功能”要细化些, 在主页检索入口设置下拉菜单选项, 方便初学用户使用;由于该库收录的核心期刊多, 设置“第一作者”, 能更加方便用户查找, 质量高的学术论文。

7 结语

通过对国内三大期刊全文数据库的信息检索从检索途径、检索功能、检索效果进行比较研究, 分析了其中的优劣, 提出了改进建议以期提高信息检索的查全率和查准率。三大期刊全文数据库各具特色, 用户在选择时, 应明确自己需求, 合理使用。

给高校读者用户的使用建议是, 低年级同学刚开始使用电子资源, 建议使用“中国知网”, 在检索中有联想功能, 有利于查找电子文献;或使用“维普”, 有“第一作者”为检索项, 也方便查找。高年级和研究生读者及教师已经能经常使用电子资源, 可以根据自身需求选择相对应的三大期刊全文数据库, 针对性地来查找文献, 以提高检索文献的准确性。

参考文献

[1]王平南, 吴娅娜.国内三大期刊全文数据库优势与特色评述[J].图书馆, 2008 (5) :88.

[2]李玲, 杨桂珍.我国两大中文期刊全文数据库之比较研究[J].现代情报, 2004 (5) :2.

[3]http://lib.nuist.edu.cn/cnki.asp

[4]http://lib.nuist.edu.cn/zwkjqksjk.asp

[5]http://www.wanfangdata.com.cn/学术期刊

[6]叶继元.信息检索导论 (第二版) [M].北京:电子工业出版社, 2009:13.

[7]贾文静.中文期刊全文数据库检索功能比较研究[J].情报探索, 2012 (4) :70.

[8]谭捷, 张李义, 饶丽君.中文学术期刊数据库的比较研究[J].图书情报知识, 2010 (4) :12.

[9]彭俊.三大中文期刊全文数据库的比较研究[J].中国索引, 2005 (2) :13.

上一篇:关于古诗词参考素材下一篇:我又想起了那位陌生人作文