检索体系

2024-05-01

检索体系(精选六篇)

检索体系 篇1

1 建立档案检索工具的要求

建立档案检索工具要符合全面性、系统性、实用性和稳定性的要求。全面向那个是指检索工具要能覆盖整个室藏档案资料的结构体系, 包括室藏的不同门类、内容、载体形态的档案资料。系统性是指检索工具要各有侧重, 相互补充, 从整个室藏概况到每一个全宗、案卷、文件都有相应的检索工具, 并且不交叉、不重复, 无遗漏。实用性是指各种检索工具都方便查阅利用, 简便实用, 查准查全率高。稳定性是指各种检索工具有长远的应用价值。

2 全宗介绍

全宗介绍是是用文字叙述的形式, 揭示一个全宗档案的主要内容、成分、价值、意义的检索工具。全宗介绍的内容很多, 概括起来主要包括立档单位概况、全宗构成情况和档案的内容介绍3部分。全宗介绍可以帮助利用者全面了解一个全宗档案的基本情况。

全宗介绍的作用主要有:一是可以帮助利用者了解立档单位的基本情况, 包括立档单位机构设置、人员配置、主要工作职能等;二是了解全宗构成的基本情况, 包括全宗档案的数量、排架长度、起止年限、主要作者、破损程度和整理编目情况等;三是可以了解全宗档案的主要内容、成分、价值、意义等, 为查阅具体档案原件打下基础。

全宗介绍起到向利用者宣传介绍室藏档案资料的作用, 还不能利用全宗介绍调阅具体的档案资料原件, 还必须利用案卷目录、卷内目录、著录卡片等具体的检索工具。

3 案卷目录

案卷目录是揭示卷内文件外表特征和内容特征的检索工具。案卷目录的具体作用为:首先, 帮助利用者了解某一案卷的基本构成情况, 包括档号、立档单位名称、卷内文件主要作者、起止年限、保管期限、密级、卷内文件页数等;其次, 可以了解卷内文件的主要内容和成分, 包括卷内文件反映的主要问题和主要的公文种类等;三是可以通过案卷目录直接调阅具体的案卷。与档案馆指南和全宗介绍不同, 案卷目录真正起到检索工具的作用。

案卷目录一般比较简练、概括和抽象, 反映卷内文件内容不够详细具体, 无法直接查阅某一具体文件。此时, 还必须依靠卷内目录。

4 卷内目录

卷内目录是具体揭示文件主要标识特征的检索工具, 主要包括顺序号、文件编号、作者、标题、起止日期、文件页数、备注等项目。卷内目录可以帮助利用者了解文件的主要标识特征, 直接查找所需要的文件。

卷内目录的作用:根据卷内目录的文件编号、作者、标题等线索, 直接找出所需要的文件资料。将卷内目录的文件编号、作者、标题重新组合成文号、作者、专题目录, 提供不同的检索利用渠道。卷内目录还可以扩大组合成全引目录, 方便和扩大了档案资料的查阅利用范围。

卷内目录可以直接查阅某一具体文件, 但无法打破案卷、全宗的限制, 按类别、专题等查阅大量的档案资料。全引目录一定程度弥补了这一弱点, 但全引目录数量大, 内容庞杂, 管理和查阅利用都比较麻烦, 查准查全率并不高。但是, 目前基层单位档案室尚无条件配备电脑或购买当案检索软件。所以, 基层单位必须编制打破案卷、全宗乃至档案室界限, 查准查全率比较高的著录卡片。

5 著录卡片

著录是对文件的外表特征和内容特征进行逐一分析、选择、记录并编制成卡片的过程。著录卡片主要包括分类号、档号、档案室代号、微缩号、题名、文件编号、责任者、文本、密级、保管期限、文件形成时间、数量及单位、丛编、附注、主题词、提要等项目, 是标引项目最多的一种检索工具。

由于著录卡片的标引项目多、内容广、信息量大, 为利用者提供了多种检索利用线索和渠道, 查阅利用方便, 查准查全率高。著录卡片还可以根据分类号、责任者、主题词等项目, 分别组合成分类、人名、专题卡片。一种著录卡片就代替了各种形式的卡片, 避免了大量的分散、交叉、重复劳动。如果将著录卡片录入到计算机, 检索效率或得到大幅度提高。即使没有电子微缩设备和人员, 著录卡片也可以用来作为手工检索工具。

当然, 著录卡片的编制过程技术性强、难度高、工作量大, 要花费大量的人力、物力和财力, 而且著录标引的项目如分类号、主题词等伸缩性大, 准确性有的较小, 规范标准不统一。

检索体系 篇2

当前,基于知识组织系统的文献检索方式主要是从文献关键词的语义角度出发,通过基于分类表和叙词表及知识本体的文献检索、基于文献关键词的标引和分词检索、基于关键词的语义检索以及叙词表重构式检索等检索方式,以自动化标引为检索手段,实现的文献检索服务。其中,借助叙词表中的概念语义关系扩展与精化的用户检索式,是各种网络信息检索工具提高其检索性能的常用方法。

此类文献检索服务以查阅、概念检索、词汇归纳等文本内容为核心,主要体现在文献信息的关键词语义扩展检索和文献信息的大众分类法的检索两种模式上。基于文献信息的关键词语义扩展检索模式,主要通过分析文献信息的关键词自身概念与语义概念间的关联性,并对文献信息关键词自身的词性进行标注,突出文献信息关键词的核心概念与语义,再借助关键词自身概念与语义概念的关联,实现基于关键词本体的文献信息语义检索。语义检索能处理信息的语义内容,实现基于语义的匹配和推理。该检索方式突出了文献信息中核心概念与文献信息关键词语义的串联,并将文献信息的核心价值通过文献的关键词标引进行充分的体现,使得检索结果与文献信息需求的关联度大幅增加,减少了用户需要筛选的检索结果数量,提升了检索的速率,提高了检索结果的准确度。而基于大众分类法的文献检索与传统分类法相比,更加注重检索者的检索习惯,通过依照知识组织分类法处理各项文献和检索用户自定义的自由词作为数字资源标注整理,实现检索与浏览的功能,使得检索过程更加便捷有效。

现阶段,对独立创建的知识组织系统的映射和服务协议是实现知识组织系统互操作的主要方式。当前,基于知识组织系统的文献检索研究主要是通过将关键词语义和文献分类法与文献的关联为基础,实现类似将分类主题词表和元数据集成在一起构造一个知识网络并在其上实施知识浏览和概念检索。这种检索模式在一定程度上提高了文献检索的便捷性和全面性。

浅淡如何建立和完善档案检索体系 篇3

一、什么是档案检索

所谓档案检索, 就是利用档案检索工具, 对所需的档案进行查找的过程。通过档案检索, 利用者可以了解档案的有关线索 (如档案的主要内容、时间、责任者、准确题名、档案号、载体形态等) , 以决定是否调档或调用档案提供条件。档案检索的任务, 是为了档案利用者理念快速、更准确、完整地找到自己所需要的档案信息或档案实体。

二、进行档案检索的必要条件

1. 要有用于检索的档案检索工具。

档案检索工具是由经过选择和压缩的档案信息编制而成的, 利用者可以借助档案检索工具, 了解馆、室藏档案的内容和特点, 并依据检索工具提供的线索调阅档案。

2. 有明确的检索对象。

检索对象是否明确是决定检索工作能否顺利进行的关键, 尤其是档案利用者委托档案人员进行的检索中, 利用者必须将自己所需要明确告诉档案人员, 否则检索工作将无法进行。

三、档案检索工具

档案检索工具既是存储、查找、报道档案信息手段, 也是档案管理与开发利用的重要工具。档案检索工作是用于存储、查找和报道档案信息的系统化文字描述工具, 是目录、索引、指南等的统称。

1. 档案检索工具的基本职能包括存贮和检索两种。

存贮的过程, 就是编制档案检索工具的过程, 它使档案信息由分散至集中, 由零乱到系列化。检索的职能, 可以按照一定的检索方法, 从存贮的线索中找到要查找档案的存址标识, 然后取出所要查找的档案。存贮是检索的基础和前提, 检索是存贮的应用和反馈。没有存贮, 就无法检索, 没有检索, 存贮也就失去了意义。

2. 按照不同的划分标准, 检索工具的种类和形式:

按编制方法划分, 可分为目录、索引、指南三大类;按检索手段划分, 可分为手检工具与机检工具两大类;按使用对象分, 可分为公务性和开放性的检索工具;按检索功能划分, 可分为查找性与报道性两种;按检索范围划分, 可分为全宗 (或其部分) 目录或专题目录等等。按其档案检索工具的载体形态分, 可分为卡片式检索工具、簿册式检索工具、计算机机检索系统。

四、档案检索体系的建设

档案检索体系, 是指从不同角度揭示馆、室藏, 为满足利用者的需要而建立起来的各种检索工具的体系。它是由一个各司其职, 又相互补充的若干检索工具组成的具有一定效率的检索工具整体。建立合理、实用的档案检索体系, 是做好档案利用和服务工作的重要基础。

1. 检索体系的必备条件:

必须由两种以上的不同的检索工具组成, 各种检索工具之间有明确分工又互为补充, 能从不同角度去揭示馆、室藏档案的内容和外形特征, 可提供较多的查找线索, 具有一定检索效率。

2. 建立档案体系的要求:

档案检索体系必须是一个有效的系统, 同时要使手检与机检衔接起来。所以, 要掌握好建立档案检索体系的条件性、实用性和专一性要求。

首先, 建立档案检索体系, 必须依据一定的条件, 一切从实际出发。档案馆、室应经类型、规模、任务、收藏档案的特点、利用对象和利用需要为依据, 以人力、物力为条件, 建立适合本馆、室情况的实用的检索体系。一般来说, 规模较大、馆藏丰富、门类繁多的档案馆、室, 检索工具也相应较多, 而规模小、档案数量少的档案馆、室, 检索工具也相应较少。

其次, 建立档案检索体系, 必须以效率为先, 讲求方便实用。档案检索体系应是一个多种形式、多种层次、多种结构、相互间既有明确分工又有紧密联系的有机整体, 必须注重实用性。同时, 还要注意手检与机检的衔接, 在著录时, 应按照《档案著录规则》的规定进行。

最后, 建立档案检索体系, 要防止检索工具之间的重复和平行, 保持每一检索工具的专一性。为此, 应确立以分类目录为主导的档案检索体系, 同时正确处理好开放目录与公务目录、分类目录与其它目录以及不同形式检索工具之间的关系, 消除检索工具之间的平行和重复, 使每一种检索工具都有其独特的检索功能。

参考文献

[1]桑毓域.档案与文件和历史联系与历史检索[J].中国档案, 2004.5.

[2]吴亚平, 沈晓雪.基于个性化的档案检索方式研究[J].兰台世界, 2013.7.

文献检索检索策略 篇4

(2)正确选择各种算符,如逻辑算符,位置算符,截词符,字段限定符等,编制合理的计算机检索式。

(3)分析学科范畴,以便确定所要检索的学科领域,提高查全率。

(4)确定检索年代、文献类型

(5)选择检索方法(常用法、追溯法和循环法)

常用法:顺查法(顺着时间的推移由远及近的查找)

倒查法(由近及远的往前追溯查找)

抽查法(根据学科发展的时代背景,发展的高峰期查找)

追溯法:参考文献法(根据所附参考文献的出处追溯检索)

科学引文法(通过被引用作者查找引用作者的文献)

(6)确定检索的信息源(包括中外文数据库和网络资源等)

检索体系 篇5

1 个性化的内容体系

信息素质教育是目前高等教育关注的焦点。作为信息素质教育的核心课程, 《医学信息检索与利用》的教学也一直受到学校重视, 被列为全校各专业、层次的必修课程。但因为不同专业密切相关的数据库各不相同, 且不同层次的学生对信息检索与利用的要求也不同, 所以, 我们对《医学信息检索与利用》教学内容也做了相应的调整, 根据授课对象的不同, 构建个性化的课程内容体系, 以这种个性化的内容, 达到因材施教的目标。具体作法是在基本理论学习的基础上, 针对不同专业, 选择不同的信息资源;针对本科学员, 偏重中文信息资源, 而对于七年制、八年制以及研究生学员, 强调外文信息资源的学习。

2 模拟科研的施教方式

《医学信息检索与利用》是一门实践很强的课程。因此为了进一步提高学员的动手能力, 提出了模拟科研的实验施教方式。

2.1 课堂案例教学

在课堂教学中, 充分利用本馆查新站积累的大量的各个专业领域的科研立题、申报成果、研究生课题查新等方面的案例, 在征求查新委托人同意和不违背保密原则的前提下, 针对不同专业的学员选择不同的案例, 例如对于临床医学专业 (肝胆外科学) 的学员, 选取吴孟超院士科研立项的查新案例;对于基础医学 (免疫学) 专业的学员, 则选取曹雪涛院士科研立项的查新案例。通过对上述案例的讲解, 让学员充分接触信息检索技巧的运用, 将信息检索的技能和信息意识融入到日常学习和科研中去[1]。这种针对不同的学科专业讲授不同的案例材料的授课方式, 能够帮助学员建立学习兴趣, 加深各专业学员对信息检索理论的理解, 使学员深入了解所学专业学科带头人的科研思维, 灵活地展现了信息检索课在科研中的实际应用。

2.2 上机实习环节的模拟科研

在信息检索课的教学安排中, 检索实习是一个非常重要的环节, 是对检索知识灵活运用的一个实践[2]。我们采取以学员为中心, 以需求为导向, 进行“模拟科研”的实习教学。首先, 对学员分组, 一般是5-7人一个组。其次, 检索实习课题由学员或与专业导师共同拟订, 检索课题可以是与所学专业相关的课题, 也可以是学员感兴趣的课题, 也可以是与时事相关的课题, 如有学员选择苏丹红对人体的危害、三聚氰胺对人体的毒性等相关方面的课题。学员综合利用各类检索工具进行课题检索, 教师给予必要的引导, 形成一个包括课题内容简介、检索策略和检索结论的检索实习报告。最后, 由小组推选一名同学为代表以“检索实习报告会”进行答辩, 由教学组相关教师做评委, 从检索和内容两个方面进行评价。整个过程中, 学员能够主动结合信息检索理论, 自主完成模拟科研的过程, 让信息检索的结果直接反映在科研过程中, 掌握未来科研工作中信息检索与利用的基本方法。

3 全方位的科研思维培养模式

在医学信息检索教学实践中, 通过对医药卫生科技查新与信息检索课相结合的方式, 通过讲解相关专业的查新实例, 强化学员的信息检索技巧以及信息分析能力, 全方位地培养学员的科研信息意识。

3.1 提高学员对课题的分析能力

通过医药卫生科技查新与信息检索课相结合的方式, 在结合相关专业的查新实例分析其在数据库中的检索过程, 让学员体验对一个课题如何去分析以解决学员想找资料而无从下手的问题。通过对查新实例的讲解、实习, 不断增强学员对课题的分析能力。通过分析课题, 能准确找出主题词, 并能编制合理的检索策略, 在检索过程中根据具体的数据库灵活地调整策略以获取有效的文献[3]。通过课堂中查新案例的讲解, 尤其是对不同专业领域进行有针对性地查新案例的讲解, 一方面加深了学员对所学专业领域知识的了解, 从信息检索的角度了解所学专业的发展深度和广度;另一方面引导学员将信息检索的知识应用于科研中, 使学员感觉自己与科研又近了一步, 有利于提升对本专业的认识度, 使其更加热爱本专业。

3.2 提高学员对文献信息的分析能力

如何对所检索到的文献资料进行有效分析, 如何从所检文献中挖掘出有价值的信息, 将是信息检索遇到的一大难题。医药卫生科技查新人员具备一定的情报分析能力, 可以结合查新项目查新点对国内外相关文献进行逐篇分析和综合对比分析, 对查新项目的新颖性、先进性或知识产权状况等进行评价, 使医药卫生查新工作有利于培养学员的文献信息分析能力, 为学员将来在所检索文献中挖掘有效信息打下良好基础[4]。

4 综合性的考核方式

在课程考核上, 强调全方位考核学员的知识、能力和素质。课程考核分为两大部分, 一是理论考试, 由试题库自动出题, 考查学员的基本理论掌握情况。二是答辩及实习报告考核, 学员以课题小组形式, 根据自选或指定的科研课题, 通过综合利用各种信息检索工具、方法, 获取反映该项目的科研进展及水平的文献信息, 最终完成一份反映课题研究情况的检索实习报告, 并采取口头报告、现场答辩的方式, 考查学员检索能力和综合素质。通过这种综合化的考核方式, 真正做到客观公正的评价学员能力和学习成果。

摘要:对医学信息检索与利用课程内容进行了重新整合与设计, 改革施教方式与考核方式, 着重培养学员的科研信息意识, 理论结合实践, 强化学生对信息检索原理、常用信息源使用方法与技巧, 以及医学信息的评价与利用等基础知识和基本技能的掌握。

关键词:信息检索,课程体系,教学

参考文献

[1]曲保丽.医学查新教育的案例教学[J].医学信息学杂志, 2006, 27 (3) :239-240.

[2]沙振江.高校文献检索课激励型教学模式探析[J].图书情报工作, 2007, 51 (12) :99-102, 149.

[3]回雁雁.“信息检索与利用”课进行实践教学改革的探索[J].图书馆理论与实践, 2008, (3) :128-130.

全文检索模型的检索性能研究 篇6

全文检索系统包括如何建立和维护全文索引以及在此基础上如何实现快速有效的检索[4,5]两个方面。因此,对全文检索模型的检索性能研究就是一项基础而重要的工作。

本文首先对几种常见的检索模型进行定性的分析,然后给出模型的关键实现,接着对检索模型的检索性能进行实验验证,最后给出全文的总结。

1 关于检索模型

目前常用的全文检索模型有单索引检索模型、单索引+数据库检索模型、分布式检索模型。其中分布式检索系统,如Google等大型通用搜索引擎,其基本思想是将海量的数据进行分散存储,通过多机集群的处理能力,集中解决协同索引和检索的问题。但其实现技术难度大,由分布式并行处理所带来的性能几乎为解决索引与检索同步问题所抵消[6],因此本文不对该模型进行更多的研究,重点对前两种模型进行分析研究。

1.1 单索引检索模型

如图1所示的单索引检索模型中,系统只建立一个全文索引库,在创建索引的同时保存被索引信息。该模型的优点是,在进行全文检索时,相关信息直接从索引库中获得,与数据库库无关,可省去数据库的查询时间。其缺点是,索引库相当庞大,会比只对索引域建索引大2倍以上,造成数据大量冗余,增加系统存储压力,同时也降低该模型的检索速度;另外,索引总是滞后于数据库中的信息变化,造成检索信息的“失真”现象。

1.2 单索引+数据库检索模型

单索引+数据库的检索模型如图2所示。创建全文索引时,只建索引,不保存被索引信息。检索过程为:先进行全文检索,再根据全文检索结果(记录ID)反查数据库,在数据库中根据相应条件过滤数据。此模型的好处是:索引库较小,减少了数据冗余,减轻了系统存储压力,全文检索的速度有所提高。其不足之处是:增加了一次数据库查询的时间开销,整体查询速度方面并未改善;索引依然滞后于数据库中的信息变化,影响系统的查准率、召回率。

2 检索模型关键实现

全文索引库是检索模型的核心,索引库的性能决定了检索模型的性能,图3全文索引库的实现流程图。

3 检索模型性能实验与分析

前面已经对各个模型做了定性的分析,为了通过实验来测试单索引模型和单索引+数据库模型的检索性能,首先实现了一个简单的检索系统。实验基本环境:单台PC机,Pentium(R)4 2.80GHz的CPU,1.5GB内存,7200转速80GB硬盘;操作系统为windows XP 2002专业版,Tomcat6.0的应用服务器,IE7.0的浏览器,使用开源数据库管理系统MySQL5.0;在测试库中导入1000条图书记录,记录包含编号、标题、摘要、内容等多个字段,图书内容长度800—5000个汉字不等,摘要长度最大200个汉字,标题最长50个汉字。测试结果如表1所示。

从表1实验数据来分析:1)从时间上看,单索引模型整体优于单索引+数据库模型,但从平均响应时间来对比,单索引模型优势并不明显,110ms左右的最大时间差不会明显影响系统检索性能;2)从索引库大小来看,单索引却处于明显劣势,随着记录的增加,会给系统带来很大的存储压力,同时索引的维护代价必然远远超出后者;3)单索引模型中,两种检索策略的使用,带来40ms左右的平均检索性能差异;4)单索引+数据库模型中,使用不同检索策略,也产生40ms左右的平均检索性能的差异。

综上所述,采用的检索模型与检索策略的不同,系统检索性能会有一定差异,为具体项目选择检索模型与策略提供了一定的实验依据,同时也为改进系统检索性能,提供了一些思路,如对检索策略、首次检索速度及索引本身进行改进。

4 结束语

本文对多种全文检索模型进行了分析与研究,实现了具体的检索系统原型,通过实验对不同检索模型的检索性能进行了验证,为今后检索模型的选择及检索性能的改进与优化提供了实验依据及思路。

摘要:对比研究了多种全文检索模型,实现了相应的系统原型,并通过实验对模型的检索性能进行了验证,为检索模型的选择与检索性能优化提供参考。

关键词:全文检索,检索模型,检索性能

参考文献

[1]王珊,文继荣.数据库与信息检索技术的融合[J].中国计算机协会通讯,2006,2(4).

[2]罗良道.高校图书馆Web站点站内搜索引擎的调研与建设[J].情报科学,2002,20(9):946-948.

[3]龙怡,刘俊熙,等.我国省级政府门户网站搜索引擎现状调研报告[J].现代情报,2008,1:212-215.

[4]徐小刚,王俊杰,等.全文索引的研究[J].计算机工程,2002,28(2):101-103.

[5]郎小伟,王申康.基于Lucene的全文检索系统研究与开发[J].计算机工程,2006,32(2):94-96.

上一篇:舌尖上的厨房下一篇:ISO22000