信息检索相关论文

2022-05-11

本文一共涵盖3篇精选的论文范文,关于《信息检索相关论文(精选3篇)》,供大家参考借鉴,希望可以帮助到有需要的朋友。摘要论文选取CNKI期刊收录的近15年我国图书情报领域信息检索相关性研究的论文,基于文献计量学对收集的数据进行了量化分析,并运用CiteSpace软件和Ucinet软件绘制了科学知识图谱。同时,论文分别从发文时间、作者、机构和研究热点(关键词)四个方面对该领域研究进展进行了详细分析和总结,进一步介绍了其知识结构与发展趋势,并为今后该领域研究提出了建议。

第一篇:信息检索相关论文

档案信息检索技术探析

摘要:信息技术为人们的生活带来了巨大的改变,随着社会信息化程度的加深,各个行业、各个领域逐渐涉及到信息技术,逐渐开始重视对信息的处理与审视。信息管理与审视的主要手段是利用信息管理系统进行操作,目前在社会各个领域中备受关注。其中尤其档案信息管理是目前比较常用的信息管理系统,而且档案信息管理技术对于机关、企业等领域来说非常重要,有着独特的属性,如何提高档案信息管理的效率,笔者认为要从档案信息检索技术入手,提高档案信息检索技术的有效性将会是档案信息管理工作现阶段以及未来必须重视的课题。

关键词:档案信息;检索技术;档案管理

随着时代的进步,科学技术日益完善,信息技术的发展与更新未来传统档案管理带来了新的挑战,經过很多年的累积、收集、整理档案数量十分庞大,而且目前对档案利用的方式却发生很大的变化。从传统的档案管理来看,主要是以手工信息检索的为主,在检索之前需要制作带有目录的条目卡片,让后续使用更加方便。随着时代的发展,机械式信息检索随之出现,主要是设备上的进步,采用了打孔机、分类机等等设备,能够对二次文献进行更好的记录与收集,而且可以通过电刷进行更加有效率的检索。每一次对检索方式进行改善都是一次进步。在信息技术的支持下,这些传统方式都无法满足现代档案信息管理与使用的要求,对设备依赖大,而且非常复杂,并且检索效率与检索质量都不高。因此,档案信息检索技术在这样的背景之下产生,利用计算机能够提高档案检索的效率与质量。目前,为了提高对档案的使用率,广大研究者逐步开发了档案管理系统,为了达到实现档案信息共享还建立了档案数字化馆,不仅实现了实现了档案信息化检索的目标,而且扩大了检索的范围,质量更高,能够满足广大人群事实检索的要求。可以说,档案信息检索技术的推出,让档案信息再次“活”起来。

一、档案信息检索技术的发展

信息化的发展带来新的技术、新的文化以及新的交际方式。信息技术在档案管理的应用中得到了前所未有的发展,但是从目前发展的现状来看,还有很多地方需要进行改善。目前,档案管理系统开发了档案信息检索功能,广大用户可以通过档案信息检索系统进行目标查询,用户一般在查询档案信息时采用的是关键字模糊查询,而相关查询结果则是事先经过录入做好顺利排列之后进行输出的,虽然具备检索的功能,但是其检索结果并没有像预期一样达到用户真正需要的检索意图,甚至没有对查询中一些关键因素进行深入的分析,比如,关于关键词出现的频率,关键词出现的位置以及关键词的重要程度等等,因此,很多时候检索结果都是无序状态,甚至和用户想要查询的结果没有存在基本的关联性,最终无法并没有真正满足到客户的实际需求。类似这样的档案信息检索结果并没有真正的意义,尤其是从广大用户的角度来看,这样的检索不仅浪费时间,而且整个检索过程异常乏味,而且大部分用户不可能去一一查看结果。因此,针对目前的档案信息检索存在的一些普遍问题,本文的研究主要是基于原来的基础上进行改进,主要是针对目前默认的查询结果进行改善,让查询结果排序更加人性化,以相关度为依据从高到底来进行显示,这样能够让用户在极短的时间内检索到自己想要的信息。

档案的价值最终体现在“用”这个环节上,如果档案一直被存放在库房而没有被使用,档案也就失去了原有的价值,更是一张张等着发霉的废纸。如何针对档案信息化系统进行改进,如何做好档案信息检索,如何才能在庞大的档案信息中准确找到自己的想要的信息,这才是我们必须要关注并且解决的问题。随着信息技术的发展,数字化档案建设之后浏览的人数与日俱增。而且不同的人有自己不同的思维模式,就大部分人来说他们对档案的记忆都是非常模糊的、片段的,本身自己的查询意图就不明确,在查询时一开始都是以试探的方式进行。如何满足这些用户的实际需求,如何让用户能够准毫无遗留的找到档案信息,这就要档案信息管理系统必须具备一套非常强大并且人性化的检索功能,让广大客户能够根据检索具备的基础条件进行更好的查询,这样查询结果将会更加准确、更加效率。目前,能够满足不同的用户不同需求的检索功能,主要包括了全文检索、图片检索、目录检索等。

二、档案信息检索技术

(一)信息检索的原理

所谓信息检索是一般是根据某种方式将各种信息进行重新组织,然后根据用户的查询需求将对应的信息反映给用户的一个过程。档案信息检索包括了:索引检索、查询处理、文档检索几个方面。

第一,索引生成。设计档案信息检索系统时必然会涉及到索引生成,那么如何选择索引与如何选择索引方法以及关键词表分词方法都显得非常重要。索引生成会涉及到EM算法、NGram算法、HMM算法等,它们都是统计学原理当中的分词方法,但是这种计算方法使用的范围比较小,而且工作量也很大。

第二,查询处理。档案信息在具体检索的过程中,用户在使用的过程汇提出查询条件,比如:关键词、自然语言、表达式等等,而且整个档案信息检索功能对于用户输入的查询条件不能肆意更改。例如,档案信息检索系统如果没有对用户给出的查询条件进行及时的处理,这样便会影响查询的准确率。因此,根据用户的查询条件一般要做好语义处理,这样才能准确领悟到用户想要表达的一切查询意图,通常使用的处理方法有关联矩阵、相关反馈、潜语义分析等等技术。

第三,检索。检索系统直观理解就是对关键词进行查询的处理方式,给用户及时提供查询出来的结果。检索系统的工作程序比较简单,通常可以利用对应的模型来对查询结果的关联性进行排列,主要的方式有:概率模型、布尔模型以及向量模型。

(二)检索的相关性

第一,系统相关性。系统相关性是查询结果与提出文档之间的匹配关系,在具体操作中会受到用户的个人习惯操作习惯的影响,文档的特征与实际操作包含了:语法表述、分类表、索引、文献组织、分析检索提问等等。系统相关性从本质属性上来分析是比较片面的,通常是将重心放在整个查询过程的系统的当中,这样就会忽略了用户的实际感受。

第二,用户相关性,是用户发出的查询结果与信息需求之间的匹配关系。目前,档案信息检索过程涉及到的数据量也非常巨大的,此时用户的实际操作将会影响到整个信息检索过程。而且需要考虑到用户在实际查询过程中一个心理变化过程,因此,要将用户相关性与档案信息检索的相关性充分结合起来,经过对比分析之后,得知前者更加能够提高检索结果的准确率。

三、 档案信息模糊检索

早在1956年,美国著名的自动控制专家、加州大学著名教授扎德第一次将模糊集合理论提出来,最开始是为了解决一些模糊不清的问题,目的是通过模糊集合理论将这些模糊繁杂的问题集中化、明确化。随着时代的发展,模糊集合理论被引用到信息领域当中,并且有了很快的发展,目前在档案信息检索中有属于一种非常常用的信息处理方式。档案信息模糊检索主要在检索的过程中针对字符串或者文件中一些相关部分将其作为关键词进行检索的一种方法,例如,如果检索的内容特别多,那么用户只需要记住想要查询内容的一部分作为关键词就可以进行信息检索,从而提高检索系统的可用性。

目前,很多系统的所有数据都提供了模糊检索功能,例如,SQL Server 数据库,针对这两个数据库进行模糊检索的时,要通过like关键字对定义检索类型进行约束从而形成模糊检索,同时还需要使用通配符号来进行模糊定义,例如:SELECT Field Name List FROM Table Name List WHERE Condition LIKE“aa<通配符>”,表示从表 Table Name List 中检索关键字是“aa<通配符>”的 Field Name List 字段。针对查询条件来看,通配符有这些表达形式:

第一,%,也就是代表多个任意字符;

第二,_,代表长度为1的单个任意字符;

第三,[],指定[]中某个对应的字符;

第四,[^],主要是指一种差值上的操作,可以理解为除[]之外的单个字符。

档案信息模糊检索与精确检索对比起来,模糊检索在结果范围上会更大,从而有效的提高了查全率。模糊检索在软件上的配置能够提高软件的实用性。基于模糊查询的实现原理来看,模糊检索的优点主要有这些:

第一,方便。模糊检索可以说为一些非专业领域的用户提供了很大的便利,在模糊检索的引导下更加容易理解与操作,用户不需要掌握专业技术、专业内容、专业规章,就可以直接通过软件或者系统提供的模糊检索功能通过关键词开始进行检索。

第二,易用。模糊检索一般采用的语言是常用的自然语言,这与受控语言有很大的区别,自然语言有一个非常大的优势便是非常符合用户平常的检索系统,有了模糊检索的这项功能,用户在使用检索功能时就不需要对关键词进行概念转化。通常自然语言具有比较丰富的标引检索入口词,因此可以提高检全率,从而为广大用户提供更加便利的服务,由于其实际操作非常简单,适合的人群就比较广泛。

第三,启发。模糊检索的范围很广,但是经常获得冗余结果,这样也不会影响到用户的检索需求,例如,查询结果集非常大,用户则可以根据当前结合的启发,再从里面选取需要查询的关键字,从而实现更加准确的检索。

四、档案著录与档案标引分析

档案著录与档案标引是档案信息检索系统的基础。档案著录主要从整个档案信息中提炼出符合用户查询要求的索引信息,将其完整收录下来,并且针对档案内容的主题进行分析,從而判断出该档案信息是否符合用户查询的要求。在经过概念转换之后能够让检索语言的整个过程更加规范化,然后再利用档案标引能够将档案信息中与一些文本信息不同之处揭示出来,这个过程有着比较显著的特点:

第一,目前,大部分档案所收集、记录、归档的信息是属于原始类信息,一般要更改原始类信息的可能性还是非常低的;

第二,档案信息内容涉及面非常广,但是分类非常明晰;

第三,无论什么类型的档案信息必须要符合专业标准,例如,要具备一级目录、二级目录、三级目录等等,并且还要具有文号信息、实体分类号、全宗号、案卷号以及文件号。

第四,档案信息要具备可以准确、快速被识别的特点,也就是每一个档案信息都必须要有对应的档案编号,编号是独一无二的。

第五,档案信息密级划分一般是5个级别,每一个级别所包含的授权信息内容与权限都不一样,不能混淆。

第六,档案信息的保管期限划分为3种,过期的档案要及时销毁。

第七,关于档案信息的必要追究责任。档案信息本身要具备非常明确的归档单位,要有对应的负责人,如果档案信息出现删除、篡改、泄漏等等情况,要对其追究法律责任。

五、结果统计排序方法分析

档案信息检索的最终目的是将检索的结果及时反馈给用户,但是由于现在的档案信息量特别大,导致信息检索的结果数量也非常大,一般用户是不会将检索结果一一全部浏览完,而且这本身也不符合档案信息检索开发的便利性原则。目前,档案信息检索主要采用的是模糊检索,而模糊检索一般情况下无法有效避免出现繁杂结果的问题,而繁杂的结果必然会影响到用户对检索结果的阅览性。因此,需要一个良好的结果统计排序机制,有效控制繁杂结果的出现,为广大用户提供更好的服务。从档案信息检索结果来看,结果之间地位肯定不会是对等的。根据结果是否能够满足用户检索的预期目标,一般将检索结果划分为目标结果与冗余结果,当然用户在对档案信息进行检索时肯定希望能够得到满意的结果,通常只会关注检索结果的最靠前的几条记录。由此可见,对档案信息检索结果的排序就显得非常重要,而且良好的排序也直接影响到用户的使用体验。排序无疑是检索的最为关键的一步,假如没有进行合理的排序,那么档案信息检索出来的结果必将失去价值。检索排序是基础性工作,也就是检索的必经步骤。而检索技术是对信息有效过滤最为有效的方法,通过检索才能获得高质量的信息。

综上所述,档案信息检索技术要从检索的基本原理入手,对检索的过程相关性分析,尤其是要了解检索相关性与用户相关性。另外,模糊检索是当前档案信息检索最为有效的检索功能,虽然无可避免模糊检索过程中会带来目标结果与冗余结果,但只要从这方面深入研究,结合档案信息的特殊性,从而对结果统计进行合理的排序,提高档案信息的利用率。

参考文献:

[1]赵进龙,霍明明.RFID技术在档案信息检索中的应用研究[J].电子世界,2016,(14):53.

[2]孙梅霞.新形势下档案信息公共服务方式研究[J].兰台世界,2015,(23):105106.

[3]方婷.信息技术在档案中的应用[J].东方企业文化,2015,(02):66+68.

[4]于雪红.数字档案信息安全防护对策分析[J].黑龙江史志,2014,(09):160.

[5]刘华珍.档案信息检索研究成果的统计分析[D].辽宁大学,2014.

[6]赵春苗.计算机技术在档案信息管理中的应用[J].科技创新与应用,2014,(07):250.

作者:马木生

第二篇:近15年国内图情领域信息检索相关性研究进展分析

摘 要 论文选取CNKI期刊收录的近15年我国图书情报领域信息检索相关性研究的论文,基于文献计量学对收集的数据进行了量化分析,并运用CiteSpace软件和Ucinet软件绘制了科学知识图谱。同时,论文分别从发文时间、作者、机构和研究热点(关键词)四个方面对该领域研究进展进行了详细分析和总结,进一步介绍了其知识结构与发展趋势,并为今后该领域研究提出了建议。

关键词 图书馆学 情报学 信息检索相关性

分类号 G250.252

DOI 10.16810/j.cnki.1672-514X.2016.08.020

Analysis on Recent 15 Years’ Researches of Information Retrieval Relevance in Library and Information Science in China

Wang Xu,Ke Kaiyan

信息检索相关性研究距今已有80多年历史,关于“相关性既是信息检索的基本问题,也是情报学的基础性概念”,国内外图书情报领域主流学者已达成共识[1-2],且在相关性研究上取得了一定的成果。考虑到目前图书情报领域关于信息检索相关性研究的内容较少,同时也为了解国内图书情报领域信息检索相关性研究的历史、进展,本文选用中国知网数据库,利用CiteSpace、Ucinet等软件绘制图书情报领域信息检索相关性主题词文献的科学知识图谱,并对近15年国内该领域的研究现状进行了系统的梳理和分析,试图发现现有研究的不足以及未来研究趋势,期望为该领域进一步研究提供借鉴。

1 研究方法

本文采用文献计量方法分析与解读图书情报领域信息检索相关性研究论文,借助文献的内、外部特征,采用统计学方法,通过绘制科学知识图谱来揭示该领域的知识结构和知识特征,以及研究的前沿领域。

1.1 数据收集

在中国知网(CNKI)检索界面,运用检索式主题=(信息检索and相关性)or(检索and相关性)(精确匹配)检索2001年至2015年我国图书情报领域信息检索相关性研究论文,共得到191篇文献,经去重、整理后为190篇。

1.2 可视化及统计工具

本文进行可视化分析的工具是CiteSpace3.8R5版本和Ucinet6.212版本。CiteSpace 在Java语言环境下运行,由陈超美教授开发,在文献引文网络分析研究领域被广泛应用;Ucinet软件由Linton Freeman编写,在社会网络分析中被广泛应用。为了呈现图书情报领域信息检索相关性研究的时间分布趋势,本文利用Excel统计2001—2015年的发文数量并绘制了文献年代分布趋势图谱。同时,借助CiteSpace、Ucinet绘制科学知识图谱,以可视化效果对图书情报领域信息检索相关性研究的分布机构以及关键词等进行分析。

2 我国图书情报领域信息检索相关性研究的时空知识图谱及其分析

2.1 年代分布分析

运用文献计量分析方法,从文献历时性上可以分析出学科的发展趋势,发文量的多少代表了在一定时期内该领域研究的冷热程度。利用Excel绘制年代分布情况(见图1),发现关于信息检索相关性的研究在2003年后呈现明显的上升趋势,2011年达到研究的高峰期,2012~2013年发文量有所下降,2014年和2015年稍有回升。近几年图情领域有关信息检索相关性研究热度下降的原因可能是在信息检索技术突破方面遇到了瓶颈。目前该领域研究已积累了大量的理论观点,今后在实证和技术方面的研究有待提高。

2.2 高产作者知识图谱

发文量可以用来衡量研究者学术水平和科研能力,高产作者一定程度上影响着某一学科的发展、演变方向,对高产作者的研究具有重要意义。根据普莱斯高产作者计算公式: (其中Nmax为最高产作者论文数)统计得知,成颖为最高产作者(8篇),则计算M值为2.11,M取邻近最大整数为3,发文≥3篇的作者称为高产作者(见表1)。

由表1可知,高产作者中有南京大学信息管理系的成颖(8篇),南开大学信息管理系的王知津(6篇),南京大学信息管理系的孙建军(6篇)等。由此可知,我国图书情报领域信息检索相关性研究的核心群体仍是高校专业教师和图书馆员,他们拥有较强的科研实力和科研队伍以及本专业深厚的研究底蕴,是国内图情领域信息检索相关性研究的核心力量。而公共图书馆研究人员较少,应鼓励专业人员加入公共图书馆,进行更好的理论分析及实践研究[3]。

2.3 研究机构知识图谱

研究机构是从事一项或者多项研究的专门性组织,在一定程度上可以理解为学术群体的代名词。机构合作有助于实现科研资源的优化配置,提高科研生产力。运用SPSS软件统计国内图书情报领域信息检索相关性研究2001年到2015年期间载文的机构分布,共计有160家国内学术机构(包括一级单位和二级单位)参与论文的创作,其中25家机构发文≥2篇(由于篇幅有限,统计图示结果未列出),排名前25位的核心机构累计发文91篇,约占全部发文的48%,是该领域研究的主要阵地。

采用CiteSpaceIII软件,时间选择为2001~2015年,时间分段单位(Slice Length)为1年,选择网络节点为机构(Institution),采用最小生成树算法,经调试得到发文机构知识图谱(见图2)。图谱中有33个节点,161条连线,网络密度为0.0026,可知各机构合作力度不大,跨地域、跨机构科研合作较少,有待加强。图谱显示,高校图书馆和高校信息管理院系是图书情报领域信息检索相关性研究的主要阵地,是最活跃的系统,贡献最大。这与高校具有浓厚的学术氛围,有一批较高水平和较高科研能力的研究者有关。

2.4 关键词知识图谱

根据文献计量学中的齐普夫定律可知:通过统计分析某一学科中关键词出现频次及其相互关系,可以对该领域的知识结构演变状况、研究热点分布情况做出清晰的揭示。

利用CiteSpaceIII软件,通过设定适当阈值,以一年为年限(Year Per Slice=1),节点选择关键词(

在国外,有关信息检索相关性研究起步远远早于国内,研究成果较国内丰富,研究体系较为完整。计算机科学界和图书情报学界构成国外信息检索相关性研究的两大学派,在计算机科学界,相关研究者被称为系统中心派,即重点在于检索系统自身的内部运行机制研究[4];在图书情报学界,相关研究者被称为用户中心派,即重点在于用户以及用户与系统之间的交互研究[5-6]。国内学者在借鉴国外信息检索相关性研究成果的基础上进行研究,基于相关性的动态性、多维性、可认知性和可测度性观点,目前,国内学者也普遍认同上述两种学派。

基于国内外有关信息检索相关性研究的两大研究学派类型,结合图3、图4对190篇文献进行梳理后,可以从计算机检索系统自身的内部运行机制研究和用户以及用户与系统之间的交互研究两大视角,总结出典型研究者对我国图书情报领域信息检索相关性研究的进展及概况,如表2、表3所示。

3 结语

本文以近15年(2001年~2015年)CNKI中有关图书情报领域信息检索相关性研究的论文为研究对象,从文献计量学的角度,利用知识图谱工具剖析了我国图书情报领域信息检索相关性研究现状,着重分析了文献发表时间、高产作者、研究机构、关键词等方面的内容,经梳理总结,得出以下几个方面的结论。

(1)从国内图情领域信息检索相关性研究的发文数量时间分布来看,在2003年后呈现明显的上升趋势,2011年达到研究的高峰期,2012~2013年发文量有所下降,2014年和2015年稍有回升。另外,近几年图情领域有关信息检索相关性研究热度下降的原因可能是在信息检索技术突破方面遇到了瓶颈。目前该领域研究已结积累了大量的理论观点,今后在实证和技术方面的研究有待提高。

(2)从国内图情领域信息检索相关性研究的高产作者及机构分布来看,高校图书馆员和高校信息管理系是该领域研究的主要阵地,拥有国内该领域信息检索相关性研究的核心群体。而公共图书馆相关研究人员较少,因此,还需要更多的专业人员加入公共图书馆,给予更好的理论分析及实践研究。同时,本研究领域迫切希望能够涌现出领军人物和核心研究团体来制定大科学时代的研究战略,组织本领域的协作研究,积极带领广大研究者开拓更广泛的研究领域和做出更专深的探索[6]。

(3)从国内图情领域信息检索相关性研究热点来看,本文基于国内外有关信息检索相关性研究的两大研究学派类型,分别从计算机索系统自身的内部运行机制研究和用户以及用户与系统之间的交互研究两大视角进行了梳理和总结。研究发现,国内在一定程度上取得了骄人的成绩,但主要集中在信息检索相关性研究的理论层面探讨上,而在实证方面的研究还有待加强。面对日益增长的海量网络信息,可以满足用户需求的信息检索相关性越来越重要,因此,以计算机检索系统为中心的设计思想转变为系统与用户并重的设计思想,重视用户友好性,是提高信息检索相关性的解决方案。相信未来国内图书情报领域信息检索相关性研究会不断深入,有所突破。

参考文献:

[ 1 ] SARACEVIC T. Information science[J].Journal of the American Society for Information Science,1999(12):1051-1063.

[ 2 ] 马费成.论情报学的基本原理及理论体系构建[J].情报学报,2007(26):3-13.

[ 3 ] 王旭.基于文献计量的国内大数据研究现状分析[J].农业图书情报学刊,2016(4):52-56.

[ 4 ] Bo-Y KANG, Dae-Won KIM, Sang-Jo LEE. Semantic indexing and fuzzy relevance model in information retrieval[J].Studies in Computational Intelligence (SCI),2005(2):49-60.

[ 5 ] HARTER S P. Psychological relevance and informationscience[J].Journal of the American Society for Information Science,1992(43):602-615.

[ 6 ] SPINK A, GREISDORF H, BATEMAN J. From highly relevant to not relevant:Examining different regions of relevance[J].Information Processing & Management,1998(34):599-621.

[ 7 ] MIZZARO S. Relevance: The whole history[J].Journal of the American Society for Information Science,1996(9):810-832.

[ 8 ] 王知津,卞丹,王文爽.信息检索中“相关性”的概念、类型及其不确定性[J].山东图书馆刊,2011(1):1-5.

[ 9 ] 成全,司辉.信息检索相关性评价及其改善策略研究[J].情报杂志,2008(2):129-133.

[10] 韩毅,邓小昭,刘丽,等.信息检索领域相关定义的演化及其启示[J].情报理论与实践,2006(3):270-273.

[11] 赖茂生,屈鹏.相关性基础理论及其在检索建模中的作用研究[J].情报理论与实践,2008(6):801-805.

[12] 黄丽红.信息检索中“相关性”的探究[J].图书馆学研究,2006(2):65-67.

[13] 成颖,孙建军,巢乃鹏.信息检索中的相关性模型[J].图书情报工作,2004(12):46-50.

[14] 王雅坤,成全.信息检索相关性研究综述及发展趋势[J].图书与情报,2012(1):88-94.

[15] 朱涵.BIR模型在提高用户检索相关性中的应用[J].情报探索,2007(4):53-55.

[16] 成颖.基于相关性判据的学术信息检索系统成功模型建构[J].现代图书情报技术,2011(9):46-53.

[17] 杨建林,邓三鸿.信息检索中相关性的维度与度量[J].情报理论与实践,2005(6):27-30.

[18] 吴丽华,罗云锋,张宏斌.信息检索模型及相关性算法的研究[J].情报杂志,2006(12):25-27.

[19] 周瑛,方宏彬,张持健.模糊聚类在信息检索中的应用[J].微机发展,2005(3):107-109.

[20] 刘铭,刘秉权,刘远超.面向信息检索的快速聚类算法[J].计算机研究与发展,2013(7):1452-1463.

[21] 何绍华,宫兆晖.基于语义网的网络信息检索相关性研究[J].情报杂志,2007(12):120-123.

[22] 成全,司辉.信息检索相关性评价及其改善策略研究[J].情报杂志,2008(2):129-133.

[23] 夏咏梅.浅析信息检索评价中“相关性”问题的内涵[J].情报杂志,2003(6):52-53.

[24] 杨锐.次序效应对用户判断检索结果相关性的影响[J].情报探索,2011(5):5-8.

[25] 成颖.信息检索相关性判据及应用研究[D].南京:南京大学,2011.

[26] 程娟.基于用户信息检索相关性反馈模型的研究[J].图书馆杂志,2008(4):52-55.

[27] 李亚琴,孙建军,杨月全,等.基于信息检索用户的相关性行为研究进展[J].情报科学,2014(5):157-160.

王 旭 黑龙江大学信息管理学院硕士研究生。黑龙江哈尔滨,150080。

柯凯艳 云南大学历史与档案学院硕士研究生。云南昆明,650000。

(收稿日期:2016-06-01 编校:陈安琪)

作者:王旭 柯凯艳

第三篇:专业信息检索的现状及改进

关键词:专业信息检索;专业检索工具;学科信息门户

摘要:目前国内的专业信息检索基本分为专业检索工具模式、学科信息门户模式和综合模式。本文分析了这三种模式的优缺点,指出如何完善专业信息检索模式和提高专业信息检索效率。

1专业信息检索现状分析

11专业性检索工具模式

专业检索工具存在的理由在于:综合性检索工具有可能在专业信息的收齐方面有所遗漏;许多专业术语在不同的学科和领域可能存在语义交叉或差异,这样在综合性检索工具中检索出的结果中可能就存在大量的不相关的结果,检索的准确度和专指度难以保证。而研究人员的信息需求具有专业性、准确性和全面性、及时性的特点,并且他们没有很多时间在大量的结果中进行再次筛选和过滤。这样,一些专业化的检索工具应运而生,像国际上著名的PubMed,就是美国国家医学图书馆开发的医学专业信息的检索工具。但是就专业研究的需要而言,还很不够,专业化检索工具将是未来信息检索领域的一个研究热点。

12学科信息门户模式

专业化信息检索的另一种体现的是学科信息门户的兴起。由于网络资源冗杂无序、图书馆资源又多以固定的分类法排列,而用户的专业信息需求日益领域化、专题化,这使得一般的网络资源和图书馆服务显得力不从心。在这种背景下,一个专业信息资源共建共享的新模式——学科信息门户的出现使人们看到了曙光,这种模式借鉴门户网站的概念,集中关注某一个学科、领域或专题信息资源的建设。学科信息门户具有学科信息内容的高度聚集和有效组织、应用的高度集成;一站式服务、界面简单统一、单点登录,一次认证、可定制个性化服务等特点。英国资源发现网络(Resource Discovery Network)开发的社会科学信息门户(SOSIG)的宗旨就是为社会科学领域内的研究者提供经筛选的高质量的网络信息。中国科学院国家数字图书馆也已建成包括物理和数学在内的六大学科信息门户,提供每一个学科领域内专业化的信息资源。武汉理工大学图书馆开发的“材料复合新技术门户”收录了学科内各种类型和载体的信息,进行了简单的组织,用户可以浏览资源(提名、关键词、摘要、相关资源等)并通过链接继续访问,或者可以通过对站内收录资源进行检索(关键词和责任者检索)直达所需信息的线索。

13综合检索模式

综合检索模式是指专业信息服务人员或信息检索水平较高的研究人员综合使用专业性和综合性检索工具、学科信息门户等实现对所需信息的查询。这种模式一般适合查全率较高、信息分布较分散的检索,也是对缺少专业检索工具或专业检索工具检索效果不能令人满意的情况下的一种弥补的策略。

2专业信息检索的改进策略

21专业检索工具和学科信息门户的改进

对某一个具体的专业或学科来讲,首先要全面了解本专业检索工具和学科信息门户的发展现状,比较各检索工具、各门户之间的优劣、异同。目前关于各个具体学科专业的检索工具比较研究和专业门户的比较研究,总体来讲还是比较少的,而且,覆盖的学科还很不全面。

专业检索工具和专业门户的改进策略主要可从两个层面展开:一是从信息检索人员和研究人员的角度出发,研究如何更好地利用现有的专业检索工具,提高检索质量和效率。二是从专业检索工具和门户开发者的角度,研究如何改进或开发出更优秀的检索工具和门户,使专业信息检索更加便捷高效。

从检索利用者的角度来看,要更好地利用现有工具、门户,必须深入了解它们的特征、优缺点、使用方法等,而专业范围内的检索工具的比较研究、专业门户的比较研究在一定程度上提供了对这些检索工具的全面分析,提供了一些提高检索效率和合理选择工具的方法。如对手工和计算机、网络数据库检索工具之间横向比较,揭示了各种检索工具之间的互相补足关系和差异。这样,就可以很好地引导使用者来利用检索工具,鼓励手工、计算机检索两种方法都使用,以达到尽可能的查全。另外一种就是范围更细的专业网络数据库检索工具比较,大体上是从文摘质量、收录范围、出版历史、检索界面、检索方法、检索功能、检索结果等方面进行了比较。这种比较就很详细,包含了选择检索途径、输入检索式、辅助检索限制条件、检索结果处理等操作细节,并且最后都能得出比较详细的使用建议,另外,比较研究的结果还有助于在检索前选择合适的检索工具。

检索人员和研究人员除了可以通过比较研究的相关论文来学习这些检索知识、优化自己的检索行为外,还可以关注图书馆或其他信息服务机构的关于专业信息检索的讲座。据笔者所知,高校图书馆经常举办某一专业、专题的信息检索讲座或专门的数据库检索讲座,这些都是获取专业检索知识的便捷途径。

从专业检索工具和门户开发者的角度来讲,要尽可能联合各方力量、协作开发。要注重对用户信息需求、用户行为的调查,从用户角度出发考虑最优化的设计,要充分发挥专业信息检索人员的参谋作用,要集中力量对开发中的关键技术进行攻关,以实现检索系统或门户的最优的信息组织和检索效果。

目前,专业信息检索工具的实现除了传统的手工检索工具外,网络检索工具的实现主要依赖于专业信息数据库的开发,比如:目前国内的一些法律、财经类专业数据库。通过构建专业本体(领域本体),实现基于本体的语义检索是未来专业信息检索的一个发展方向,因此,领域本体和语义网络将是专业检索工具实现的有效途径。比如,中国政法大学的黄都培教授探讨了法律本体的构架和基于法律本体的信息检索。

22学科馆员工作的加强

学科馆员最简洁而全面的描述是:通过图书馆与院系学科专家师生的交流,加强资源建设,促进参考咨询服务。也就是说,学科馆员的工作主要面向院系的专业研究人员、面向其专业信息需求。学科馆员要通过与走访调研,掌握专业研究人员的信息需求,并尽力满足其需求。学科馆员可以说是专业研究人员和专业信息检索工具之间的中介角色,学科馆员为专业用户提供专业信息的代查代检服务、举办专业信息检索讲座、甚至介入其研究过程,全程提供检索咨询并观察用户信息行为。

因此,学科馆员在促进专业信息检索的发展方面可以发挥举足轻重的作用。首先,学科馆员要熟悉和了解与专业相关的各种检索工具和资源,为专业用户提供尽可能满意的代查代检服务,有条件的学科馆员应深入院系,介入用户的研究过程,发现和挖掘用户的潜在信息需求,并根据其反馈调整检索行为、优化检索策略,为用户提供信息保障,使之在研究过程中无信息保障方面的后顾之忧。其次,学科馆员要注重向专业研究人员普及专业信息检索知识,一方面提高用户的检索能力,另一方面也将自己从繁琐、雷同的工作中解脱出来,将更多的精力放在专业信息的发现、整合、评价和其他创新性工作上面。专业的研究人员也更需要自己掌握专业检索技能。举办专题检索讲座和单独的检索咨询都是较好的普及途径,前者受众较多,影响较大,后者则具有针对性改为强、见效快的特点。

3结语

总的来说,国内的专业信息检索发展不平衡,大部分专业没有专业信息检索工具,学科信息门户在信息检索功能上非常欠缺,专业研究人员的专业信息检索能力参差不齐,学科馆员大量的时间和精力耗费在专业用户的检索求助上。要大力发展各个学科的专业信息检索工具,建设学科信息门户,努力提高专业信息服务人员的专业信息检索技能和服务水平,增强对用户专业信息需求和检索行为的研究,促进面向学科的专业信息检索的发展,提高专业研究人员的信息占有水平,扩大其研究视野、提高其研究水平,从而促进我国整体科研实力、创新能力的提高。

参考文献:

[1][ZK(#]黄静网络信息检索发展方向展望[J]农业图书情报学刊,2008(1):14-19

[2]http://wwwintuteacuk/socialsciences/

[3]http://atmspwhuteducn/

[4]都培基于本体的法律信息语义检索[J]计算机工程与应用,2008(28):196-199

[5]冯东中美大学图书馆学科馆员设置比较研究[J]图书情报知识,2008(3):57-61[ZK)]

(编校:严真)

作者:姚李洁 谢婷

上一篇:世界著名建筑论文下一篇:建筑装饰施工论文