信息检索复习大纲

2024-05-13

信息检索复习大纲(共6篇)

篇1:信息检索复习大纲

信息检索复习

1、什麽是信息素养P.1 信息素养是指图书检索技能和计算机技能集合而成的一种综合的能力和素质。

2、信息、知识、情报和文献的定义

P3-6

信息:是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。

知识:知识是人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。

情报:为一定目的而搜集和传递的有特定效用的知识。文献:记录有知识的一切载体。

3、情报的3个基本属性是什么?

知识性、传递性、效用性

4、构成文献的四个基本要素是什么?

知识内容、物质载体、记录符号、记录手段

5、文献按物质载体形式可划分为几种类型?P.9 手写型、印刷型、缩微型、声像型、机读型

①手写型:指雕版印刷发明之前的古代文献和今天没有正式复印的手写文稿。如甲骨文、竹木简和现在的手稿、日记、书信等

②印刷型:以印刷、复印、打印等为记录手段而产生的一种文献,如图书 ③微缩型:包括微缩胶卷、微缩平片、微缩卡片和全自息胶片等

④声像型:唱片、录音带、录像带、电影等

⑤机读型:磁带、磁盘、光盘

6、文献信息按出版形式的不同可划分为几种类型?P.10 图书、期刊、报纸和特种文献。

特种文献包括:科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案。

7、图书作为文献信息源的特点是什么?形式特征是什么?

特点:

1、内容比较成熟、全面、系统、可靠。

2、出版周期长,传递信息速度慢,不能及时反映最新科技动态。它一般只反应3-5年以前的知识。

文献信息源的形式特征:

著录格式反映其形式特征:书名、责任者、出版项 ISBN号(国际标准书号的简称)期刊的特点和形式特征有那些?P.12-13

1、数量大、品种多,2、内容新颖,出版周期短、报道速度快,及时反映最新研究动态和成果,及时反映当前的科技水平;

3、连续性强,流通面广,便于获取信息和跟踪研究动态。

8、公开发行的期刊有2个重要的外表特征号码,如何表示?

①ISSN(International Standard Serial Number)号,国际标准刊号的简称,它是经国际标准化组织通过,并在国际间实行的用于识别连续出版物的标准编号。

②CN号,正式公开发行的期刊才拥有。

9、核心期刊的定义:

主要刊载某一学科或专业的论文,且论文的质量较高,所刊登的论文基本上能反映该学科最新成果及最新动向和发展水平,基本能满足该学科科技人员对信息的需求。

10、期刊的著录格式有哪几项

期刊的标准著录格式是:作者、论文题名、期刊名、出版年、卷号、期号、起止页码。

11、一些文献类型的特征号码(ISBN,ISSN,CN,GB2763-1981,GB/T)分别是什么的简称

ISBN是国际标准书号的简称,2007年以前由10位数字组成,2007年开始为13位

分四个部分:组号(0~9)代表国家、地区、语种(7为中国大陆)出版社号(2~50)组号+出版社号 书序号(1~6)出版社自给

检验码(0~10,其中10由X代替)

CN是中国发行的有中国统一刊号

GB表示强制性国家标准 ISSN是国际标准刊号

ISO是国际标准化组织

GB/T表示国家推荐性标准

12、如何解释“学位论文”P.16

学位论文是高等学校或研究机构学生为获得某种学位而撰写的科学论文。根据《中华人民共和国学位条例》的规定,学位论文分为学士论文、硕士论文、博士论文三种。

13、掌握不同文献类型标志。(M、N、D、J)

(1)期刊[J](journal)

(2)专著[M](monograph)

(3)论文集[C](collected papers)

(4)学位论文[D](dissertation)

(5)专利[P](patent)

(6)技术标准[S](standardization)

(7)报纸[N](newspaper article)

(8)科技报告[R](report)

14、按文献的加工深度可划分为几种类型?P.17-18(零次、一次、二次、三次文献)

一次、二次、三次文献的区别。

一次:专著、论文、期刊、研究报告、专利文献、标准文献等。是以作者本人的科研、生产和工作成果为依据创作而成的文献。

二次:所有的检索工具书,如各种目录、题录、文摘、数据库(VIP、CNKI、万方)等都属于二次文献。是对无序的一次文献进行加工、整理、提炼和浓缩,按一定的规则组织起来,能够方便地从中检出所需的文献信息的信息集合体。

三次:各种述评、综述(综述性的学位论文)教材、各种参考工具书(百科全书、字(辞)典、手册、年鉴)等属于三次文献。是利用二次文献获取大量的一次文献,对一次文献进行综合、分析、研究后撰写的文献。

15、信息检索的定义及其类型 P.43 按检索的对象文献信息检索分为:文献检索、数据检索、事实检索三种类型。

文献检索:是以文献作为检索对象,它为用户提供的是与用户的信息需求相关的文献。是一种相关性检索。

数据检索:是以数据作为检索对象,查找用户所需要的数值型数据,又称数值检索。数

据检索是一种确定性检索,检索的结果通常具有唯一性。

事实检索:是以某一客观事实为检索对象,查找用户所需要的描述性事实。事实检索也是一种确定性的检索,要向用户提供准确的事实。

17、网络信息资源有那些类型P.19 1)图书馆馆藏目录

使用时人们通过目标图书馆目录的URL,即可在自己的网络终端查询世界各地的大学图书馆、公共图书馆、专业图书馆的馆藏。

2)电子书刊

电子书刊指完全在网络环境下编辑、出版、传播的书刊。广义的电子书刊也包括印刷式3)参考工具书

各类百科全书、辞典、年鉴等的网络版参考工具书。

4)数据库

在网络环境下,数据库生产商将其产品联人因特网供用户直接进行联机检索,从而降低书刊的电子版。

检索费用,改变了传统的联机检索服务费用高昂的状况。同时,数据库作为高质量的学术、商业、政策和新闻信息的重要信息来源,以其信息质量的可靠,成为网络信息资源中重要的和不可替代的组成部分。

5)其他类型的信息

非正式信息,如电子邮件、电子会议、电子布告板、新闻、论坛、博客、空间等

18、什么是检索语言P.33 检索语言就是用来描述文献特征和表达信息提问,沟通信息标引人员和信息检索者双方思想的一种人工语言。

存贮文献信息时,按照一定的语言来描述、著录,形成记录;

检索文献信息时,也按一定的语言来表达、搜索、匹配所需要的文献记录。

这种文献的存贮和检索所使用的共同语言就叫检索语言

19、什么是“主题词” 什么是“主题法” P.34-35(1)用来表达文献主题内容的词语称为主题词。

(2)以主题词作为揭示文献主题概念的标识,并以此标识来编排、组织和查找文献的方法称为主题法。主题法提供了一种直接面向文献主题概念的组织方法和检索途径,具有直观性、专指性、灵活性等特点。

20、如何划分关键词和叙词

叙词常称之为“主题词”,就是经过规范化的、具有组配性能的词和词组(受主题词表控制)。

关键词是指从文献的题目、正文或摘要中抽出的能反映文献主题内容的、具有实质意义的关键性词语。它们不加规范或只作少量规范化处理,不受词表控制,除少数禁用词,如介词、副词、连词、冠词、代词、感叹词、助动词及部分形容词等外,其他词都可用做关键词。

21、我校图书馆用的是什么分类法

《中国图书馆分类法》

22、写出《中国图书馆分类法》的5个基本部类

P.36(1)马列主义、毛泽东思想、邓小平理论(2)哲学(3)社会科学(4)自然科学(5)综合性图书

23、《中图法》的标记符号(即分类号)采用什么文字方式组合是汉语拼音字母与阿拉伯数字相结合的混合制号码,用22个字母表示22个大类。

24、当今世界上影响最大、应用最广的一部大型分类法叫什么

《杜威十进分类法》

25、索书号由什么组成分类号加著者号

26、参考工具书的类型 P.53-56 字典、词(辞)典、百科全书、年鉴、手册、类书、政书、名录(人名、地名、机构名称)

产品目录图录(地名、地图信息、图像)表谱(分为年表,历表)

27、检索工具书的类型

P.51-53 指示线索型的检索工具书是用于查找文献信息线索的工具书,属于二次文献,包括各种目录、题录、文摘、索引、工具书指南和书目之书目等。

28、世界三大百科全书是哪三种?

《美国百科全书》(EA)《不列颠百科全书》(EB)科里尔百科全书(CE)

(1)搜索引擎是Internet上的一种网站,是网络信息资源的检索工具.它的主要任务是在Internet上主动搜索Web服务器信息并将其自动索引,其索引内容存

29、搜索引擎的概念及组成P.77 储于可供查询的大型数据库中。

(2)搜索引擎的组成:搜索器、索引器、检索器、用户接口 30、搜索引擎的关键词语法规则有哪些?P.123 1)逻辑运算算符

2)截词符

3)位置算符

4)字段限定

31、百度、谷歌都适用的字段限定主要掌握:

(1)限定网页标题,格式:intitle:检索词

(2)限定在某站点或某个网站内,格式:检索词 site:站点域名

(3)限定搜索的文件类型,格式:检索词filetype:文件扩展名

(4)限定在URL中搜索,格式:inurl:网址中的词

32、选择检索词应注意的问题P99(1)选用课题所涉及的学科专业内有检索意义的、表达主要主题概念的词汇,检索词的数量和专指度要合适。

(2)选用关键词要尽可能地考虑其相关的同义词、近义词,以保证查全率。

(3)一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的通义词,如“分析、研究、应用、建立、方法、发展、趋势、现状、设计等。

(4)随时根据检索需要,调整检索词,灵活使用多义词、同义词、近义词等。如果需要扩大检索范围,要尽量选择上位概念词;如果需要缩小检索范围,则选择专指性较强的下位概念词、特定概念词或者专业术语。

33、构造检索表达式的基本要求

(1)要全面、准确地反映检索课题需求的内容。

(2)要了解清楚所使用的数据库的检索用词规则和支持的运算符及其含义。不同的数据库往往采用不同的符号或文字来描述词与词之间的组配关系,要与数据库中的检索标识相匹配。

检索效果评价指标有哪些?P101-102 查全率

查准率

34、如何提高查全率P.100 如果检索结果为零或太少应该考虑扩大检索范围,提高查全率。扩检的方法如下:

(1)降低检索词的专指度,采用上位词、扩展词。

(2)去除不重要的限定词,选用主要概念词、核心概念词检索,以放宽检索范围。(3)增加检索词的同义词、近义词、相关词,充分挖掘隐含概念词,使用逻辑或组配。

(4)逐步提高查全率的字段依次为题名→关键词→摘要→全文。

(5)逐步扩大限定条件的范围,如分类类目、年代范围、语种、文献类型等。

35、如何提高查准率

(1)提高检索词的专指度,采用下位词、专指性较高的自由词、专用词、专业词汇。

(2)增加检索词的修饰词、限定词,使用逻辑与组配。

(3)用逻辑非排除无关的概念。(4))逐步缩小主题途径的检索范围。逐步提高查准率的字段依次为全文→摘要→关键词→题名。

(5)逐步缩小限定条件的范围,如分类类目、年代范围、语种、文献类型等。

(6)利用检索结果的相关度排序,获取切题文献。

(1)所谓检索途径,就是利用文献信息的某种特征作为检索标识来查询相关的信息。

36、如何解释检索途径?数据库检索有哪些途径?P.93(2)数据库检索有主题途径、分类途径、著者途径和其他

37、布尔逻辑算符主要有哪些?各个算符表示什么意思?P.82(* +-)

38、截词符有几种?有限截词和无限截词各用什么符号表示?了解截词方式P.83 ?*

39、位置算符的用法(W,N)P.85(w)是with缩写,简写(),表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其它的词或字母,但允许有一空格或标点符号。

(N)是near的缩写,表示此算符两侧的检索词必须相邻,词序不限,词间不允许插入其它词或字母,但允许有一空格或标点符号。40、获取原文的方法(了解)

网上传递原文、就近借阅等

41、如何判别IP地址、域名地址和URL地址(http://……)?顶级域名主要有哪些?(.net/.com/.gov)

42、IP地址分成两部分即:网络标识和主机标识,由32位二进制数组成,分成四段,每段8位,中间用小数点隔开,然后将每八位二进制转换成十进制数。例如我们学校的图书馆馆藏资源的IP地址:210.34.85.102由来:

43、知识产权的定义?

(知识产权是指对智力劳动成果和经营管理活动中所享有的占有、使用、处理和收益等的权利。)

44、国家法定的学位论文收藏单位(国家图书馆)

45、SCI、EI、ISTP、ISR是世界四大重要检索系统

46、专利有哪几种类型?各种类型专利的时效性分别是几年?

发明专利保护期限是20年,实用新型专利和外观设计专利的保护期都是10年

47、专利的特点:独占性、时效性和地域性,了解这三种特性的内涵。

48、中国专利号、申请号的位数编码的含义及区别。CN03184563.2,ZL03184563.2 实习

一、手工检索

1、检索工具的概念、手工检索工具按著录信息的特征可划分为哪些类型?各种类型检索工具分别有哪些? P12-P13(人们用来存储、报道和查找各类信息的工具)

(目录、题录、文摘型)

二、各种数据库:

重庆维普数据库、清华同方公司的中国知网系列数据库(cnki)、万方公司的系列数据库、数字图书馆(超星、北大方正、中数图、书生读吧等)、部分外文数据库

数据库中可以进行主题检索的字段有哪些?

检索图书、期刊、学位论文分别可选用哪些数据库? 学位论文:CNKI优秀博硕士学位论文全文数据库、维普《中文科技期刊全文数据库》、中国知识产权局网、万方学位论文全文数据库

图书: 维普的《中文科技期刊全文数据库》、北大方正Apabi数字图书馆、超星数字图书馆、清华同方公司的《中国期刊全文数据库》、

篇2:信息检索复习大纲

1.如何查找纸本原文,必备信息是什么,刊名等同于什么

刊名等同于ISSN号,必备的信息是,文章题目、期刊名称或是ISSN号,年/卷/期。

先查找有无电子全文。

谷歌搜索、SFX全文搜索系统、先查本馆纸本期刊目录,获取论文全文中的查询本馆纸本期刊目录,联合目录。

2.哪些数据库有自动截词功能?EI 3.中文科技期刊数据库、SCI和EI数据库的精确检索是如何实现的 中文:可选择限定检索学科领域 可选择逻辑算符

可选择跨库检索的其他检索方式 可选择匹配度 二次检索

其他限制条件 EI:精炼检索结果

 位置:检索结果显示页左侧 Refine Search的工具栏  添加一个检索词的二次检索(Add a term)

 优化和调整检索结果(限定(Limit to)按钮或排除(Exclude)按钮:

作者、作者机构、规范词、分类类名、国家、文献类型、语种、出版年、刊名、出版者等限定字段

4.数据库检索结果的排序方式 CNKI:主题 发表时间 被引 下载 EI:相关度和时间

系统提供5种排序方式(按相关度、出版年代、作者字顺、刊名字顺和出版者字顺)

5.主要的全文数据库

CNKI、维普、万方:中文期刊全文数据库。

EBSCO、ScinceDirect、SpringerLinker:外文全文数据库。

6.Web ofScience数据库中包含有哪些数据库?

SCIE/SSCI/A&HCL/ CPCI-S(ISTP)

/

CPCI-SSH 7.查全查准率如何实现?

提高查全率(扩大检索结果)的方法

 选择较大字段:如摘要、主题、全文、任意字段等

 尽量多用同义词、近义词、反义词、缩写词、上下位类词(增加逻辑或关系)

 减少逻辑与关系(限制条件) 采用模糊匹配功能  扩大检索年限

 使用截词符(*?$)

提高查准率(缩小检索结果)的方法

 选择较小字段:如篇名(题名)、题名或关键词字段  尽量增加核心检索词:从内容中挖掘核心词  使用词位检索

 采用精确匹配/精确短语功能

 采用“AND” 或“NOT”算符连接检索词或进行二次检索。 减少同义词、同族相关词等相关性不强的检索词。

8.SCI和EI数据库中的作者检索 SCI

9.每个数据库的检索技术 CNKI:

布尔检索;逻辑与、或、非;二次检索

(1)在快速、初级和高级检索方式中,使用下拉菜单选择布尔检索算符,其逻辑算符为“并且”(逻辑与)、“或者”(逻辑或)、“不包含”(逻辑非)。

(2)在专业检索中,直接输入检索式。检索词之间的逻辑算符为:“and”、“or”、“not”

。如果要选择运算顺序,请使用半角圆括号“()”。在输入检索式时,除检索词之外的所有符号均采用英文半角。布尔逻辑算符前后要空一个字节。

限制检索:字段,时间,匹配度 维普: 布尔检索

支持逻辑与、逻辑或、逻辑非检索技术。

在各个检索框之间,使用下拉菜单选择

“并且”、“或者”、“不包含”。

在同一检索框中,使用布尔算符 *、+、-。

2.同义词、同名作者检索

在“传统检索” 和 “高级检索”方式中设置了“同义词”和“同名作者”检索;

同义词功能适用于“关键词(K)” 字段,可提高检全率。

同名作者功能适用于“作者(A)”、“第一作者(F)”

字段,可提高检准率。

3.限制检索

“传统检索”和“高级检索”方式可以对字段、学科、期刊范围、时间范围、精确/模糊检索进行限制,“快速检索”只能对字段、精确/模糊检索进行限制。SCIE:(1)布尔检索(and, or, not)(2)邻近检索(near/x, same)

(3)截词检索(*,$,?)

(4)精确短语检索(“”)

(5)词形还原检索(Lemmatization)(6)逻辑算符及其先后次序

EI:

1.布尔检索(and or not)

2.截词检索(* ?)

3.词位检索(near onear near/n onear/n)

(1)NEAR :词序可颠倒。

(2)ONEAR:词序不能颠倒。

(3)NEAR/n、ONEAR/n表示前后两词之间允许插入n个词(≦n)

NEAR、ONEAR、AND的区别

查全率: AND>NEAR>ONEAR

4.限制检索

5.精确短语检索(“ ”{ })

10.著作权、专利权、商标权保护期限?/50年或者10年、10年 11.专利的审查制度

12.专利的类型,以及申请专利具备的条件 发明专利、实用新型专利、外观设计专利 13.知识产权的三性

新颖性、创造性和实用性

14.《中文科技期刊数据库》的检索方式 维普:基本检索、高级检索、传统检索、期刊导航、检索历史

CNKI:基本检索、高级检索、专业检索、作者发文检索、科研基金检索、句子检索、来源期刊检索

15.检索式编写,EI。SCI EI

TI=rosiglitazone and(synthes* or prepar* or produc*)

SCI

16.如何查看文献的被引用次数,如何越查越新越查越旧 在SCIE中检索得到的结果,勾选所有结果,分析检索结果,创建引文报告。

“记录显示格式”中选定某篇文章,打开“全纪录格式”,查找引用文献,越查越新;查找参考文献(越查越旧),查看相关记录,查看引证关系。

17.如何区分期刊论文和会议论文

篇3:信息检索概述

(一) 信息检索的定义及基本原理

信息检索 (Information Retrieval) 是指将信息按照一定的方式组织和存储起来, 并根据用户的需要找出相关信息的过程。它包括两个部分:1.存储:将大量分散无序的信息集中起来, 经过加工整理, 使之有序化、系统化, 成为可以查询使用的信息集合。2.检索:借助于查询语言, 将所需要的信息从集合中查找出来。这是广义的信息检索, 狭义的信息检索仅指第3部分, 即从信息集合中找出所需信息的过程。

从本质上讲, 信息检索就是对信息集合与需求集合的匹配与选择。从图2-1的原理图我们可以看到, 要实现匹配与选择, 首先要对信息集合进行特征化表示, 即通过人工或计算机的方法对信息集合进行加工处理, 将原来隐含的、不易识别的特征显性化。这种加工处理工作被称为内容分析与标引, 其中, 用来表示文档特征的词条被称为标引词。另一方面, 在检索时, 也要对用户所提出的信息需求进行分析, 提取概念或属性, 并利用与标引过程相同的标识系统 (检索语言) 来表达需求中所包含的概念和属性, 然后通过匹配和选择机制, 对需求集合与信息集合进行相似性比较, 最后根据一定的标准选出符合需要的信息。

(二) 经典信息检索模型

信息检索的三个经典模型分别是:布尔模型、向量模型和概率模型。在布尔模型中, 文献和查询用标引词集合来表示, 因此, 称布尔模型为集合论模型;在向量模型中, 文献和查询用t维空间的向量来表示, 则称该模型是代数模型;在概率模型中, 用于构建文献和查询模型的机制是基于概率论的, 则称该模型是概率模型。

在过去几年中, 人们已经为每一种经典模型提出了各种不同的改进模型。在基于集合理论的模型中, 又提出了模糊集合理论模型和扩展布尔模型;对于代数模型, 衍生出了广义向量模型、潜在语义标引模型和神经网络模型;概率模型中的一个主流学派就是基于贝叶斯网络的信息检索模型。本文将简要地讨论三个经典信息检索模型。

1. 布尔模型

布尔检索模型的理论经过多年的发展已基本成熟, 被过去甚至现在许多检索系统采用。布尔检索模型表达提问的方式与人们的思维方式相近, 很多人习惯采用这种模式进行检索。传统布尔逻辑检索模型最显著的特点是将用户查询与文献标引进行逻辑的、非数值的比较而获得检索结果, 查询结果一般不进行相关性排序。

对布尔模型而言, 标引词权重变量都是二值的0或1, 查询q是一个常规布尔表达式。用qdnf表示查询q的析取范式, qcc表示qdnf的任意析取分量, 文献d j和查询q的相似度可定义为:

如果Sim (d j, q) =1, 则布尔模型表示文献dj与查询q相关 (实际上是被检索到, 是否相关需要进一步判断) , 否则文献与查询不相关。布尔模型只是判断文献要么相关、要么不相关, 无法描述与查询条件部分匹配的情况。

2. 向量空间模型

向量模型认为用二值权重存在着太多局限, 并提出一种框架以便能够进行部分匹配, 即通过给查询和文献中的标引词分配非二值权重来实现这个目标。这些词语的权重用于计算存储系统中文档和用户查询的相似度, 向量模型依据相似度值将检出文献以递减顺序返回。

在向量模型中, wij是一个正的非二值数, 用以表示索引术语ki在文档dj中的权重。wiq也是一个正的非二值数, 用以表示索引术语ki在查询中的权重。查询向量qv表示为, 文档dj的向量可以表示为, 即查询q和文档dj均可由t维向量表示。我们用文档向量udjv和查询向量qv之间的相似性来评价文档和查询的相似程度。这种关系可以定量表示, 一般用这两个向量间夹角的余弦值来计算, 即:

令N表示系统中的文献总数, in表示包含标引词ki的文献总数, freqij表示术语ki在文献dj中出现的次数。则文献dj中术语ki的标准化频率tfij为:

其中maxlfreqlj为文献dj中出现次数最多的标引词kl出现的次数。此外, 术语ki的逆文献频率为:

运用公式 (3) 及公式 (4) 可得wij的计算方法如下:

事实上, wij有多种计算方法, 上式是最著名的术语加权方案。对于查询术语的权值, Salton和Buckley指出可以采用如下方法计算:

其中freqiq为术语ki在查询q中出现的次数, maxlfreqlq为查询q中出现次数最多的术语kl出现的次数。很多时候, 查询中术语出现的次数是相等的, 均为1, 这种情况下, 公式 (6) 可改写为:。

3. 概率模型

概率模型多建立在相关性理论基础上, 基于对相关性的不同理解, 建立了不同的概率检索模型, 并由此导致不同的排序输出原则。可以说, 相关性原理和排序原理是概率检索模型的理论核心。

对于概率模型而言, 术语权重都是二值的, 即, 查询q是概念空间U的一个子集, 用R表示已知的相关文献 (或最初的猜测集) , 用表示R的补集, 即不相关文献集, 条件概率P (R|dj) 表示文献dj和查询q相关的概率, 表示文献dj与查询q不相关的概率, 则文献dj与查询q的相似度可以定义为:

根据条件概率:

P (dj|R) 表示从相关文献集R中随机选择文献dj的概率, P (R) 表示从整个文献集中随机选择的文献是相关文献的概率;表示从补集中选择文献dj的概率, 表示从整个文献集中随机选择一篇文献是不相关的概率。

因为对文献集的所有文献来说, P (R) 和都是一样的, 所以公式 (8) 可以写成:

(三) 经典模型的简单比较

从上面对三种经典信息检索模型的介绍可以看出:布尔检索模型是一种基于逻辑判断的检索模型, 不能实现部分匹配, 而后两种检索模型则都是把检索问题归结为一种数值比较, 以实现部分匹配。

概率检索模型与向量检索模型在对文献的表示方面, 都是用一系列标引词及其权值的组合来表达。不同之处在于概率检索模型的权值是自动标引时标引词在文献中出现的概率, 而在向量空间检索模型中, 所谓的权值是标引词反映主题的程度, 其中一种常见的方案就是用词在文献中发生的频率来计算, 因而二者又达到了统一。另外, 二者的用户查询也是以一组词及其权值组合而成, 只不过向量空间模型把它作为向量处理而已。最后, 在文献—查询匹配中, 概率模型是计算权值和;而向量空间模型则是依据相似系数。最后的检索结果都代表用户对检索文献的满意程度的一系列数据, 用户可通过设置阈值来控制。

由此看来, 在一定程度上可以把概率检索模型视为向量检索模型。因为概率检索模型都是在假设系统有反馈信息基础上, 并能做出正确的参数估计。在没有反馈信息时, 概率检索模型可视为向量空间模型, 是它的扩充。

参考文献

[1]Ricardo Baeza-Yates, Berthier Ribeiro-Neto.现代信息检索[J].北京:机械工业出版, 2005:24-42.

[2]孙登峰.XML文档信息检索技术的研究与实现[C].北京:国防科学技术大学硕士学位论文, 2002:11-15.

[3]杭月芹.基于文档查询信息的检索系统研究与实现[C].江苏:扬州大学硕士学位论文, 2004:11-15.

篇4:浅析网络信息检索

【关键词】网络信息;检索

随着信息技术的高速发展,信息资源的越来越显得重要,而网络信息资源也逐步成为这个信息时代的核心资源。信息检索技术也很快得到发展,在此网络信息检索随着网络的发展也应运而生。网络信息检索,就是将描述特定用户所需网络信息的提问特征,与信息储存的检索标识进行异同比较,从中找出与提问一致或基本一致的网络信息的过程。相对传统文献检索,网络信息检索显现出了很多的优越性,如不受时间地点的限制,检索方式多样化,多元化等。但是我觉得网络信息检索的发展还不是十分完善,仍存在些问题,如目前检索工具在信息搜集缺乏统一的规范管理,检索过程会出现很多雷同,甚至无用的垃圾信息等。以下从网络信息检索目前存在的问题,及针对问题面临的以后的发展方向进行了探讨。

随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完善都不可能满足一个人所有的检索需求。如果遇到文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。为解决逐一登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求等烦琐操作,基于网络检索工具的检索工具产生了。

目前这列检索工具只要有两种:集成搜索引擎和元搜索引擎。所谓集成搜索引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜索引擎也可以要求多个引擎同时检索,搜索结果由各搜索引擎分别以不同页面提交的网络检索工具,其实是利用网站链接技术形成的搜索引擎集合。集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业搜索引擎集成链接,深受特定用户群欢迎。如国内天网搜霸和百度搜霸,国外比较著名的有“搜索之家” “网际瑞士军刀”等。

另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前国内现在还没有见到真正意义上的元搜索引擎。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。目前元搜索引擎技术主要有并行处理式和串行处理式两大类。并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。

从第一个元搜索引擎Metacrawler诞生至今,这一新型的网络检索工具异军突起,发展迅速,目前可用的元搜索引擎已近百种。由于元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约,元搜索引擎比较理想的并不多见。信息检索专家邢志宇将元搜索引擎存在的问题归纳如下:(1)大多元搜索引擎不支持多语种,尤其是汉语检索;(2)一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;(3)部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;(4)大部分元搜索引擎仅支持调用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。

Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。我觉得未来网络信息检索技术的发展方向如下:

1.智能化

现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。

2.标准化

现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。

3.个性化

科技的发展要以人为本,随着科学技术的发展,个性化服务也将成为网络信息检索的一个发展方向。随着互联网的飞速发展,每个人的对信息的需求将不再满足于标准化、单一化的大众需求。不同的人需要不同的服务,如残疾人士对网络信息检索的要求就要区别于常人,要是信息检索能很好的识别语音检索就能很有效的满足他们的信息需求。如何使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求,个性化服务也会成为网络信息检索重要的发展方向。

篇5:信息检索复习资料

1、常用法,其中包括顺查法,倒查法,和抽查法三种也就常用法。顺查法就是按照检索课题的时间顺序,从过去到现在由远及近检索文献信息的方法;倒查法,是一种由近及远、由新到旧的顺序检索文献信息的方法;抽查法是根据检索课题的特定需求,根据课题学科发展的实际情况抽出学科发展兴旺、发表文献多的一段时间进行重点检索的方法。

2、追溯法,也称追踪法、扩展法,是以文献末尾所附参考文献为线索进行追溯查询相关原始文献的方法。

3、综合法,又叫循环法或交替法,是把上述两种方法综合在一起或交替运用的检索方法。

基本途径:

1、题名途径,是以文献的名称为线索进行检索的途径,以文献名称(书名、刊名、篇名等)进行迅速查询。

2、著者途径,是以文献责任者名称为检索词进行文献信息检索的途径。责任者包括作者、译者、编者、注释者、文献发布者及专利发明人等。

3、文献序号途径,是以文献的编号为特征进行文献信息检索的途径。文献序号种类很多,有专利号、标准号、报告号、入藏号、合同号、国际标准书号和国际标准连续出版物号等。

基本步骤:

1、分析课题确定主题概念,2、选择检索工具和方法;

3、选择检索途径和检索标识;

4、查找文献,可采取先近后远的方法。;

5、获取原始文献,主要途径有:所

在单位或者地区图书馆;国内外其他图书馆、信息单位;利用馆际互借和文献传递服务获取原文;求助于国内外大型图书馆参考咨询、信息服务人员;求助于原文献出版机构及文献著者。

核心期刊:是专业性期刊中科技期刊的一种,根据在学科专业领域内的载文率、引用指数(影响因子)及利用率较高,深受本学科专家和读者关注的一种期刊。

数据库的类型:有序化的数字文献信息资源通常存储在各种文献信息数据库中,数据库按照信息的内容可化分为参考数据库和源数据库两种。参考数据库是指为用用户提供信息线索的指示性数据库,包括书目数据库如《科学引文索引数据库》、《化学文摘数据库》等;指南数据库,如公司名录数据库、产品(商品)数据库、人物名录数据库、技术标准数据库等。源数据库是指能够直接为用户提供原始文献信息或具体数据的一类数据库。此类数据库在欧洲也被称为数据银行包括全文数据库、数值数据库、文本一数值数据库、图像数据库及术语数据库等。源数据库的显著特征是用户可以直接获得原始文献资料或数据。

搜索引擎:是一种能够通过互联网接受用户查询信息指令,向用户提供符合查询要求的信息资源网址的网络信息搜索系统,是建立在传统数据库检索技术的基础上,增加了自动搜索和自动更新数据库信息的功能,并采用人工智能方

法对检索结果进行区分和排序。其搜索系统基本上是自动的,利用网页搜索软件如网络机器人、网络蜘蛛、网络流浪等的自动搜索程序,主动在网页上按某种策略进行远程数据搜索和获取,并生成数据库索引。

情报是在特定时间、特定状态下,对特定的人提供的有用知识或信息,具有 3个基本属性:知识性、传递性与效用性。情报与、知识、文献、资料、数据等相关概念有着不可分割的密切联系。不是所有的数据都可成其为情报,只有被定义了的数据才是情报,情报是加工了的数据,是数据的内容。

查准率(精度)是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100%

查全率(召回率),是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。普遍表示为:查全率=(检索出的相关信息量/系统中的相关信息总量)x100%

篇6:信息检索复习题

第 1 章 信息:狭义是指适用通信、存储或处理的形式来表示的知识或消息,即用语言、文字、数字、符号、图像、声音、情景、表情、状态等方式传达的容。

信息 资 源是企业生产及管理过程中所涉及的一切文件、资料、图表和数据等信息的总称。信息资源与企业的人力、财力、物力和自然资源一样同为企业的重要资源,而且是企业发展的战略资源。

文 献 :是记录知识的一切载体,是指将知识、信息、利用文字、符号、图像、音频等技术手段记录在一定的物质载体上。文献的三个基本属性:即文献的知识性、记录性和物质性。它具有储存知识、传递和交流信息的功能。

文 献 的 类 型:1、按照文献的载体形态来划分:分为印刷型、微缩型、声像型和电子型。2、按文 献 的出版形式划分:分为图书、期刊、会议文献、科技报告、学位论文、技术标准、专利文献。在正式出版图书封底都有一个 ISBN 叫国际标准书号。在正式出版期刊封面都有一个 ISSN 叫国际标准编码。

特种文献又称丛刊,或不定期的连续出版物,是出版形式比较特殊的一种文献类型。P5 科技 报 告:记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告、报告文献。

会议 文 献 :在学术会议上宣读和交流的论文、报告及其他有关资料,会议文献多数以会议录的形式出现,特点:传递情报比较及时,容新颖,专业型和针对性强,种类繁多,出版形式多样,会议文献分为:会前、会中和会后 3 中。

政府出版物:各国政府及其所属机构出版的,有官方性质的文献,又称官方出版物,是指有政府机关负责编辑印刷的,并通过各种渠道发送或出售的文字、图片、及磁带、软件等。

其他类型资料:包括产品样品、档案文献、灰色文献和视听资料等。

按照文 献产 生的次序与被加工整理的深度划分:可将文献分为零次文献、一次文献、二次文献、三次文献。一次文献:是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也称原始文献,其所记载的知识信息比较新颖、具体、详尽。

信息 检 索:是指信息按照一定的方式组织起来,并根据信息用户的需要找出有关信息过程和技术,狭义的信息检索是指信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程。也就是我们通常说的信息查寻。

信息 检 索的种 类 :按照检索对象来划分:书目检索、数据检索、事实检索三种。

按照信息存储和检索手段来划分:手工、机械化、计算机检索三种。

按照信息检索的途径来划分:直接检索和间接检索。

信息 检 索的步 骤 :1、分析研究课题,明确检索要求。2、选择信息检索系统,确定检索途径。

3、确定检索词。4.构造检索式,确定检索策略。5、处理检索结果。6、原始文献获取。

信息 检 索系 统 的 组 成:文献信息选择子系统,词表子系统,标引著录子系统,查询子系统,用户与系统之间交互子系统,匹配子系统。

..信息 检 索系 统 的 类 型:按照容可划分为期刊信息检索系统、图书信息检索系统、学位论文检索系统、专利信息检索系统、标准信息检索系统和会议论文检索系统。

按照存 储设备 和用 户检 索方 式,可将电子信息检索系统划分为:联机数据库检索系统、光盘数据库检索系统和网络数据库检索系统。

对 于 计 算机信息 检 索 数 据 库来说,一般由字段、记录、文档和辅助部分 4 项组成。

计 算机信息 检 索技 术 :1、布尔逻辑运算:就是采用布尔代数中的逻辑与、逻辑或、逻辑非等逻辑运算符,将情报提问转换成逻辑表达式。

2、位置运算:又称邻接运算符,是用一些特定的运算符来表达检索词与检索词之间的临近关系,并且可以不依赖主题词而直接使用自由词进行检索的技术方法。

3、截词运算:截词就是利用检索词(关键词、主题词)的词干或不完整词形进行查找,他可以起到扩大检索围,提高查全率,减少检索词的输入量,节省检索时间的作用。截词运算的方式有多种,课分为有限截词、无限截词和中间截词。

以知 识属 性 来 描述和表 达 信息容的信息 处 理方法 称为 分 类 法:著名的分类法有《国际十进分类法》《美国国会图书馆图书分类法》《国际专利分类法》《中国图书馆分类法》等。

《 国际 十 进 分 类 法》:简称 UDC,是当今国外图书情报界流行和影响较大的分类法,类目总数达 11 万多,21 种语言文本。

《美 国国会图书馆图书 分 类 法 》:是美国国会图书馆在馆长普特兰主持下编写的。是一个综合性等级列举式分类法。

第 2 章 国著名的资源系统有:万方数据知识服务平台,中国知网、中国高等教育文献保障系统、国家科技图书文献中心。

万方 数 据知 识 服 务平台:

全文类信息资源:1、中国学位论文全文数据库。2、中国学术会议论文全文数据库。3、中国标准全文数据库。4、中国法律法规全文数据库。5、中国专利全文数据库。6、数字化期刊全文数据库。

文摘题录信息资源:1、会议论文数据库。2、科技文献数据库。3、科技名人数据库。4、科教机构。5、科技成果数据库。6、中外标准数据库。7、企业产品数据库。

中 国 知网:数据库特色:1、种类繁多的文献类型:学术期刊、博士学位论文,优秀硕士论文,重要会议论文,年鉴,专著,报纸等。2、所有数据库产品都分为自然科学与工程技术文献和人文社会科学文献两大类。

3、出版容丰富多彩,主要包括基础研究、应用基础研究、工程技术。。。

4、数据库收录时间围:1912 年至今。

5、文献资源编辑方式:按照《中国图书馆分类法》分类汇编 10 个专辑,168 个专题。

6、提供学术期刊优先数字出版平台。。。。

..主要数据库:1、中国学术期刊网络出版总库。2、中国博士学位论文全文数据库。3 中国优秀硕士学位论文全文数据库。4、中国重要会议论文全文数据库。5、中国重要报纸全文数据库。6、中国专利全文数据库。7、国外专利数据库。8、国家标准全文数据库。9、国外标准数据库。10、国家科技成果数据库。11、中国年鉴全文数据库。中国引文数据库。

中 国 高等教育文 献 保障系 统。简称 CALIS,经过 10 年的建设,主要包括以下数据库。

1、联合目录子项目。2、引数据库子项目。3、高校学位论文库子项目。4、专题特色数据库子项目。5、重点学科导航库子项目。6、虚拟参考咨询子项目。7、教学参考信息子项目。

国 家科技 图书 文 献 中心:数据库主要服务容包括:全文文献,目次浏览,目录查询,热点门户,网络导航,参考咨询,预印本服务,特色文献服务。

第 第 3 3 章

图书是指通过一定的方法与手段将知识容以一定的形式和符号(文字、图画、电子文件等),按照一定的体例,系统地记录于 一定的形态的材料之上的著作物。

图书 按其容和 读 者 对 象可分 为 :专著、科普读物、教科书、参考工具。国际标准 ISBN 出版代号。

检 索中文 图书 常用的 书 目工具:1、《全国新书目》。2、《全国总书目》。3、《中国国家书目》。

联 合目 录 :揭示与报道个文献收藏单位所收藏文献的目录,按照地域围可分为国际性的、国家性的和地区性的联合目录,按文献类型可分图书联合目录、期刊联合目录。按收录文献的容围可分为:综合性的、专科性的联合目录。联合目录能扩大读者的检索和利用文献围,也便于图书馆书协调、馆际互借和实现图书资源共享。

目前,国 著名的 联 合目 录 主要有:中国高等教育文献保障系统的 CALIS 联合目录,国家科学图书馆组织编写的全国期刊联合目录。国外著名联合目录:WorldCat,WebPAC 等。

电 子 图书 :电子图书又称 e-book,是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备使用,并可以复制发行的大众传播体。其类型有:电子图书、电子期刊、电子报纸和软件读物等。

国 著名的 电 子 图书数 据 库 主要有:超星数字图书馆、北大方正阿帕比数字图书馆、中国外文电子图书全文数据库、时代圣典数字图书馆、中国电子图书馆、高校教参数据库等。P68 第 4 章 国 著名的 电 子期刊 数 据 库 主要有:全国期刊联合目录、万方数据知识服务平台下的学术期刊论文全文数据库及CNKI中国知网下的中国学术期刊网络出版总库。

第 5 章 学 位 论:

文:是表明作者从事科学研究取得创造性成果或有了新的见解,并依此为容撰写而成,作为提出申请授予相应的学位时评审用的学术论文。从学位名称划分:有博士论文、硕士论文、学士学位论文三中。特点:1、出版

..形式特殊。2、数量大,难以系统的收集、管理和交流。

中 国国 家 图书馆 收藏了我 国 所有博士的印刷版 学 位 论 文。中 国 高等教育文 献 保障系统 统 CALIS从 从 0 2000 年 开 始由清 华 大 学牵头 建设 设 S CALIS 高校 学 位 论 文 数 据 库。

中 国 知网 开发 了中 国 优秀 硕 士 学 位 论 文 数 据 库、中国博士学位论文数据库。P119 国 家 图书馆 博士 论 文 库:国家图书馆学位论文收藏中心是国务院学位委员会指定的全国唯一负责全面收藏整理我国学位论文的专门机构,也是人事部专家司确定的唯一负责全面收藏博士后研究报告的专门机构。

中文 电 子 学 位 论 文服 务 :主要收集来自地区各大学的学位论文。

P136 第 6 章 标 准:是为了在一定围获得最佳秩序,经协商一致制定由公认机构批准,共同使用的或重复使用的一种规性文件。可见标准是一种特殊文件,特殊规。

标 准文 献:

:狭义是指按规定程序制定的,经公认权威机构批准的一正太在特定围必须执行的规格、规则、技术要求等规性文献,简称标准。

广义是指与标准化工作有关的一切文献,包括标准形成过程中的各种档案、宣传推广标准的手册及其他出版物、揭示报道标准文献信息的目录、检索。

标 准文 献 的分 类 :按其使用围来划分:国际标准、区域性标准、国际标准、专业(部)标准和企业标准。国家保准 GB9400-1980.我国的标准文献数据库主要有印刷型、光盘型和网络型三种,检索我国印刷型标准文献的检索工具主要有:《中华人民国国家标准目录及信息总汇》《中国标准化年鉴》《中国标准导报》《中国国家标准汇编》《机械标准汇编》。光盘型的标准文献主要有:P152 我 国 著名的网 络标 准 数 据 库 主要有:中国标准数据库,国家标准全文数据库,国外标准数据库,中国标准全文数据库,中外标准数据库,中国标准服务网,中国标准咨询网,中国国家标准咨询服务网,中国标准网,标准网,国家标准化委员会,军用标准化信息网。

中国标准数据库是中国知网 CNKIZ 中的一个字库,从 1957 年至今,共计标准 8 万件。

国 外著名 标 准 数 据 库 :1、国际标准化组织(ISO)是目前世界上最大,最有权威性的国际标准化专门机构,任务是促进全球围的标准化。有 100 多个国家组成。代表中国参加是中国国家技术监督局。2、IEC 国际电工委员会。成立 1906 年,负责有关电气工程和电子工程的领域中的国际标准化工作。3、ITU 国际电信联盟,成立于 1865 年,是由法、德、俄等 20 国家组成。

第 7 章 科技 报 告:是记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告或报告文献,是在研究活动的各个阶段,由科技人员按照有关规定和格式撰写的,以积累,传播和交流为目的,能完整真实地反映其所从事科研活动的技术容和经验的特种文献。每份报告自成一册。

科技 报 告 类 型:按研究类型:基础理论研究和工程技术两大类。

按形式划分:技术报告,技术札记,技术论文,技术备忘录,通报,技术译文。

按流通 围 分:绝密报告,报告,秘密报告,非密限制发行报告,非密报告,解密报告。

..按研究资料来源分:实验报告,考察报告,研究报告,按研究进度分:初期报告,进展报告,中间报告,最终报告。

科技 报 告出版形式:一般以报告,札记,备忘录,论文,译文等形式出版。

科技 报 告 数 据 库:我国著名科技报告数据库主要有万方数据资源系统中的中国科技成果数据库,科技成果精品数据库,中国重大科技成果数据库,科技决策支持数据库,国家级科技授奖项目数据库,全国科技成果交易信息数据库等。

国 外著名的科技 报 告 数 据 库 :1、美国四大政府科技报告。2、英国航空委员会报告(ARC)。3、法国原子能委员会报告(CEA)。4、德国孙航研究报告(DVC)。5、瑞典国家航空研究报告(FFA)。

第 8 章 专 利有 双 重含 义,一是指申请人就某项发明创造申请的受法律保护的专利权,二是指申请受法律保护的发明创造本身。工业产权的主要形式就是专利权。

专 利 权有 有 3 3 个 特征:排他性,时间性和区域性。工业产权又将专利划分为 3 种类型:发明专利,适用新型专利,外观设计专利。

我 国 《 专 利法》 规 定:授予专利权的发明和实用新型,应当具备三性:新颖性,创造性,实用性。我国《专利法》规定,专利权限自申请日算起,发明专利权的期限为 20 年,实用新型专利权和外观设计专利权的期限为 10 年。

国际 性的 专 利 组织:1、保护工业产权巴黎公约。2、国际专利合作条约(PCT)。3、欧洲专利公约(EPC)。4、世界知识产权组织(WIPO)。

专 利文 献:狭义主要指专利申请说明书和专利说明书。专利说明书由扉页、正文和权项组成。

专 利文 献 特 点:容新颖、围广泛,出版迅速、传达信息块,容适用,分类方法科学,形式格式统一,重复出版量大,在时间上、地域上和容上有一定的限制性。

《 发 明 专 利公 报 》《外 观设计专 利公 报 》《 实 用新型 专 利公 报 》这三种公报检索是近期中国专利最有效的检索工具。国家知识产权局向公众免费提供检索服务。

其他 数 据 库:1、中国专利信息检索网。2、中国专利文献数据库。3、中国知识产权网。4、中国专利商标网。5、中国发明专利信息网。6、中国专利数据库。7、中华人民国特别行政区专利。

美 国专 利文 献 的种 类:1、发明专利:美国专利文献主体,占美国专利文献总量 95%,有限期 17 年。2、植物专利,限期 17 年。3、外观设计专利。4、再公告专利。5、防卫性公告。6、再审查证书。

美 国专 利文 献 的 检 索工具:1、美国专利分类表。2、美国专利局公报。3、美国专利索引。4、美国专利分类总索引。

因特网上免 费专 利 资 源:1、知识产权数字图书馆。2、美国专利数据库。3、美国 Delphion网。4、欧洲网上专利数据库。5、加拿大专利文献网上检索。还有法国专利文献网上检索,德国、罗斯专利文献网上检索,日本专利与商标数据库,世界知识产权组织。

第 第 9 9 章

会议 文 献:在学术会议上宣读和交流的论文、报告及其他有关资料都被称为会议文献,多数

..以会议的形式出现。是了解各国科技水平动态。跟踪和预测科技发展趋势,进行信息分析和信息研究的重要参考资料,是传递科技信息,交流科技成果与经验方面的重要科技信息资源之一。

按 组织规 模分 为:国际学术会议和国学术会议。

按照出版 顺 序分:会前文献、会中文献和会后文献。

国会议 文 献数 据 库:1、万方数据知识服务平台中“会议论文全文数据库”。2、中国知网中的“中国重要会议论文全文数据库”。3、国家科技图书文献中心。4、中国学术会议在线。

第 10 章 参 考工具 书:就是作为工具使用的一种特定类型的书籍,它是指根据一定的社会需要,以一定的编排形式和检索方法,为人们广泛汇集、迅速提供某方面的经过验证的浓缩的基本知识和知识线索,专供查考的特定类型的书籍。

参 考工具 书 的种 类:百科全书,字典或词典,年鉴,手册,机构名录,传纪资料,地理资料,书目,工具书指南。也有专家认为应分为:字词典,百科全书,类书,政书,年鉴,手册,名录,图书,表谱。

百科全 书:是概要记述人类一切门类知识或某一门类全部知识的完备的工具书,它搜集专门术语,重要名词,分列条目,加上详细的叙述和说明,提供定义、原理,方法、历史及现状、统计、书目等方面的资料。分为综合性和专科性百科全书。

国 著名的百科全 书 :1、《中国大百科全书》是我国第一部具有权威性,世界性的综合大百科全书,全书容包括哲学、社会科学、文学艺术、文化教育、自然科学、工程技术。

2、《简明中华百科全书》。3、《简明不列颠百科全书》。4《New Encyclopedia Britannica》。5、P214.网 络 百科全 书:1、《新不列颠百科全书》。2、《美国百科全书》。3、Encyclopedia.。4、国家百科全书网。5、百科全书网。6、中国大百科全书网络版。7、世界百科全书。

手 册:是汇集某一或若干学科和专科领域的基本知识,参考资料和数据,供随时查检的便捷性工具书。分为综合性手册和专业性手册。P220。

年 鉴:是逐年出版,提供相应年份各行业资料的工具书,常有幸被称为“微型百科全书”,既是各类动态性资料和事实,数据的综合性考察工具,也是编制百科全书类工具书的基本信息。

年 鉴 一般由:文献、慨况、专题论述、大事记、统计资料和附录组成。

国 外著名的年 鉴:1、《中华人民国年鉴》。2、《中国人物年鉴》。3、《中国统计年鉴》。4、美国《世界年鉴》。5、美国《咨询年鉴》。

网 络 年 鉴数 据 库:1、中国年鉴信息网。2、中国年鉴网。3 中国年鉴资源全文数据库。4、年鉴信息网。5、中国年鉴网络出版总库。

上一篇:求职岗位自我介绍下一篇:清明节买祭品