信息计量学论文范文

2022-05-15

今天小编为大家精心挑选了关于《信息计量学论文范文(精选3篇)》,供大家阅读,更多内容可以运用本站顶部的搜索功能。网络信息计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。

第一篇:信息计量学论文范文

我国生物信息学领域文献计量学研究

【摘要】本文应用文献计量学的方法,通过对我国生物信息学研究论文的时间分布、地区分布、期刊分布、高产单位和作者、论文/作者频率分布和合著情况等进行分析,以揭示我国生物信息学研究现状,为科研管理和人才培养提供一定的指导。

【关键词】生物信息学 文献计量学 研究现状

1 概述

1.1 文献计量学研究概况

文献是科学知识的载体,是科研成果的主要表现形式。文献的产生、分布、增长、老化和引证都与科学的交叉渗透和发展进化息息相关。文献信息源的定量研究开始于20世纪初,逐渐形成了以布拉德福(Bradford)定律、齐普夫(Zipf)定律、洛特卡(Lotka)定律、文献增长规律、文献老化规律、文献引用规律六大规律为主体的、比较完整、系统的文献计量学体系,并在后来的研究中得到不断的发展和完善。用文献计量学方法研究科学活动特征与科学发展规律,是文献计量学应用研究的重要内容。

1.2 生物信息学研究概况

生物信息学是采用计算机技术和信息论方法,研究生命科学中各种生物信息表达、采集、存储、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学等学科相互渗透形成的新学科。

生物信息学是20世纪80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科, 最初常被称为基因组信息学。生物信息学产生和发展的推动因素主要有以下三方面: 一是人类基因组计划; 二是信息技术的大规模应用; 三是生物医药的迅速发展及其经济的需求。伴随着基因组研究, 相关信息出现了爆炸性增长, 迫切需要对海量生物信息进行处理[3]。

2 生物信息学文献分布现状

笔者以CNKI中国期刊全文数据库为检索工具,本文以生物信息学为检索入口,以主题检索方式进行检索,并从中删除通知、会议、短讯、动态、简要、消息、新闻报道及部分不相关文献。处理后,共检出了1994年至2009年的5296篇生物信息学文献。

2.1 文献总量及年度变化

经统计,从1994年到2009年5月的生物信息学文献总量为5296篇,我国在1995年就有生物信息学文献刊载,这被认为是我国对生物信息粗浅的认识阶段;但早期的研究文献以综述或评论性为主,并没有进入深度的实验研究。1998年生物信息学文献量增长速度较快,但文献总量还偏低;2000年文献量剧增,累计文献量303篇。经过其后3年的发展,2004年和2005年两年的文献量基本持平,占总量的11.6%;2006年至今,文献量基本保持缓慢增长。从总体来看,文献量呈现逐年增长到基本保持平稳的态势,随着文献量基数越来越大,增长速度渐趋缓慢,表明学科正逐渐走向成熟。

2.2 论文的地区分布

1994年—2009年间,全国有30个省、市、自治区发表了生物信息学论文,但地区差异悬殊。我国生物信息学研究论文的地区分布极不平衡,北京以1113篇的发文量遥遥领先于其它地区,占总论文量的21%;其次是上海511篇,湖南295篇,广东251篇。上述居于前四位的地区发文量占总量的41%,可以视为我国生物信息学研究的核心地区。其它发文量居于前12位内的地区包括:江苏、重庆、浙江、陕西、山东、天津、辽宁和四川,这8个地区总的发文量是1482篇,占总量的28%,是我国生物信息学研究的有机力量。但是,贵州、青海、江西、宁夏、海南、河北和广西七省的累计发文量才158篇,只占总量的约3%,说明这些地区的生物信息学研究较为薄弱,亟待加强。值得注意的是,有美国(6篇)、英国(1篇)、荷兰(1篇)、德国(1篇)和新加坡(1篇)的作者在我国的相关期刊上发表生物信息学论文,体现了科研领域国际间的交流与合作,同时也可以看出我国的相关期刊努力吸引海外优秀论文,寻求在国际范围内的学术影响作用。

2.3 论文的期刊分布

5296篇文献分布在839种期刊上,按其载文量的多少排名,前22位期刊的载文量共1853篇,占总载文量的35%。其中,发文量最多的8种期刊是:世界华人消化杂志、生物化学与生物物理进展、生物信息学、医学信息、生物技术通讯、生物技术通报、遗传学报和中国生物工程杂志等。这些期刊的载文量大,论文质量高,代表中国生物信息学研究的前沿水平,可以被视为中国生物信息学领域的核心期刊。但是,上述的8种期刊总载文量为636篇,只占总论文数的12%;更多的文献则分散在其它期刊中。其中,仅刊载一篇相关论文的期刊多达485种,占总期刊数的58%,但其刊载的论文只占总论文数的20%。这表明我国生物信息学研究文献的分散程度很高,文献分散在大量不同的期刊中。其中,很多论文刊载在基础医学、临床医学、药学、计算机等学科的期刊上。

2.4 多产单位分析

根据对我国生物信息学研究文献的第一作者单位进行统计分析,共有475家单位发表过生物信息学文献。发文量在20篇以上的22个单位,共发文2383篇,占总发文量的45.2%,成为我国生物信息学研究较为集中的核心单位。在22个高产单位中有高等学校17个;科研机构4个,医院1个。说明高等院校和科研院所是生物信息学研究的主力军。从高产单位排名看, 中南大学产出的论文数量最多,其次是中国科学院、中国人民解放军第302医院、军事医学科学院和中山大学,这五个单位显示了其在生物信息学研究领域雄厚的研究实力和丰硕的研究成果。

2.5 高产作者分析

在对论文合作者进行处理时,不考虑作者在论文署名中的先后顺序,即只要在论文作者款目中出现一次,其频次计为1,最后,以每位作者的总频次为依据统计每位作者的发文量。另外,统计作者发文量时,由于同一学科中核心作者同名的情况较少,且不会对整体结果造成大的影响,因此,没有考虑作者同名的情况。

发文量在10篇以上的作者有70位,分布在19个不同的单位,分别为,解放军第302医院(21位)、上海第二医科大学(8位)、复旦大学(6位)、北京大学(4位)、北京地坛医院传染病研究所(3位)、军事医学科学院放射医学研究所(3位)、南华大学(4位)、中南大学湘雅医学院(3位)、中山大学(4位)、中国科学院(2位)、西安交通大学(2位)、苏州大学(2位)。从这些数据中可看出我国生物信息学高产作者主要集中在北京和上海,同时也表现出北京和上海在生物信息学研究领域的技术和人才优势。

2.6 论文/作者频率分布情况

科学论文是科研成果的主要表现形式,而且有大量的科研人员致力于某一领域的科学研究,但不同的研究人员攒写的论文数量有多寡之分。洛特卡定律正是对科学论文著者的不平衡分布规律进行了探讨。根据洛特卡定律我们可以明确,在宏观的科研著述活动中,少数作者写出了大量的文章,而大多数人的著述则是不多的。

我国生物信息学论文的作者数为7289人,仅发表一篇论文的作者有5321人,占作者总人数的73%;发文量在10篇以上的高产作者有95人,占作者总人数的1.3%。结果与洛特卡定律所揭示的规律基本相符。

2.7 合著情况

大科学时代,科学技术的发展在不断分化的基础上开始走向新的综合,学科间交叉渗透日趋加剧,许多研究项目和课题规模与难度不断加大,越来越依赖于各学科集体来完成,这些变化要求科研人员必须采用工业化原则,形成分工协作的研究模式。而科研合作最明显的表现形式之一就是合作论文。作者合作程度的高低能反映作者合作科研开展程度和合作智能发挥程度,一篇论文有适量的合作者可以相互取长补短,切磋琢磨,充分发挥群体的智力,使论文在知识含量、结构与写作技巧等方面更趋完善。同时合作论文可以改善科学劳动组织,增加科研成果数量,提高科学劳动效率。

评价论文的合作程度有合作率和合作度两个指标,合作率指合作论文占总论文数的比例,论文的合作度指论文篇均作者数,它们体现了作者的合作规模,亦即作者的智力合作规模,数值越高,说明科研合作力度越大,智力合作越强。

1994~2006年我国生物信息学论文的平均合著率为75%,平均合作度为3.65;高于自然科学期刊的平均合著率71.66%和自然科学论文的平均合作度3.02。合作度和合著率是略有波动,但总体上是呈逐年上升趋势。

3 结论及思考

(1)生物信息学文献量呈现逐年增长到基本保持平稳的态势。文献量基数越来越大,增长速度渐趋缓慢,表明学科正逐渐走向成熟。另外,在通过逐一阅读文献标题对数据进行筛选的过程中,作者有一个大致的印象:在早期,我国生物信息学描述性文献占有很大比重。随着科学界对生物信息学认识的不断深化,大量实验性研究的生物信息学文献不断涌现。很显然,我国的生物信息学研究取得了巨大的发展,但是大多论文都是基于医学(如肿瘤、肝炎)研究中新技术的运用,而对生物信息学的基础研究(如基因或蛋白数据库)则非常少。我国生物信息学研究有待向更深和更广的领域进军。

(2)我国生物信息学研究的地区分布极不平衡。北京、上海、湖南和广东在生物信息学领域具有领先的科研和人才优势。而河北、海南、宁夏、江西、青海等省份,生物信息学研究十分的薄弱。建议这些地区要充分利用自身的优势,整合特色资源,同时也要加强和外界的沟通与合作。

(3)我国生物信息学期刊的国际影响力还不够。而且,国内的研究机构或研究人员与国外共同完成的论文也较少,建议国内的研究主体要积极寻求国际间的交流与合作,并且提高科研活动的自主创新能力。

(4)生物信息学是个多学科交叉的知识、技术密集型学科,小规模合作不利于高层次研究成果的产生。因此,科研管理者更要注重营造开放和信任的环境,同时科研人员必须改变传统的单枪匹马式的科学研究模式,积极主动地与有关机构或个人开展实质性的科研合作攻关,特别是跨地域、跨行业、跨部门的合作。

(5)经过十几年的发展和积淀,我国的生物信息学研究已经达到一定的水平。基因组学的发展已经进入后基因组研究阶段,致力于蛋白质功能研究的蛋白质组学和功能蛋白质组学正在蓬勃发展。针对我国生物信息学发展的现状,我国要制定出其宏观发展战略,注重本国生物信息学研究队伍的培养和专项科技攻关资金的投入,在国际一体化的科技大潮中不断提高我国生物信息学研究水平。

参考文献

[1] 李后卿,罗爱静.卫生信息管理概论[M].北京:科学出版社,2002:38-40.

[2] 刘莉,王倩飞.国内脑血管疾病核心作者测定及其队伍演变规律研究.中南大学研究生学位论文.2006.

[3] 郭晓华,王欣强.生命科学信息时代的标志——生物信息学[J].沈阳教育学院学报.2005,(7):131.

[4] 王玉梅,王艳,金奇.基于文献计量的我国生物信息学研究发展动态[J].科技情报开发与经济.2002,(12):1.

[5] 杨彩霞.从作者分析看我国情报学研究队伍的状况[J].现代情报.2005,(10):153-157.

[6] 程现昆.我国生物信息学研究现状与展望[J].中国科技信息.2006,(8):242.

[7] 朱杰.生物信息学的研究现状及其发展问题的探讨[J].生物信息学.2005,3(4):186.

作者:付 云

第二篇:网络信息计量学及其应用

网络信息计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。它是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学;是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科;它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

1.网络信息计量学的研究对象

网络信息计量学的研究范围十分广泛,包括网络技术、网页中文献计量学方法、万维网的电子数据库分析、数字图书馆等。网络信息计量学的对象主要涉及3个层次:

(1)网络信息的直接计量问题。如,对集文字、图像、声音为一体的多媒体数字信息的计量方法研究,对以字节为单位的信息量和流量的计量研究等,包括计量站点的数量、静止的网页数、静止网页的平均规模、交互式网页的数量等。

(2)网上文献、文献信息及其相关特征信息的计量问题。如,网上电子期刊、论文、图书、报告等各种类型的文献,以及文献的分布、学科主题、关键词、著者信息、出版信息等的计量,既涉及此文献的计量,又涉及网上二、三次文献的计量问题。

(3)网络结构单元的信息计量问题。如,网络站点的文献信息增长、学科分布、信息传递,以及各单元之间的相互引证和联系等的计量研究。

当前,网络信息计量学更加注重科学计量学、文献计量学和信息计量学研究中与网络相关的内容研究。从2003年起,Webometrics将关注的焦点集中于以下几个方面:应用科学计量学方法对万维网和世界性的新闻组网络中科学信息的分析;对超文本链接现象、信息计量学规律、信息分布的数学模型分析;关于科学合作、科研组织、信息流和跨学科链接的网络影口向;电子科学杂志的评价以及在万维网上的快速处理程序的研究等。

2.网络信息计量学的研究方法

从目前情况来看,网络信息计量学研究方法大致可以归为以下几种类型:

(1)运用推理统计对数据进行统计分析。不少研究机构就是采用这种简单易行的方法,对网站数量、服务器数量、网络用户的特征及网络发展的增长率进行分析。这种方法的局限性在于,面对网络的迅猛发展及日益复杂的网络结构,统计数据难以保证准确性,需要构建一些宏观的测量统计指标体系。

(2)运用图论的方法对数据进行可视化研究,即运用网络绘图和信息技术来讲究网页间超链接的拓扑结构,直观反映网页间的关系。但其缺点是限制了对内容的研究,并且常常是自我结论性的,不具有普遍性。

(3)运用揭示数据聚簇和分散的工具进行数据挖掘研究。与统计方法相比,数据挖掘可对一个站点上的各种特征进行深度研究,包括站点的交通测度及各个国家IP地址的分布等,但它不能用来研究整个网络的特征。

(4)运用解释和模拟网络结构与增长的理论工具进行模型研究,即通过构建网络结构的模型来研究网络。如,网络的相互连接及拓扑结构,主要用于研究各个国家域的等级频次分布,网页之间和网页内部、外部的超链接等。

3.网络信息计量学

网络信息计量学的应用主要有以下几个方面:

(1)研究因特网的知识结构、网络信息的评价指标,指导和管理网络信息资源的组织建设。对于因特网的知识结构及其信息资源的发展状况,人们知之甚少。网络信息计量学的兴起则为把握因特网的发展状况,加强网络信息资源的组织管理提供了可能。对于因特网的知识结构,国外已有学者进行了探索,根据主题特征或国别特征进行计量。例如,阿曼德和英格维森将信息计量学方法应用于万维网上,利用AltaVista收集研究数据,通过对丹麦在网上的可视性及其科学数据库的发展情况的定量分析,得出了丹麦的网络发展严重落后于其他北欧国家的结论,其研究具有开创性的意义。此外,对网站链接的分析可以用于确定网络信息资源的权威性和可靠性。例如,阿·史密斯通过计算网站的被链接率来确定网站的网络影响因子。埃达等人发现网页的受欢迎程度可以用齐普夫定律来表述;运用布拉德福定律对核心期刊的测定方法就能找出所需的核心网站,由此便解决了网络信息检索中如何准确、快速查找信息资源的难题。

(2)在数字图书馆中的应用。网络资源的激增给数字图书馆的建设和管理带来了困难。网络计量学的发展将对数字图书馆的资源管理进行科学指导,并提供定量的依据,提高数字图书馆的管理水平,既可进行馆藏的动态维护,在探明信息资源数量特征的基础上判断其价值和实效性,又可对各类信息源的分布进行定量分析评价,确定出核心信息来源,有效地指导信息收集。

(3)研究网络环境下的科学信息交流,分析建立新的科学发展指标,为有关科技决策提供参考。通过对因特网上的有关各学科的站点、讨论组、电子期刊等的计量分析,可以掌握科学信息在网络上的分布;通过对相关网站之间的链接用于被引分析乃至利用专用软件分析特定对象的电子邮件使用情况,可以了解网上的科学信息交流情况。例如,尼泊尔学者戴哈尔将科学计量方法用于Web上的科学信息交流和科技信息指标分析,他运用了引文分析(包括对超链接的分析)方法,还将信息计量学的重要定律用于对网上信息分布规律的分析,从而对因特网及科技研究机构之间的科研合作、信息流动和科技政策实施的影响作了探索性的研究。

(4)研究网络信息资源的挖掘、分类、过滤与排序等,指导网络搜索引擎的研究开发。例如,凯勒随机选取了361个网页及其所在网站,利用Flashsitel.01每周搜集数据,对网页关键词和全文索引作分析,考察网页的超链接和其他引文系统、网上即时动态信息的特点及其分类,并提出了利用自动程序对网上动态信息进行抓取、过滤、测度和分类的方法。这一研究对于信息搜索过程的设计具有一定的参考价值。此外,Google搜索引擎则通过对搜索到的网页的超链接进行定量分析来对其搜索结果排序。

(5)网络信息资源的老化研究。在万维网上,一个网页或网站可能随时增加新内容而成为新网页、新网站,也可能因过时而从网上消失。个人主页和网站也可因内容长期未更新而被主页空间提供者关闭。一些网站也可能因不善经

营而关闭,而另一些网站则不时更新,使得网络信息资源变化迅速,同样也带来了信息老化的加速,甚至可能高于信息增长速度。对此,也可利用信息计量学的老化规律来研究网络信息资源的老化规律。以其高速变化的特性来看,网络信息资源的半衰期会越来越短。网页文件的最后修改日期这一信息十分有助于进行半衰期分析。此外,网络信息引用的相关链接也可以进行网络文献引文半衰期分析,从而判断该信息的领先和时效程度。

(6)研究网络终端用户的信息需求和上网习惯,指导网络建设和网站管理。由于用户上网行为的随意性和不易记录等特点,一些学者进行用户研究时,大都采用以下两种措施:一是使用专用软件进行动态跟踪;二是在网上进行交互式调查。卡洛斯在对万维网用户作定量研究时,就对Mosaic的50万用户进行实时跟踪,搜集数据作计量分析。凯瑟琳·雷等则专门对网络用户中的学生群体作了定量研究,采取的方法主要是问卷调查和数据分析。随着因特网的日益商业化,网上竞争日趋激烈,用户信息将显得尤为重要,这方面的计量研究必将增多。

4.网络信息计量学的发展趋势

网络信息计量学是一门新兴交叉学科,融传统文献计量学与现代计算机网络技术于一体,却不仅仅是文献计量学的简单继承,而是信息产业飞速发展的产物,基于其计量结果分析上的应用,将会对现代科研工作带来巨大的指导意义和学术价值。随着因特网的不断发展,网络信息计量学的作用与意义必将日益突出。网络环境下,网络信息计量学研究方式和内容都有了很大的发展,其未来的发展趋势如下:

(1)网络信息计量学数学模型的深入研究,包括对原有几大经典定律的修正与完善,以及在网络环境下的扩展。

(2)网络信息计量学分支学科的成型与发展,包括对理论的探讨,学科体系的架构等。

(3)引文分析——网络链接分析(包括XML、RSS、引文可视化等技术)技术的探索以及引文数据库的建设。

(4)内容分析法的深入研究,以及与网络信息计量学的融合发展(内容分析法从信息表层深入到对知识内容层面的分析)。

(5)计算机辅助计量的深入应用,包括计量分析软件和应用系统的开发等。

(6)基于网络信息的知识发现。

(7)网络信息计量学在科学研究与科技管理中的应用,在科学评价与科学决策中的应用。

(8)网络信息检索与网络信息计量学的结合应用,在设计检索系统的同时充分考虑计量的功能,建立检索与计量分析之间的系统接口,搭建综合集成信息服务平台。

(9)网络信息计量和数据挖掘的结合,以及它们在电子商务和企业竞争情报中的应用。

参考文献

1 邱均平,张洋.网络信息计量学综述.高校图书馆工作,2005,25(105)

2 邓湘琳.网络信息计量学在互联网上的应用研究.科技情报开发与经济,2002,12(4)

3 邱均平,陈敬全.网络信息计量学及其应用研究.情报理论与实践,2001,24(3)

4 沈嵘.网络信息计量学的研究及其应用.现代情报,2004(6)

5 苏云,曹正民.网络信息计量学的研究和应用.西北师范大学学报(自然科学版),2004,40(2)

6 陈亦伟.网络信息计量学研究农业图书情报学刊,2004,16(11)

7 龚立群,朱庆华.网络信息计量学的研究方法及应用.新世纪图书馆,2003(6)

8 李长志,李东洋,齐源.网络信息计量学的研究对象与方法.情报科学,2002,20(1)

9 张晓雁.网络信息计量学初探.情报杂志,2003(3)

10 徐久龄,许莲莲.网络信息计量学.情报科学,2002,20(1)

11 姜春林,鞠树成.略论网络信息计量学及其对科学计量学的影响情报杂志,2004(1)

12 邱均平.文献计量学.北京:科技文献出版社,1988

13 王崇德.文献计量学引论.桂林:广西师范大学出版社,1997

(作者单位:

朱良兵,纪希禹 四川大学公共管理学院 四川成都610064

李荣素 河北科技大学图书馆 河北石家庄 050018)

作者:朱良兵 李荣素 纪希禹

第三篇:基于SCOPUS的药学信息学文献计量学分析

〔摘 要〕为了寻找药学信息学领域内的核心文献群。为药学信息学的发展积累文献信息资源,以SCOPUS为数据源对药学信息学进行文献计量学分析,确定药学信息学的文献单元和出版单元核心集合。

〔关键词〕药学信息学;核心期刊;核心论文

作者:顾东蕾 朱正唯

上一篇:临床药理学论文范文下一篇:理论教育法论文范文