图书馆个性化服务数据挖掘论文

2022-04-30

【摘要】数字图书馆是图书馆模式的信息资源有序化组织和知识化管理,是下一代网络信息资源管理的主导模式。数据挖掘(数据库挖掘、文本挖掘、图像挖掘)技术就是信息资源管理的核心技术。本文针对数据挖掘技术在图书馆个性化服务管理中的应用进行探讨。以下是小编精心整理的《图书馆个性化服务数据挖掘论文(精选3篇)》,欢迎阅读,希望大家能够喜欢。

图书馆个性化服务数据挖掘论文 篇1:

数据挖掘在图书馆个性化服务中的研究

【摘要】图书馆拥有海量的信息数据,这些数据背后隐藏着许多重要的信息,通过对其进行科学的梳理和细分,挖掘数据背后隐藏的信息,从而为个性化服务提供决策和支持。文章在描述数据挖掘技术与方法的基础上,研究了数据挖掘在图书馆个性化服务中的应用特点、原则、分类等。

【关键词】数据挖掘;图书馆;个性化服务

引言

随着信息技术的不断发展与数字图书馆建设水平的不断提高,各高校都相继建立了自动化管理系统,这些管理系统中积累了大量的统计数据和表单,它们对图书馆馆藏建设等业务有着很强的指导作用。但目前对这些数据的处理还停留在用系统提供的工具进行初级的数据备份、查询及简单的统计阶段,而图书馆有必要增强对这些数据的处理能力以及对它们的组织能力。应用数据挖掘技术可以对系统中海量的信息进行深入的开发,提取信息的内在联系,为决策者获得知识和洞察力,从而优化图书馆资源建设,推动读者个性化服务,同时促进图情工作研究。

1.数据挖掘技术简介

1.1 数据挖掘的定义

数据挖掘定义有若干表达,在技术角度的定义比较公认的是W.J.Frawley,G.PiatetskyShapiro等人提出的:数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据提取隐含在其中的,人们事先不知道的,但又是潜在又用的信息和知识的过程。数据挖掘与传统的数据分析如查询、报表、联机应用分析(OLAP)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识,数据挖掘得到的信息应具有先前未知、有效和实用三个特征。

1.2 数据挖掘的过程

数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的,有效的,可实用的信息,并使用这些信息做出决策或丰富知识。

数据挖掘环境包括:数据库、挖掘工具、可视化工具和最终用户,见图2.1。

数据挖掘过程和步骤经过选择、数据预处理、数据转换、数据挖掘、分析和同化几个步骤。见图2.2。

1.3 数据挖掘的方法

数据挖掘有多种,从功能上分主要有关联分析、聚类分析、异类分析、分类与预测、偏差分析等。下面分别介绍几类重要的数据挖掘方法。

1.3.1 关联分析(association analysis)

关联规则挖掘是由rakesh apwal等人首先提出的,关联规则挖掘可以发现存在于数据库中的项目或属性间的有趣关系,这些关系是预先未知的和被隐藏的,它不能通过数据库的逻辑操作(如:表的连接)或统计的方法得出。这说明它们不是基于数据自身的固有属性(例如函数依赖关系),而是基于数据项目的同时出现特征,所发现的关联规则可以辅助人们进行市场运作,决策支持及商业管理,网站设计等。Apriori算法是挖掘产生布尔关联规则所需频繁项集的基本算法,也是最著名的关联规则挖掘算法之一。Apriori算法就是根据有关频繁项集特性的先验知识(prior knowledge)而命名的。该算法利用了一个层次顺序搜索的循环方法来完成频繁项集的挖掘工作。

1.3.2 分类(classification)

分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。

1.3.3 聚类分析(clustering)

聚类是把数据按照相似性归纳成若干类别,使得在同一类中的数据之间有较高的相似度,而不同类中的数据差别尽可能大。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。

2.数据挖掘在图书馆个性化服务中的研究

根据图书馆发展需要,构建读者信息数据仓库和图书文献数据仓库,并对其进行数据挖掘实现整合馆藏文献资源、指导图书采购与资源共享等目标。同时可以发现读者阅读兴趣习惯,划分读者群体,预测读者借阅行为,这些都使未来的个性化服务成为可能。

2.1 数据挖掘在图书馆个性化服务中应用的特点

2.1.1 大容量的数据库

图书馆每天每时都会产生大量的数据。每天读者的到馆数据;流通库里读者的借阅信息;电子阅览室里读者浏览电子文献、图书馆的数据库的信息等等。这些数据都可以作为数据挖掘的源文件。这些数据,形成了一个大容量的数据库。由于数据挖掘处理的对象往往是海量数据,因此操作与分析速度较慢。

2.1.2 文献的深度加工

数据挖掘对图书馆的文献深加工,使图书馆的工作有别于其他信息服务机构的基础性工作。图书馆利用新兴的数据挖掘技术对馆藏资源进行深层次加工,去伪存真,对知识信息进行分析、综合、整序,将新的、序列化的知识单元供给用户,以满足用户的多方面要求。

2.1.3 数据的时间性

图书馆的数据库是相对较稳定的,但是数据库中的数据是不断变化的。不同时间的数据集合不同,它的价值也不同。其保存的数据具有一定的时限,随着时间的变化,会不断增加新内容,越新鲜的数据对数据挖掘越有意义,对挖掘目标越有价值。因而,删去过时的信息以及对综合数据进行重新计算综合,对我们的挖掘更有用。

2.2 数据挖掘在图书馆个性化服务中应用的原则

2.2.1 真实性原则

真实性原则是指数据挖掘的数据对象要客观真实,如实地反映挖掘内容,要以实际发生的数据、信息为依据。挖掘对象需真实,因而挖掘数据的准备阶段需认真对待,不得伪造,或不用不全面的数据进行挖掘。真实性是对数据挖掘很重要的质量要求。

2.2.2 合理性原则

数据挖掘的内容要客观、适度,符合理性。具体要求是数据挖掘行为的动因应符合挖掘目的;挖掘行为应建立在正当考虑的基础上;挖掘行为的内容应合乎理性。各种数据有自身的特点,因挖掘的目的不同,选择数据挖掘算法时,要明智地全面考虑各种相关因素,实事求是地进行挖掘。

2.2.3 标准化原则

数据挖掘的数据标准化工作是图书馆数据挖掘的前提条件,直接关系到数据挖掘的效果。因此,在数据挖掘的数据选择上要注重数据格式的标准化和挖掘语言的标准化,确保数据在引进后即能投入使用。

2.2.4 实用性原则

实用就是务实不务虚,就是注重解决实际问题。数据挖掘一个很大的优点就是可以跳出人思维的局限,找到意想不到的有用信息。数据挖掘的结果要可读、实用。通过数据挖掘,能对图书馆的服务工作起到实际上的指导与帮助。实用性对数据挖掘的顺利实施和使用具有至关重要的意义,实用性的欠缺造成项目失败的案例在许多领域已经屡见不鲜,我们要引起高度重视。

2.2.5 可扩展性原则

一次完整的数据挖掘过程结束后,将来可能还会增加一些功能模块或者与其他技术互联、互溶,这就要求数据挖掘具有很好的拓展性,能够提供开放和标准的接口,在不影响正常使用的情况下与第三方灵活对接,以便有更好的发展空间。

2.3 数据挖掘应用在图书馆个性化服务中的分类

基于挖掘对象一数据的类型,数据挖掘可分为文本数据挖掘、web数据挖掘、图像与视频数据挖掘、关系数据库数据挖掘等。针对图书馆的个性特点与服务现状,图书馆主要有两种數据挖掘。

2.3.1 数据库挖掘

数据库挖掘的对象主要是数据库。数据库是人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据的集合,也称数据仓库。数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。对图书馆而言,最常用的可能就是关系数据库挖掘了。

在数据库中,利用可用的数据建立一个模型,这个模型对剩余的、未来的数据,对一个特定的变量(数据库中表的属性,即列)进行描述。一旦数据库稳定,功能顺畅,没有堵塞、丢失数据的现象,就能在不同操作环境以及操作习惯中长期平稳运行,甚至可以适合大规模的数据挖掘。

2.3.2 Web挖掘

当数据挖掘技术应用于网络环境下的Web中就成为Web挖掘(Web Mining),Web挖掘可以广义地定义为从WWW中发现和分析有用的信息。Web挖掘是一个前景非常看好的工具。我们知道,传统的效率低下的搜索引擎检索出的信息往往索引不完全、有大量的无关信息或没有进行可靠性验证。用户能够快速方便地从Web中检索出相关的可靠的信息是一个系统的最基本的要求.Web挖掘技术能够帮助图书馆员在设计站点时朝着方便用户、节省时间和高效率方向发展。

2.4 数据挖掘在图书馆个性化服务中应用的因素

2.4.1 要有比较明确的挖掘目标

我们在进行数据挖掘之前,首先要对数据挖掘有个全面、乐观的了解。盲目的数据挖掘是很难成功的。数据挖掘是一个工作量巨大、比较复杂、难度比较高的工作。因而,我们先要明确数据挖掘的目标。

2.4.2 做好基础数据库的建设

图书馆要实现数据挖掘的前提和基础是拥有大量、真实的数据积累。准备数据它是数据挖掘技术应用的基础工作,没有数据积累,数据挖掘将无用武之地。收集涉及读者借阅行为的大量信息,包括图书馆系统数据库中的读者借阅日志、网上留言、预约信息和续借信息等。其次,数据筛选和处理。对所收集的数据进行去除噪声数据、重复数据等筛选操作,再对筛选数据进行预处理和转换,建立动态的结构化数据库,这样有利于数据挖掘算法的进行。

2.4.3 人才配置与交流

数据挖掘必须由来自不同领域的人员共同参与,包括行业专家、数据管理人员、数据分析人员、业务分析人员、数据挖掘专家等。大家需要通力合作,尋找一套适合自己企业的开发方法,并逐步建立起挖掘的模型库。

目前,复合型项目人才一将难求。数据挖掘的当今市场,基本处在跨国巨头的垄断之下,至今未出现类似于ERP、SCM等领域的本土知名企业,连提供解决方案与咨询的厂商,其骨干及项目经验也多来自外企或国外。无论是软件开发商、咨询服务提供商或实施方,人才匾乏问题成为数据挖掘发展的一大瓶颈。

2.4.4 挖掘结果的解释与管理

数据挖掘是多种专家合作的过程,也是资金上和技术上高投入的过程。这一过程要反复进行并在反复过程中,不断地趋近事物的本质,不断地优先问题的解决方案。数据挖掘,不仅需要很高的资金投入,而且挖掘结果是供决策层决策使用的,必须得到最高决策管理层的支持、认可和参与。所以数据挖掘结果的解释与管理必须要引起重视。将结果解释得尽可能的清晰、易读、易懂,就能最大程度地被管理者接纳,并指导决策。

结束语

数据挖掘是一门年轻的技术,是一种增值服务。随着数据挖掘技术进一步成熟,我们将努力实现让数据挖掘支持图书馆各种移动环境。数据挖掘技术在图书管理系统中的应用,让我们看到其在数据处理、分析、组织以及信息挖掘等方面所表现出来的巨大潜力,相信不久的将来,随着数据库的不断扩容、网络技术在图书馆应用的不断植入、个性化服务理念的不断深入,数据挖掘技术将在图书馆的应用中大放异彩,而且能够在传统图书馆向数字图书馆的转变过程中起到很大的促进作用。

参考文献

[1]朱明.数据挖掘[M].合肥:中国科学技术大学出版社,2008.11.

[2]朱晓华.浅析数据挖掘技术在图书馆自动化中的应用[J].图书馆学研究,2002(5):

41-42.

[3]何少卓.浅谈数据挖掘及其在图书馆的应用[J].图书馆界,2004(3):52-54.

[4]王燕.数据挖掘在数字图书馆中的应用[J].情报科学,2003(2):211-214.

[5]宋丽哲,牛振东,宋瀚涛,等.数字图书馆的个性化服务[J].计算机工程,2004(2):46-48.

[6]向阳,张巍.基于事务数据库的关联规则采掘算法研究[J].山东大学学报:自然科学版,2001,20(2):55-59.

[7]宋丽哲,牛振东,宋瀚涛,等.数字图书馆的个性化服务[J].计算机工程,2004(2):

46-48.

[8]赵春燕.数据挖掘技术及其在高校图书馆的应用[J].北京政法职业学院学报.2007(3):94-96.

[9]龚宇花,刑耐生.数据挖掘技术在高校数字化图书馆中的应用[J].电脑知识与技术,2008,4(7):1547-1548.

作者简介:吴淼(1982—),男,硕士,工程师,西安财经学院图书馆信息技术部技术主管,已发表论文6篇。

作者:吴淼

图书馆个性化服务数据挖掘论文 篇2:

数据挖掘技术在图书馆个性化服务管理中的应用

【摘 要】数字图书馆是图书馆模式的信息资源有序化组织和知识化管理,是下一代网络信息资源管理的主导模式。数据挖掘(数据库挖掘、文本挖掘、图像挖掘)技术就是信息资源管理的核心技术。本文针对数据挖掘技术在图书馆个性化服务管理中的应用进行探讨。

【关键词】数据挖掘;图书馆;个性化服务

数字图书馆是图书馆信息服务朝网络化、电子化和数字化方向发展的产物,它是一个将计算机网络环境下信息资源收藏、服务和使用者集成在一起的环境,以支持数字化数据、信息和知识的生成、发布、传输、利用和保存。以下将结合数据挖掘技术进行具体地阐述。

一、数据挖掘技术

数据挖掘的基本思想是从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。从决策支持的角度看,数据挖掘是一种决策支持的过程,主要基于人工智能、机器学习、数据库技术等多种技术,能高度自动地分析企业原有的数据,进行归纳推理,从中挖掘出潜在的模式,预测客户行为,帮助决策者调整市场策略,从而减少风险,做出正确决策。从数据库的角度看,数据挖掘就是从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解的信息的高级处理过程。从定义中可以看出,数据挖掘是一个高级的处理过程,它从数据集中识别出用模式表示的知识。高级的处理过程是指一个多步骤的处理过程,多步骤之间相互影响、反复调整,形成一种螺旋式上升过程。数据挖掘的模式有多种,按功能可分为两大类:预测型模式和描述型模式。预测型模式是可以根据数据项的值精确确定某种结果的模式,挖掘预测型模式所使用的数据也可以明确知道结果。

二、数据挖掘技术与数字图书馆

(1)数据收集、存储和组织。数字图书馆系统面对的不仅仅是一个图书馆的馆藏资源,还包括各个联盟成员的馆藏信息及网上信息,这些数据的分布分散,再加上数据内容和数据特征的多样性都给图书馆进行数据存储和数据分析带来了很大的困难。面对这些问题,数字图书馆系统就必须采用新的数据存储思想,利用新的强大的解决方案,将数据分主题、有组织,系统地进行存储,在较高的层次上对分析对象进行了完整、统一的描述,保证了数据的完整性和一致性。(2)数据分析和知识挖掘。馆藏数据中隐藏着许多重要的信息,有必要对其进行更高层次的分析,以便更好地利用这些数据。由于传统的数据库系统缺乏数据分析和挖掘数据中隐藏的知识的手段,业务数据形式的复杂多样以及数据规模的庞大更使传统的决策支持系统无能为力。为了提高数据的利用率,急需一种技术能够从海量的数据中,快速地挖掘出有意义、有价值的知识,以支持信息咨询服务。数据挖掘技术的基本思想就是从数据中抽取有价值的信息,它可以帮助我们从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解的知识。影响我国图书馆事业发展的重要因素之一是管理水平不高。管理水平不高在很大程度上是由于决策方式不科学。传统的图书馆决策方式没有与时俱进地改进以适应时代的变化,多凭经验与感觉进行,往往存在片面、主观、盲目等问题。数据仓库技术使领导层决策的科学性更有保障。第一,数据仓库技术使决策所依据的信息更加充足。数据仓库将各种内部数据和外部信息汇集起来并进行处理和转换,形成随时可用、集中统一的决策信息,从而有效解决了决策所依据的信息不足的问题。第二,数据仓库技术使决策可靠度和可行性更高。数据仓库技术可以从多种角度对集成数据进行分析和比较,审查和验证决策假设,提高决策的可靠度和可行性。最后,数据挖掘工具可以从海量的历史数据中找出潜在的模式,并准确地做出预测。这样,图书馆决策者的创新思维能够得到充分激发,从而有效应对信息化给图书馆事业发展带来的挑战。(3)决策支持。数据仓库和数据挖掘技术是科学决策的有效工具,通过下面案例可以了解它们在图书馆服务中的应用。案例:基于数字图书馆的领导决策信息咨询服务系统图书情报机构拥有强大的信息资源优势,有全面、准确提供信息服务的手段,有对信息进行分析、综合、浓缩、转换与创新的条件和实力,已经具备为领导决策提供信息咨询服务的能力和优势。但是,图书情报机构并没有成为领导决策信息咨询服务的重要组成部分。究其原因,一是信息咨询服务形式乱而无序,缺少有针对性的某一领域和某一专业的信息咨询服务,没有形成统一管理、统筹安排、有针对性地提供服务的格局;二是缺乏对信息的深加工,不能为决策者提供直接、有效的知识。因此,在今后的信息咨询中,图书情报机构需要做好以下两点:一是信息资源建设的针对性。图书情报机构应分析自己的馆藏信息,确定信息咨询方向,有针对性地全面采集某一领域或某一专业的信息,形成信息优势。二是采用先进的信息技术(如数据挖掘技术和数据仓库技术)对馆藏数据库进行深加工。馆藏数据中隐藏着许多重要信息,蕴涵着丰富的知识,如果能把这些信息和知识从数据库中抽取出来,进一步加工,将为决策创造很多直接的、潜在的支持。数字图书馆是图书馆信息服务朝网络化、电子化和数字化方向发展的产物,它是一个将计算机网络环境下信息资源收藏、服务和使用者集成在一起的环境,以支持数字化数据、信息和知识的生成、发布、传输、利用和保存。在数字图书馆系统中,增加数据挖掘、数据仓库系统,就能对馆藏资源进行深加工,更好地进行决策咨询服务。(1)特色源数据库是指某一特定咨询领域的信息集合。(2)数据挖掘、数据仓库是决策信息咨询的技术基础,数据仓库为有效支持决策分析提供了全局一致的数据环境,数据挖掘从数据库中搜索出有价值的决策信息。(3)信息采集是手工采集和网络机器人采集相结合。(4)信息检索服务包括图书馆业务中的内容检索、元信息检索和决策信息检索。

三、发展前景

数字图书馆作为图书馆的未来发展趋势,在实践中面临许多困难,其中之一就是知识的有效组织与发现。由于数据仓库技术在数据的组织与分析、数据挖掘、知识发现等方面具有的巨大潜力和优势,所以可以为数字图书馆的建设提供关键技术。例如:借助和参考数据仓库技术,人们可以进行海量信息的有效存储和利用,元数据的界定与自动抽取,超大规模分布式数据库的快速存取以及实现分布式资源库互操作性。中国数字图书馆工程在数字图书馆建设中对数据仓库技术实际应用进行了有益的尝试,工程的一个重要部分就包括建立分布式存储、集中式管理的大型数据仓库,并对其进行智能化的管理与挖掘,再通过个性化和智能化的人机交互界面实现网络信息服务。未来社会是信息的社会。可以预见,信息技术将在未来的图书馆中得到更加充分的运用。目前,数据仓库技术在图书馆领域的应用虽然还处于起步阶段,但基于其在数据的组织、分析和知识发现等方面的巨大优势和潜力,应用前景将十分广阔。

四、结论

网络时代的图书馆咨询需求将转向更为广阔的信息源,要求接受咨询的人员提供综合度更高、附加值更大的信息产品。数据仓库作为新型的信息架构,为咨询馆员提供了一个广阔的查询数据源。同时,数据仓库为分析和挖掘信息提供了一个良好的数据环境,一方面咨询馆员可以从海量数据中分析出事物之间的联系,找到隐藏其中的信息规律,为用户提供深层次信息产品。另一方面,咨询馆员还可以通过分析用户的历史咨询记录,了解他们的研究方向和兴趣所在,从而提供主动的个性化信息服务。

参考文献

[1]刘志勇.关联规则数据挖掘在图书馆藏书建设中的应用研究[J].电子设计工程.2011(21)

[2]陈东莉.基于遗传算法的数据挖掘技术在图书馆中的应用研究[J].计算机与现代化.2012(1)

[3]周文云.数据挖掘在数字图书馆个性化服务中的研究与应用[J].军民两用技术与产品.2012(1)

作者:谢旭明

图书馆个性化服务数据挖掘论文 篇3:

数据挖掘技术在高校数字图书馆个性化服务中的应用

摘要:随着计算机技术的不断发展,当今社会已经逐渐进入了大数据时代,在大数据时代中,数据挖掘技术也在各个领域使人们的生活更加方便。数据挖掘技术是基于大数据时代下的一种新型数据分析类技术,该技术可以针对不同的用户提供数据分析得出的个性化服务,目前这项技术已经被应用在了许多领域,文章分析了其在网购领域以及许多对用户需求有要求的软件之中得到的应用。

关键词:数字图书馆;数据挖掘技术;大数据;个性化服务

1 数据挖掘技术概念简述

数据挖掘技术是大数据时代下的重要数据分析技术之一,又称为数据处理技术,数据挖掘技术是从数据本身来考虑,通常数据挖掘需要有数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。数据挖掘的具体操作方法有8种,分别为:神经网络、遗传算法、决策树算法、粗集算法、覆盖正例排斥反例方法、统计分析法、模糊集方法以及挖掘对象。一般数据挖掘技术在应用过程中的挖掘对象都是根据信息存储格式,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及互联网等。

数据挖掘技术简单来讲就是在数据库中发现线索或者知识、进而对这些线索知识进行分析。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标,而数据挖掘技术的研究目的就是出于人们的简单需求,通过用户使用各种软件的需求量以及定向性来进行数据处理以及数据挖掘工作,进而更加方便的挖掘用户的心理及用户的需求信息,以便于进一步为用户提供定向性个性化的服务[1]。目前,数据挖掘技术已经被广泛地应用到人们的生活之中,在零售业以及网购平台中的有效应用也是数据挖掘技术的一个成功案例,因此,在研究数据挖掘技术在高校数字图书馆中的应用時,也可以对该技术的某些其他领域成功案例进行借鉴分析,进一步提高数据挖掘技术在数字图书馆技术中的有效应用。

2 数字图书馆以及其个性化服务中的大数据技术概况

数字图书馆是在新时期计算机技术的硬性下诞生的一种数字处理的网上图书馆。这种图书馆的形式与传统的实体图书馆形式不同,可以更方便的使读者得到想找的信息,也就是说是一种没有围墙的图书馆。这种虚拟的、数据的图书馆形式在目前的许多高校中得到了广泛的应用。

2.1 数字图书馆

数字图书馆是一门全新的科学技术,也是一项全新的社会事业。简而言之,数字图书馆是一种拥有多种媒体内容的数字化信息资源,能够为用户提供方便、快捷、高水平的信息化服务机制[2]。

数字图书馆不是图书馆实体:它对应于各种公共信息管理与传播的现实社会活动,表现为种种新型信息资源组织和信息传播服务。它借鉴图书馆的资源组织模式、借助计算机网络通信等高新技术,以普遍存取人类知识为目标,创造性地运用知识分类和精准检索手段,有效地进行信息整序,使人们获取信息消费不受空间限制,很大程度上也不受时间限制。另外,在高校数字图书馆之中也加入了许多个性化服务,这些个性化服务本身就利用了数据挖掘技术以及大数据技术的理念,这些理念的加入也使得数字图书馆的便利程度加大,在很大程度上解决了学生的读书、找书等问题。

2.2 个性化推荐服务

在一个高校之中,图书馆是重要的学校建筑物之一,因为许多学生为了学习、复习或者提高个人修养都要去图书馆进行读书或查找资料。然而数字图书馆的形式在丰富了学生的读书范围同时,也方便了学生查找文献。在数字图书馆中有一项个性化服务为个性化推荐,个性化推荐的主要目的是为学生提供精准的书目推荐,这也是大数据技术中的重要项目之一。

许多学生在进行学习研究时通常需要找寻特定的文献或者书籍,但在图书馆当中,书籍之多、文献之广常常使学生捉襟见肘。数字图书馆中的个性化推荐就解决了学生的这一问题。数字图书馆在对学生进行推荐书目时,数据挖掘技术就会对学生的图书搜索方向以及图书浏览方向进行专业的测算分析,进而为学生推荐出符合学生需求的书籍名目,以便于学生参考,这种技术就类似于对学生需求书目的预测,其技术核心是对学生的检索以及学生过去使用数字图书馆的浏览记录以及需求方向进行的测算[3]。

2.3 个性化推送

个性化推送也是数字图书馆中的一项个性化服务内容,其含义是通过大数据技术手段向学生推送他们所需求或者所喜爱的内容,进而对学生的需求方向进行分析推送。个性化推送服务有助于学生在进行研究时查找类似文献时使用,由于学生在进行研究或者论文写作时经常出现不知道该查找那些具体文献的情况,因此,在使用数字图书馆时,图书馆会为学生提供个性化推送,进而提高了学生查找文献的效率,还可能为学生带来许多意外的收获,在一定程度上扩大了学生的阅读范围,给学生提供了方便,在一定程度上减少了查找书籍的时间。

2.4 个性化检索服务

个性化检索服务是数字图书馆中的重要个性化服务之一,其主要内容有两方面,一是精准检索,二是模糊检索。个性化检索与传统的图书检索功能不一样,在传统的检索功能中,学生进行图书检索只会搜索出题目名称完全一样或者近乎一样的文献,而在数字图书馆的个性化检索中,学生搜索一本书籍的名称可能会出现许多内容相似但名称不相似的书籍[4]。

3 数据挖掘技术在高校数字图书馆个性化服务中的应用方向

在大数据时代下,数字图书馆要进行更为深入的发展,数据挖掘技术要想在数字图书馆的个性化服务中得到更为有效的应用,就要明确新时期的应用方向。本文从个性化推荐以及个性化检索和推送3个方面具体地对高校数字图书馆个性化服务的应用方向进行了分析。

3.1 数据挖掘技术在个性化推荐中的应用

数据挖掘技术的主要应用方向就是在个性化推荐服务之中,数据挖掘技术可应用在个性化推荐之中可以使学生更好的得到所推荐的书目,在大数据的环境下,数字图书馆的研发人员可以通过数据挖掘技术中的具体算法进行更为深入的研究与发掘,进而提高个性化推荐的精准度,使数据挖掘技术更有效地应用在数字图书馆个性化服务之中。

3.1.1 文献关联算法的应用

在具体的数据挖掘算法应用过程中,研发者可以参考数据挖掘技术在网络零售行业内的成功案例,通过对学生搜索或者使用的文献之间的关联性进行其文献关联算法的应用,并结合学生在最近阶段的浏览历史以及查阅的文献内容类别进行文献关联,进而提高个性化推荐的精准度[5]。

3.1.2 用户评分分析算法的应用

一般每个学生在查阅文献或者寻找书籍时,其大体寻找的文献书籍相似度较高。在进行推荐时对学生进行更为精准的优化推荐,就需要在这些相似文献中进行用户评分分析测算,即通过学生对相似文献的打分情况以及阅读时间进行测算分析,进而为学生提供同类别文献内的最优选项。

3.1.3 自动过滤算法的应用

在个性化推荐服务中,不仅需要通过测算进行文献书籍的推荐,而且还需要通过过滤算法进行文献的过滤工作,通过对学生的需求测算,从学生的历史浏览以及用户评分等方面为学生过滤掉其不喜欢的内容,这样可以提高学生的文献查找精度,并且为学生带来更好的文献查询体验。现阶段,数据挖掘技术的过滤算法有3种,协同过滤推荐、基于物品的协同过滤推荐、基于模型的协同过滤推荐。

3.1.4 混合推荐算法的应用

最后,数据挖掘技术在个性化服务中还有一个研究方向就是混合推荐算法的应用。混合推荐算法是数据挖掘技术中推荐技术内的多种推荐结果合并的算法,这种算法的优点在于可以为学生提供一个全方位的推荐书目,避免了学生出现对文献需求过度的现象。

3.2 数据挖掘在个性化检索和推送中的应用

数据挖掘技术在个性化检索、推送中的应用深度明显要低于在个性化推荐中的应用。在具体的个性化推送以及检索中的应用可以在其检索引擎中进行应用,通过对检索引擎内的各种链接数据以及用户搜索关键字词的分析测算进行检索优化[6]。在推送中可以借鉴个性化推荐中的测算方法进行推送,进而提高推送质量,过滤掉质量较差的推送内容,避免出现推送内容单一的情况。

4 结语

在当今社会的高速发展过程中,大数据时代已经来临,数据挖掘技术也得到了更为深入广泛的应用,本文从多方面对数据挖掘技术在数字图书馆个性化服务中的应用,进行了简要的分析和讨论,数据挖掘技术的深入应用及优化有利于高校师生对数字图书馆的满意程度,进而提高高校师生的文獻查找体验。因此,数据挖掘技术在高校数字图书馆个性化服务中的应用优化不仅有利于大数据技术的优化,更有利于我国高校教育事业的发展。

[参考文献]

[1]郅秀丽.基于信息素质教育视阈下的民族地区高校图书馆个性化服务提升策略——以宁夏大学图书馆为例[J].图书馆理论与实践,2015(12):78-81.

[2]叶春蕾,冯路,冷伏海.数字图书馆个性化服务中用户弱信息需求模型研究[J].图书情报工作,2012(15):25-30.

[3]何胜,熊太纯,周冰,等.高校图书馆大数据服务现实困境与应用模式分析[J].图书情报工作,2015(22):50-55.

[4]李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016(2):60-68.

[5]柳益君,何胜,熊太纯,等.大数据挖掘视角下的图书馆智慧服务——模型、技术和服务[J].现代情报,2017(11):81-86.

[6]庄经纬.基于社会网络分析方法和数据挖掘方法的网络论坛定量分析[D].重庆:重庆大学,2010.

作者:赵志远 孙剑华 汪方正

上一篇:社区健康服务机构绩效管理论文下一篇:供电企业用工成本劳动关系论文