图书馆图书推荐算法

2024-05-06

图书馆图书推荐算法(精选十篇)

图书馆图书推荐算法 篇1

数字图书馆逐渐向自动化、智能化、个性化发展。数据资源丰富,属性众多,信息冗杂,但是有效利用率并不高,而且读者接受的服务并不具有针对性。个性化图书推荐可以根据个人图书借阅历史、用户的浏览痕迹和用户的资料,找出学生或者老师可能感兴趣的图书,由此向学生或者老师推荐相关的图书,图书推荐的方式有很多方法,例如基于内容的推荐、基于关联规则的推荐和基于协同过滤的推荐等。

协同过滤是分析用户兴趣,并找出与当前用户有共同喜好的用户,然后根据相似用户对某一项目的喜好度,预测当前用户是否喜欢此项目,由此作出推荐。算法的推荐原理非常的简单。用户的信息与项目在预测部分要事先预处理下,然后输出推荐的结果。

2协同过滤算法的分类

根据Breese等学者的研究,可将协同过滤算法分为两大类:基于模型的协同过滤算法(Model.Based Collaborative Filtering)和基于记忆的协同过滤算法(Memory—Based Collaborative Filtering)。

基于模型算法的主要思想是根据机器学习或者统计方法对用户的评分信息进行建模,通过建好的模型来预测用户的喜好度,以此来作出推荐。常用的建模算法有潜在语义技术、聚类技术、Bayes算法以及支持向量机等算法。支持向量机算法具有实时性较好,稳定性较高,但是需要建立大量的模型,并且费用较高。

基于记忆的协同过滤算法主要分为基于用户的协同过滤算法(User-based Collaborative Filtering,UBCF)和基于项目的协同过滤算法(Item-based Collaborative Filtering,IBCF)两类。在本文中,将详细介绍基于项目的协同过滤算法。

3基于项目的协同过滤算法

基于用户的协同过滤推荐算法㈣有扩展性和稀疏性问题,在2001年,Sarwar等人提出了基于项目的协同过滤算法[351。其基本原理用户对项目进行喜好评分,根据这些评分计算项目之间的相似度,把相似的项目推荐给用户。原理如图1所示。

从图1中可以看出学生A对图书1和图书,3感兴趣,学生B对图书1、图书2和图书3感兴趣,学生C对图书1感兴趣,可以推出,图书1和图书3是比较相似的,对图书1感兴趣的学生可能也对图书3感兴趣。由此也可以推出学生C对图书3也比较感兴趣,可以考虑将图书3推荐给学生C。

基于项目的协同过滤算法主要有三个步骤,先计算项目之间的相似度,然后选择近邻,最后作出推荐。

(1)项目之间相似度的计算。常见的计算相似度的算法有Pearson相关系数法(Pearson Correlation Coefficient)、余弦相似度法(Cosine Similarity)和调整余弦相似度法(Adjustment Cosine Similarity)。例如:Pearson相关系数:计算两个项目之间的线性关系,如式(1)所示

在上式中,simuv表示项目u和v之间的相似度,rui是用户u对项目i的评分,rvi是用户v对项目i的评分,ur是用户u在已经评价过的项目上的平均分,vr是用户v在已经评价过的项目上的平均分。

(2)寻找相似邻。计算了项目之间的相似度后,寻找相似近邻。最常用的寻找相似近邻有K均值方法和设阈值法。

(3)产生推荐。主要有两种方法:Top-N推荐列表和预测当前用户对项目的评分。考虑到求平均值是不太理想的,有人提出了使用加权平均值方法。主要两种方法,具体如式(2.10)与式(2.11)所示。

其中,simnuv为项目间的相似度,项目间的相似度越大,则预测评分的影响就也越大。

4算法实验验证

本文实验评估仍然基于Book.Crossing数据集,学校图书馆中用户对图书的评分从2003年到2015年的评分有1e10条记录,是由1e6个用户对5e5的评分,这些评分是0~5,0表示用户不喜欢,5表示用户非常的喜欢该本图书。对算法进行测试,测量真实评分与预测评分之间的平均绝对误。算法运行5次,平均误差小于0.5%,因此,说明算法具有很好的推荐效果。

5结语

阐述了协同过滤推荐算法的相关理论,重点介绍基于项目的协同过滤算法,算法的步骤可以分为项目之间相似度的计算、寻找相似邻和产生推荐三个方面。实验结果表明,该算法具有一定的推荐效果。

参考文献

图书馆读书推荐 篇2

三月春日,阳光明媚。让我们闲暇时分来读读心理学吧!图书馆在向你招手哦~

第二周推荐:

1.《好好说话》:新鲜有趣的话术精进技巧

蔡康永、罗振宇、高晓松联袂推荐,李笑来、樊登作序推荐。200000+用户已深受影响,奉之为说话宝典。金句遍布网络,《奇葩说》人气选手系统阐述,倾囊相授。话语是一种权力。

2.《哲学家们都干了些什么》 严谨又不严肃的哲学史,轰动豆瓣的奇葩之书,用穷凶极恶的吐槽和喜闻乐见的八卦,瓦解你对哲学史的成见!

3.《好的孤独》

新闻联播推荐!孤独藏有巨大的精神力量,找到它你就可以脱胎换骨。复旦名师陈果博士,用哲学的方式告诉你,孤独的自己有多强大。

4.《恐怖密码》:那些你恐惧的行为,心理学都有答案

恐惧就像喜悦一样,是一种正常的情绪,不要为换上恐惧症而恐惧,找到恐惧的根源是克服恐惧的开始。

5.《儿童性格色彩心理学》

图书馆图书推荐算法 篇3

作者:史蒂芬·霍金 出版社:湖南科学技术出版社

出版日期:2002年2月 推荐指数:★★★★

内容简介:相对论和量子论是20世纪最伟大的科学成就,尤其是前者,完全是人类智慧的伟大构筑,所以在《果壳中的宇宙》的第一章《相对论简史》中主要是关于爱因斯坦的生平。量子论则是实验观测的被动产物,它的含义迄今还解释不清。在广义相对论中,时空不再是一个被动的背景,而是宇宙演化的主动参与者。物质分布使时空弯曲。现在再去侈谈宇宙之外的空间和时间,对这些概念进行所谓的思辨,只能是倒退到圣奥古斯丁之前。

《大设计》书号:9787535765444 定价:48.00元

作者:史蒂芬·霍金 出版社:湖南科学技术出版社

出版日期:2011年1月 推荐指数:★★★★

内容简介:宇宙何时并如何起始?我们为何在此?为何是有非无?何为实在本性?为何自然定律被这么精细地协调至让我们这样的生命存在?科学能否提供另一种解释?这些均在《大设计》中有所解释。根据量子论,宇宙不仅具有单独的存在或历史,而且同时存在每种可能的历史。把这种思想应用于宇宙整体,就对因果概念本身提出疑问。

《时间简史》书号:9787535744517 定价:38.00元

作者:史蒂芬·霍金 出版社:湖南科学技术出版社

出版日期:2006年1月 推荐指数:★★★★

内容简介:史蒂芬·霍金那本畅销世界的《时间简史》已成为科学著述的里程碑。这不仅归因于作者迷人的表达方式,还归因于他讨论的令人敬畏的主题:空间和时间的本性,宇宙的历史和将来。虽然本书在篇幅上的确是“更简明”些,但它实际上扩大了原书伟大的论题,删除了纯粹技术性的概念,诸如混沌的边界条件的数学等。相反,包括相对论、弯曲空间以及量子论的课题,它们虽然具有无穷的趣味,但由于散布于原书而很难理解,现在则各自分章论述。

《霍金经典著作合集(大设计+时间简史)——限量版》

书号:9787535769992 定价:78.00元

作者:史蒂芬·霍金 出版社:湖南科学技术出版社

出版日期:2012年1月 推荐指数:★★★★★

内容简介:本书为2012年最新出版的限量版霍金合集。它将纷繁复杂的宇宙物理学首次用极其通俗的语言介绍给一般读者,使读者对现代物理学有透彻清晰的了解。霍金以精彩而简朴的非专业语言表述了有关宇宙奥秘的最新的科学思考。

图书馆图书推荐算法 篇4

个性化推荐系统 (PersonalizedRecommenderSystems) , 就是在互联网上使用数据挖掘等技术, 为客户提供智能化、个性化的服务, 使互联网从过去的“人找信息”发展到“信息找人”的智能阶段。个性化推荐系统已经在电子商务网站和数字图书馆等方面被不同程度地应用, 而基于关联规则的推荐 (Association Rule-based Recommendation) 则是其中最重要的技术之一。

本系统将利用现有的图书管理 (销售) 系统中用户对图书借阅 (收藏或者购买) 的记录, 通过关联规则的原理, 使用改进的算法, 分析图书之间的关联度。根据分析结果, 向管理者提供图书之间的关系, 向借阅者推荐相关图书, 增进借阅量, 该方法也能用于图书销售, 使用户快速发现相关的书籍, 增加销量。

本文分析了现有的关联规则算法, 提出减少每次计算量的改进方法, 并给出改进后的算法。

1 算法

1.1 现有算法分析

在关联规则领域, 主要的基本算法是Apriori算法。这是一种广度优先算法, 通过多次扫描数据库来获取支持度大于一定阈值的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁的;非频繁项集的任一超集一定是非频繁的。然后从这些频繁项集中获得项之间支持度大于一定阈值的结果集, 从而得到商品相互之间是否是有关联。

利用现有的算法获得所有商品之间的关联度, 需要多次扫描整个数据库, 第二次扫描时还要统计不同记录组合的出现次数, 时间复杂度接近O (N2) 。在数据项数量不多的情况下计算、统计的次数并不多, 现有的图书系统中, 书籍、用户的数量都是上万甚至上十万。以Nb=1*104种图书, Nu=5*104用户为例, 首先获得频繁项需要扫描S1=Nu=5*104条用户的图书记录, 假设获得的频繁项集占4%为R1=4*103条;之后计算频繁项之间的关联度, 将再次扫描S2=Nu=5*104条用户的图书记录, 并且每条记录需统计7.998*106种组合以确定频繁项集, 一共计算了大约4*1011次。实际应用中, 图书和用户之间的关系是不断变化的, 每隔一段时间又要进行一次计算, 一般服务器难以承受这种计算量。

1.2 改进方法

现有算法的主要问题是计算次数过多, 虽然可以采用将数据库条目合并或压缩, 数据分区或抽样等方法来简化统计量, 对于一个正在提供服务的网站, 实用性不高。针对这种状况, 可以在用户浏览单个图书时, 仅通过该图书来获取有限的关联项, 从中筛选出频繁项, 将结果缓存, 超过时间限制后再重新计算, 这样既可以减少单次的计算量, 也可以保证推荐列表的实时程度。这种方法比原有方法更有针对性, 获得中间结果集的规模缩小, 推荐集的计算量减小, 并且在用户使用过程中将会逐渐完善图书之间的关联信息。

该算法对于指定的一本图书, 第一次扫描数据库获得所有收藏 (或购买) 了该图书的用户, 获得选择的所有图书, 作为中间结果集合。第二次扫描这些图书, 统计清单中所有图书的出现次数, 此时出现次数与中间结果集合条目总数之比即为支持度, 当其大于一定阈值时可认为是与指定图书有关联。该方法在第一次获得中间结果集时, 不去考虑与指定图书无关的条目, 这样得出中间结果规模将明显缩小, 之后可以快速地获得频繁项。该算法的时间复杂度为O (MN) , M为中间结果数量, 当M远小于N时, 复杂度近似于O (M+N) , 性能有很大提高。

仍以Nb=1*104种图书, Nu=5*104用户为例, 根据指定的一本图书, 获得所有收藏 (或购买) 该图书的用户列表, 假设数量为L1=8*103, 并假设这L1名用户选择图书占总图数量的50%即5000。第一次扫描S1=Nu=5*104条用户的图书记录, 第二次只扫描S2=L1=8*103条记录, 每条记录统计5000本书的出现次数。总计算次数大约S2*5000+S1=4*107次, 即使第二次扫描记录量仍为N u=5*104, 总计算次数也只有2.5*109次。可见每一次的计算量明显少于原有算法, 平均情况下, 使用合理的编程方法, 一般的服务器系统是可以运行的。这样就将原来大量的计算分散开来, 虽然想获得所有任两本图书之间的关联, 计算量并没有减少, 分散后, 每次的计算量在实际应用中是可以接受的。

该算法的一个重要特点是可以直接使用SQL语句来实现而无需其他语言的辅助。对于一个常见的数据库系统, 可以将其写成一个数据库函数, 应用开发人员通过编写的程序调用, 既可以迅速运行, 又方便管理。

2 结语

关联规则的算法, 对于单个项数据的要求不高, 但需要大量的关联数据。本系统通过提高推荐时的针对性, 分散计算商品间关联度的过程, 减轻每一次计算的复杂度, 使其可以在用户每次访问时获得推荐结果, 并且通过缓存结果集的方法进一步提高速度。本推荐系统将在互联网领域为用户提供更加便捷、有效的用户信息获取体验。

摘要:讨论了现有的关联规则推荐算法, 运行时每次的运算量巨大。提出一种基于数据库系统的推荐算法, 将有趣性发现的运算分散到用户的每次访问, 以减少单次的运算量。该算法主要由SQL语句写成, 基于数据库, 具有平台独立性, 拥有一定的准确性, 在速度上优于现有方法, 可以应用于实际的系统。

关键词:推荐系统,关联规则,Apriori算法,数据库,图书管理,图书销售

参考文献

[1]赵亮, 胡乃静, 张守志.个性化推荐算法设计[J].计算机研究与发展, 2002 (8)

电子图书馆使用方法(推荐) 篇5

1.登入方法:

开机,打开浏览器,通过浏览器打开数字图书馆的登入页,在“读者号”文本框输入读者号:14,在“密码”文本框中输入密码:123。点击“登录”按钮,即可进入到数字图书馆的首页。(注:如果出现网络链接的,直接选择“重试”链接)

2.图书查询方法:

① 在进入图书馆主页后,单击“电子图书”链接,有所有电子图书的书目的分类链接,单击相应的链接,即可跳转到相应的图书分类信息页面上。在页面底端会显示图书记录导航信息,其中记录当前页面中是书目数量。如果图书书目超过一页,则可以通过单击“最前页”、“上一页”、“下一页”和“最末页”链接,在各个记录显示子页之间切换。

② 在数字图书馆的首页,单击相应图书类型区域中的分类链接。位于首页的电子图书分类区域,单击某个分类链接,即可进入到相应的图书分类页面中。同样,如果想再查找其他分类中的图书,可以在页面左端,点击相应的分类选项按钮,这时在右方就会显示该分类中的相应书目。如果想在页面中显示所有分类的电子图书,可以在页面左端,点击相应的“所有电子图书”链接。③ 在数字图书馆首页顶端的导航条上,单击相应的图书类型链接,以进入到该类型图书分类信息页面中。在任何一个分类的图书分类信息页面上,都包含有“关键字查询输入框”允许你重新设置关键字,进行查询。在“关键字”文本框中,输入要查询的关键字,然后单击“查询”按钮,即可进行查询。、3.设置书签:

① 书签保存:首先查询出需要是书籍书目——单击书目链接,进入到该图书的“图书信息”页面——要将该图书位置作为书签保存,可以单击“图书信息”页面下方的“加入书签”链接。完成操作后,会显示书签添加成功的提示信息

② 查询书签:登入系统,进入数字图书馆主页。——在主页右下角的用户个人信息区域,单击“个人信息”链接,进入“我的信息”页面。——在“我的信息”页面左端,单击“我的书签”链接,这时在右方区域就会显示当前该用户的个人书签列表。——要访问书签内图书,只需要单击书签列表中的书目链接即可。

天翼图书推荐 篇6

[美]保罗·克鲁格曼著

中信出版社2008年10月版

定价:36.00元

本书是2008年诺贝尔经济学奖得主、美国著名经济学家克鲁格曼的最新力作。他在书中回顾了将近一个世纪的美国历史,从镀金年代的政治经济,直到布什年代的经济停滞。从“60年代纷扰的繁荣”到“迎战不平等”,书写了一个自由主义者的良知、感悟与建言。克鲁格曼性格刚直,他的文笔则清晰流畅,深入浅出。在公众眼中,是一位不可多得的大众经济学家,被誉为“自凯恩斯以来,文章写得最好的经济学家”。

刀锋上的舞蹈:我如何挽救了吉列

[美]詹姆斯·基尔茨、约翰·曼弗雷迪、罗伯特·洛伯著

机械工业出版社2008年11月版

定价:38.00元

詹姆斯·基尔茨堪称世界上最神奇的CEO,他历任三家跨国消费品巨头公司:卡夫、纳贝斯克、吉列。在这三家企业濒于危难之际,他临危授命,成功使它们从谷底攀上巅峰。他的事业始于一个车间助理,但却能引领这三大企业上演享有盛名的大逆转,化腐朽为神奇,这种管理能力世间罕有。本书告诉你一个真实的CEO在面临纷繁复杂的管理问题时,心里究竟想些什么,究竟如何抓住关键。

无欲之争:我所领悟的至关重要的原则

[美]约翰·白波著

北京大学出版社2008年10月版

定价:39.00元

约翰·白波没有列举企业的成功故事,也并不强调自己的卓越决策,他只愿意分享一个问题:在商业和个人发展中,什么是决定成就的最基础也是最关键的原则。对于快速发展的中国企业来说,这本看起来不那么热闹的书,特别需要认真研读。

新的企业模式:创造没有贫困的世界

[孟]穆罕默德·尤努斯著

中信出版社2008年10月版

定价:32.00元

图书馆检索系统中图书推荐技术研究 篇7

1 推荐系统的概念

一般情况下,用户会根据自身需要,通过搜索引擎来查找,但有些时候,用户给出的关键词语并不能诠释自己需要的图书类别的资料的内容,这就很容易造成检索结果给出的资料与用户的实际要求不相符的情况,这就需要在检索系统当中增添推荐系统,以便更好的为用户提供服务。其次,当读者通过该系统输入关键词时,系统现给读者。

2 图书推荐技术设计

当前,图书馆的检索推荐方式分为两类,一类是图书馆内的管理人员协助读者检索推荐;另一类是读者通过自己总结出的关键词,借助图书检索系统的推荐技术进行关键词的检索。从当前图书出版业与图书馆的发展形势来看,这两类检索方式都不符合图书馆建设人性化、个性化信息服务的要求。因此,要对图书推荐系统进行重新设计。

2.1 系统总体设计

随着电子商务的不断发展,网上书店也随之兴旺起来,其中,其当当网、China-Pub、卓越网等知名网络书店都使用了推荐技术,帮助用户快速购书。虽然现在的图书馆也在使用推荐技术,但是在图书内容的相关性上要弱于网上书店,因此,本文结合网上书店的推荐技术,将图书推荐系统分四个板块进行设计。首先,对网络书店中图书的数据进行采集,在分析出该店半结构化的网页源码后,得出相关的有效数据,并根据其中的有效数据设计出专用的爬虫,将数据导入到图书馆的数据库中。然后,利用Book Rank计算技术算出每一本图书Book Rank数值,为后续推荐系统模块的图书排序提供有效的数据,防止在排序上出现数值误差。最后,设计出符合该系统的两个推荐策略。

2.2 数据库设计

推荐系统的设计需要大量的数据做辅助,为了使图书馆的图书推荐系统能够更好的与网上的半结构化的网页源码数据相结合,使其能够更好的贴合图书馆数据库系统,就需要对图书馆的数据库系统进行合理设计。首先,对当当网、China-Pub和卓越网这三大网站提供的数据详细分析,找出图书数据来源等问题,在确定了这一系列数据来源的基础上,设计图书数据库。图书数据库各类图书关系的设计主要分为三大类:一是图书的隶属关系,其关系从大到小排列为图书主分类 - 分类名称 - 上一级分类;二是表示图书现有数量的分类,分类主要包括,图书主分类以及各类图书数量两大方面。

3 图书推荐策略

3.1依照关键词

该方法主要为了解决当前图书馆检索系统在检索关键词时,只会将与关键词相关的图书检索出来,没有进行分类,用户查找不便,关键词推荐策略是针对当用户在检索系统中输入关键词得到信息时,推荐系统会根据图书的类别进行分类统计,并依据个类别的现有数量,合理的分配不同类别推荐的图书数目。同时,依据BookRank值来从推荐的数目当中进行图书的选择、汇总和排序。

3.2 依照特定图书

当读者选择某一本书时,图书推荐系统会根据该图书的相关分类信息向读者推荐同类图书。这一设计思路主要是:当读者选择此本书籍时,他可能会对同类图书也感兴趣,由此推理出其需要的书籍可能在同类的图书当中,于是便将该类别的图书作为推荐目录。

图书数据库是将图书按照树状结构进行分类的,总目录是该树状结构的基础部分,其目录名即为分类号,子目录是该树状结构的中间点,而图书则是该树状结构的叶子部分。该方法的特点是,当读者选取的目录中图书数量较少或者没有该类图书时,读者可以扩大目录选级,从而有效的弥补当前图书推荐系统,推荐数量不足的现状,扩大目录范围,为读者提供更多的选择。具体流程如图1所示。

4 结 语

图书馆推荐图书体系的数据挖掘研究 篇8

1 图书馆智能推荐系统关键技术

常见的依托于数据挖掘的图书馆图书智能推荐技术主要有三种, 其中两种分别是建立在内容聚类及用户聚类基础之上的协同过滤推荐, 还有一种关联规则推荐, 其中前两种协同过滤推荐分别是以项目内容及用户评价为推荐依据;关联规则推荐的关键是确定又去关联或者相关频繁项集。关联规则推荐的一个典型应用实例就是商品购物篮分析, 即根据关联规则确定用户经常一起购买的东西, 换句话说, 就是确定用户在购买某种商品的时候通常会连带购买其他哪种商品。

关联规则推荐与其他两种协同过滤推荐相比具有明显优势, 主要体现为以下几点:首先, 关联规则推荐的抽取支持离线操作, 能够解决图书借阅在线费时问题;第二, 借助语义或词库可以有效改进产品名同一性和重复性问题;最后有效避免了冷启动的新商品及新用户问题, 用户上线即可进行推荐。鉴于关联规则推荐上述优势, 笔者选择关联规则推荐技术来构建图书馆推荐图书系统。

2 关联规则

假设项的集合I={i1, i2, …, im}, 在上述集合之中, 其内部的元素即为项。设D是事务T的集合, 而事务T则是项的集合, 且T I。这样就能够使得每一项事务都能够具备唯一的标志, 比如可以将事务号命名为TID。同时, 假设X为项的集合中的一个子集, 且X T, 此时我们称X子集被事务T包含。X圯Y (X奂I, Y奂I且X∩Y=Φ) 是最为常见的关联规则表达式, 上述关联规则在事务数据库中的支持度实际上就是事务集T中包含的X以及Y的数量与所有事务数量的比值, 用表达式表述为:support (X圯Y) 。

相应的, X圯Y作为一种关联规则, 其可信度则是指在事务集中包含X以及Y的事务数量与包含X的交易数量之间的比值, 可信度可以用如下表达式表述为:confidence (X圯Y) 。

若确定事务集D, 则对关联规则的挖掘的实质就是在集合之中寻找support以及confidence都要高于用户给定的最小支持度与最小可信度的问题。

关联规则的挖掘过程包括了两步, 首先需要根据最小支持度寻找到出现频率较高的项集, 然后在此基础上根据最小置信度找到关联规则。一般而言, 第二个步骤是较为容易的, 在经过了第一个步骤的信息剔除之后, 频繁项集的数量并不会很多, 基本上依靠子集产生法就能够找到关联规则。但是, 第一个步骤则需要花费大量的资源, 而如果要确保其效率, 则需要通过一个较为高效的算法来进行计算。

早在1993年, Rakesh Agrawal就提出了Apriori算法, 该算法是一种非常经典的数据挖掘算法, 到目前为止都还有不少的数据挖掘方法是基于该算法进行的。通过Apriori算法, 可以在一大堆的事务数据之中, 通过一个个的单个项的计数, 然后再完成所有的事务计数之后, 在将支持度较低明显无法获得用户给定支持度的项目去除, 在逐步扩展到多项事务之中。通过这种方法, 最终能够保留下来的频繁项集, 就能够通过上述的两个步骤产生管理规则。再然后根据上文提及的方法, 去除带有误导性质的关联规则, 就能够得到最终的关联规则。

3 图书馆图书智能推荐系统设计

本文的研究主要是为了更好的应用关联规则对用户的访问习惯进行分析, 从而找到符合用户期望的网页。因此, 需要首先将目的定义为网页推荐, 然后基于此需要对网页服务器的浏览记录进行检索, 从而分析出用户的偏好以及可能的期望, 据此推荐与用户的偏好以及期望相符的网页。然后, 根据推荐前后用户的使用习惯的变化, 验证关联规则的正确性, 并且基于此对关联规则进行不断的调整和修改。为了对用户的偏好以及期望进行有效分析, 需要在对网页服务器的相关数据完成基本过滤之后, 根据用户的ID进行具体的分类, 然后对其目标网页的网址以及其访问的时间进行记录, 再逐一进行分析。

其基本结构如图1所示:

3.1 O ffline部分

Offline主要涉及数据准备及关联规则挖掘任务两部分内容。数据准备主要是在完成数据预处理基础之上生成用户log文件及历史借阅记录文件。之后的规则挖掘的准确性及效率在很大程度上是由数据准备的质量所决定的。不论是图书馆实时数据, 还是历史数据, 都无法避免噪声, 因此要通过数据预处理来对数据去噪, 数据预处理是数据挖掘算法不可获取的重要一步。

关联规则挖掘则主要负责进行频繁项集扫描及生成关联规则。生成关联模式之后便可以确定用户浏览模式, 通过对用户浏览模式进行剖析, 保存读者借阅规则, 以供之后在线服务部分使用。关联规则挖掘主要任务包括:对完成去噪的数据进行扫描并生成相应的频繁相集, 在此基础之上对频繁式中关联规则进行计算, 并构建起读者借阅规则。

3.2 O nline部分

Online部分所采用的就是前面Offline部分所生成的关联规则的集合, 同时会对用户浏览行为进行同步检测, 并将检测结果记录下来, 在此基础之上向不同的用户提供实时书目或链接推荐服务。Online部分主要涉及读者推荐Agent及图书馆Web服务器两部分, 其中读者推荐Agent的主要任务是进行读者行为数据与前一步所生成的有趣规则的匹配, 并在此基础之上向用户提供个性化的图书或链接推荐服务。

1) 读者推荐Age nt。读者推荐Age nt的正常有序运作必须建立在对以下两部分模块功能的有效整合的基础之上, 一个是Offline部分的关联规则挖掘模块, 另一个就是下面所谈及的图书馆Web服务器部分。举例来说, 读者推荐Agent从图书馆Web服务器处进行诸如用户基本信息以及用户访问操作路径信息等A用户相关信息, 如果系统检测到此时该用户正在进行《数据挖掘导论》一书的浏览, 读者推荐Age nt便会立即在规则库中进行搜索, 以便确定能够与该用户浏览内容相匹配的规则集合, 最终可能搜索到的规则有数据挖掘导论 (《神经网络入门教程》) 等, 在完成匹配之后, 会向图书馆Web服务器进行相应的操作信息反馈, 借助图书馆Web服务器推荐给该用户, 这样该用户就可以接收到智能图书馆推荐系统所提供的《神经网络入门教程》推荐链接, 并且如果《神经网络入门教程》这本书该用户之前已经浏览过了, 系统就会自动对其进行过滤, 不会重复提供给用户。

2) 图书馆We b服务器。图书馆We b服务器主要具有以下功能:第一, 对读者活动数据进行收集, 图书馆Web服务器所收集的相关数据主要是提供给数据准备环节使用;以读者推荐Agent为依据, 向不同的用户提供个性化的页面调度服务, 从本质上讲, 图书馆Web服务器就是以读者用户为直接对向的接口, 一方面负责向系统提供数据输入服务, 另一方面, 还负责根据广大读者的不同需求提供个性化的数据输出服务。

4 结语

随着信息时代的到来, 图书馆数据不管是数量还是复杂程度均有所提升, 如果依旧沿用手动检索方式, 准确搜索信息的难度极大, 用户也无法感受到灵活的个性化服务, 针对传统图书馆在信息检索方面存在的不足, 本文提出了依托于数据挖掘技术构建图书馆智能图书推荐系统的设计方案, 并重点从Offline部分及Online部分进行分析和探讨。通过对应用图书馆智能图书推荐系统前后的用户访问习惯以及实际调研结果发现, 在应用基于数据挖掘技术的图书馆智能推荐系统之后, 用户的查找目标书目以及相关信息的效率得到了较大的提升, 实际应用效较好, 值得推荐。

参考文献

[1]冯太琴.基于Web的网上推荐图书系统——以北京化工大学图书馆网上推荐图书系统为例[J].科技情报开发与经济, 2010.

[2]史明文.高校图书馆推荐书目工作初探[J].华北地区高校图协第二十四届学术年会论文 (文章) 汇编, 2010.

图书推荐 篇9

编著:中国科技发展战略研究小组

出版:科学出版社

定价:68.00元

本报告的主题是金融危机、技术创新与产业升级。报告围绕金融危机和经济周期的起源及创新的关系作了深入的分析。报告解剖了美国金融危机的深层原因, 并对我国政府及地方政府如何应对这场危机作了分析。然后, 报告结合中国制造业的发展现实, 就如何进行危机后的技术创新能力建设与产业升级提出了看法和政策建议。

木塑复合材料

编著:[俄]Anatole A.Klyosov;王伟宏, 宋永明, 高华译

出版:科学出版社

定价:99.00元

木塑复合材料这种新兴的环保材料产品在世界范围得到越来越多的关注和认同, 其生产量和使用量都在逐年快速增加。本书以通俗易懂的语言和简洁明了的方式, 系统地介绍了制造木塑复合材料所用原料 (木质纤维材料、塑料、填料和偶联剂) 的种类、性能及其在产品中的作用;在材料性能方面阐述了弯曲、压缩、拉伸、热膨胀收缩、线性收缩、防滑性、吸水性状等物理力学性能的主要影响因素和变化规律;对新近引起企业和学术领域关注的热点问题, 如燃烧性能、抗微生物降解性能、抗氧化性能以及流变性能等, 进行了详细地阐述;在相关部分给出了原料与制品性能检测方法的国外标准, 并简要介绍了具体方法。全书以大量的数据和丰富的例证作支撑材料, 实用性强, 理论分析深入, 见解独到。

本书可供从事木塑复合材料生产、应用、产品检验和科学研究等工作的工程技术人员、科研人员和管理者阅读参考, 也可供相关专业的大学生和研究生阅读。

2010高技术发展报告

编著:中国科学院

出版:科学出版社

定价:46.00元

全书在综述2009年高技术发展动态的同时, 以新材料、新能源技术为主题, 着重介绍新材料、新能源技术发展趋势、产业化动态、产业创新能力与国际竞争力、高技术与社会等社会普遍关注的重大问题, 提出促进中国高技术与产业发展的思路和政策建议。

多层低温共烧陶瓷技术

编著:[日]今中佳彦 (Yoshihiko Imanaka) ;詹欣祥, 周济译

出版:科学出版社

定价:45.00元

本书全面介绍了低温共烧陶瓷 (LTCC) 技术, 给出了大量20世纪80年代富士通和IBM美国公司开发的大型计算机用铜电路图层的大面积多层陶瓷基板的工程图表。全书共10章。第1章绪论, 概述了低温共烧陶瓷技术的历史、典型材料、主要制造过程等。第2章至第9章分为两大部分, 第一部分为材料技术, 包括第2章至第4章, 论述了陶瓷材料、导体材料及辅助材料的特性和应用;第二部分为工艺技术, 包括第5章至第9章, 细致地描述了各工序特点、工艺条件、控制、在制品评价、缺陷防止和产品可靠性等诸多问题。最后, 在第10章, 展望了低温共烧陶瓷技术的未来发展。

本书适合从事电子、材料等领域研究、开发和生产的技术人员参考阅读, 也可作为高等院校相关专业的研究生、本科生教材使用。

纳米流体能量传递理论与应用

编著:宣益民, 李强

出版:科学出版社

定价:60.00元

本书围绕纳米流体的制备方法、聚集结构、输运参数、流动与能量质量传递特性等方面内容, 系统地总结了作者多年来在纳米流体及其应用基础方面的研究工作, 描述了纳米流体的基本属性、流动与能量质量传递特征, 详细介绍了纳米流体流动与能量质量传递的理论和实验研究方法, 重点阐述了纳米流体聚集结构与纳米粒子微运动效应对纳米流体能量质量传递过程的作用机制, 并概述了纳米流体在新型高效散热冷却和节能技术等领域的应用研究进展。

本书可供能源、动力、电子、航空航天、机械、化工、材料等领域从事热科学理论与应用技术的科研和技术人员, 以及大专院校相关专业的师生参考。

道路工程专论

编著:张金喜

出版:科学出版社

定价:78.00元

本书吸纳了国内外道路工程方向的最新研究成果, 以专题的方式系统地介绍了道路工程从设计、施工、使用、养护维修到道路使用性能评价的理论和方法, 阐述了相关领域研究现状和发展趋势。主要内容包括:道路工程发展简史、道路线形设计理论与方法、路基路面设计与施工、道路景观与多功能路面、道路工程病害及防治方法、道路养护与技术状况评价、道路与交通安全、国外沥青路面设计方法简介。

本书可作为交通运输工程和土木工程专业 (道路工程方向) 研究生教材使用, 还可作为交通工程和土木工程专业 (道路工程方向) 本科生参考书和教学参考书使用, 也可供交通、城建、公安等部门从事设计、施工和管理工作的技术人员参考。

能源软科学研究进展

主编:周德群

出版:科学出版社

定价:48.00元

能源问题纷繁复杂, 涉及多学科、多领域的知识。能源问题不仅是资源的开采、加工和利用技术问题, 更是经济问题、社会问题、环境问题和管理问题, 同时还是政治问题。复杂的能源问题已非传统的能源科学与技术 (能源硬科学) 所能解决, 而更多地有赖于能源软科学相关知识的支持。本书是南京航空航天大学产业组织与技术创新研究中心能源软科学研究团队近年来针对能源软科学问题取得的重要研究成果, 内容涉及能源价格与市场、能源效率与环境、能源城市与转型以及能源金融等方面, 在一定程度上反映了能源软科学在相关方向的发展动态, 是一部系统研究能源软科学问题的导读书, 同时也是研究我国能源战略问题的重要参考书。

本书可供政府决策部门、能源政策制定部门、能源经济与管理的研究人员以及关心中国能源发展的人士阅读, 也可作为相关专业研究生的教学参考书。

基于环境一号卫星的生态环境遥感监测

作者:王桥等著

出版:科学出版社

定价:300.00元

图书推荐 篇10

主编:金保华

出版:科学出版社

定价:45.00元 (含光盘)

Java是Sun Microsystems公司推出的一种程序设计语言, 以其面向对象和跨平台的特性风靡全球, 是目前软件设计中极为流行的编程语言。Java语言不仅可以用来开发大型的应用程序, 而且特别适合基于网络的应用开发, Java已经成为网络时代最重要的编程语言。

本书通俗易懂, 便于读者自学。对于一些较为难以理解的概念, 采用循序渐进、逐步展开的方式进行介绍;对于不容易理解的问题, 采用大量简单的示例进行说明, 书中的这些示例都是作者精心设计的, 具有很强的针对性。

全书共分13章, 分别介绍了Java的运行开发环境、基本数据类型、控制语句、类、对象、接口、常用类、异常处理、Swing组件、多线程、输入/输出流、网络编程和数据库连接技术等内容。最后, 通过一个实例对书中各章节的知识点进行了综合应用。

本书不仅可以作为高等院校本、专科计算机软件、信息系统、电子商务等相关专业的教材, 同时也可供自学者及软件开发人员参考。

二维和三维视频处理及立体显示技术

编著:张兆杨、安平、张之江、沈礼权, 等

出版:科学出版社

定价:42.00元

由于三维视频技术是二维视频技术的延拓, 本书扼要介绍了以H.264/AVC和TFT-LCD显示器为主的二维视频技术;主要阐述了三维视频与立体图像显示技术, 主要内容包括:三维视频与立体图像显示系统的组成及其发展概况, 构成3DTV的基于双目/多视摄像阵列的三维场景获取、双视/多视视频编码、解码端的合成视绘制和基于液晶的立体显示等四个主要组成部分的基本概念与实现方法。对其中的关键技术包括多视摄像机的标定方法与预处理、基于H.264/AVC时域分层B结构的多视视频预测结构/编码方法及发展的新方法、基于视内插和深度的视合成绘制方法以及自动立体液晶显示器技术及其优化方法进行了较深入的分析和阐述。

本书可作为通信、计算机、光电子、传媒类等研究机构和企事业单位的科研、设计人员从事研究和新技术开发的参考书, 也可作为上述相关专业的本科生、硕士生、博士生的学习用书, 或高校教师的教学、科研参考书。

分数阶微积分原理及其在现代信号分析与处理中的应用

编著:周激流、蒲亦非、廖科

出版:科学出版社

定价:59.00元

本书应用现代信号处理理论, 系统地对分数阶微积分在现代信号分析与处理中的应用进行了研究。主要内容包括:分数阶微积分理论基础、研究现状及其主要应用, 现代信号分析与处理中分数阶微积分的数值实现, 分数阶演算的模拟分抗电路及其分数阶仿生神经型脉冲振荡器的构造, 分数阶微积分在多层动态联想神经网络、数字图像处理、数字滤波器、数字水印技术中的应用等。

本书可供信号与信息处理、通信与信息系统等学科的专业人员以及高等院校相关专业的师生阅读和参考, 也可供其他领域研究人员参考。

气候变化国家评估报告

编著:《气候变化国家评估报告》编写委员会

出版:科学出版社

定价:228.00元

《气候变化国家评估报告》是由科学技术部、中国气象局、中国科学院等12个部委组织实施的一项重要工程, 共有17个部门88位专家参与编写工作。这是我国第一次组织编写这类报告。

本书内容包括中国气候变化的科学基础、气候变化的影响与适应对策, 以及气候变化的社会经济评价3部分, 共25章。全书反映了我国气候变化研究领域的重要新成果, 代表了国家水平和发展趋势。可为国家制定国民经济和社会长期发展战略提供科学决策依据, 为我国参与气候变化领域的国际行动提供科技支撑。

本书可供中央、地方和国家各部委决策部门, 以及气象气候、经济、外交、水文、海洋、农林牧、地质和地理等领域的科研与教学人员参考使用。

中国气候与环境演变

总主编:秦大河、陈宜瑜、李学勇

出版:科学出版社

定价:220.00元 (上、下卷)

本书为中国气候与环境演变科学报告成果, 全书分为上、下两卷。上卷主要以中国科学家的研究成果为依据, 以东亚气候与环境变化为背景, 对中国近百年到千年的气候、环境演变进行了评估, 阐述了中国区域气候与环境变化的基本事实以及相关的重大变化事件, 并对中国气候变化的原因 (包括自然原因与人类活动的原因) 进行了分析。在此基础上, 应用气候模式对未来20年、50年、100年中国气候与环境变化趋势进行了预估。

下卷首先分析了气候变化对自然生态系统和社会经济系统的可能影响;其次评估了在可持续发展框架下中国各大区气候变化的情况与适应问题;探讨了气候变化对经济社会发展的利弊关系, 以及南水北调、三峡工程、青藏铁路建设等重大工程的影响;最后进行了气候变化适应与减缓对策下的社会经济分析, 并据此提出发展观念、决策机制、健全法制、环境建设和气候变化等方面的咨询建议。

本书可供气象、环境、水文、生态等相关领域的科研人员、政府管理部门有关人员以及高校师生参考。

生物的起源、辐射与多样性演变——华夏化石记录的启示

作者:戎嘉余

出版:科学出版社

定价:210.00元

地球生命历史包含了一个极其漫长又纷繁复杂的演化过程。本书主要根据中国的化石证据, 探讨生物演化进程, 包括部分生物类群的起源与早期演化、重大地质历史时期的生物辐射 (radiation) 与海洋生物多样性 (biodiversity) 的演变, 试图从华夏化石记录中寻找生物演化的启示。作为本书重点之一的生物辐射, 是生命历史中一个十分重要的组成部分, 但在演化教科书中却鲜有系统阐述。中国的材料为此提供了许多重要的证据。史前海洋生物多样性的演变在国内尚未全面研究, 本书在建立各门类化石数据库的基础上, 首次初步探讨华南前元古代末至中生代早期海洋生物多样性的变化及其控制因素, 为全球史前生物多样性研究提供来自同一板块的系统资料。大量研究证明, 自然环境的强弱变化不同程度地影响了生物演化的进程和生物多样性的变化, 生物又通过自身演化深刻地影响着地球表面环境条件的变化。

本书可供地质科学、古生物学、生物科学、演化生物学等科研人员、大专院校教师、研究生、本科生以及对本书研究内容感兴趣的人阅读。

事件相关电位原理与技术

编著:魏景汉、罗跃嘉

出版:科学出版社

定价:48.00元

本书内容主要包括事件相关电位 (ERP) 的发展与基础, 数据记录与提取的基本技术原理与方法, 主要ERP成分与实验范式、刺激方法, ERP的数据测量和统计分析方法。本书的论述深入浅出, 兼顾基本原理的系统性和内容的实用性。

本书既是初学ERP的入门教材, 又是深入研究ERP的高级参考书, 可供心理学、生理学、医学、认知科学、神经科学及其他生命科学有关专业的科研人员、教师、工作人员、博士研究生、硕士研究生、本科生学习和参考。

基因组信号处理

编著:[俄]I.什穆列维奇, [美]E.R.多尔蒂;刘文斌, 高琳译

出版:科学出版社

定价:68.00元

随着各种高通量微阵列技术的飞速发展, 基于基因表达谱数据的分析已经成为系统生物学研究中的一个非常重要的领域。基因表达谱数据的最大特点是高噪声、高维数和小样本, 针对这种数据的特点, 本书主要介绍了基因调控网络的建模方法及其动态行为分析、分类器的设计及其误差估计、数据和特征的正则化, 以及聚类算法及其验证过程等内容。

上一篇:工程建设信息化管理下一篇:民主法治建设