非结构化WEB数据库与图书馆多媒体信息资源的组织利用

2024-05-03

非结构化WEB数据库与图书馆多媒体信息资源的组织利用（精选3篇）

篇1：非结构化WEB数据库与图书馆多媒体信息资源的组织利用

【内容提要】针对传统关系数据库在处理非结构化多媒体WEB信息中所存在的问题，结合图书馆多媒体数据库的特点及特定技术要求，介绍了非结构化WEB数据库的技术特点及其在组织与利用馆藏多媒体信息资源中的作用。

【摘要题】信息资源建设

【关键词】非结构化WEB数据库/多媒体/信息资源/组织利用/关系数据库

【正文】

1 非结构化WEB数据库简介

非结构化WEB数据库，是指其字段长度可变，并且每个字段的记录又可以由可重复或不可重复的子字段构成的基于INTERNET、INTRANET的数据库，用它不仅可以处理结构化数据（如数字、符号等信息）而且更适合处理非结构化数据（全文文本、图象、声音、影视、超媒体等信息）并在互联网上发布。非结构化WEB数据库主要是针对非结构化数据而产生的，与以往流行的`关系数据库相比，其最大区别在于它突破了关系数据库结构定义不易改变和数据定长的限制，支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理，在处理连续信息（包括全文信息）和非结构化信息（包括各种多媒体信息）中有着传统关系型数据库所无法比拟的优势。

2 图书馆多媒体信息资源的特点及组织利用中的技术要求

2.1 图书馆多媒体信息的数据量非常大，象馆藏影视资料和各种多媒体教育（www.xfhttp.com－雪风网络xfhttp教育网）资料，其动态图象信号，每秒可达数兆字节，一段几分钟的MP3音乐也有几兆字节，即使经过压缩、也十分巨大。如何对多媒体海量数据进行有效地组织、存储并构成WEB数据库提供给用户网上使用，技术要求很高。

2.2 馆藏多媒体信息的数据类型很多，包括各种图文数据、声音数据、影视数据、超媒体数据、多种格式的随书光盘等等，其数据长度不固定，结构上的差异大，使得处理这些数据十分困难，要求数据库既能够处理可变长度字段又能够处理可重复的子字段。

2.3 多媒体信息处理在时间上要求很高，多媒体信息中的声音和动态图像对时间特别敏感，在使用这些信息时，必须保证其时间上的要求，否则将会使这些信息失真甚至变得毫无意义。

2.4 开发利用馆藏多媒体信息资源经常要多种信息集成描述，比如某种多媒体，既有图像，又有声音，还有文字说明，这样就会改变传统的数据库操作形式和数据库接口，尤其对图文并茂的数据库的建立和查询，需要统一语义描述。

基于多媒体信息资源的上述特点，要想使馆藏丰富的多媒体信息资源得到充分利用，满足信息用户不断增长的信息需求，对多媒体信息处理提出了不同于普通信息处理技术的新要求：

（1）多媒体数据库元数据存储技术要求

我们知道音频、图象、视频等多媒体信息数据是非结构化的，它们不能用简单的数字解析式表示，多媒体数据库必须取得基于这些媒体对象内容及信息特征的解释，才能完成存储及应用，这些解释就称为元数据，通过对元数据的归类、整理、实现标准化的存储是多媒体信息资源组织利用的关键。多媒体数据库元数据存储技术要求包括：文本元数据的存取，语音元数据的存取，图象元数据的存取，视频元数据的存取等方面的技术要求。

（2）多媒体数据库结构字段设计与数据记录处理方面的要求

a.允许可变长字段、可重复字段、子字段和MARC字段。

b.数据库记录的数目与记录长度，字段数目与字段长度，字段可重复次数不应受到限制。

c.允许建立可以快速存取的倒排文件和多媒体、多语言记录表。

d.数据库可自动接受和产生MARC和ISO2709记录格式的文件，并且满足对MEDADATA数据模式的支持功能。

（3）基于WEB的多媒体信息检索与信息发布的技术要求

随着用户对于信息需求的大量增加，以及对于多媒体信息的实效性要求，基于WEB的数据库信息存储的检索越来越倾向于多媒体全文信息检索的查询语言，并且对于检索结果的需求也侧重于多媒体全文信息的获取。与此同时，WEB数据库的信息发布形式开始更多地过渡到通过网络浏览器以

[1] [2] [3]

篇2：非结构化WEB数据库与图书馆多媒体信息资源的组织利用

Web2.0是相对于Web 1.0的新一类互联网应用的统称。Web2.0在Webl.0的基础上, 通过技术手段的升级, 实现了信息传播方式上的一次革命性跨越, 成功的创造了全新的传播内容更丰富、更具操作性和人性化一种的互联网模式。其核心理念是“以人为本”, 强调以用户为核心, 变以往的用户上网为用户织网是Web2.0突破Web1.0最根本性的变革。在Web2.0搭建的各个交互平台上, 用户之间的联系及交互作用得到了更多的关注, 每个用户在浏览网站内容的同时, 也在参与并制造着新的网站内容。从Web2.0这一概念提出至今, 其理论研究和实际应用得到了迅猛的发展, 政府、学校、企业、个人等多种形式的博客雨后春笋般的出现在网络上。还有众多的大学图书馆甚至一些知名企业配置了RSS订阅等功能。

2 Web2.0相关技术

2.1 Blog (博客)

Blog (博客) 是以网络作为载体, 简易迅速便捷地发布自己的心得, 及时有效轻松地与他人进行交流, 再集丰富多彩的个性化展示于一体的综合性平台。Blog是继Email、BBS、ICQ之后出现的又一种网络交流方式, 可以说是互联网时代的个人文摘空间, 博客代表的是一种新学习方式, 同时也是一种新的的生活方式和工作方式。博客是一个正处于快速发展和快速演变中的互联网新应用。

2.2 Wiki (维客)

维客由沃德·坎宁安于1995年所创。原名为wiki (另译名维基) 。它是一种基于互联网的可供多人协同创作的超文本系统, 维客是一种新的超文本系统技术。这种超文本系统支持面向社群的协作式写作, 系统中也包括支持这种协作写作的辅助工具。从这个意义上来说, 维客是一种支持多人协作的写作工具, 而参与写作的人便是维客。Wiki技术要比Blog的互动性更强, 更能展现出Web2.0时代的网络共享性。

2.3 Tag (标签)

Tag, 通常被直译为“标签”, 它能让你为自己在互联网上所发布的文字、图片、视频、音频等文件创建一些用作注释的标签。这种标签更类似于传统媒体的“栏目”, 加标签是在用户需要的前提下产生的方法技术, 用户在使用Tag的过程中, 集合集体智慧, 形成多种分类规则。创作者不会因媒体栏目的有限性而无法给作品归类是它的优势所在。

2.4 RSS (简易信息聚合)

RSS (Really Simple Syndication, 真正简单聚合) 是一种Web内容联合格式, 包含了一套用于描述Web内容的元数据规范, 具有一套新颖的能够实现内容整合者、内容提供商和最终用户之间的WEB内容 (包括元数据) 的互动的、多赢的联合应用机制。用户可以直接通过RSS阅读器来阅读网站的摘要和新闻。现在, RSS与搜索引擎逐渐形成双峰对峙的局面, 一个包送, 一个自取, 构成了极具价值的网络应用。RSS在获取、组织和管理庞大但又缺乏整合的微内容方面显示出比较强的处理能力。

2.5 Digg (掘客)

Digg, 网络最新名词。掘客类网站其实是一个文章投票评论站点, 它结合了书签、博客、RSS以及无等级的评论控制。它的独特在于它没有职业网站编辑, 编辑全部取决于用户。用户可以随意提交文章, 然后由阅读者来判断该文章是否有用, 收藏文章的用户人数越多, 说明该文章越有热点。即用户认为这篇文章不错, 那么Digg一下, 当Digg数达到一定程度, 那么该文章就会出现在首页或者其他页面上。

掘客的核心思想是发动大众进行新闻挖掘, 由网民民主投票来决定网站首页应该显示哪些新闻, 这样, 筛选出的新闻往往是最有价值的, 最受网民关注的新闻。掘客是WEB2.0的又一种具体表现形式。

3 图书馆引入Web2.0

随着Web2.0的出现, 相关理念和技术也引起图书馆界的重视。许多国外该领域的专业人士开始对这个新概念进行阐述。2005年, 凯西·比森最早使用了图书馆2.0一词。他对图书馆2.0给出的定义是:“它不是一种技术, 它是力求从外界搜集好的思想并且利用它们传递新的改进的服务, 以满足用户的特定需求。图书馆2.0的核心是一种思想, 是一种操作运行的方式。是我们对图书馆服务的认识的重要转变的一个典型。通过程序设计、社区建设和Blog, Wiki等技术, 图书馆2.0更加活灵活现地展现在人们面前。”

萨拉·霍顿则将:“图书馆2.0”阐述为:“Web2.0的出现, 意味着图书馆的空间正在朝着交互式、协作式的方向发展, 并随着读者需求的变化而更新。它的生命力来源于通过发布读者需要的各种信息来吸引读者, 使图书馆成为大家共同关注的目标。”

综合专家们的意见可以总结出, 把Web2.0的Blog, Wiki、RSS等技术应用到图书馆的信息组织与服务建设中, 将会大大提高图书馆信息服务的质量水平。图书馆通过用户的各种信息需求, 提供多层次的个性化服务, 通过Web2.0技术的应用, 给用户提供一个最大限度地满足个性而多样的信息服务需求的平台, 从而真正实现图书馆以人为本, 读者至上的服务理念和办馆宗旨。

4 Web2.0环境下图书馆信息组织和服务

在以往图书馆服务的发展过程中, 被动服务总是多于主动服务。馆员们习惯于用同样的程序给同样的读者群组织、整理、加工信息资源, 然后以被动的方式等待读者主动前来索取服务。这样的服务模式, 往往带给用户的需求满意度很低, 同时也无法开拓挖掘用户更深层次兴趣需求。所以顺应网络时代的图书馆服务的变革势在必行。

4.1 建立用户交流平台, 以资源为节点共同“织网”

在Web2.0环境下, 图书馆必须强调以读者为中心, 在文献信息的组织服务中, 吸纳用户的积极参与, 共同构建馆员与读者的交互平台。这里的用户不再特指使用者, 而是包括图书馆员在内的最大范围的用户群体。鼓励用户通过使用Blog或Digg等Web2.0技术建立网上互动交流平台。撰写阅读、学习、新闻、聊天、生活、工作等心得体会, 通过自身的真切感受推荐和评价自己感兴趣和认为有意义的资源。有支持有否定, 让图书馆静态的资源流动起来, 在用户不断编织的网上形成各种形态的节点。需要注意的是, 自主化Tag和聚类在一定程度上影响到检索的可靠性。因此, “织网”的过程中应充分发挥图书馆自身优势, 在资源组织和分类上给与可靠的支持和保障, 让自由标注Tag和主题分类并行, 不失灵活性同时也不失可靠性。

4.2 应用RSS技术对兴趣资源形成即时推送

RSS (源) 技术提供了一个实时高效、安全且又低成本的信息发布渠道, 对于图书馆的读者们, RSS (源) 技术给了大家了一个全新的获取最新信息的渠道。目前国内很多高校图书馆都把RSS (源) 技术应用到了本馆的服务中。如武汉大学图书馆的RSS信息聚合中心, 主要向读者传达图书馆的最新信息、国内外的图情动态以及本馆开展的学术讲座, 培训讲座预告等等;长春理工大学图书馆也推出了RSS推送服务, 使读者在不打开网站内容页面的情况下, 阅读支持RSS输出的网站内容, 获取本馆最新的资源动态和工作动态。

4.3 开创合作共享空间, 共创共享Wi Ki知识库

图书馆馆员的学历和经验的局限性决定了图书馆无法准确的单方面完善某些学科领域的信息资源建设。所以, 为使图书馆文献资源构建更趋科学合理, 迫切需要一些特殊读者群体的参与帮助。解决的方案是, 图书馆可以利用Wiki系统建立一个馆员与馆员、读者与读者、馆员与读者之间的互动平台——wiki空间。馆员和读者都可以对Wiki空间上的文本进行浏览、更改, 也可以自己创建新的文本, 发表对有关专题的意见和建议。Wiki系统为这个空间里的写作群体提供必要的的沟通工具。wiki空间的使用, 能让我们在一个共同的平台上共享某一领域的信息资源。这个空间不是个性化的舞台, 让大家享受到完整、充分、权威的信息是图书馆创建wiki的最终目的。同时, 图书馆还可以邀请某些专业的专家教授既相关人员, 参与到相关学科知识库的建设钟来, 共同构建一个能有助于学校教学科研发展及学生成长需求的的知识库。

4.4 发挥图书馆传统资源组织优势, 结合自组织方式, 让资源组织更灵活

是不是引入了Web2.0后, 就完全摒弃了图书馆原有的资源组织方式呢?笔者认为, 图书馆信息资源组织百年的历史有着精准严格的组织框架, 图书馆资源组织严密、有序是检索全面准确的前提, 因此, 不但不能丢弃, 反而要发扬传统资源组织的优势, 结合Web2.0的相关技术, 主题与标签, 分类与聚类并存, 让图书馆信息资源组织保持精准的同时更赋予灵活易用性。

5 结论

Web2.0引发图书馆服务的变革将使图书馆的各项服务更加科学、合理, 更具人性化。而满足读者的使用需求永远是图书馆发展的目标所在。实现传统图书馆与数字图书馆的完美结合, 是图书馆未来发展的重要方向。以读者为中心、让读者无障碍使用图书馆的信息资源, 开辟读者与馆员之间无障碍的交互平台, 建设完善图书馆的信息组织与服务将是图书馆人长期内共同面对的的任务和课题。

参考文献

[1]米国伟, 刘春茂.基于Web2.0的网络用户信息认知行为的案例分析.情报理论与实践, 2009 (8) :72-76.

[2]白玉.Web2.0环境下图书馆信息服务研究.

[3]赵春琳.Webs2.0环境下用户参与的信息组织研究.

篇3：非结构化WEB数据库与图书馆多媒体信息资源的组织利用

关键词web数据库；数字图书馆；信息资源

中图分类号TP文献标识码A文章编号1673-9671-(2011)041-0127-01

随着近代计算机的兴起，网络的普及，人们获得知识的途径在不断扩展，而图书馆作为传统的信息中心的地位受到挑战。如何整合网络资源，使丰富的、不断更新变化的网络信息资源为图书馆所用，是图书馆所要面对的新挑战。

1传统图书馆的局限性与网络的便利性

图书馆在相当长的时间里都只是保存实体资料，如木简、帛书、纸质图书、泥版等人们要使用图书馆，还得亲自到图书馆，才能获得信息资源，对于交通不甚方便的时代，这使得民众获得信息颇为周折。其次，图书馆还会受到战争、天灾、政治等因素受到破坏，使得保存在里面的图书受到损毁甚至到无法继续使用。在印刷技术还没有得到很好的发展，图书副本往往受到一定的限制，图书馆受到破坏，图书遭到损坏，都给知识的传递造成不可挽回的损失。

这些因素都极大的限制了图书馆的发展以及信息的传播和利用。

网络技术的发展，恰恰改变了图书馆的这种局限性。只要有终端浏览器，如计算机、手机、以及其他電子设备，如psp、ipad等，接入互联网，瞬间就可以很方便查询所需信息。特别是在WEB2.0以后。出现了如维基百科、百度知道等这一类型的网络资源的出现，更是大大方便了人们获得知识。只要上这些网址，输入想要知道的词条，就可以得到词条的解释、扩展阅读等等的数据。人们从搜索信息、分析信息才能获得信息到直接获得信息。

其次，网络的传播和复制都有不可消磨性。一条信息的发布，要使其完全删除是很困难的，因为各种各样的网络自动程序会迅速的抓取，并且用网络快照的形式展现在各种各样的搜索引擎上，或者是被完全复制、引用到某些页面上。

网络资源的便利性，从另外一方面补足图书馆的不足，使得图书从多方面更好的满足读者的需求。

2建立web数据库的基础条件

1）网民群体的扩大。在2009年第七次全国国民阅读调查数据显示，2009年，我国国民上网率为41.0%（推及人口数为4.8544亿），比2008年的36.8%增长了4.2个百分点，涨幅为 11.41%。

中国的网络人口增长迅速，已经超越美国，成为世界第一。根据这个调查的推断，中国网民有四亿多，而美国的总人口也不过是三亿多。庞大且还在不断增加的网民，为图书馆的web数据库奠定了广阔的用户群体。

2）利用电子设备均阅读时间的增加。调查还提到：18周岁以上成年国民数字出版阅读率为24.6%，比2008年增长了0.1个百分点。网络在线阅读和手机阅读是两大主要数字化阅读方式，分别有16.7%的国民通过网络在线阅读，14.9%的国民接触过手机阅读，另有1.3%的国民使用其他手持阅读器进行数字化阅读，比2008年的1%增加了0.3个百分点，增幅为30%。从国民对各类出版物接触时长看，2009年，我国18—70周岁识字国民人均每天读书时长为14.70分钟，人均每天读报时长为21.02分钟，人均每天读杂志时长为15.40分钟，人均上网时长为每天34.09分钟，人均通过手机阅读的时长为6.06分钟。与上年相比，国民每天平均接触报纸、图书、期刊的时间有所下降，而上网和进行手机阅读的时间则在增加。

传统的纸本书相对于现代人来说并不是唯一的阅读选择，各种价格、大小的手持电子设备都非常方便使用和购买。

3）人均上网时间的增加。人均上网时间，已经超过了阅读报纸和杂志的时间。也就是说，人们已经把上网当作日常生活的一部分。我国网民上网从事的活动中61.2% 是阅读新闻，“查询各类信息”：占48.0%。我国网民中有18.1%的人将“阅读网络书籍、报刊”作为网上从事的主要活动。

民众这种从网络上寻找信息和了解信息的使用习惯，web数据库提供了一定量的使用率保障。

从上世纪九十年代初，邓小平提到：计算机要从娃娃抓起。计算机从中小学开始普及教育。在现在社会，大部分的家庭都拥有一台计算机，甚至多台计算机，在城市、乡镇，还有大大小小的网吧。因此计算机的普及率，使得web数据库的使用，提供了足够的硬件设施。

综合以上人、计算机软件、硬件设施的成熟，建立web数据库的条件已经完善。

3Web数据库的模式、内容

1）数据库运行模式。数据库与Web技术的结合产生了Web数据库：数据库服务器在后台运行，负责数据的集中存储和快速检索；Web服务器处于数据库服务器（后台）和客户端浏览器（前台）之间，在接收来自客户端的查询后，通过Web页面的脚本或应用程序，在后台中查找数据，最后将结果传回前台，由客户端的浏览器显示给用户。

2）Web数据库与实体资源的交错。在接触过数字化阅读方式的国民中，91.0%的读者阅读电子书后就不会再购买此书的纸质版，另有9.0%的读者表示阅读电子书后还会购买该书的纸质版。那么在建立web数据库时，可以和实物馆藏有一定程度的错开。一些最新最流行的讯息可以大量存储在数据库中，而图书馆内的实物馆藏，可以主要以经典的文献为主。这样可以避免重复建设，造成浪费。

3）特色数据库。此外，web数据库还可以根据每个图书馆以及图书馆所在地方的特色构建特色数据库和专题数据库。让馆藏更方便快捷的共享在网络上，让更多人利用。

其次，除了一般的文字性的文本内容，还要扩展到数字化图像、音频和视频流等多媒体和流媒体信息。随着多媒体的发展，人们也越来越习惯利用多媒体资源辅助文本阅读。如语言、设计等类型的书籍，很多都有随书附送光盘。

除此以外，Web数据库还应该整合网络资源。但是网络资源的可信度对于图书都是一个新的挑战，因此数据库应该整合可信度高的门户网站内容。

4Web数据库的开放性

Web2.0的理念是以用户为中心，强调用户参与、协作。因此，数据库的建设不应该是封闭式的，少数人的工作，而是应该开放式的，让用户参与到数据库的建设中。从技术的层面看，技术必须是模块化、组建化、具有很强的平台和设备独立性、符合各类协议标准、可以非常方便地进行组合搭配。从内容上，可以多方协作、参与构建。

并且可以利用DC元素据，实时、动态的更新数据，而不需要工作人员手动检查、更新。

相对于Web技术，数据库技术发展得比较成熟，特别适用于大量的数据进行组织管理；Web技术具有简单易学、与平台无关等特点，使安装、维护以及用户培训等费用大大降低。结合两者，可以构建出一个架构严谨，但又方便操作的Web数据库。

书籍等实体资源固然是图书一个很重要的构成部分。但是不可否认，越来越多的人开始进入数字化的生活。查找资源也越来越倾向从电子计算机、网络方面寻找。因此，图书馆的数字化、信息化已是大势所趋。在这种趋势下，构建Web数据库，整合网络资源、信息资源也是图书馆不可缺少的资源。

参考文献

[1]人民网.第七次全国国民阅读调查显示:中国人越来越爱读书.http://media.people.com.cn/GB/40606/11409193.html.

[2]欧阳峰.Web数据挖掘与高校数字图书馆个性化服.现代情报.2008,1.

[3]史庆艳.数字时代大学生信息需求探讨及图书馆策略.晋图学刊.2010,5.

本文来自 360文秘网(www.360wenmi.com)，转载请保留网址和出处

【非结构化WEB数据库与图书馆多媒体信息资源的组织利用】相关文章：

非结构化数据05-16

地理信息系统数据结构及数据组织管理研究12-17

地理信息系统数据结构及数据组织管理研究02-21