网页著作权的案例分析论文

2022-04-27

笔者通过本文,对实践中常见的网页抄袭纠纷进行梳理分析,尝试厘清:哪些类型的网页可以给予法律保护?应适用《著作权法》还是适用《反不正当竞争法》?又有哪些类型的网页无法获得法律保护?“抄袭”一词虽然尚未正式出现在当前我国的法律法规中,但在侵害著作权纠纷案件中,却是一个当事人时常提及的词。今天小编为大家精心挑选了关于《网页著作权的案例分析论文(精选3篇)》,供大家参考借鉴,希望可以帮助到有需要的朋友。

网页著作权的案例分析论文 篇1:

现代案例分析法在法律课程教学的改革探索

(邵阳学院 政法系,湖南 邵阳 422000)

摘 要: 案例分析法是法律教學的一种重要教学法,而传统案例分析法在差时上容易产生矛盾,难以兼顾时间和教学效果。本文对现代案例分析法在法律课程内容和授课方式方面进行了改革实践探索,在提高教学时效和教学质量上有了较好的效果。

关键词: 现代案例分析法 授课内容 现代教学工具

案例分析法是教学中的一种常用方法,也是法律课程案例教学法的重要部分。在法律课程教学过程中常常引用经典案例,通过案例的剖析认知法律条文的应用及相关法律要义的理解,这种教学方法以教学大纲为依据,以教材为中心,以理论联系实际的原则为指导,以案例为突破口,实践效果明显,学生接受度高,对于学生今后工作、生活中遇到法律问题也有所帮助,特别对于法律专业的学生而言,今后从事司法实际工作多有裨益①。传统案例分析法因案例内容多,相关资料复杂,涉及知识点较多,剖析时间长,占用课时较多,而课时有限,时差容易产生矛盾。分析案例的过程往往属于研讨过程,易产生新的问题需要解答,有的甚至需要做进一步研究。如何用好案例,讲好课程,又控制好时间,是当前急需解决的一大问题。为此,我们对课程内容和授课方式进行了改革实践探索,尝试创建现代案例分析法应用于法律课程教学改革,以期达到明显的教学效果。

一、精造授课内容,突出课程重点,突破课程难点

1.精造授课内容。

要讲好一门课程,最重要的基础之一是授课内容的精造。精造授课内容,我们首先以传统的教学方式安排好课程章节和授课时间,备好授课提纲,精造好案例及相关资料。只有精造授课内容,打好基础,才能走好讲课的第一步。而对于授课过程中重点板书什么,什么地方该分析、什么时候该提问、如何与学生互动等,都应该心中有数。尤其是在精造课程内容时要注意避免落入传统教学的讲-学模式,要根据法律课程的实践性,合理安排书本理论知识、案例资料及问答、讨论等各个部分的时间和位置。比如可以根据不同的教学内容,创设不同的问题小情境引入案例和知识点,使案例和书本知识有机结合,让学生更容易理解和掌握精髓,同时对于理论在实际中的实践有所了解②。

2.突出课程重点,突破课程难点。

在精造授课内容时,我们要注意突出课程重点,突破课程难点。以专利制度的基本特征一课为例,如何讲清其垄断性和公开性就是这次课的重点,而如何理解这两大特征从而了解专利法的立法宗旨则是本课的难点。在对重点和难点有所理解后再看实际中的专利制度如何保证垄断性和公开性的法律实施,是以专利权的申报、审核制度和专利说明书、权利要求书实现的。

在此处我们可以举例微软操作系统的专利权作为案例进行说明,以应用最广泛的操作系统举例,更容易激发学生对于专利权的探究兴趣,增强对于本课知识点的理解认知。事实上,中国所有软件著作权均是按照现行申报制度的技术公开性而产生的,但显然此时举例影响广泛的经典更容易让学生理解,由此可以引申出对于我国专利制度的探究和思考。显然,这样一门课如果完全按照传统授课方式进行,课时超时是显而易见的事情。并且容易引申太过,导致影响接下来的教学进程。为此,我们做了如下改革尝试。

二、充分利用现代教学工具,扩展课前课后预习思考

1.引入现代教学工具,以多媒体课件等特色授课方式,丰富课程内容和授课手段。

在传统案例分析法中,案例引入和分析、课程板书等都占用大量时间,客观上挤占师生互动的时效。为此,我们在精造课程内容的基础上,做好课件,把老师授课、学生看课有机结合,把课件刷屏与老师讲解有机融合,把案例分析与媒体呈例相交融。同步操讲,既可提供画面、声音的直观性、冲击性,又可减少因板书和翻阅资料占用的时间,还可因内容丰富而扩大学生的知识面,提高其学习兴趣,增强师生互动的热情。这种以教师主讲、学生主想、媒体辅课的授课方式是实施案例分析法的有效途径。

2.以网络为媒介,抓好课前预习、课后复习的全过程,是现代案例分析法的重要方式。

课前预习、课后复习是授课过程的重要组成部分。传统授课方式中师生围着课本进行教学,往往趣味不浓,效果欠佳。为此,我们根据现代学生喜欢网络的特点,利用校园网的强大功能与资源,将课件与相关案例资料上传课程平台,以信息派送的方式提醒学生预习和复习,用有故事的案例网页吸引学生,用有法律条文使用的微课渗透于学生茶余饭后,使知识碎片化,让学生学习自觉成为习惯。

以法律基础课为例。这门公共课程旨在通过教学培养和提高大学生的法律意识和法律素质,使他们能够知法、懂法、守法和用法,以适应依法治国和现代化建设的需要③。因而涉及的内容多,从法律的渊源、类别等到宪法、各部门法等法律法条,相关知识都有涉及。而作为一门公共课,课时较少,面对的学生更是没有社会经验、没有法律知识甚至没有法律常识的年轻人。学生对一些法律知识理解度较低,需要了解的知识点却很多,授课效果容易平平。而如果大量使用案例帮助学生理解掌握知识,课时又远远不够。我们尝試将课程微型化后做成课件,结合一些案例引导学生课余自觉学习、自觉思考,既深受欢迎,又加深、加快学生对这门课的理解和掌握。

比起传统教学模式局限于课堂讲授,这种改革尝试既充分利用课余时间,将传统教学中消耗大量时间的案例内容和相关引申内容放在课堂之外,又激发学生对于学习的乐趣,由生动、立体的案例将知识碎片化,加深学生对知识点的理解和掌握,更符合法律需要结合实际进行理解运用、而非单纯枯燥条文的特性要求。

三、教学并非单纯的教与学,师生之间需要更多的互动

对于学习法律课程的学生而言,知识的理解和掌握并不那么容易。传统教学模式的讲授方式中师生是两个对应的个体,老师讲授知识,学生听取知识。课后更多地依靠学生的自我学习能力,而法律的枯燥容易造成学生对学习的厌怠。这是我们在教学中需要引起重视、进行改革尝试的一个重要方面。我们不仅要用一个个案例让学生明了法律的精要,更要用无限的师爱照亮学生的心灵。

教师对学生负有传道授业解惑的责任。在我们看来,负责的有效方式是爱学生。爱学生,要有足够的耐心浸润学生的心智,才能日见成效,而不仅仅是将知识讲给学生听。对于法律专业的学生,需要理解、掌握的法律内容十分繁复,需要学习、熟知的法律相关课程难点颇多,如果单纯地死记硬背通常事倍功半。授课方式如果只是照本宣科,就算课件做得好,课程也会乏而无味、死气沉沉。如果把案例变为故事,学生兴趣自然浓厚,但时间苦短,知识点往往讲不完。如何让案例成为明了法律的精要,如何让学生理解立法的宗旨而量准其要义,则是法学专业教师须认真研究的课题。我们做了如下尝试,把一个案例的缘由、过程、事实呈例清楚,把相关法律条文呈于案例分析之上,对于一些经典、热点案例,把法院判文与专家评析相比对,形成一条完整的思考链,让学生通过案例熟知相关法律,通过分析明了其宗旨精要,通过比对辨别实践和思考容易产生的错误。课堂上主讲要点、难点,师生互动解决疑点,课后以网络平台、互动答题加深理解。

四、结语

我們对于现代案例分析法在法律课程中的应用进行了一些教学实践探索,以求解决课程质量与教学时间的时差矛盾,在保证教学内容的前提下增强教学效果,让师生都有所得。诚然,我们的改革实践才刚刚起步,探索之路还很漫长,需要更多的实践尝试来调整和完善。案例分析法是一种应用广泛、在法律教学中有着重要地位的教学方法,对于它的研究是一项大的工程,作为青年教师,笔者水平有限,希望广大同仁志士不吝赐教,以便研究探索更进一步。

注释:

①黄永彩.运用案例分析法进行法学教学的体会[J].桂林电子工业学院学报,1993(9).

②李黎明,吴禹达.浅析案例分析法在法学教育中的应用[J].教育教学论坛,2014(7).

③胡斌.案例分析法在法律基础课教学中的应用[J].哈尔滨职业技术学院学报,2008(2).

参考文献:

[1]黄永彩.运用案例分析法进行法学教学的体会[J].桂林电子工业学院学报,1993(9).

[2]薛刚凌,李媛.论法学教学方法的改革[J].中国政法大学学报,2007(1).

[3]李黎明,吴禹达.浅析案例分析法在法学教育中的应用[J].教育教学论坛,2014(7).

[4]胡斌.案例分析法在法律基礎课教学中的应用[J].哈尔滨职业技术学院学报,2008(2).

[5]王爱民.试论法律人才的培养与法学教学方法的革新[J].社会科学家,2005(1).

[6]吴东镐.关于法学教育中“案例教学法”的几点认识[J].东疆学刊,2005(1).

本文受到湖南省教育厅项目资助

作者:刘雪婷

网页著作权的案例分析论文 篇2:

网页抄袭可能引发的法律纠纷

笔者通过本文,对实践中常见的网页抄袭纠纷进行梳理分析,尝试厘清:哪些类型的网页可以给予法律保护?应适用《著作权法》还是适用《反不正当竞争法》?又有哪些类型的网页无法获得法律保护?

“抄袭”一词虽然尚未正式出现在当前我国的法律法规中,但在侵害著作权纠纷案件中,却是一个当事人时常提及的词。就司法实践而言,我们在著作权案件中通常把“抄袭”一词理解为未经他人许可使用他人作品的行为。

近年来,涉及网络的知识产權侵权案件中,提及“抄袭”,已经远不止指著作权法意义上的“抄袭”。特别是不断出现的网页(本文所指的网页,不限于web页面,也包括各类客户端应用软件的页面)“抄袭”纠纷中,不同的原告在诉讼中往往分别提出侵害著作权、仿冒知名商品特有包装及装潢、虚假宣传、恶意搭便车等等各种主张。对此,法院的裁判结果也各不相同。笔者通过本文,对实践中常见的网页抄袭纠纷进行梳理分析,尝试厘清:哪些类型的网页可以给予法律保护?应适用《著作权法》还是适用《反不正当竞争法》?又有哪些类型的网页无法获得法律保护?

一、可适用《著作权法》的情形

尽管网页一般由图、文、色彩、线条、音频、视频、Flash及前述元素的组合而构成,主张适用《著作权法》保护的网页权利人,一般会主张其网页整体构成美术作品(由于网页中的Flash或音、视频动画被他人抄袭时当事人可以单独提出主张,所以当事人一般不在主张网页被抄袭的纠纷中专门强调此部分音、视频内容)。能否将原告主张的网页整体认定为美术作品,则要考察该网页是否符合《著作权法》对美术作品规定的要件,即网页中各要素通过组合形成具有审美意义的作品。

网页中各要素的呈现方式既要满足系统、显示终端等软硬件的适配要求,也要满足适应用户的浏览访问习惯、与其他页面相联系等功能性要求,除此以外,如果该网页还能在整体上表现出创作者对审美意义的理解,则能将其认定为美术作品。事实上,实践中的此类网页并不多见,因此能被法院认定为美术作品的网页也不多见。

有些当事人提出,一些美术作品,如简笔画,仅用非常简单的线条等元素表达,就能成为一幅美术作品,甚至因为创作者是知名画家而售价不菲,为什么同样使用了简单元素表现的网页就不能成为美术作品?对此,需要明确的是,《著作权法》保护美术作品,是保护创作者对美的表达。生活中有很多简单形式的美,只要其为作者所独创,便不妨碍法律给予其保护。仅由非常简单的元素构成的网页,如常见的搜索引擎首页、仅显示公司各类业务介绍和功能菜单的页面等,一方面更多用于体现网页的实用性和功能性,而非用于表现美;另一方面,由简单元素表现的网页是极少是由原告独创的。因此,常见的简单元素构成的网页,无法成为与美术作品同一性质的法律保护对象。

另一种有意思的主张则是,原告承认其单个网页页面不构成美术作品,但坚持多级页面相组合,就能成为一个汇编作品,理由是我国《著作权法》第14条规定,汇编作品是汇编若干作品、作品的片段、不构成作品的数据或者其他材料,且对其内容的选择或者编排体现独创性的作品。编排者将多级页面进行选择编排,能体现出其独创性劳动。笔者认为,对于这样的主张,不能一概而论其是否成立,但有必要强调,汇编作品之所以能获得《著作权法》保护,在于汇编者对被汇编对象的独创性劳动,不能因为多级页面有一定的排列顺序,就能将其整体认定为汇编作品。如果编排者将多级页面按常见或必要的逻辑顺序排列,一般无法被认定为体现了汇编的独创性。

二、可适用《反不正当竞争法》的情形

无法认定为作品的网页,是否也无法体现开发经营者的合法权益?答案是否定的。实践中,针对他人抄袭网页,主要存在三种适用《反不正当竞争法》的类型:一是原告认为被告违反了诚实信用原则和公认的商业道德,主张适用《反不正当竞争法》第二条规制被告的行为;二是原告认为其网页已经存在相当的显著性,被告抄袭网页的行为属于仿冒其知名商品特有的包装、装潢;三是原告以网页被抄袭而主张被告虚假宣传的,一般仅针对被告网页中的某些宣传表述虚假,如被告将原告的公司荣誉、成功案例作为自己的宣传内容。此时,是否“抄袭”原告网页内容并不是重点,关键在于判断被告网页中的宣传内容是否真实。实践中,第三种类型的争议事实和法律认定相对简单清楚,本文不做展开论述。

第一种类型,被告的抄袭行为较为严重,类似于著作权纠纷中涉及的“低级抄袭”,抄袭的网页不仅数量多,而且基本都是原样抄袭,整体上看,被告网页与原告网页基本相同。比如“中华万年历”应用软件被抄袭的案件中,被告在后开发的“中华万年历”应用软件中有一百余张资源图都抄袭自原告在先开发的“中华万年历”应用软件,占到双方软件全部资源图的一半以上。尽管这些资源图中单幅或组合并不成为《著作权法》可保护的作品,但也属于原告的经营成果,他人在同类应用软件中大量抄袭使用,必将以不劳而获的方式替代原告产品,损害原告的合法权益。笔者注意到,此类低级抄袭引发的不正当竞争纠纷有上升趋势,不仅是应用软件界面,还包括同类服务网站页面、同类游戏界面等,这主要是在互联网产品快速推出的过程中,经营者在急功近利的心态和对被追诉的侥幸心理驱使下,为迅速上线各类产品或服务、吸引流量所致。

第二种类型区别于第一种“低级抄袭”,往往出现被告抄袭原告网页中主要、典型的图文等元素,同时添加、调整元素组合和结构安排,使被告网页整体上与原告网页相似,但又存在差异。若是原告的应用软件产品或服务在市场上经过了一定范围的宣传推广,有一定的知名度,则原告往往会主张被告仿冒其知名商品特有包装或装潢。

能否将他人抄袭网页中部分元素的行为认定为仿冒知名商品特有包装或装潢?根据通常理解,法律对于仿冒行为的规制,实际上是将知名商品特有名称、包装、装潢等标识或可识别性的外观视为未注册商标,只有相关商品的名称、包装、装潢达到了足以识别商品来源的商标性功能,才能禁止他人仿冒。

同时,也要明确《反不正当竞争法》禁止仿冒的“包装”“装横”的含义。物质载体意义上的“包装”,是为了在商品流转过程中保护商品、便于存储、促进销售,而为商品专门设计安置的容器、材料等。当然,可依据《反不正当竞争法》制止他人仿冒的“包裝”,不能简单理解为某一商品的物质载体,而属于能体现识别商品来源的形状、图案、线条、颜色及其组合。同样的,“装潢”是为识别和美化商品而在商品或者其包装上附加的文字、图案、色彩及其排列组合。可见,“包装”“装潢”是区别于商品本身的、用于识别和美化商品的图文及其组合。

网页中的图文等部分元素,能否视为经营者提供商品或服务的“包装”“装潢”?笔者认为,按照生活逻辑理解,绝大部分情况下的答案是否定的。网页本身属于经营者提供的商品、服务内容或内容的组成部分,起不到在商品或服务之外识别和美化商品或服务的作用。因此,如果原告主张其网站中的网页元素或应用软件中部分页面内容被他人抄袭,由于难以将网页元素或页面内容解释为网站或应用软件的“包装”“装潢”,因而即使他人抄袭了这些内容,也难以适用《反不正当竞争法》中的仿冒条款进行规制。

当然,不能适用仿冒条款,不意味着类似的抄袭行为无法通过法律进行规制。如果被抄袭的内容可认定为作品,则可适用《著作权法》;如果被抄袭的内容无法成为作品,也不宜认定为“包装”“装潢”,但其中属于经过广泛推广使用、具有显著性的栏目名称、板块名称等,可能会构成仿冒知名服务特有名称;如果被抄袭的内容亦无法认定为知名服务特有名称,但由于抄袭元素数量众多,被告抄袭行为搭便车的恶意非常明显,有必要禁止,则可适用《反不正当竞争法》的原则条款。

三、仅满足功能实现而设计的网页不受专有性保护

互联网企业创新的速度往往决定了其市场占有份额,一些应用软件就是多了一项或几项创新功能,才得以快速吸引用户、积累商誉。网络经营者为了多创新一项产品或产品功能,要花费较多人力物力,承受巨大的失败风险。为此,许多网络经营者非常珍视其创新功能点,希望法律能保护其产品的创新性功能成果。一些创新功能正是通过网页设计来实现的,因此,在先完成设计并将之投入市场的经营者,能否阻止其他经营者为实现同样的功能而使用相同或近似的网页设计?

一般而言,以图文形式呈现的网页界面可以有体现相关实用性功能的层级菜单、工具按钮、供用户选择操作的素材等设计,还可以有部分起到美化、标示经营者身份作用的独特设计。只有相关的独特的界面设计或界面设计的组合形成了相对稳定的指向性表现形式,能起到区分商品或服务来源的作用,经营者才能制止他人对相关界面进行恶意模仿。

因此,可受专有性保护的网页设计,只有在属于本文前两部分中提到的可保护的情形时方可禁止他人使用。如果经营者提供了创新功能,但实现该功能的网页设计仅体现功能性、实用性特点,比如表现音乐播放进度的“进度杆”、三角形的播放按钮、两条短竖杠的暂停按钮、放大镜图案的搜索按钮等等,则经营者将无法禁止他人使用。

作者:曹丽萍

网页著作权的案例分析论文 篇3:

数字人文项目中的数据众包运作策略研究

摘   要:数据驱动研究成为人文学科研究的主流,数据是数字人文项目实施的基础和核心之一。文章分析了新网络环境下数字人文数据众包的概念和现状,从数据众包发起者的角度出发论述了数据众包项目的运作模式及任务,并针对性地提出数字人文数据众包的实施方式、数据管理、质量管理、激励政策、诚信问题和成果发布及版权等问题的应对策略。研究认为,数字人文数据众包对人文数据的建设是有益的补充,数据众包给数字人文工作提供了数据化的平台和工具,数字人文数据众包可以加深公众对文化和历史的理解。

关键词:数字人文;数据众包;人文数据;众包策略

Key words digital humanities; data crowdsourcing; humanities data; cowdsourcing strategies

1   引言

數字人文是充分运用计算机技术开展的合作性、跨学科的研究、教学与出版的新型学术模型和组织形式[1]。数字人文最显著的特点就是借助计算机进行量化分析,数据是数字人文项目实施的基础和核心之一,数据驱动研究成为人文学科研究的主流。目前大部分人文数据由图书馆和数据供应商所拥有,由于人文数据建设需要花费大量的时间及经费,因此学者能自由使用的人文数据非常有限,人文数据匮乏已成为数字人文研究者的共识。面对人文数据匮乏的局面,近年来,数字人文研究者尝试了多种人文数据建设的方式,数据众包就是帮助数字人文研究者获取人文数据的有效方式之一。

随着信息技术的发展,新的网络环境不断演进,形成了一个分散式共享、合作和传播的全球化、网络化的世界。在新的网络环境下,公众通过社交互动、参与式的知识创造形式来表达他们的需求。然而,目前对于数字人文类众包项目的研究侧重于用户参与数字人文众包的意愿、绩效影响因素、运作流程和平台,缺少对人文数据特点的分析,数据众包的整体运作策略研究较少,对数据众包过程中负面问题的解决策略研究也相对匮乏。因此有必要对数字人文数据众包的运作策略进行研究,了解新网络环境下数字人文数据众包的主要任务,分析数据众包发起者如何选择实施方式、实施平台和任务发布方式,以及对运行管理、成果管理中可能遇到的问题提出应对策略,从而为今后的数字人文数据众包项目提供一定的借鉴意义。

2   数字人文数据众包的概念和研究现状

2.1    数字人文数据众包的概念

杰夫·豪[2]于2006年6月在《连线》杂志的一篇文中首次正式提出“众包”一词,并指出众包是一个公司或机构将过去由员工执行的工作任务以自由自愿的形式外包给非特定(通常是大型的)大众网络的做法。众包是利用大型在线社区对特定任务进行创建内容或收集想法的实践,它是互联网技术关键文化转变的产物,也适用于数字人文的数据众包项目。

数字人文数据众包是一种创新实践活动,它根据数字人文项目的需要,采用大众共建的方式,实现定制化的数据获取与数据加工方案设计与执行服务,为数字人文项目提供标准化、结构化的可用数据,其中数据采集及数据标注的类型涵盖文本、图像、音频、视频、网页等。数字人文项目的主要工作量消耗在数据处理上,仅仅依靠有限的项目人员无法完成大规模数据整理、加工及组织工作,因此有必要利用大众智慧进行数据众包来共同完成数字人文项目研究。

2.2    数字人文数据众包的研究现状

学术领域的众包可以称为公众科学,目前公众科学研究引起不少学者关注。而数字人文类众包属于公众科学的一种,研究主要集中在四个方面:(1)用户参与数字人文众包的意愿和影响因素研究。如张轩慧等[3]通过S-O-R理论构建公众参与数字人文类众包动因的实证模型,提出志愿者的感知有用性、自我效能、娱乐享受和使命感是参与众包的主要动机;Seitsonen和Oula[4]通过对芬兰的文化遗产机构的众包案例分析发现用户的自我满足感是主要参与动机;(2)数字人文众包绩效的影响因素研究。如韩文婷等[5]提出任务复杂度和领域知识水平是影响数字人文类众包任务绩效的主要原因;(3)数字人文众包的运作流程研究。如赵宇翔[6]在传统的众包活动的三个主体(发包方、平台和接包方)基础上加入第三方组织机构,构建矩阵式项目管理机制,指出公众科学项目运作基本流程包含八个行动;Oomen和Aroyo[7]利用数字内容生命周期模型提出了数字人文领域众包的运行包括筛选、创造、管理、发现、使用和保存;(4)数字人文众包平台研究。如肖奕[8]以数字人文项目在线合作平台DHCOMMONS为例,提出资助机构、学科领域、隶属机构、合作类型与合作者类型影响数字人文项目合作平台的发展。

综上所述,目前学者对于数字人文类众包研究主要集中在公众参与意愿、绩效影响因素、运作流程和平台方面,然而缺少对于人文数据的分析,以及人文数据如何进行众包,人文数据众包过程中可能出现的数据管理、质量管理、激励政策、诚信和版权等问题和障碍提出的应对策略研究较少。因此有必要对数字人文数据众包的运作策略进行研究。

3   数字人文数据众包主要任务

数字人文项目中的人文数据具有的特点及人文学者研究对人文数据的需求构成了人文数据组织及重构的基本要素,其中主要有人文数据的完整性、可计算性、可用性及重用性、可发现及获得性等[9]。数字人文項目对人文数据提出了独特的要求,人文数据的构建很大程度上由学科规范和方法论所决定,人文数据的组织通常需要有人文素养的介入,即需要了解人文数据特点及符合人文学者研究的需求才能确保人文数据的有效性。

开展数字人文数据众包,首先要从人文数据研究者的需要去界定任务类型,不同的数字人文研究者或研究机构有不同的数据众包需求,Oomen和Aroyo[7]从文化遗产机构的大量众包实践中,提出了美术馆、图书馆、档案馆及博物馆(GLAMs)存在校正和转录任务、语境化、补充收藏、分类、联合策展、众筹等六种众包类型。借助数据生命周期模型可以帮助我们更好地理解数字人文数据众包不同阶段的活动。典型的数据生命周期模型包括数据的创建/收集、描述、存储、发现、分析和重用[10]。目前,在数字人文数据众包实践活动中,多数志愿者参与了人文数据的创建/收集和描述工作,其可以利用数字人文研究者提供的原始人文资料进行人文数据的创建,或者自行提供原始人文资料,并转化为完整的人文数据,此外他们还积极利用Web2.0技术对一些人文资料进行标签化或者评论,从而为数字人文项目提供元数据。这些工作可以分别对应转录校正型任务、补充收集型任务和标记分类型任务。而存储、发现、分析和重用工作往往由数字人文数据众包的发起者或平台执行,随着数字人文数据众包实践的不断发展,未来志愿者可以参与更深层次的人文数据管理。

3.1    转录校正型任务

转录校正型任务是最受欢迎的数据众包任务之一,它对已有的大量人文资料进行人工转录和校正,从而创建可供数字人文项目所需的集成化、细粒化、关联化及可计算化的数据。虽然光学字符识别技术(Optical Character Recognition,OCR)可以通过电子设备检查纸上打印的字符,然后将形状翻译成计算机文字[11]。但它只针对印刷体字符,对扫描的图像有很高的质量要求,然而一些手稿、照片、古籍等无法通过OCR识别技术获得准确率高的可计算文本数据。因此,可以将无法OCR识别或OCR识别准确率较低的图像信息通过大量人工干预的方式转录、校正成数字人文项目所需的人文数据。边沁手稿转录项目利用对手稿转录有兴趣的志愿者对哲学家边沁的手稿进行人工转录,建立可搜索的数据库[12]。美国史密森尼转录中心为志愿者提供19个博物馆和档案馆的材料进行转录[13]。上海图书馆历史文献众包中心开展的盛宣怀档案抄录项目,选取盛宣怀档案中与辛亥革命相关的信函、电报、公牍、奏折等若干,以供抄录[14]。澳大利亚国家图书馆借助专门的数字资源呈现系统,招募志愿者对数字化了的1803-1954年间没有版权的历史报纸进行校正,以提高文本质量[15]。

3.2    补充收集型任务

补充收集型任务是在缺少现有人文资料的情况下,通过志愿者收集可参考的人文数据,一般志愿者可以在日常生活中获取这些数据,从而保证项目数据的完备性。纽约公共图书馆开展“建筑检查员”(Building Inspector)项目,利用公民在日常环境中寻找旧地图所需的数据,并提交纽约公共图书馆的数据库中[16]。上海图书馆家谱知识服务平台支持用户贡献内容的形式,吸引众多网络用户撰写反馈家谱信息,平台不断更新,使数据在使用过程中增值[17]。

3.3    标记分类型任务

标记分类型任务要求志愿者利用元数据描述数字化信息资源的属性,通过添加标签、评论的方式,评价、追踪资源,协助数据有效检索。视频是人文研究中较为复杂的资料,获取它的内容信息较为困难。纽约公共图书馆引入用户标签系统,通过志愿者浏览口述历史视频,从菜单中选择关键词,将标签映射到视频中的时间码,同时可以对缺失的字幕视频进行标记,此外还可以将非英语视频翻译成英文字幕视频[18]。英国国家档案馆开展“战争日记”项目,希望志愿者对第一次世界大战英国士兵的日记进行标记和分类[19],志愿者可以从受控词表中选择关键词进行标记。豆瓣网则允许用户对图书、电影、音乐等添加标签、评分,从而获得图书、电影的关键词信息,并用这些信息改善网站的推荐效果。

由于不同任务对于志愿者专业水平要求和限定完成时间不同,三种类型的数据众包任务难易度不同(见表1)。其中,转录校正型任务通常要求转录者具有转录内容的背景知识,如“籍合网”招募校正古籍的志愿者时,要求志愿者实名注册,具有文史哲相关专业及背景,并有古籍整理的经验,这类转录校正任务通常消耗的时间较长。补充收集型任务虽然要求志愿者对某方面研究具有一定的了解,但通过项目发起者的培训或者志愿者自我学习,可以较快掌握任务操作流程。而大多数标记分类型任务不需要志愿者具备专深的背景知识,他们可以注册登录,也可以匿名访问,一般标记、分类和评论不会花费志愿者太长的时间。

4   数字人文数据众包策略

传统的众包运作流程包括3个阶段:任务准备、任务执行和任务答案整合。其中任务准备阶段包括:发起者设计任务、发布任务,志愿者选择任务;任务执行阶段包括:志愿者接收任务、解答任务、提交答案;任务答案整合阶段包括:发起者接收/拒绝答案、整合答案[20]。数字人文领域数据众包主要由数据众包发起者、志愿者和平台这三个主体组成,三个主体之间相互制约、相互影响,共同推动数据众包的运行(见图1)。从数据众包发起者的角度来说,需要考虑发起者在数据众包的前期、中期和后期的主要工作,将数据众包的运作流程分为数据众包设计、数据众包运行管理、数据众包成果管理[21]。其中,数据众包设计包括界定任务类型,选择任务实施方式、选择平台和发布任务;数据众包运行管理则需解决数据管理、质量管理、激励政策和诚信伦理等问题;数据众包成果管理对版权和成果发布问题进行讨论。

4.1    数字人文数据众包实施方式选择

传统的众包模式主要包括众包竞赛和协作社区两种类型[22]。数据众包项目的最终目的是为了解决数字人文项目的数据短缺问题,而解决问题可以有唯一最优解和无穷多最优解,分别对应着众包竞赛和协作社區。

众包竞赛以比赛竞争的形式对人文数据进行众包,发起者根据不同参与者的解决方案,进行排名并对最佳解决方案发放奖励,它强调解决方案的优选性,主要由外部动机即项目发起者所推动,采取自上而下的组织方式[23]。InnoCentive众包创新平台把需要解决的众包任务标准化成一个或若干个竞赛,并提出优胜的标准,每个项目的奖金额度为5000美元至100万美元不等[24]。2018年南京大学信息管理学院和上海图书馆历史文献众包中心联合开展了文化遗产数字化竞赛,参赛者选取盛宣怀档案中进行抄录,经过专家审核评分,共17个团队获奖[25]。

众包协作社区则是在一个和谐的环境内允许志愿者提交的不同解决方案同时存在,它强调解决方案的聚合性,主要由内部动机即志愿者所推动,采取自下而上的组织方式[23],维基百科是利用协作社区进行数据众包的典型例子。维基百科将多名贡献者的成果进行编排,整合成一个连贯的整体,实现价值的创造,通过自动化流程来协调和整合大众的编辑工作,跟踪所有的改动,由于维基百科大众规模庞大,任何一条词条都需经过多重人员的审查,从而保障了内容质量,由此可见,协作社区最适用于解决编排相对简单的项目,大众协作依靠广泛的任务模块化、标准化程序和技术来实现合作的顺畅。

因此,数字人文数据众包任务发起者应该根据所需的数据解决方案而选择合适的数据众包实施方式(见表2),以获取符合人文学者研究的人文数据。在数字人文的数据众包中任务难度较大的转录校正型众包任务可以通过众包竞赛的方式实施,获取解决众包任务的最优方案。而对于任务难度较小的标记分类型任务、补充收集型任务则适合采用协作社区的方法,一方面不必花费过多的精力设计专项众包平台,另一方面,协作社区以多元化的属性,整合尽可能多的成果。

4.2    数字人文数据众包平台选择及任务发布

众包任务的发布和数据的收集是通过众包平台来完成的。数字人文数据众包的平台主要分为三大类[6,21]:一是项目发起者设计的专项平台,这类数据众包平台虽然前期耗费一定的时间与精力设计,但是它能较好地保障项目的专业性和数据的完整性,有利于多维性数据的收集与数据之间关联的建立;二是Facebook、Twitter、微博、校内论坛等社交媒体平台,这类平台收集到的人文数据杂乱且碎片化,但是可以节约项目经费,快速部署,对参与者的门槛较低,成果传播范围更广;三是商用的众包平台,如国外的Amazon Mechanical Turk、CloudCrowd、InnoCentive等,国内的猪八戒、脑力库、三打哈等,这类平台有丰富的众包经验,可以缩短项目实施时间,优化项目管理效率。

本文提到的边沁手稿转录项目、史密森尼转录项目、盛宣怀档案抄录项目、上海图书馆家谱知识服务项目等都是设立了专门的众包平台或系统;美国国会图书馆利用Flickr社区进行图片标记分类,则吸引了众多志愿者参与,传播范围较广。因此数字人文数据众包平台的选择需要根据发布者的需求来选择,对数据专业性和数据的完整性有特殊要求、或众包数据量较大的众包项目可以自行设计自己的众包平台,不但能保证数据的完整性,而且有利于后续数据众包的继续开展,而对于数据要求不严格或众包数据量不多的众包项目则可以选择第三方的数据众包平台。

4.3    数字人文数据众包运行管理

4.3.1   数据管理

数字人文项目进行数据众包离不开对庞大的数据管理。数字人文数据众包的启动离不开大量的原始数据基础,数字人文数据众包实施过程中数据的管理直接关系到项目实施的效率和完成的质量,此外,成功的数字人文数据众包也积累了大量的数据。因此数据的可持续发展问题值得我们思考,数据众包项目需要考虑项目成果将在哪里进行存储和维护?持续研究项目的资金如何解决?如果要进行长期持续开发,可能的资助来源有哪些?哪些机构长期备份或存储项目的数据?与我们熟悉的商业活动众包项目相比,数字人文领域的数据众包在数据容量、数据种类、数据有效性及数据完整性上更加难以有效管理。因此,数字人文领域的数据众包项目对数据质量管理有更高层次的需求。

赵宇翔[6]提出以往的公众科学项目缺乏对数据的关注和深入挖掘,没有将产生的科研数据作为一种资产进行有效管理和利用,同时提倡将元数据构建、关联数据以及数据监护等图书情报学科的理论和方法应用在数字人文平台的管理中。数字人文数据众包中的数据组织及重构方法包括数据化、数据融合、数据关联及发布,首先,在OCR识别文本的基础上,加强对文献内容的重组,将文献内容转化为可制表分析的量化数据,满足数字人文研究者对数据的属性要求[26];其次,通过异构融合、多源融合、多模融合三种不同的形式对人文数据进行融合,形成有效的多视角分析数据集,从而进行多维度挖掘和分析,帮助人文学者发现新规律、新价值[27]。此外,利用数据关联技术建立人文数据集。近年来上海图书馆家谱关联数据服务平台及历史地理数据的开放方面应用关联数据技术进行大量实践研究,采用关联数据从以图书馆为中心的知识组织系统向跨领域公开可用和易于访问的知识图谱转变,可提高人文数据的可用性和重用性。

4.3.2   质量管理

由于数字人文数据众包项目的志愿者大多数是普通大众而不是具备专深理论知识的研究者,高质量的成果往往数量不多。因此,数据众包项目发起者应该均衡任务的成本、任务的质量、任务完成时间三者的关系,以提高项目质量。

首先,在数据众包实施之前可以对志愿者进行相关知识调查和测试,这不仅可以过滤不符合工作要求的志愿者,还可以让志愿者进一步了解工作任务,进而提高工作质量。如“籍合网”招募校正古籍的志愿者时,要求志愿者实名注册,具有文史哲相关专业及背景。

其次,对通过测试的志愿者进行培训,使志愿者更加熟悉任务,提高工作效率和工作质量。对于难度较大的转录校正型项目,如边沁转录项目为志愿者提供了详细的转录指南,并定期开展转录培训。补充收集型项目由于难度不大,管理者可以适量提供一些工具类的培训。如纽约公共图书馆“Building Inspector”项目开展计算机培训,鼓励参与者利用计算机软件更方便地收集地理信息。对于分类标记型项目,管理者会提供一定的受控词表,志愿者以此进行分类和标记,避免分类过大,提高项目质量。

最后,合理设计任务过期时间,使志愿者在适度的时间内完成任务。Ipeirotis[28]发现,大多数任务请求者都将任务的“过期时间”设置为12小时或7天,在12小时这个时间节点,只有大约50%的任务被完成,如果等到7天,大约90%的任务被完成。

4.3.3   激励政策

数据众包的参与志愿者多样化,因此任务发起者必须花费更多的精力来平衡志愿者的需求。完善的激励政策才能保证数据众包项目顺利实施。目前,用户参与的激励政策分为物质金钱激励方式和非物质金钱激励方式。

其中,物质金钱激励可以在短期内招募大量志愿者,但是很多数字人文项目属于非营利性项目,长期采用物质金钱激励方式不太现实。因此,数据众包项目可以支付志愿者小部分工资,同时使数据众包的志愿者对工作内容产生兴趣或实现自我满足。Mason和Watts[29]研究发现,只有合适的任务回报才能吸引志愿者参与数字人文众包项目。偏高的回报导致吸引过多的参与者,从而降低了任务质量同时给发包商增加成本压力;偏低的回报则会导致志愿者的兴趣点下降,对众包工作产生懈怠心理,导致任务时间周期较长。众包竞赛中经常利用物质金钱激励志愿者参与项目,InnoCentive众包平台根据不同难度的众包任务设置不同的奖励,一般难度的项目要求志愿者提交方案的时间为1-2个月,奖金取决于完成情况,最高为数万美元;中等难度的项目提交方案时间为2-3个月,奖金为数万至数十万美元;难度较大的项目提交方案的时间为3个月以上,奖金最高达100万美元。

麦肯锡的研究表明,推动Web2.0用户进行无条件构建知识的主要动力不是物质激励,而是兴趣和声誉[30]。非物质金钱激励方式主要包括积分制和排行榜公示。虚拟积分可以激发志愿者一定程度的兴趣和积极性。排行榜公式激励方式即在项目网站上公布参与用户的贡献度。同时进行贡献度认证,各参与用户需提供一份说明在各阶段的作用和付出的时间。根据马斯洛需求层次理论,排行榜公式方式正好满足了参与用户尊重需求和自我实现需求等高层次需求,同时排行榜能够激发参与志愿者之间的竞争,这种竞争可以良性推动数据众包工作的开展。边沁手稿转录项目采用积分和排行榜公式的方式激励志愿者,网站上公布了前五十名志愿者的积分,并根据积分将上榜者划分不同称号。盛宣怀档案抄录项目在平台首页右侧清晰地展示了前十名的用户名和积分。

此外,从外部激励和内部激励角度激发志愿者的积极性,数字人文数据众包项目还应针对不同阶段灵活采取不同的激励政策。张轩慧[3,31]对数字人文类众包项目初期和中后期公众参与动因进行了探讨,提出在众包项目实施初期,应该增强平台的易用性和社交性,提高任务的自主性、有趣性和情境性,从而激发参与者的感知有用性和使命感,从而吸引更多用户参与数据众包项目,保证项目的正常启动。在众包项目实施中后期,项目发起者应该将物质奖励和精神奖励有机结合,同时创建志愿者交流社区,将游戏化元素融入平台,同时增加反馈和协助机制,增强志愿者参与信心;此外在任务设计方面,循序渐进的任务难度和不断更新的任务种类,才能保持志愿者的持续执行动力,增加志愿者与项目的粘性,保障数据众包项目的顺利完成。

4.3.4   伦理诚信

由于公众参与众包的方式包括匿名访问、注册登录、实名参与。因此,一方面数据众包平台可能泄露参与用户个人隐私。如“籍合网”在招募古籍校正志愿者时,要求志愿者填写真实姓名、身份证号以及发放报酬用的银行卡号等,此外,一些地理空间众包工作任务可能会暴露志愿者的地理位置;另一方面,由于参与用户可以直接接触研究者的研究资料,因此可能会歪曲众包的信息,或者將研究者的众包信息泄露给其他研究者,阻碍数字人文众包项目的有效实施。因此,众包项目发起者应该与志愿者在实行任务前签订同意书和保密协议,避免知识产权纠纷,众包发起者和志愿者自觉维护双方权利,才能促进众包项目的顺利实施。

4.4    数字人文数据众包成果管理

4.4.1   成果宣传

众包成果可以分为阶段性成果和最终成果。在众包项目运行中,项目方通常会发布相关文章或报告,分享阶段性成果,同时也起到项目宣传的效果,吸引更多的志愿者参与。在项目结束后,除了发表相关文章,项目成果通常还有开放数据库、开源工具等公开性成果。如边沁手稿转录项目每个月都会在其网站上公布转录的进度和成果,并定期向学术界和公众发布演讲。“籍合网”对于完成转录校正的古籍,汇总成开放的古籍数据库供大众查阅,服务公众和社会。上海图书馆家谱知识服务平台将收集到的家谱信息集合成档案供公众浏览和搜索。

4.4.2   版权管理

从某种角度上讲,众包模式推动了文化和历史的传播。为了加快知识的有效流传,资源所有者应该积极树立开放意识,主动推进人文学科资源的数据化工作。Cooper等[31]提出应该在志愿者参与科学研究的成果中清晰地标注“公众科学”的字样,这不仅可以认同公众参与科学研究的积极作用,还能提醒未来学者归纳此领域的研究成果。数字人文项目人员逐渐从个体转变为跨领域学者和志愿者合作团队组成,数字人文的数据众包成果也应该转变著述模式,以“我”为核心的单一著述模式转变为以“我们”为中心的合作性著述模式,打破传统的以版权保护和专属授权限制为中心的著作权理念,限制程度最低的共享与授权模式应该成为主流。边沁手稿转录项目每月更新成果版本,上海图书馆家谱知识服务平台实时对家谱目录进行补充。以数字手段出版和发表的作品不再是最终版本,而是处于不断迭代过程中的更新版,新的知识和发现可以随时被补充进来。

5   结语

本文从数字人文数据众包发起者的角度论述了数据众包运作策略,在数据众包的设计、运行管理和成果管理三个阶段中,具体介绍了转录校正型、标记分类型、补充收集型这三种任务,区分了众包竞赛和协作社区的实施方式和不同众包平台的特点,并对可能出现的数据管理、质量管理、激励政策、诚信问题和成果发布与版权问题提出了应对策略。

目前,我国数字人文领域应用众包形式的案例逐渐增多,我们应当积极吸取国外数字人文众包项目的成功经验,充分利用众包的力量,加速人文数据的建设,推动数字人文研究。数字人文数据众包对人文数据的建设是有益的补充,数据众包给数字人文工作提供了数据化的平台和工具,通过数字人文数据众包活动,不仅帮助人文学者获取研究所需的人文数据,还进一步加深公众对文化和历史的理解,达到了宣传的效果[32]。我们在塑造平台、工具和技术的同时,这些平台、工具和技术也在塑造我们,由此形成了数字人文的社会生活。

参考文献:

[1]  (美)安妮·伯迪克,约翰娜·德鲁克,彼得·伦恩费尔德,等.马林青,韩若画,译.数字人文:改变知识创新与分享的游戏规则[M].北京:中国人民大学出版社,2018:121.

[2]  HOWE J.The rise of crowdourcing[J].Wired,2006,14(6):176-183.

[3]  张轩慧,赵宇翔,王曰芬.数字人文类公众科学项目冷启动阶段的公众参与动因研究[J].图书与情报,2019(3):61-72.

[4]  Seitsonen,Oula.Crowdsourcing Cultural Heritage:Public Participation and Conflict Legacy in Finland[J].Journal of Community Archaeology & Heritage,2017:1-19.

[5]  韩文婷,宋士杰,赵宇翔,等.数字人文类众包抄录平台中任务绩效的影响因素研究——基于任务复杂度与领域知识视角[J].图书与情报,2019(3):73-84.

[6]  赵宇翔.科研众包视角下公众科学项目刍议:概念解析、模式探索及学科机遇[J].中国图书馆学报,2017,43(5):42-56.

[7]  Oomen J,Aroyo L.Crowdsourcing in the cultural heritage domain:opportunities and challenges[C].International Conference on Communities and Technologies.ACM,2011:138-149.

[8]  肖奕.数字人文项目合作平台分析——以DHCOMMONS为例[J].知识管理论坛,2017,2(6):464-476.

[9]  欧阳剑,彭松林,李臻.数字人文背景下图书馆人文数据组织与重构[J].图书情报工作,2019,63 (11):15-24.

[10]  DCC Curation Lifecycle Model[EB/OL].[2019-11-23].http://www.dcc.ac.uk/resources/curation-lifecycle-model.

[11]  梁连高.浅析纸质文书档案数字副本OCR识别方法[J].科技与创新,2018(4):129-130.

[12]  边沁手稿转录项目[EB/OL].[2019-03-20].https://blogs.ucl.ac.uk/transcribe-bentham/.

[13]  史密森尼轉录中心[EB/OL].[2019-03-20].https://transcription.si.edu/.

[14]  盛宣怀档案抄录项目[EB/OL].[2019-03-20].http://zb.library.sh.cn/index.jhtml.

[15]  澳大利亚国家图书馆数字报纸项目[EB/OL].[2019-03-20].http://www.nla.gov.au/content/newspaper-digitisation-program.

[16]  纽约公共图书馆“建筑检查员”项目[EB/OL].[2019-03-20].http://buildinginspector.nypl.org/.

[17]  上海图书馆家谱知识服务平台[EB/OL].[2019-03-20].http://search.library.sh.cn/jiapu/.

[18]  纽约公共图书馆“社区口述历史项目”[EB/OL].[2019-03-20].http://oralhistory.nypl.org/.

[19]  英国国家档案馆“战争日记”项目[EB/OL].[2019-03-20].http://www.operationwardiary.org/.

[20]  冯剑红,李国良,冯建华.众包技术研究综述[J].计算机学报,2015,38(9):1713-1726.

[21]  练靖雯,张轩慧,赵宇翔.国外数字人文领域公众科学项目的案例分析及经验启示[J].情报资料工作,2018(5):32-40.

[22]  邢文明,司莉.Web2.0环境下用户参与图书馆信息组织的可行性分析——基于用户接受的实证研究[J].图书馆建设,2012(4):31-35.

[23]  乔健.美国众包悬赏竞赛创新模式剖析[J].全球科技经济瞭望,2017,32(10):8-12.

[24]  InnoCentive众包创新平台[EB/OL].[2019-03-20].https://www.innocentive.com/.

[25]  南京大学信息管理学院主办的文化遗产数字化竞赛活动落幕[EB/OL].[2019-03-20].http://im.nju.edu.cn/content.do?mid=3&mmid=34&cid=7bf6abc0-1634-11e9-b5d3-40a8f01ece83.

[26]  赵思渊.地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例[J].清史研究,2016(4):26-35.

[27]  欧阳剑.面向数字人文研究的多源数据融合[R].第十三届数字图书馆前沿问题高级研讨班(ADLS2016),上海,2016.

[28]  Ipeirotis P G.Analyzing the amazon mechanical turk marketplace[J].ACM Crossroads,2010,17(2):16-21.

[29]  Mason W A,Watts D J.Financial incentives and the “performance of crowd”.Proceedings of the ACM SIGKDD Workshop on the Human Computation[J].Paris,France,2009:77-85.

[30]  Michael Chui,Six ways to make Web 2.0 work[EB/OL].[2019-03-20].https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/six-ways-to-make-web-20-work.

[31]  Cooper C B,Dickinson J,Phillips T,et al.Citizen Science as a tool for conservation in residential ecosystems[J].Ecology&Society,2007,12(2):375-386.

[32]  S Schreibman,R Siemens,J Unsworth.Crowdsourcing in the Digital Humanities[M].John Wiley & Sons,Ltd,2015.

作者簡介:岑炅莲,女,广西民族大学管理学院硕士研究生;欧阳剑,男,上海外国语大学图书馆研究馆员;曾辉,男,广西民族大学管理学院硕士研究生。

作者:岑炅莲 欧阳剑 曾辉

上一篇:视觉文化媒介素养教育论文下一篇:东印度公司与中国贸易论文