文学作品分析论文提纲

2022-11-15

论文题目:中文文学作品中的社会网络构建与分析 ——以《三国志》为例

摘要:随着网络空间中的信息量呈爆炸式增长,我们能够共享到的信息越来越多。然而,这些信息通常以多种不同的数据形式存储于网络空间中,阻碍了数据的获取及处理。因此,如何有效地获取及处理这些数据,进而从庞大的数据中挖掘有用的信息,并加以分析成为了很多领域的研究重点。人物关系网络的构建与分析是其中一项十分重要的研究内容,对于侦察情况分析及资源分析、检索等具有重要意义。中文文学作品是一类重要的信息来源。中文文学作品中人物关系的分析与挖掘,对于把握作品情节的展开,进而更好的理解该作品具有重要的意义。当前对文学作品中的人物关系网络研究已经有所开展,但仍然存在一些问题,主要包括:1)现有工作仅关注文学作品中的一小部分人物,未能比较完整地构建出文学作品中的人物关系网络;2)现有工作所研究的内容主要集中在人物网络结构和角色分析等问题,并未关注人物关系网络中关键人物的识别工作,然而关键人物对于理解作品具有重要的意义。有鉴于此,本文以《三国志》为研究载体,研究中文文学作品中人物之间社会网络的构建与分析技术,深入地分析该社会网络的结构特征,并挖掘出重要人物,从而为定量地分析文学作品提供支持。研究内容主要包括三个部分:(1)《三国志》人物关系网构建本文采用自然语言处理技术对《三国志》文本进行分句、分词及词性标注等处理。同时,有别于现代白话文的识别,本文通过添加自定义词典对古代文言文文本进行精确分词处理。在文言文处理中,人名消歧义是一个十分重要的环节。因为同一个人物经常会用代词多次指代,所以本文采用指代消解来避免人物重复读取的错误。人物关系的抽取是本文最关键的一步,本文将通过定义相关规则将文本进行结构化处理,进而识别人物关系。(2)《三国志》人物关系网的结构分析《三国志》人物关系网形式化的表达了三国人物及他们之间的各种交互关系。通过分析网络的静态结构有利于挖掘潜在的信息,从而为更好地理解《三国志》提供支持。本文将引入社会网络分析中的各种常用统计参数,如度分布、网络密度、模块度、平均路径长度、聚类系数等相关复杂网络指标,分析三国人物关系网的静态结构,进而量化地分析三国社会的结构特征、历史格局的形成因素及变化规律。(3)三国关键人物挖掘关键人物对于历史的形成与发展具有重要意义。因此,识别《三国志》中的关键人物对于分析《三国志》具有重要意义。本文采用加权网络的k-核分解方法来挖掘《三国志》中的重要人物,并与社会网络的其它几个中心性指标进行对比分析,验证方法的有效性。关键人物的识别可以帮助读者更好的理解历史情节的形成与发展。此外,挖掘出来的关键人物可以与历史学研究者们关于三国历史的研究成果相比较,这对于历史史实的分析和验证,以及历史趋势的走向与发展具有重要意义。本文开展的是文学和社会网络的交叉研究,创新主要在于构建了比较完整的文学作品人物关系网络,并比较全面的分析了该类人物关系网络的结构特征,并提供了一种挖掘文学作品关键人物的方法。本文的工作有助于用户理解其不熟悉的文学作品,可用于理解普通文学作品中的故事情节,同时对史料的研究也有辅助作用。

关键词:《三国志》;社会网络;自然语言处理;加权网络k-核分解

学科专业:计算机科学与技术

摘要

ABSTRACT

第1章 绪论

1.1 研究背景及意义

1.2 主要工作内容

1.3 论文组织结构

第2章 相关研究

2.1 引言

2.2 自然语言处理相关研究

2.3 社会网络分析研究现状

2.4 中文文学作品中的社会网络分析研究现状

2.5 本章小结

第3章 《三国志》人物关系网构建

3.1 引言

3.2 《三国志》人物关系网构建

3.2.1 中文文本分句处理

3.2.2 中文文本分词处理及词性标注

3.2.3 添加自定义词典

3.2.4 指代消解

3.2.5 人物角色识别

3.2.6 三国人物关系和权重

3.2.7 《三国志》人物关系可视化

3.3 本章小结

第4章 《三国志》人物关系网的结构分析

4.1 引言

4.2 社会网络统计指标

4.2.1 度分布

4.2.2 网络密度

4.2.3 模块度

4.2.4 平均路径长度

4.2.5 聚类系数

4.2.6 同配性与异配性

4.3 实验设计

4.3.1 数据集

4.3.2 实验结论与分析

4.4 本章小结

第5章 三国关键人物挖掘

5.1 引言

5.2 加权网络的k-核分解方法

5.3 实验设计

5.3.1 数据集

5.3.2 对比方法

5.3.3 实验过程

5.3.4 实验结果分析

5.4 本章小结

第6章 总结与展望

参考文献

致谢

上一篇:投资风险分析应用研究论文提纲下一篇:心理资本员工绩效管理论文提纲