计算机大数据论文提纲

2022-11-15

论文题目:个人大数据定价方法研究

摘要:随着人工智能时代的来临,数据已经成为最有价值的资产。数据作为一种重要的资源和资产,如何对其进行共享交易,实现其流通,挖掘其价值是目前行业研究的热点。数据成本难以估计,应用场景的多样化和动态性导致数据的市场价值难以评估。同时,数据之间复杂的相关性使得数据市场存在套利行为。如何设计合理的数据定价机制来充分利用大数据资源,实现交易多方互利共赢,是数据交易可持续健康发展的一个技术难题。个人大数据作为一种重要的大数据资源,在个人用户不知情的情况下,已经被很多数据代理商采集和分析,并且进行售卖以获取利益。如何保护个人大数据所有者的权益,让个人积极参与数据交易,贡献高质量有价值的数据并获得应有的利益,让数据购买者获取到有价值的数据,促进个人大数据交易市场的健康发展是目前亟待解决的关键问题。数据定价已经成为计算机领域和经济学领域热门的研究话题。目前数据库领域的数据定价相关工作关注的大都是结构化、关系型的通用数据,而对个人大数据进行定价的研究甚少。个人大数据质量是影响个人大数据价值的主要因素,根据个人大数据质量定价使得数据购买者能够获得有价值的数据。信息熵用来度量个人大数据包含的信息量,根据信息熵定价能够精确反应个人大数据的价值。最小溯源用来度量对查询结果的贡献大小,根据溯源定价使得个人大数据定价具有公平性。差分隐私是保护个人大数据的有效方法,根据隐私损失程度进行合理定价和补偿,使得个人大数据能够得到有效利用。个人大数据定价机制在个人大数据交易市场框架中正好起到基石作用,对个人大数据定价方法的研究将具有十分重要的意义。本文从多个角度对个人大数据定价方法进行了比较系统和深入的研究,主要的工作及创新如下:(1)研究了信息熵定价问题,采用香农的信息熵来度量数据元组包含的价值量。不同数据包含的信息熵不同,价值量不同,进而其价格也是不同的。提出了一种新的数据定价度量——数据信息熵,从信息量角度定价个人大数据,建立信息熵与价格之间的函数关系,通过连接函数实现信息熵到价格的映射。实验结果表明基于信息熵的定价度量方法对数据定价机制的研究具有一定的启发作用,并将进一步促进个人大数据交易市场的发展。(2)研究了最小溯源定价问题,根据源元组价格设置函数以及价值权重,进行基于最小溯源查询定价分析。同时考虑了数据本身的重要性(内在质量)以及数据之间的相关性。首先提出了个人大数据的溯源定价方法,该方法根据对查询结果作出贡献的最小溯源进行定价。然后设计了精确算法和近似算法来分别计算查询的精确价格和近似价格。最后分别用选择-连接查询和复杂查询实例化定价方法,在两个实际数据集上进行实例验证,并广泛评估了其性能。实验结果表明该定价方法是有效的和高效的。(3)研究了差分隐私定价问题,分析了如何在保护个人隐私的同时,充分挖掘个人大数据所蕴含的价值。提出了个人大数据的隐私定价方法,设计了正向定价和反向定价两种不同机制对隐私数据进行合理定价,并根据个人用户的隐私损失程度进行适当补偿,实现对个人大数据进行隐私保护的同时进行合理利用。通过在个人大数据中添加噪音,对数据进行脱敏处理,实现不同程度的隐私保护,得到不同精确度的数据。根据个人不同的隐私保护需求,添加不同的噪音,得到不同精确度的数据,实现差别化定价。实验结果表明该定价方法可以对个人大数据进行合理定价,对个人隐私损失进行比较公平的补偿,保证数据实用性,在隐私保护和数据效用之间实现平衡。目前国内外研究机构对个人大数据定价方法的研究还处于探索阶段,存在公平性、合理性、实用性、免套利性等诸多问题。本文分别从信息熵、数据溯源和差分隐私等几个方面对个人大数据定价方法进行了深入研究和探索,为个人大数据交易和定价方法的研究作出了有益的贡献。

关键词:个人大数据;数据定价;信息熵;数据溯源;差分隐私

学科专业:计算机科学与技术

摘要

Abstract

第1章 绪论

1.1 研究背景与意义

1.2 国内外研究现状及存在问题

1.2.1 数据定价策略

1.2.2 数据定价模型

1.2.3 数据定价机制

1.2.4 主要存在的问题

1.3 研究内容与创新性

1.4 论文的组织结构

第2章 相关研究工作

2.1 大数据

2.1.1 大数据的特征

2.1.2 大数据的质量与价值评估

2.1.3 大数据定价机制

2.1.4 大数据资产化

2.1.5 大数据面临的关键问题

2.1.6 大数据的意义

2.2 个人大数据

2.2.1 数据特征选取

2.2.2 数据价值影响因素

2.2.3 正向分级、反向定价

2.3 数据定价

2.3.1 基于数据的定价

2.3.2 基于查询的定价

2.3.3 基于拍卖的定价

2.3.4 基于差分隐私的定价

2.4 信息熵

2.4.1 数据交易市场

2.4.2 数据定价机制

2.5 数据溯源

2.5.1 Why-Provenance

2.5.2 Where-Provenance和How-Provenance

2.5.3 当前溯源的问题

2.6 差分隐私

2.7 本章小结

第3章 信息熵定价

3.1 引言

3.2 信息熵

3.2.1 信息熵的价值

3.2.2 信息熵的价值评估

3.3 价值与价格

3.4 基于信息熵的数据定价

3.4.1 问题公式化

3.4.2 信息量的度量

3.4.3 基于数据信息熵的定价函数

3.4.4 讨论

3.5 实验分析

3.5.1 实施问题

3.5.2 对公共研究质量数据集进行实验

3.5.3 定价函数

3.6 本章小结

第4章 最小溯源定价

4.1 引言

4.2 定价数据

4.2.1 定价方法

4.2.2 最小溯源

4.2.3 p-范数

4.2.4 定价函数

4.3 定价算法

4.3.1 精确算法

4.3.2 近似算法

4.4 实验分析

4.4.1 有效性

4.4.2 效率

4.5 本章小结

第5章 差分隐私定价

5.1 引言

5.2 定价模型

5.3 免套利定价函数

5.4 定价框架

5.4.1 隐私损失

5.4.2 正向定价

5.4.3 反向定价

5.5 实验分析

5.5.1 分类及效果评价

5.5.2 隐私与效用

5.5.3 定价函数

5.5.4 隐私补偿

5.6 讨论

5.7 本章小结

第6章 总结与展望

6.1 全文总结

6.2 研究展望

参考文献

致谢

上一篇:基金筹资农村合作医疗论文提纲下一篇:儿童心理学论文提纲