审计学习论文提纲

2022-11-15

论文题目：基于可解释性机器学习的审计业务规则挖掘

摘要：随着审计信息化的持续推进,审计业务的精细化要求不断被提高,为了提高程序合规性、内容真实性、理由充分性以及审计判断的效率,研究人员需要从数据中进行规律性知识发现,提取审计业务规则。传统的审计业务规则大多利用专家经验或统计分析的方法,但该途径具有一定的主观性及片面性等不足,基于多维数据及机器学习模型的审计业务规则挖掘可以弥补上述不足,但目前流行的深度学习等途径还具有黑箱的不可解释的不足,由此会限制挖掘出的审计规则使用的可信性,因而需要构建具有可解释性的机器学习模型。本文基于某市审计局的工程变更数据利用关联规则、决策树以及贝叶斯网络这些可解释性强的机器学习方法进行规则提取。结构化数据方面,利用受约束的关联规则方法来发现其他特征与目标特征的关联,把这样的关联规则作为审计业务规则。利用决策树作为审计业务数据的分类模型,其中根节点到叶子节点的关系作为审计业务规则输出。利用贝叶斯网络模型对审计业务数据进行结构学习形成审计业务数据特征的有向无环图然后进行参数学习,最后把贝叶斯网络的推理结果作为审计业务规则。非结构化数据方面,同样利用这三个方法挖掘审计文本中主题词之间的条件依赖关系作为审计业务规则,揭示审计文本的内在属性。审计业务规则的抽取是形成从“工程数据→审计疑点→审计证据→审计判断”的审计证据链的关键一环。关联规则作为无监督的机器学习方法,用于知识发现,它对于审计业务规则提取有较好的效果,规则直观,且具有置信度作为对规则本身有效性的评价。决策树和贝叶斯网络模型对审计业务的结构化数据都有较好的分类效果。其中决策树在精准率、召回率、F1值、AUC值分别达到82.3%、91.4%、86.6%、85.7%。贝叶斯网络在分类效果在精准率、召回率、F1值、AUC值分别达到89.4%、99.0%、94.0%、93.6%。由于审计数据样本的不均衡,把AUC值作为更有参考价值的分类评价指标,同时也以此作为输出规则的置信度。利用可解释性机器学习方法进行审计业务规则挖掘,比较各个机器学习模型间的差异与优劣,探索不同方法的适用场景,同时拓展了可解释性机器学习模型的应用面。利用可解释性机器学习挖掘的审计业务规则客观可信,能够作为审计人员审计决策时的辅助依据。

关键词：审计业务;规则挖掘;机器学习;可解释性

学科专业：计算机技术（专业学位）

摘要

Abstract

1 绪论

1.1 研究背景及意义

1.2 研究现状及发展趋势

1.2.1 基于专家经验的审计业务规则挖掘

1.2.2 基于多源数据的审计业务规则挖掘

1.2.3 基于可解释机器学习的规则挖掘

1.2.4 文献评述

1.3 研究内容