基于数据挖掘的客服业务增量预测管理设计——以GPRS业务为例

2023-02-26

本文以某省联通公司业务管理系统中GPRS业务增量预测应用为背景, 结合商务智能领域前沿理论, 深入讨论在电信行业中实施数据挖掘解决方案的具体过程。本文主要是针对GPRS业务增量预测问题应用数据挖掘技术在大量已知历史数据中进行挖掘分析, 使用Climentine等工具, 结合C5.0, Logistic回归算法对样本数据进行分析, 挖掘GPRS业务用户群的特征, 建立预测模型, 并将模型应用到业务管理系统中。

本文主要是针对GPRS业务增量预测问题应用数据挖掘技术在大量已知历史数据中进行挖掘分析, 使用Climentine等工具, 结合C5.0, Logistic回归算法对样本数据进行分析, 挖掘GPRS业务用户群的特征, 建立预测模型, 并将模型应用到数据业务管理平台中。建立模型的指导思想如下。

连续三个月使用GPRS业务的用户定义为GPRS重度用户, 连续三个月未使用GPRS业务的用户定义为非GPRS用户。通过数据挖掘算法及工具分析出GPRS重度用户区别于非GPRS用户的特征, 建立模型对未使用GPRS业务的用户进行GPRS使用可能性打分, 对分数高的用户进行业务推荐, 从而达到精确营销的目的。

本系统采用了SPSS公司的Clementine8.1作为后台数据挖掘开发工具。该工具提供多种常用数据挖掘算法, 提供可视化、流程化的集成开发环境, 并且完全支持CRISP-DM数据挖掘过程模型。

建立模型就是要得到一个类似Y=A1*X1+A2*X2+A3*X3+…的公式。其中Y表示用户使用GPRS业务可能性评分, Xi表示对预测结果有影响的宽表中的属性字段, Ai表示影响系数。因此建立模型的过程实际上就是解方程的过程。但是宽表中256个字段, 并不是每个字段都对预测目标有影响, 若以所有字段作为输入求解方程必将影响建模的效率与模型的准确性。因此需要找出对预测结果影响大的字段, 作为输入求解方程。决策树算法对于客户分群有着极高的效率, 且生成的规则直观易懂, 其生成的结果树中, 根部元素为能最大限度将群分开的元素, 其分枝节点中越靠近根元素的节点分群的能力越大。由决策树模型的这种特点, 可以首先在样本数据上应用决策树模型, 生成决策树。然后从根部开始往下选出一定的字段, 作为输入进行下一步建模。这些字段必将是对预测结果最有影响的字段。应用决策树算法后得到了所求公式中的输入X, 要求出系数A可应用回归模型。回归模型从统计的角度对输入变量是否对GPRS业务使用有影响进行分析, 最后得出一个多元一次方程, 用来对客户的GPRS业务使用可能性进行评分。

决策树分析。

首先应用决策树算法对数据进行分群分析, 分析出哪些字段对标识字段的影响最大。决策树算法选择工具中提供的C5.0模型。C5.0模型中flag字段即GPRS使用标识字段作为目标字段, 其余字段作为输入字段。算法将以目标字段的值为依据进行分群。

回归分析。

决策树分析只能对数据进行分群, 预测用户是与不是, 若要对用户使用GPRS业务的可能性进行评分, 可以应用Logistic回归模型。在这里, 从决策树的根部开始分别取四层, 五层, 六层的节点字段, 作为输入分别建立模型, 然后对模型进行评估, 选择评估效果最理想的模型作为最终模型发布。

在建立模型的过程中, 依据Logistic输入字段的不同分别建立了模型, 究竟哪个模型最能准确的发现潜在用户?这就需要在建立模型的过程中建立模型评测的方法, 对模型的准确性做出评测, 将评测效果最好的模型作为稳定的模型发布应用。首先介绍一些模型评估指标。

命中率。

表示在被预测出是GPRS业务使用用户的客户当中, 实际GPRS业务用户所占比率, 它是描述模型精确性的指标。

查全率。

表示在实际的GPRS业务用户中, 被预测出为GPRS业务使用用户所占的比率, 它是描述模型普适性的指标。

提升率。

每组客户中的命中率/不使用模型时的业务使用率, 若该值大于1说明模型是起作用的。

模型1的分析结果。

一般情况下, 一个电信行业增量预测模型提升率大于5时就被认为是一个较好的模型。从这个指标来看三个模型的提升率都大于5, 都是符合要求的。但是模型3无论是在准确率, 查全率还是提升率上都比前两个模型效果好。

通过建立模型和模型评估, 得到了一个准确稳定的, 形如Y=A1*X1+A2*X2+A3*X3+…的模型。

模型建立并经验证之后, 可以有两种主要的使用方法。第一种是提供给市场决策人员作参考, 由他通过查看和分析这个模型之后提出行动方案建议。比如可以把模型检测到的聚类, 模型中蕴含的规则或表明模型效果的图表拿给市场决策人员看。

另一种是把此模型应用到不同的数据集上。模型可以用来标识一个事例的类别, 给一项申请打分等。还可以用模型在数据库中选择符合特定要求的记录, 以用分析工具做进一步分析。

本文把商务智能理论与实际项目相结合, 最终实现了将预测系统应用于GPRS业务客户的识别, 体现了巨大的应用价值。应用结果表明所建立的预测模型是科学的, 是符合实际情况的, 能够指导通信公司业务人员针对GPRS业务进行精确营销, 该模型对于公司扩大GPRS业务用户规模, 增加收入具有重大意义。

摘要:“盘活存量, 激活增量”是当前运营商普遍采取的经营战略。经过多年业务系统建设, 电信运营商往往积累了大量的业务数据, 如何从中快速提取信息、发掘隐藏在业务数据中的一些深层次的内在规律, 把握业务发展的趋势, 对业务发展进行分析、预测以及制定相应的市场策略, 对市场机会做出及时灵活的反应, 将成为企业在信息时代市场竞争中立于不败之地的关键所在。

关键词:数据挖掘,客户业务,增量预测,GPRS业务

参考文献

[1] 胡雪梅.浅谈数据仓库技术在中国电信的应用前景[J].通信世界, 2001 (11) .

[2] 周东山, 李喜英.数据仓库建设中的数据质量问题的研究[J].华南金融电脑, 2007 (6) .

[3] 张中平, 徐佑军.OLAP技术在电信领域中的应用[J].计算机工程与设计, 2007 (2) .

[4] 江涛.浅析数据挖掘技术[J].IT技术, 2007 (4) .

[5] 杨忠, 戴世雄, 严南, 等.数据挖掘技术在电信欠费客户流失中的应用[J].中国水运, 2007 (23) :9.

[6] 王诚.OLAP技术在电信经营管理中的应用[J].计算机信息技术, 2007 (5) .

[7] 吴良清.商业智能的研究与应用[J].中国科技信息, 2007 (1) .

[8] 谭学清, 陆泉, 谭永丽, 等.商务智能.武汉大学, 2006.

[9] (美) 米切尔.贝瑞.客户关系管理的科学与技术[M].中国财政经济出版社, 2004.

[10] 唐晓东.基于数据仓库的数据挖掘技术[M].机械工业出版社, 2004.

[11] 李雄飞, 李军.数据挖掘与知识发现[M].高等教育出版社, 2004.

[12] 朱建秋.OLAP解决方案[M].电子工业出版社, 2004.

[13] (美) 荫蒙.数据仓库[M].机械工业出版社, 2006.

上一篇:探析企业传统档案形式的发展与改革下一篇:影响地铁施工质量的主要因素分析