专家系统个性化电子商务论文

2022-04-28

摘要:智能信息技术是我们国家最近几年以来快速兴起的,它通过与计算机、通信、电子以及控制等各项技术相结合从而完成对信息进行采集以及处置,并且伴随网络技术的迅猛发展,为智能信息的处置工作奠定了通信以及协同的基础,从而使得智能信息技术将会获得日益广泛地运用。今天小编为大家推荐《专家系统个性化电子商务论文(精选3篇)》,希望对大家有所帮助。

专家系统个性化电子商务论文 篇1:

在线礼品制作的个性化信息推送服务研究

【摘要】信息大爆炸的今天,个性化信息推送服务是一种可以满足用户特定信息需求的个性化环境,将用户感兴趣的信息主动推荐给用户的服务模式。个性化信息推送服务在在线礼品制作运营中以其区别于普通信息推送的及时主动性、针对目的性、集成性、便捷高效性的优势,为客户提供了准确、高效、便捷的服务。

【关键词】在线礼品制作;信息推送;个性化信息服务

一、研究背景

在当今社会,随着互联网的不断深入发展,近几年新兴的电子商务在我国已成为庞大的行业体系。我国电子商务行业发展迅猛,产业规模迅速扩大,和电子商务相关的行业渗透到人们生活的各个角落,为人们的生活带来了方便,并产生了巨大的影响。随着电子商务信息、交易和技术等服务企业不断涌现,当代大学二来越多的商品可供人们挑选。尽管人们可以更加轻松的买到自己所需的物品,但是不得不在数目繁多的商品中进行痛苦的选择。很多时候,人们希望有人向他们推荐。同时,虚拟的网络环境决定了用户不可能直接接触商品,从而不能全面的了解商品的质量特征。商家、企业及时准确的提供个性化的商品信息给用户,并提供舒适的购物环境,逐渐成为电子商务企业的核心力量。为此,我們的创业团队对在线礼品制作的个性化推送服务进行了初步研究。

二、信息推送及个性化信息服务

1.信息推送

从技术而言,信息推送是一项以数据挖掘、自然语言处理以及互联网等多门技术为基础的综合性方向。将合适的信息推送给合适的人,是一项极具挑战的工作。这个过程需要对信息作充分的分析,并对人的兴趣、行为做细致的刻画,并对两者进行有效匹配。

广义上的信息推送则就是”web广播”,是通过一定的技术标准或协议,在互联网上通过定期传送用户需要的信息来减少信息过载的一项新技术。推送技术通过自动传送信息给用户,来减少用于网络上搜索的时间。它根据用户的兴趣来搜索、过滤信息,并将其定期推给用户,帮助用户高效率地发掘有价值的信息。

2.个性化信息服务

网上的信息资源虽然极为丰富,但粗浅、重复的信息泛滥,信息噪声和信息垃圾充斥,与个人信息需求相关的信息被分在各地,使得用户置身于信息海洋中。这就迫切的需要一种可以满足用户特定信息需求的个性化环境,将用户感兴趣的信息主动推荐给用户的服务模式,即个性化信息服务。被推送的文件既可以是文字、图形、图像、声音、程序等,也可用超文本或通过超文本访问的文件形式保存于用户的硬盘上。个性化信息服务之所以可以提供个性化的服务,主要由于其具有普通信息服务系统所不具备的功能,如以下几点:

(1)个性化信息服务系统可根据用户的兴趣将相对应的信息主动推荐给用户。当用户进入个性化信息服务后,系统将自动将其感兴趣的相关内容以不同的形式呈现给用户,如文档、图片等。

(2)当用户使用查询功能时,系统首先是在一件离奇的用户兴趣资源中进行查找,只有当用户人为地选择了其他资源,系统才会在源数据库中进行全面查找。这样一来,可以缩小查找范围,为用户提供便利。

(3)系统还会根据用户的不同兴趣,对兴趣资源进行分类,从而使用户快速准确的找到自己感兴趣的信息。

三、在线礼品制作个性化信息推送服务

1.在线制作个性化信息推送服务的内容

(1)在线制作

在线制作的主要对象是一些个性DIY礼品,如手绘T恤、照片纸牌、纪念册、个性挂饰等。在线制作的主要商品形式以技术型为主,即由客户提供具体素材,提出个性化设计要求,由商家(制作方)在线制作样品,呈递给客户,满意后,即进行后续网络交易。在此过程中,客户只需要提供素材,提出要求,而不用在泛滥的信息中查找,节省时间并且还可以达到满意效果。比如:我们团队在校园网内建立了一个网站,有需要的同学可以通过联系方式找到我们,我们再和顾客进行面谈,主要谈一些制作细节和要求,和客户商定好了制作要求以后,由顾客提供相关素材,然后团队成员再根据要求进行具体分工。团队成员在制作过程中再相互商量、修改,做到精益求精。

(2)个性化服务的实现过程

a)用户描述具体信息的表述与更新

系统可以要求用户反馈自己对推荐资源的喜好程度。或采取用户浏览、查询等行为的跟踪方式来对兴趣信息进行更新。其具体表述与更新过程如图1所示。

图1

b)资源描述文件的表达

资源文件的表达需要获取资源的特征,并表示为合适的方式。由于资源类型的多样性,资源特征的选取成为了一个突出的问题,特别是那些不能直接获取特征的资源。个性化服务技术在电子商务的应用主要实例有Amazon.com,eBuy.com。我们团队的在线礼品制作也是基于电子商务进行的改进。

c)个性化推荐

不同的服务形式需要相应的支撑技术。要实现个性化网站,就需要针对单个用户的数据挖掘技术和网站自适应技术。

以我们团队的在线礼品制作为例,当客户提出产品需求时,我们的后台系统会在已建立的资源库中搜集符合要求的产品样式,不断地向客户推荐,当客户对需求信息做进一步更改时,会有我们的网络工作人员与之进行在线沟通交流,完成产品定制。

(3)个性化信息推送服务的内容

个性化主动信息服务是指利用现代网络技术、人工智能技术和专家系统等技术,主动地获取个人用户的特定信息需求以及部分研究团队用户的共同信息需求,针对用户需求自动检索网络信息,并根据用户要求把用户所需信息自动、主动地推送给用户的一种综合性的信息服务机制。将其应用到在线礼品制作的网络交易中,通过主动获取用户对礼品定制的要求,完成个性化礼品的设计和加工,并提供给用户可选择的礼品形式,自动推送。既体现了电子商务的便捷也充分考虑了用户的体验,也大大改善了电子商务行业以网络平台为交易背景的缺乏信任弊病。

(4)个性化服务实例

2.在线礼品制作个性化信息推送服务的优点

(1)主动性

这是在线礼品制作个性化信息推送服务最基本的特点,即当有新的信息需要提交时,依据传送信息的类型和重要性不同,推送机制会主动提醒用户接收新信息。从而提高了客户获取信息的及时性。

(2)针对性

礼品制作的个性化信息推送服务提供的信息是根据客户的特定需求定制的,这充分体现了客户的个性化需求。这种个性化的服务还是动态的,客户只需在定制之初描述信息需求,推送機制就会自动跟踪客户的使用倾向,实时地完成特定信息的推送。其中针对性包括服务内容的针对性和服务方式的针对性。

(3)集成性、可定制性

礼品制作个性化的信息推送服务中,信息人员从各种渠道,根据客户要求进行定制,通过各种方式获取信息、礼品形式、设计样式,并对其进行加工集成,通过固定的渠道传送给客户,这种经过加工的信息显然更全面,准确性更高。

(4)便捷高效性、智能性

客户只需输入一次信息请求,就可获得连续的信息服务。礼品制作的个性化信息推送服务还采用信息代理机制,可以自动跟踪客户的信息需求。这样的推送服务既节省了客户主动拉取的时间,又减少了冗余信息的传递,提高了信息的匹配度,从而大大方便了客户,提高了效率。

四、小结

个性化服务技术是目前流行的一种技术,面对日益增长的Web信息,要满足不同背景、不同目的和不同时期的查询请求,必须针对不同用户提供不同的服务才能真正解决这个问题。另一方面,随着电子商务的不断发展,个性化服务显得越来越重要,它能将电子商务网站的浏览者转变为购买者、提供电子商务网站的交叉销售能力、提高用户对电子商务网站的忠诚度。

目前,个性化服务的研究取得很大的进展,但仍存在很多尚未解决的问题:

(1)由于用户兴趣是多方面和动态变化的,因此,跟踪、学习和表达用户兴趣是一个最基本也是难以解决的问题;

(2)由于学习信息来源的多样性,因此很难测评和分析不同学习信息来源的有效性。

参考文献

[1]沈艺.信息推送技木及其应用[J].计算机系统应用,1999 (5):26-27.

[2]葛嘉佳.网络个性化信息服务综述[J].计算机时代, 2004(05).

[3]尤晓青.论个性化信息推送服务[J].石家庄学院学报,2009.

[4]李秀.推送技术——完善网络信息服务的关键技术[J].现代图书情报技术,2001(5):56-58.

[5]曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002(10).

[6]代其锋.基于电子商务的个性化推荐研究[D].中国科学技术大学,2011.

[7]余力,刘鲁.电子商务个性化推荐研究[J].计算机集成制造系统,2004(10).

[8]李永.个性化服务研究:[D].中南大学,2007.

课题来源:2103大学生创新创业训练计划之“轻舞飞扬”——大学生个性化礼品在线定制。

作者:刘昱宏

专家系统个性化电子商务论文 篇2:

论智能信息处理技术应用

摘要:智能信息技术是我们国家最近几年以来快速兴起的,它通过与计算机、通信、电子以及控制等各项技术相结合从而完成对信息进行采集以及处置,并且伴随网络技术的迅猛发展,为智能信息的处置工作奠定了通信以及协同的基础,从而使得智能信息技术将会获得日益广泛地运用。

关键词:智能信息处理;通信技术;应用

文献标识码:A

信息系统指的是通过对信息进行传输与交换、对各种信息进行处理以及利用信息网络为主体的各种通信以及信息组成的系统。

智能信息处理技术是利用计算机或者其余的电子设备以达到对信息进行自动收集、处理以及显示等功能,能够实现无人化处理,从而大大降低用户的工作压力。对智能化的信息处理技术的基本理论进行研究,比如信息以及知识处理的数学原理、复杂的算法设计原理、并行处理的算法以及原理、生物以及量子计算等全新的计算模式、机器学习理论、神经网络以及生物信息处理等。以运用互联网为基本背景的各种领域智能化信息处理技术,比如:处理大规模的文本、检索并处理图像视频等信息、以网络技术为基础的知识集成、提炼以及升华等。此外还包括对各种商务以及金融活动进行智能化的处理,比如电子商务、政务以及金融活动等等,极大地促进了智能化信息技术在我们国家经济发展的各个领域的运用,从而不断提升信息处理技术的经济以及社会效应。

最近几年以来,智能化信息处理技术受到了高度的关注并且得到日益广泛的运用,充分发挥智能化信息处理技术自身优势是该行业发展的方向,而目前研究的重点领域为综合性的智能化信息处理技术以及相应的软件平台等。比如:智能化的机器人系统需要充分运用各种智能化的信息处理技术从而进一步提升其智能化的程度;利用数据融合技术能够实现不同的传感数据及其特征的相互补充,同时利用多重模型的决策融合以便增强决策的准确性以及可靠性;计算机的图象以及视觉处理技术是通过摄像头所获取的图象达到对目标进行检测与辨识以及避开障碍物等;最终实现对人工智能技术加以表达、对相关的决策加以推理、对故障进行诊断等各种基本功能。

智能化的信息处理技术将会有十分广泛的的应用前景,除了能够在军事、医疗以及工业等各个领域得到应用之外,还可以应用在其它领域,比如:在防治灾害以及公共安全等领域,该技术使得图像监控的范围进一步扩大,充分运用图象分析技术从而达到对有关的生物特征信息(比如:人的脸部、指纹等)、各种非法的入侵物以及火焰等进行有效辨识,进而运用于智能化程度比较高的安保中的门禁、辨识身份以及防火防盗等各个方面。

通过运用遥感图象处理以及数据挖掘等技术从而实现对森林火灾以及洪灾进行有效监测和预报等工作。在农业领域,数据挖掘以及专家系统等相关技术将有效运用于农作物中种子、化肥以及农药的选择、预防与治疗病虫害等方面,同时还可以运用于对农作物的产量进行估计等。在电子商务领域,该技术将有效运用在对于市场进行分析与预测、对大型超市的货架进行分析与研究、对于电子商务中各种个性化的购物进行分析与预测等。

在保险与金融业领域,数据挖掘以及专家系统技术将有效运用于对外汇以及期货、股市进行分析、对各种金融风险进行有效评估、设计保险产品等方面。在生活过程中用到智能化的信息处理技术也是十分广泛。比如:各种智能卡、手机、空调、电饭煲等,汽车智能报警系统等等。机器人可以分成工业机器人和智能机器两种类型。定理证明可以利用计算机来证明定理或者数学猜想,比如最非常著名四色定理的证明。

模式辨识,关键的是图形以及语言的辨识,比如刑侦学中的识别指纹、辨识手写汉字、语音的辨识等都是模式辨识的运用实例。专家系统是一种可以模仿专家的思想、知识以及经验等,取代专家实施判断以及推理工作,并且做出最终决策的人工智能化的软件,目前已经有医疗专家系统得到了良好的应用。

智能化的信息处理技术在实际生活过程中的运用价值:

(1)互联网是由很多台服务器以及路由器所构成的,其中路由器的功能是为各自数据的通道进行选择并且进行传送,假如通过智能化的网络技术的路由器能够进行有效协作,从而对传输数据最理想的路径分析出来,有效避免网络的堵塞。

(2)取代我们的部分脑力劳动。

(3)辨识文字、语音与图像、语音的合成工作、机器的翻译和理解自然语言等相关技术已得到广发应用。

(4)由于计算机的运行速度愈来愈快、存储容量愈来愈大、价格愈来愈低以及网络技术的快速发展,人工智能理论也取得了很大的进展与突破,很多以往难以实现的功能现在已经可以实现。

当前信息处理技术方面的发展存在两种趋势:第一,朝着大规模以及多介质的信息,从而使得计算机系统能够处理更多的信息;第二,和人工智能有效结合起来,从而使得计算机系统处理信息方面能够更加智能化。智能化的信息处理技术是计算机科学中的比较先进的交叉学科,其最终的目标是处理十分繁杂而大量的信息,对于全新的、前沿的技术与理论进行研究。由于网络技术的迅猛发展,智能化的信息技术将会在更加广泛的领域获得更好地运用。智能化的信息处理技术包括了应用研究、基础研究、关键技术研究以及应用基础研究等各个方面的研究,它不但具有理论价值,并且对于我国的信息产业的发展甚至是国民经济的发展与建设等各个方面都十分重大的意义,同时也是将来计算机技术发展的必然趋势。

参考文献

[1]陈炼.数据采集[J].计算机应用与软件,2003,(4).

[2]黄莉.智能信息与网络处理探究[J].电脑知识与技术,2010,(7).

作者:林楚雄

专家系统个性化电子商务论文 篇3:

数据挖掘在电子商务中的应用与实现

数据挖掘技术作为解决“数据爆炸”时代出现的最有效手段之一,受到了企业界的极大关注。如何最大限度地利用企业各个部门多年来在数据库系统上积累下来的大量数据进行整合及二次开发,本文针对数据库营销系统,研究了数据挖掘工具、统计分析工具和客户关系管理工具的协同运用,以及对数据挖掘所采用的技术框架、数据资源等进行了深入的分析。

近十几年来,无数个数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息的有效利用率呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据将可能成为包袱,甚至成为垃圾。因此,面对“人们被数据淹没,却饥饿于知识”的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。

同时在日常生活中我们经常会遇到这样的情况:超市的经营者希望将经常被同时购买的商品放在一起,以增加销售;保险公司想知道购买保险的客户一般具有哪些特征;医学研究人员希望从已有的成千上万份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助。

对于以上问题,现有信息管理系统中的数据分析工具无法给出答案。因为无论是查询、统计还是报表,其处理方式都是对指定的数据进行简单的数字处理,而不能对这些数据所包含的内在信息进行提取。随着信息管理系统的广泛应用和数据量激增,人们希望能够提供更高层次的数据分析功能,从而更好地对决策或科研工作提供支持。

正是为了满足这种要求,从大量数据中提取出隐藏在其中的有用信息,将机器学习应用于大型数据库的数据挖掘(Data Mining)技术得到了长足的发展。

一、数据挖掘技术和电子商务的概念

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。或者说是从数据库中发现有用的知识(KDD),并进行数据分析、数据融合(Data Fusion)以及决策支持的过程。人们把数据看作是形成知识的源泉,数据挖掘就像从矿石中采矿、沙石中采金一样,从浩瀚的原始数据海洋中,淘出自己所需要的一点点信息。同时原始数据可以是结构化的,如关系型数据库中的数据;也可以是半结构化的,如文本、图形、图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于对数据自身的维护。因此,数据挖掘是一门广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。

电子商务是指以Internet网络为载体、利用数字化电子方式开展商务活动。随着网络技术和数据库技术的飞速发展,电子商务正显示越来越强大的生命力。电子商务的发展促使公司内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和知识,为公司创造更多潜在的利润。利用数据挖掘技术可以有效地帮助企业分析从网上获取的大量数据,发现隐藏在其后的规律性,提取出有效信息,进而指导企业调整营销策略,为客户提供动态的、个性化的高效率服务。

数据挖掘概念就是从这样的商业角度开发出来的。数据挖掘涉及的学科领域和方法很多,其核心技术历经了数十年的发展,其中包括统计、近邻、聚类、决策树、神经网络和规则等方法。今天,这些成熟的技术在电子商务中已进入了实用阶段,并取得了良好的效果。本文结合数据挖掘技术在电子商务中的应用,从挖掘任务和数据信息两个角度进行分析,指出各种数据挖掘技术适用的场合,以便开发出切实可用的数据挖掘系统。

二、数据库与数据挖掘技术的发展与研究

数据库技术在经过了80年代的辉煌之后,已经在各行各业成为一种数据库文化或时尚,数据库界目前除了关注分布式数据库、面向对象数据库、多媒体数据库、查询优化和并行计算等技术外,已经在开始反思。数据库实质的应用仅仅是查询吗?理论根基最深的关系型数据库最本质的技术进步点,就是数据存放和数据使用之间的相互分离。查询是数据库的奴隶,发现才是数据库的主人。

由于数据库文化的迅速普及,用数据库作为知识源具有坚实的基础;另一方面,对于一个感兴趣的特定领域——客观世界,先用数据库技术将其形式化并组织起来,就会大大提高知识获取起点,以后从中发掘或发现的所有知识都是针对该数据库而言的。因此,在需求的驱动下,很多数据库学者转向对数据仓库和数据挖掘的研究,从对演绎数据库的研究转向对归纳数据库的研究。

专家系统曾经是人工智能研究工作者的骄傲。专家系统实质上是一个问题求解系统,目前的主要理论工具是基于谓词演算的机器定理证明技术——二阶演绎系统。领域专家长期以来面向一个特定领域的经验世界,通过人脑的思维活动积累了大量有用信息。

在研制一个专家系统时,知识工程师首先要从领域专家那里获取知识,这一过程实质上是归纳过程,是非常复杂的个人到个人之问的交互过程,有很强的个性和随机性。因此,知识获取成为专家系统研究中公认的瓶颈问题。其次,知识工程师在整理表达从领域专家那里获得的知识时,用if-then等类的规则表达,约束性太大,用常规数理逻辑来表达社会现象和人的思维活动局限性太大,也太困难,勉强抽象出来的规则有很强的工艺色彩,差异性极大,知识表示又成为一大难题。此外,即使某个领域的知识通过一定手段获取并表达了,但这样做成的专家系统对常识和百科知识出奇地贫乏,而人类专家的知识是以拥有大量常识为基础的。人工智能学家Feigenbaum估计,一般人拥有的常识存入计算机大约有100万条事实和抽象经验法则,离开常识的专家系统有时会比傻子还傻。例如战场指挥员会根据“在某地发现一只刚死的波斯猫”的情报很快断定敌高级指挥所的位置,而再好的军事专家系统也难以顾全到如此的信息。

以上这3大难题大大限制了专家系统的应用,使得专家系统目前还停留在构造诸如发动机故障论断一类的水平上。人工智能学者开始着手基于案例的推理,尤其是从事机器学习的科学家们,不再满足自己构造的小样本学习模式的象牙塔,开始正视现实生活中大量的、不完全的、有噪声的、模糊的、随机的大数据样本,也走上了数据挖掘的道路。

数理统计是应用数学中最重要、最活跃的学科之一,它在计算机发明之前就诞生了,迄今已有几百年的发展历史。如今相当强大有效的数理统计方法和工具,已成为信息咨询

业的基础。信息时代,咨询业更为发达。然而,数理统计和数据库技术结合得并不算快,数据库查询语言SQL中的聚合函数功能极其简单,就是一个证明。咨询业用数据库查询数据还远远不够。一旦人们有了从数据查询到知识发现、从数据演绎到数据归纳的要求,概率论和数理统计就获得了新的生命力,所以才会在DMKD这个结合点上,立即呈现出“忽如一夜春风来,千树万树梨花开”的繁荣景象。一向以数理统计工具和可视化计算闻名的美国SAS公司,领先宣布进入DMKD行列。

数据挖掘所能发现的知识有如下几种:广义型知识,反映同类事物共同性质的知识;特征型知识,反映事物各方面的特征知识;差异型知识,反映不同事物之间属性差别的知识;关联型知识,反映事物之间依赖或关联的知识;预测型知识,根据历史的和当前的数据推测未来数据;偏离型知识,揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决策的需要。例如,从一家超市的数据仓库中,可以发现的一条典型关联规则可能是“买面包和黄油的顾客十有八九也买牛奶”,也可能是“买食品的顾客几乎都用信用卡”,这种规则对于商家开发和实施客户化的销售计划和策略是非常有用的。至于发现工具和方法,常用的有分类、聚类、模式识别、可视化、决策树、遗传算法、不确定性处理等。

当前,DMKD研究正方兴未艾,预计在21世纪还会形成更大的高潮,研究焦点可能会集中到以下几个方面:研究专门用于知识发现的数据挖掘语言,也许会像SQL语言一样走向形式化和标准化;寻求数据挖掘过程中的可视化方法,使得知识发现的过程能够被用户理解,也便于在知识发现过程中的人机交互;研究在网络环境下的数据挖掘技术,特别是在Internet上建立DMKD服务器,与数据库服务器配合,实现数据挖掘;加强对各种非结构化数据的挖掘,如文本数据、图形图像数据、多媒体数据。但是,无论怎样,需求牵引,市场驱动是永恒的,DMKD将首先满足信息时代用户的急需,大量基于DMKD的决策支持软件工具产品将会问世。

三、数据挖掘技术的实现

1、原始数据的来源与类型

(1)服务器数据 客户访问服务器就会在服务器上产生相应的服务数据,这些数据通常指服务器日志文件或者Cookie日志文件,通常文件的格式为:“Date,Client,_IP,Us-er_name,Bytes,Server,Request,Status,Service name,Time,Protocol_ version,User_agent,Cookie,Referrer”。如果可以对这些文件中存储的数据进行语法上的分析,例如分析DNS,就可以知道客户来源的区域,如域名Alibaba。com被分析后就可以知道客户来自美国。现在,Microsoft最新的数据库管理系统(SQL Server 2000)中已经具备了数据仓储功能。

(2)背景信息 客户登记信息也是另一个数据挖掘重要的数据源,主要来源于客户登记表。客户登记信息是指客户在浏览器页面上填写的、需要提交给远端服务器的有关资料,比如客户的个人资料,客户要订购的商品资料、客户提出的一些问题、要求等。

(3)其它信息 在面向电子商务的数据挖掘中,将客户登记信息和服务器日志有效地结合起来进行分析,可以提高挖掘的精度和深度,得出更理想的结果。另外,电子商务在In-ternet上分布着大量异质的数据源中也隐含着其他有用的信息,挖掘后提供给有兴趣的客户也可以支持商业决策。

2、数据挖掘技术的实现步骤

面向电子商务的数据挖掘过程可以分为准备数据、发现模式和分析解释模式3个步骤。

首先,进行数据挖掘的时候,一般并不是对原始的数据进行挖掘,而是先要对数据作一些预处理,包括合并数据,将多个文件或多个数据库中的数据进行合并处理;选择数据,提取出适合分析的数据集合;数据清洗、过滤,剔除一些无关记录,将文件、图形、图像及多媒体等文件转换成可便于数据挖掘的格式等。接着,根据不同的挖掘目标,可以相应采用不同的挖掘方法,得到有意义的数据模式。数据挖掘的方法有很多种,主要包括3大类:统计分析、知识发现、其他可视化方法。最后,通过技术手段,对得到的模式进行数据分析,得出有意义的结论。

3、数据挖掘常用的技术手段

(1)关联规则揭示数据之间的内在的联系,发现用户与站点各页面的访问关系。其数据挖掘的形式描述为:设I={i1,i2,…im}为挖掘对象的数据集,存在一个事件T,若I中的一个子集X,有X包含于T,则I与T存在关联规则。例如:“在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”,表示为:(面包+黄油(牛奶))。同时利用关联规则技术,表述为顾客访问了页面/company/product1,90%的人也会访问页面/company/product2。通过构建关联模型,进行WEB上的数据挖掘,我们可以更好地组织站点,减少用户过滤信息地负担。

(2)分类给出类的公共属性描述,并将新的记录分配到预先定义好的类中去或分类新的项。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。在电子商务中分类分析可以预测客户响应,如哪些客户最倾向于对直接邮件推销做出回应,又有哪些客户可能会换他的手机服务提供商,或进行商店定位,如按成功的商店、一般商店和失败商店排列得出这3类商店各自具有的属性。然后选择包含位置属性的地理数据库,分析每一预期的商店位置属性,以确定预期的商店定位属于哪一类。只有那些符合成功一类要求的商店位置才作为商店定位的候选。用于分类分析的技术有很多,典型方法有统计方法的贝叶斯分类、机器学习的判定树归纳分类、神经网络的后向传播分类等。最近数据挖掘技术也将关联规则用于分类问题。另外还有一些其它分类方法,包括k-最临近分类、MBR、遗传算法、粗糙集和模糊集方法。目前,尚未发现有一种方法对所有数据都优于其它方法。实验研究表明,许多算法的准确性非常相似,其差别是统计不明显,而计算时间可能显著不同。

(3)聚类 分类的逆过程,按照“类内相似性最大,类间相似性最小”的原则,对数据进行类的聚集,多指客户群体聚类和Web网页聚类。客户群体聚类将具有相似浏览模式的用户分在一组,而Web网页聚类提供有针对性的网络服务应用。

(4)序列模式 侧重于挖掘出数据的前后时间顺序关系,分析是否存在一定趋势,以预测未来的访问模式。序列模式分析和关联分析类似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。它能发现数据库中形如“在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序列A?B?C出现的频率较高”之类的知识。序列模式分析描述的问题是:在给定交易序列数据库中,每个序列是按照交易时间排列的一组交易集,挖掘序列函数作用在这个交易序列数据库上,返回该数据库中出现的高频序列。在进行序列模式分析时,同样也需要有用户输入最小值信度C和最小支持度S。另外序列关联规则挖掘中采用的Apriori特性可以用于序列模式的挖掘,另一类挖掘此类模式的方法是基于数据库投影的序列模式生长技术。

4、数据挖掘的工具

数据挖掘工具:从数据仓库的组成入手,分析数据仓库的体系结构;在数据仓库的设计过程中必须注意3个关键的问题:选择数据仓库的目标数据库、数据抽取和转换工具及前端数据访问和分析工具。

四、结论

随着电子商务发展的势头越来越强劲,面向电子商务的数据挖掘将是一个非常有前景的领域。它能自动预测客户的消费趋势、市场走向,指导企业建设个性化智能网站,带来巨大的商业利润,可以为企业创建新的商业增长点。但是在面向电子商务的数据挖掘中还存在很多问题急需解决,比如怎样将服务器的客户数据转化成适合某种数据挖掘技术的数据格式,怎样解决分布性、异构性数据源的挖掘,如何控制整个Web上知识发现过程等。利用这些挖掘技术可有效统计和分析用户个性特征,从而指导营销的组织和分配,让企业在市场竞争中处于有利位置抢占先机。

(作者单位:广东商学院)

作者:陈振宇

上一篇:服务器虚拟化信息化建设论文下一篇:农机信息化建设分析探究论文