电子商务应用系统研究论文

2022-04-26

摘要:现在,很多营销站点建设了他们自己的数据仓库系统,但是他们之间彼此是独立的,不相关的,为了解决信息孤岛问题,需要整合每一个不相关的数据仓库系统来建立一个统一的网络营销信息平台。该文将根据各个网络数据仓库的特点将其进行无缝整合,建立基于数据仓库的网络营销系统。该系统能够满足各级电子商务网络的应用需求,在一定程度上提高了网络营销企业的运营效率。今天小编给大家找来了《电子商务应用系统研究论文(精选3篇)》,仅供参考,希望能够帮助到大家。

电子商务应用系统研究论文 篇1:

基于物联网的RFID技术在电子商务中的应用探究

摘 要:物联网属于感知物品与物品相连的信息系统,当前被广泛应用于各行业中。针对于此,本文对物联网实行基本概述,对RFID技术进行基本概述,并对基于物联网的RFID技术在电子商务中的应用情况加以探究,现进行具体阐述。

关键词:物联网;RFID技术;电子商务;应用

物联网,属于信息产业,可能够对我国的经济效益、全球经济构成直接的影响。当前,我国信息产业的良好发展下,基于物联网下应合理使用RFID技术于电子商务中,以此促进我国物联网的良好发展。

一、物联网的基本概述

1.物联网的基本概念

物联网,即为传感网,属于一种较大的网络,經不同的末端设备、设施,按照具体的协议内容,通过不同的无线、有线的通讯网络达到互换互通M2M效果。在任何物品、互联网连接下,均可实行信息交换、通讯。与此同时,可采用适当的信息安全机制,提供实时监测、定位追踪、报警联动、远程控制等服务,进而能对物体进行智能化识别、定位、监控、管理等,为一体化网络控制技术。物联网的核心、基础为互联网,属于在互联网之上延伸的网络。物联网,即为能全面感知的物体、人的互联集合,经户端延伸、扩展到物体间。此外,需遵循通讯的协议,经相关的软件、硬件达到最佳效果。

2.物联网的技术构架情况

(1)物联网的感知控制层构架

感知控制层,为体系的最下层,可全面感知物联网的核心能力。一般情况下,多在物理事件中,收集相关数据、环境信息。这一控制层,通过较多的感知信息识别功能设备所构成,主要包括:设计传感设备、RFID、实施定位等设备。

(2)物联网的网络传输层

网络传输层,属于基础设施,主要通过互联网、电信网、移动通信网等构成,进而形成融合网络,能够将感知信息,更加安全、可靠的传输。所以,需要传感网络、移动通讯、互联网等技术相互融合。

(3)物联网的应用层

物联网中的应用层,可分为应用服务支撑子层、应用服务子层。前者,多在跨行业、跨系统信息共享、互通中应用。后者,能够提供丰富的应用,有机结合物联网技术、行业信息需求,如:交通、物流、环境监测等。

(4)物联网的公共技术

公共技术,不是物联网技术的特定层面,其和物联网构架的其他几层均存在密切的联系,主要由标识、解析、安全技术、网络及服务管理组成。

二、RFID技术的基本概述

物联网,属于新兴的领域,这一系统属于较为复杂的信息系统。物联网系统技术,涉及的领域较多,主要通过射频识别技术RFID、云技术、传感器和网络通信技术所构成。RFID技术,属于自动识别技术,当前在物联网中的应用效果较好。

RFID技术,也可以叫做电子标签、无线射频识别,属于通信技术的一种。借助无线射频方式,对非接触双向通信进行自动识别处理,同时可有效交换相关数据。这一技术,能对较多目标、运动目标实行识别,进而可达到较好的跟踪效果、管理效果。RFID技术,在电子门票、手机支付、车牌识别、集装箱管理等中应用,应用效果均非常理想。射频标签,也可以称为电子标签,属于微型的无线收发装置,为RFID系统数据的载体。电子标签,也属于通信技术的一种,经无线电信号,对特定的目标实行识别,主要通过内置天线、芯片构成。读写器,经天线、读写器、外部传感器构成。

三、基于物联网的RFID技术在电子商务中的应用探究

RFID技术和电子商务有机结合起来,可很好的推动消费者购物、智能物流、移动电子商务的进程。

1.在消费者购物中的应用情况

国民经济的良好发展,使得人们的生活水平越来越好。超市的物品类型较多,人们的选择范围更广。但是商品类型较多的同时,对于人们在选购商品时也会构成一定的困扰。为此,在超市货架上,可张贴RFID的标签,以便在具体范围内合理设置数量读卡器,可经智能购物车为消费者提供便捷。消费者通过智能购物车中输入的产品名称,读取通信信息,以此明确商品的具体位置。生产厂商可在商品的包装上张贴电子标签,标明商品名称、价格、生产厂家、生产日期等。经读卡器读取商品信息,并和生产厂家网站链接,进而确保商品的安全性、可靠性。消费者在超市购物时,多需要排队购买,这对于消费者的购买欲望会构成直接的影响,还会对超市工作人员的工作质量造成严重影响。为此,在超市出口应合理使用RFID技术,以便构建RFID收货通道,经系统对购物车内张贴RFID的商品扫描,如此一来节省了双方的时间,并提高了超市工作的整体效率和质量,使得消费者获得了较好的消费体验。

2.在智能物流中的应用情况

智能物流,即为使用物联网技术在物流领域中,能达到物流现代化的效果。智能物流,即为货物经供应商——消费者移动的过程。智能物流主要由运输、仓储、配送、包装、装卸、获取信息、加工、处理构成。存在RFID电子标签的货物,达到配送站的过程中,在入口位置阅读器会对RFID标签实行识别处理,结合读取信息,自动更新存货的清单。与此同时,在读取信息后还能将具体的货物运输到相应的区域。这种方式,不但简化了货物验收入库环节,还节省了检查、记录、清点的时间,以及人力、物力。实际配送的过程中,运输的货物、车辆均应合理使用RFID技术,张贴相应的电子标签,以此对货物实行自动识别。货物运输时期,供应商、经销商,均需加强对货物实时位置、预计达到时间情况的了解。针对易于发生泄漏的商品,可将相应的标签张贴在箱内。对于非正常开箱情况,监控系统能够明确物品的实际情况,并作出相应的反应,进而降低配送和运输过程中的不良影响。智能物流,不但可智能交通,确保公共安全、智能消防,还能够加强对环境的保护,对食品溯源进行追踪、监测。电子商务模式下,商品配送时间较短,配送类型较多,且能够小批量、多频次配送。与此同时,配送业务更加灵活,可见性较强,消费者可实时掌握商品的运输情况。消费者对配送的商品能准确监控,并经RFID技术获得商品编码相关信息。经物联网处理后,将信息传输至供应链,以便于商家、消费者实时查询,以此确保消费者对商品运输情况放心,加强商务电子商品配送的准确性、及时性。

3.在移动电子商务中的应用情况

近年来,信息化技术的良好发展,使得人们的生活、工作更加便捷,可随时收发电子邮件,查阅信息、订阅相关商品,进而达到移动互联的效果。趋于互联网形态下,手机智能卡被广泛应用,能够将RFID、SIM卡相融合。手机中,放置智能卡可接受RFID信号,并且能经四周物体接受信息。合理使用这一技术于手机智能卡芯片中,还可以获得个人身份信息、身份标识,经阅读用户的实际信息,能自动识别身份,如:门禁、会员身份、校园卡、电子检票等。此外,用户经手机读取RFID终端的信息,还可以享有信息服务,获得天气、餐厅、公交路线等相关信息。手机支付,属于新兴的支付方式之一,可在手机智能卡中下载银行网银,采用非接触式POS机时,即可有效转账、汇款、查询。通过网银、手机支付,手机智能卡可经和后台CA认证,对移动电子商务、办公信息加以加密处理。需要注意的是,交易的过程中,双方需要身份验证,避免在完成交易后出现安全隐患问题,以此确保手机银行支付的安全性。

四、结语

近年来,我国物联网发展较好,但仍处于起步阶段,主要表现在各项机制尚不完善。我国对于物联网技术发展非常重視,趋于物联网下人们的生活、工作越来越便捷。为此,基于物联网下需合理使用RFID技术,以便有效提高电子商务工作效率,将RFID技术有效应用于人们的生活中,为人们生活提供更多的便捷。

参考文献:

[1]刘波.基于物联网的RFID技术在通信网络的应用[J].电子技术与软件工程,2017(6):35-35.

[2]皇甫汉聪.基于物联网RFID技术的地下资产防外力破坏的系统研究[J].自动化与仪器仪表,2017(6):193-194.

[3]李珊珊,邓云桂.基于RFID和二维码技术的农产品溯源商务平台建设的分析与研究[J].信息系统工程,2017(7):165-165.

[4]李鹤,王程程.物联网技术在电子商务物流中的应用[J].合作经济与科技,2017(4):118-119.

[5]高茂庭,吴盈盈,徐威男.基于RFID和EPC的物联商务追溯系统[J].现代计算机,2017(21):52-58.

[6]苗芃.基于物联网的生鲜蔬菜供应链可追溯系统设计与研究[J].数码世界,2017(7):248-250.

作者简介:李光祥,山东省菏泽信息工程学校,高级讲师,大学学历,研究方向:网络营销

作者:李光祥

电子商务应用系统研究论文 篇2:

基于数据挖掘的网络营销系统研究

摘要:现在,很多营销站点建设了他们自己的数据仓库系统,但是他们之间彼此是独立的,不相关的,为了解决信息孤岛问题,需要整合每一个不相关的数据仓库系统来建立一个统一的网络营销信息平台。该文将根据各个网络数据仓库的特点将其进行无缝整合,建立基于数据仓库的网络营销系统。该系统能够满足各级电子商务网络的应用需求,在一定程度上提高了网络营销企业的运营效率。

关键词:数据仓库;网络营销;信息孤岛;数据挖掘;数据整合;OLAP

1 概述

目前,随着电子商务的不断深入,网络营销企业需要从电子商务积累的数据中快速准确地提取出用于指导网络营销决策的信息。参考文献[1]为制造企业提出了市场营销决策支持系统的解决方案,此方案是在数据库基础上产生的,包括数据库,OLAP,数据挖掘。其中,数据库用于集成、存储、决策主体的数据管理;OLAP用于多维数据分析;数据挖掘用于预测、聚类和统计分析,以达到发现知识和潜力模型的目的。但是,这种方法只适用于单一的网络营销企业,而目前的电子商务网络则是由全国各地甚至海外的广阔的营销网站组成的。因此,有必要建立一个统一的网络营销信息平台,有效地消除信息孤岛问题。由于各个网络营销节点的数据库建立在各个地方,为了充分利用数据仓库和网络[2]中的原始数据,网络数据仓库的建设成为一个重要的研究课题。

目前,研究人员已经在一定程度上对网络数据仓库技术进行了研究。文献[3]~[5]介绍了将网络数据(HTML,XML,等等)综合到网络数据库的方法。文献[6][7]介绍了基于原始数据库的网络数据库解决方案。文献[8]研究了代理技术在网络服务器中的应用,提出了构建网络数据仓库系统的关键技术。文献[9]提出并实现了从网络中提取数据的包装算法。但这些文件不能生成完整的框架,用于网络数据仓库系统设计。综合对各文献进行深入分析和研究之后,提出了完整的网络数据仓库解决方案,并对网络数据库营销系统的构建方法进行了深入的探讨。

2网络数据库整体解决方案

一个完整的网络数据库应该有2个特点:现有的数据库和网络数据库。本文提出的网络数据仓库的解决方案具有两个方面的优势,即网络信息的综合利用问题和分布式环境下的数据查询问题[11]。

2.1将现有的数据库导入网络

数据库是一个发布企业数据资源的地方。但是传统的数据库是无法满足电子商务规模不断扩大的需要,它受限于C/S结构及复杂、昂贵、且集中化的设计。随着网络技术的引入,大型分布式数据库逐渐实现。

将现有的数据库导到网页,需要下面的三个步骤,如图1所示。

1)数据集成:将源数据整合到数据库中。

2)服务器处理:DM(数据挖掘)、EIS(管理信息系统)和应用服务器提供OLAP(联机分析处理)应用,这些应用程序被称为数据处理,其结果可以通过Web服务器发布。

3)结果显示:客户端浏览器显示数据处理结果。

2.2将网络导入数据库

这一阶段主要包括以下几个部分:

1)基于Web的数据主要是半结构化数据,如HTML,XML等,可通过搜索引擎查询。但为了使其能够适合结构化查询的数据库查询,必须将这些数据整合到网络数据库中,满足结构化查询的要求。

2)网络技术的进步促进了电子商务的发展,互联网技术中通常用点击流的概念来记录网站的浏览行为,最终以Web日志文件的形式进行保存。点击流可以作为数据库的数据源,用于构建相应的数据库。使用点击流可以捕获和分析用户的行为,以支持决策。

3基于数据库的网络营销系统

3.1数据整合

从电子商务企业信息系统建设的现状来看,各企业迫切需要一个工具来执行总部公布的标准和政策,以确保迅速下达到所属子公司,并得到快速响应,同时更新和纠正。随着信息化的不断发展,一定程度上能够解决数据整合问题,由于目前的信息化只是一种分布式的模式[11],数据的整合和集中非常低效。在这种情况下,可以考虑将上层总部数据从“总部”转移到“集体化”。数据整合是指将多个分散的数据源进行整合,最终实现企业数据的集中存储和处理。電子商务企业通常有以下三种模式的数据集成[10]。

1)县级数据整合模式。电子商务企业只需建立一个数据中心,企业总部和下属公司的业务数据都存储在这个中心。

2)区域级数据集成模式。电子商务企业区域网络节点作为中心收集其领域内商业数据,通过整合总部的数据交换中心来组成二次数据存储结构

3)全省数据整合模式。以省级数据为中心,由总部、区域数据处理中心以及二者数据交换中心的数据,形成三级数据存储结构[11]。

在这种情况下,网络营销系统还需要整合他们的数据。但不同层次的电子商务网络节点的需求也不同。国家级的网络需要详细的业务数据,处理所有用户信息。省、地区网络往往更关心一些汇总数据,如下属县市的网络营销绩效。电子商务是一种金字塔式结构,总部属于高层管理者,为了更全面更可靠的给高层决策支持提供有效数据,其所涉及的数据强度也是最大的,数据具有广泛的分布特征,因此采用数据库作为网络营销系统的数据基础。因此,我们如何对数据仓库的进行设计,可以充分考虑不同层次的电子商务网站,并通过网络发布方式形成大型分布式网络数据库。

3.2通用数据库的设计

网络营销系统的核心包括网络购物、商业交易、现金管理、库存管理和网络推广等,此外,还提供了各种业务的服务模块和分析模块。服务模块包括电话服务、互联网服务和客户服务中心。综合业务分析模块包括基于历史数据统计的查询、分析和决策支持,重点研究为企业提供及时、准确的决策依据[11]。

此数据库不同于二维结构的关系数据库,它是多维数据集的载体。针对网络营销系统的特点和用户需求,采用建模方法构建数据库,包括:销售、供应、销售利润、市场需求等。例如,销售主题包括以下2个事实表和六维表:实际销售事实表、计划销售事实表、日期维度表、客户维度表、产品类别维度表、产品级维度表、客户分类维度表和客户区域维度表。实际销售事实表的各项指标包括:销售增长量、销售增长率、销售份额增长量、销售份额增长率。预期的销售事实表的指标包括预期销售增长量,预期销售增长率,以及预期销售量市场份额增长量,预期的销售份额增长率。

3.3网络库的设计

与一般的数据仓库相比,该系统具有数据整合的要求,因此我们采用了分层结构的设计模式。这一战略的含义包括两个方面:层次数据仓库(县、市、省、国家)、网络出版分层(数据层、应用层和表示层)。系统框架图如图2所示。

1) 国家级数据库

要建立国家级数据仓库首先要确定数据源。所有的基础数据源来源于电子商务企业的管理信息系统和外部环境,通过录入、提取,过滤,合并后存储在数据库中。

2) 省、市县级信息库

建立省级或市、县级的数据库也需要确定数据来源。该数据库通常是根据实际需要,在较低的数据库中进行数据提取、转换和加载的数据组成的。例如,该省、地区数据库是由一个下属县和市数据仓库衍生的。所以,数据仓库无论是在不同的层次上还是在同一层次上必须能够互相通信,而且任何级别数据库都可以通过网络服务器与外部环境进行连接。

3) 应用服务器

网络营销系统一般包括两大模块:服务模块和分析模块。一般而言,不同层次的系统需要建立在数据库的基础上,以满足业务、服务和分析模块的需求。低层次的系统一般只需要业务模块,随着系统水平的增加分析模块的需求也会随之有所增加[11]。在网络营销系统,功能模块部署在不同的应用服务器,用户可以通过网络使用由企业提供的应用服务器,如基于EIS应用技术上的OLAP和DM。

3.4决策支持

构建基于数据库的网络营销体系可以分析并组合各级电子商务网络节点的营销数据,满足各级电子商务网络节点的数据需求。省级、区域性网络节点和总部的关注点是基于基础业务的信息汇总,这可以指导企业的业务调整和政策制定。数据分析技术简单而言是一种数学分析方法,该方法主要是基于数据库的商业应用分析,包括联机分析处理(OLAP)、数据挖掘等。

OLAP的可以在用户界面的前端进行显示。更加直观清晰,同时OLAP的具有两项主要功能:不仅能够满足决策支持,同时还可以支持多维环境的特定查询需求。OLAP的应用功能也包含两项内容:分析用户的当前数据和历史数据,方便提供决策支持。通过关键多维度数据操作,如查询、相关延伸、深度延伸、切片等,相应的报告就可产生并被分析。OLAP可以根据从用户那里提取出的相关问题或假设的详细信息,将多个问题或假设进行合并,从而生成可视化的结果提供给用户。

数据挖掘可以为企业管理者、营销总监等相关人员提供多总分析数据,如供应分析、销售分析、客户识别分析、成本分析、需求分析等。让企业管理者、营销总监把握客户的特点,特别是客户价值、经营风险和成本等信息,促使管理人员从事务型转变为思维型,通过后处理来预测。

4结论

针对目前网络营销企业存在的问题,本文提出了一种基于数据库的网络营销系统。在电子商务环境下,对有效的信息交换和知识管理的需求日益迫切[12],数据库可以为网络营销企业提供一个良好的数据环境。在实践中,各级营销网络节点的数据库缺乏统一的规划,容易形成数据孤岛。在本质上,基于数据库的大型分布式网络营销系统可以有效地解决这一问题。通过合理的规划构建金字塔式的网络营销体系,能够满足不同层次的电子商务网络节点的不同应用需求,并在一定程度上提高其运作效率。

参考文献:

[1] Zhigang Yang, Zhiqiang Yue, Guishi Deng. The research of sales KPI query analysis system for manufacturing enterprise based on data warehouse[J]. Machinery, 2005(8):61-64.

[2] Yun Liu, Dongsu Liu. Data warehouse and data mining technology based on Web[J].Information Studies:Theory & Application, 2001(4):289-290.

[3] Jiangjiao Duan, Zhenhua Huang, Xin Chen, Xiaogang Liu. Research on Web-based integrated environment for data warehouse[J]. Computer Science, 2004(10):114-117.

[4] Lili Xu. Research on approach about heterogeneous data integration based on Web[D]. Hubei, Wuhan, master thesis of Wuhan University of technology, 2008.

[5] Bin Xu, Weiwei Yu, Zhitao Yu. Research on the integration of heterogeneous database based on Web service[J]. Chinese science and technology resources review, 2008(5):19-24.

[6] Lang Liu, Liya Wang, Hailiang Huang. Web-enabled Data Warehouse Resolvent[J]. Computer Engineering, 2005,31(1):92-94.

[7] Yu Feng. Data warehouse and data mining based on Web technology[J]. China Water Transport:Theory Edition, 2006,4(8):94-95.

[8] Qian Zhang, Jihui Yu. Study on application of Agent technology in the Web-based data warehouse system[J]. Computer Science, 2005,32(6):79-82.

[9] Xuemei He, Changjie Tang, Liqiang Wang, Tianqing Zhang. Research on Web-based data warehouse[J]. Computer Application, 1998,18(10):5-8.

[10] Liukai Wang. The data integration middleware oriented to collaborative e-business[D]. Jiangsu, Nanjing, master thesis of Southeast University, 2009.

[11] 孫逸群.基于Web数据仓库的电力营销系统研究[J].中央民族大学学报:自然科学版,2012(8).

[12] 叶彬,曾伟民.数据仓库在电力系统中的应用[J].电力系统及其自动化学报,2005(6).

作者:孟彩霞

电子商务应用系统研究论文 篇3:

从ACM RecSys’2014国际会议看推荐系统的热点和发展

[摘要]美国计算机学会每年举办的RecSys年会是最重要的推荐系统国际会议之一,其内容体现了当前推荐系统研究的热点和发展趋势。本文分析RecSys’2014年会的论文内容和主题,从推荐系统的新应用、情景敏感推荐、冷启动和混合推荐、安全和用户隐私、推荐系统评估、多样性和新颖性、推荐理论和方法、排序和Top-N推荐、矩阵分解等9个方面对会议进行综述,总结当前推荐系统研究的特点,认为混合推荐是未来推荐系统研究的主要方向。

[关键词]推荐系统;ACM RecSys;热点主题

[文献标识码]A

自1992年帕洛阿尔托研究中心的Tapestry系统引入协同过滤的思想和概念以来,推荐系统日益引起人们的关注。推荐系统(RS:Recommender System)是能主动地发现用户当前或潜在的信息需求,并主动推送信息给用户的一种Web信息系统。在信息爆炸时代,推荐系统是解决用户“信息过载”的一种有效手段,已被成功应用于电子商务、社交网络、多媒体等众多领域。

由于推荐系统实际应用效果显著,近年来国际学术界与其相关的研究极为活跃。推荐系统研究的顶级会议是美国计算机学会(ACM)每年举办的RecSys年会,该会议自2007年以来已在世界各地(美国、瑞士、西班牙、爱尔兰、中国香港等)举办了8届,并成为全球关于推荐系统研究最重要的交流渠道和把脉其最新进展的重要窗口。

最近一次ACM RecSys年会于2014年10月6~10日于美国硅谷(第8届)举办,共收录各国学者研究论文55篇,内容基本涵盖了当前RS研究的主流领域,既有对传统领域的深入探讨,也有对新领域的探索;既有对实践和技术的应用研究,也有推荐基本理论和方法的探析。本文逐一研读了本次会议论文,并按照主题分类进行综述,以期了解和掌握目前国际上推荐系统研究的热点与发展趋势,为国内推荐系统研究提供借鉴。

1 会议主题分析

2014’RecSys年会论文按主题可分为9个方面:新应用、情景推荐、冷启动推荐、安全和隐私、推荐系统评估、多样性和新颖性、推荐方法和理论、排序和Top-N推荐、矩阵分解推荐方法等。

1.1新应用

推荐系统产生于快速发展的互联网环境中,与理论研究相比,商业化实践更为人们所关注,历次ACM RecSys会议都把实践应用作为会议的重要主题之一。2014年会展示了推荐系统在儿童图书推荐、社交媒体、学术论文同行评议、MOOC、数据挖掘流程设计以及旅游指导、房屋租赁、健康顾问等诸多方面的应用。例如,PeraMS等针对现有图书推荐系统缺乏专门面向儿童阅读推荐的功能缺陷,设计和开发了一个模拟图书馆读者咨询服务的图书推荐系统(Rabbit),该系统不仅考虑了儿童读者的阅读能力,也考虑了图书所包含的情感因素。Liu X等通过在论文和评议专家之间构建关联图,开发了一个学术论文同行评议的专家推荐系统,增强了论文评议系统的功能。

1.2情景敏感推荐

情景敏感推荐系统(CARS)是近几年推荐系统研究的热点。情景也称之为上下文(Context),指的是用户模型中的额外信息(如位置、时间、天气等),利用情景信息可以提高推荐系统的推荐精度。

本次会议的一些论文在推荐系统适应动态情景方面做了深入研究。如,Hariri N等开发了一个交互式推荐系统,系统根据用户行为动态地适应情景变化,匹配用户最近的兴趣喜好,为其生成更合适的推荐结果,系统的独特之处是包含了一个“情景变化侦测器”,负责探测用户行为的变化,一旦检测到有重大改变时,推荐系统就优先采用用户最新行为信息来重建情景模型。而Braunhofer M等则通过在系统中设置“情景开关”的方法解决推荐系统的情景适应性问题。

1.3冷启动推荐

由于推荐系统中的新用户(或新项目)的评分数据稀少,系统很难为其产生推荐,这就是所谓的冷启动推荐问题。在基于协同过滤和基于矩阵分解的推荐算法中,冷启动问题尤其严重。

冷启动问题通常采用混合推荐方法或融合其他数据源来解决。如,混合内容过滤方法和协同过滤方法、融合用户评论与评分数据、在协同过滤算法中引入用户的人口统计学信息(如性别、年龄、位置等)以及社会网络信息(如Facebook好友关系、空间主页等)、利用Web日志信息中的用户浏览路径等。

另外,动态情景敏感策略也有助于解决冷启动问题,如,Tang L等提出对不同情景策略进行组合,在多种预设情景上层构建“元情景”(Meta-Context),“元情景”根据新用户与推荐系统交互产生的反馈信息,选择相对合适的情景为新用户推荐其感兴趣的网页,该方法在原理上类似于元搜索引擎。而Braunhofer M等在不同的情景算法中设置“情景开关”,当系统侦测到不同的冷启动情景时(如新用户或新项目),则会转换到适宜的算法。

1.4安全和隐私

推荐系统是可以带来实在经济效益的。正因如此,其可能受到恶意攻击并不为奇,安全和隐私是每一届会议的主要议题之一。

Seminario C E等从攻击者的角度,提出了“强项目”攻击模型(PIA),并通过实验模拟,证明PIA不仅可以成功攻击基于SVD和基于用户的协同推荐系统,也可以成功攻击基于项目的协同过滤推荐系统,研究结果为推荐系统的攻击检测提供指导。Bhagat S等研究了用户隐私的“善意”挖掘方法,设计了一个基于矩阵分解的贝叶斯分类器,仅根据少量的评分数据就能推测用户的二元属性信息(如类别,性别等),从而为推荐系统构建用户兴趣模型提供辅助信息。

1.5推荐系统评估

由于设计目标、实施算法、评价策略等方面不同,且一些场合可能还需要人工参与,推荐系统目前尚没有一个公认的标准对其真实效果和作用进行评估。本次年会,Said A等在相同的评价环境下对不同的推荐算法作了对比,提出了一个评估推荐系统的指标体系。Yi X等利用用户在网页上的停留时间来量化评估用户对网页的兴趣度,提出如何对不同设备和情景下的停留时间进行标准化处理的方法。

推荐系统评估也包括对用户评分真实性的评估。Krishnan S等研究了社会影响偏见(SIB)对用户真实评分的影响,提出在推荐系统中设置学习、分析、缓解3个阶段来降低SIB效应。

1.6推荐多样性和新颖性

多样性是从推荐系统角度看RS的一种特性,即尽可能使全部或大多数项目都得到推荐,而不只局限于少数项目;新颖性是从用户角度看RS的一种特性,即推荐结果对用户来说应该是新奇而又感兴趣的。

Vargas S等从推荐任务的反方向思考,通过将用户推荐给项目的方式,增强商品推荐的销售多样性。Adamopoulos P等在协同过滤近邻选择过程中,考虑目标用户和候选近邻的相似级别,确定k近邻的权重,从而提高推荐结果的多样性。Ekstrand M D等通过用户实验研究了用户对推荐结果的满意度和新颖性、多样性之间的相关关系。Noia T D等根据项目的内容属性计算多样性,将推荐算法生成的Top-N结果重新进行计算排序,以增强推荐结果的多样性。

另外,Vargas S等发现,推荐项目的类别(如电影分类、图书类别、音乐类别等)属性也可以用来增强推荐系统的多样性。

1.7推荐方法和理论

推荐系统研究虽然已取得了丰硕成果,但是仍有许多问题需要进一步研究。本次会议在推荐新算法的设计和传统算法的改进、用户兴趣建模、信任推荐等方面都有新的研究成果展示。

另外,会议在跨域推荐、群组推荐方面也有一些和以往经验不同的新发现。如,大部分推荐算法都假设评分矩阵中的缺失值是随机分布的,而Kim Y D等认为实际情况并非如此,缺失数据的分布其实是依赖于用户、项目以及评分值的,并提出一个贝叶斯两项式混合模型,利用非随机分布的评分数据预测用户评分。跨域推荐可以在源RS和目标RS之间共享推荐信息,Cremonesi P等研究了跨域推荐的数据特征后,认为所谓的密码本传递方法(CBT)并不能在没有重叠项目(或用户)的源域和目标域之间实现跨域推荐。

1.8排序和Top-N推荐

推荐结果以何种方式展示给用户非常重要,其中,推荐列表的排序、推荐数量的确定是两个主要的研究内容。Vanchinathan H P等利用用户或项目之间的相似度解决推荐列表的排序问题。Gueye M等设计了一个无参数的优化标签列表大小的算法,本质是通过舍弃一些不相关的标签来提高推荐精度和效率。Naamani-Dery L等采用迭代算法启发用户兴趣,来缩小群组推荐的Top-N列表规模。而Liu X等则通过线上、线下组件分别计算新、老项目的影响力,为用户生成Top-N推荐。

1.9矩阵分解推荐方法

矩阵分解是当前最有效的推荐算法之一。矩阵分解过程中,计算项目的得分并排序是一个非常耗时的过程,会议的一些论文在如何提高算法的计算效率和可扩展性方面提出了新的方法和思路。

在矩阵分解算法中如何引入其它信息(如情景、信任等),也是矩阵分解推荐方法的研究重点。分解机(Factor-ization Machine)和情景特征的结合,时间维度、评分聚类、隐式信任关系等在矩阵分解推荐算法中的应用在本次会议中都有成果展示。

另外,也有论文研究了矩阵分解推荐算法在一般概率分布上的应用,从而拓展了矩阵分解推荐算法的应用范围。

2 当前推荐系统研究的特点

ACM RecSys是国际上推荐系统研究的顶级会议,其研究内容理所当然地反映着推荐系统的前沿和热点。综合来看,2014年推荐系统研究具有“新”、“深”、“合”的特点。

2.1“新”:新技术、新应用、新发现不断出现

2014年ACM RecSys年会最大的特点是“新”,各种新技术、新发现、新应用不断出现。例如,组合情景策略解决冷启动问题、“强项目”攻击模型、用户评分SIB的缓解方法、用户自生成分类的推荐方法等都是较新的技术;评分矩阵的缺失值并非随机分布、CBT方法在跨域推荐的缺陷性等也是会议的新发现;而新应用更是会议的重点,推荐系统从来就是一个实践性很强的领域,正是因为其在众多行业,如电子商务、新闻、音乐、电影、Apps的应用收到了实际效益,才被研究人员们广为关注。本次年会除了对一些传统的推荐应用有进一步的深入研究外,也出现了许多新应用,如MOOC中的问题推荐、社交网络上的好友推荐和专业技能标签推荐、学术论文同行评议的专家推荐、数据挖掘流程设计的操作符推荐等。

2.2“深”:推荐理论和方法不断深入

推荐系统研究发展至今,已取得了非常丰硕的成果,理论基础和技术体系逐渐成形,研究已不再局限于基础问题和浅层问题的探讨,而是已深入到推荐系统研究所涉及的方方面面。如,虽然情景敏感推荐方法、矩阵分解推荐方法仍是非常热门的研究领域,但是研究已不再是方法的简单介绍和粗浅应用,而是已深入到了推荐方法的细节研究。例如,设计“情景变化侦测器”探测用户兴趣的重大变化、“元情景”解决用户冷启动问题、一般概率分布上的矩阵分解方法等都是对推荐方法非常深入的探讨。

2.3“合”:推荐算法不断混合,推荐数据源不断融合

各种推荐方法都有其优、缺点,单一方法无法解决推荐系统的所有问题,其研究越来越趋向组合不同技术实现混合推荐。大量的混合推荐方法研究出现于本次年会论文中,例如,内容过滤和协同过滤的混合、基于项目和基于用户的协同过滤算法的混合、情景敏感和矩阵分解推荐算法的混合、多种情景算法的混合、线上和线下推荐方法的混合等。

经典推荐系统利用的数据源只有用户的评分数据,然而由于评分数据的稀疏性降低了推荐系统的精确度,一些研究人员开始考虑将其它信息源引入到推荐系统,与评分数据融合来提高推荐精度。如,评分数据和评论文本的融合、评分数据和用户其它信息(人口学、社交网络)的融合、评分数据和项目类别的融合等。

3 结语

本文从推荐系统的重要国际会议ACM RecSys角度,分析了当前推荐系统研究的热点和发展趋势,认为当前国际上的推荐系统研究无论是理论基础、还是实践应用都已经取得了非常多的成果,而基于多种方法混合、多种数据源融合的混合推荐将是未来推荐系统研究的主要方向。

另外,值得注意的是,从55篇年会论文的来源国家看,欧美国家占了绝大部分,而我国仅有香港地区2篇论文被会议接收,反映出我国(尤其是大陆地区)对该会议尚不够重视或研究实力稍逊。鉴于该会议在推荐系统研究领域的重要程度,建议我国学者加强对该会议的了解和参与力度。

(本文责任编辑:马卓)

作者:景民昌

上一篇:大学生和谐道德观研究论文下一篇:学生美术学习教育改革论文