浅析电子商务中的WEB数据的挖掘论文
[摘要] 本文立足于web数据挖掘技术,从个性化网站的设计、crm中的应用和推荐系统中的应用三个角度,分析了电子商务中的web数据挖掘应用。
[关键词] 电子商务 web 数据挖掘
电子商务改变了人们传统的商务模式,同时,也改变了商家与顾客之间的关系。客户选择余地的扩大使得他们更加关注商品的价值,而不象以前首先考虑品牌和地理因素。因此对销售商而言尽可能的了解客户的爱好、价值取向,才能在竞争中立于不败之地。数据挖掘技术可以有效地帮助销售商理解客户行为,提高站点的效率。在电子商务网站的设计、客户关系管理(crm)、网络营销等方面得到广泛的应用。
一、数据挖掘在电子商务网站设计中的应用
数据挖掘可以得出诸如:什么客户喜欢这个站点、客户通过什么访问路径达成交易,以及客户访问站点的频率等信息,从而优化网站的结构提高网站的访问量,吸引更多的客户。对于改进网站设计、定制个性化页面、判断站点效率有着重要帮助。
利用web数据挖掘技术,个性化电子商务系统的实现过程包括信息采集、信息分析和个性化服务三个主要步骤:
1.信息采集。收集客户个人信息是提供个性化服务的基础。收集个人信息主要有两种方式。第一种方式是通过客户注册来获得,这种方式可以得到客户的性别、出生日期、最高学历、家庭收入、婚姻状况、职业等;第二种是通过客户在网站上的行为来判断个人的兴趣爱好等特点,从而获得客户个人信息。如果客户经常浏览某类产品或相关广告,我们就可以知道客户对这类产品感兴趣。Www.133229.CoM
2.信息分析。一个成功和完善的个性化电子商务网站应该能够在对客户透明的情况下,对客户的资料、行为进行分析,并尽量不影响客户的页面处理时间,对于耗时较多的分析、分类处理应放在系统相对空闲和客户退出网站等时间处理,减少客户等待时间。信息分析过程如下:(1)将网站客户群进行分类,然后按照客户群兴趣特点进行内容设计,并且将内容相应归类;(2)定义客户类别所对应的内容,即某类客户最需要看到什么内容;(3)分析客户的行为和登录资料,判别客户所属的类别;(4)客户浏览网站不同页面时,以及提交购买定单时,修改相应行为资料。
3.个性化服务。根据客户类别显示相应的内容给客户,达到个性化服务的目的。为了使分类更具有可信性和稳定性,对注册时间较长,浏览及购买行为相对稳定的客户优先抽样。
二、数据挖掘在crm中的应用
1.客户的获取。在大多数的'商业领域中,业务发展的主要指标包括新客户的获取能力。企业的市场部门人员可以采用传统的方法来发展新客户,如开展大规模广告活动;也可以根据所了解的目标客户群,将他们分类,然后进行直销活动。但是当数据量增大时,即使有丰富经验的市场人员想要选择出相关的人口调查属性的筛选条件也会变得很困难,随客户数量不断增长和每位客户的细节因素增多,要得出这样的行为模式的复杂度也同样增大。而数据挖掘技术可以帮助完成潜在客户的筛选工作。首先从一份潜在的客户名单开始,列出可能对企业的产品或服务感兴趣的消费者的信息,通过调查和处理对这些信息进行数据扩展,并和一些外部信息匹配,使之更适合数据挖掘分析。然后进行市场试验活动,根据所需要预测的客户行为在一定范围内对客户进行试验,记录下客户的反馈,称之为“反应行为模式”。剔除无反应行为和反应行为类别中重复的数据后,在确定细节粒度的基础上,利用数据挖掘技术构建出n元反应行为预测模型。根据这个模型,可以将潜在的客户排序,以便找出那些对企业的产品或服务最感兴趣的客户。
2.客户的保持。随着行业中的竞争愈来愈激烈和获得一个新客户的开支愈来愈大,保持原有客户的工作也愈来愈有价值。在crm的实施中,企业通过预测,找出可能会流失的客户,并分析出主要有哪些因素导致他们想要离开,在此基础上,有针对性地挽留那些有离开倾向的客户。
利用数据挖掘技术,可以通过挖掘大量的客户信息来构建预测模型,较准确地找出易流失客户群,并制定相应的方案,最大程度地保持住老客户。数据挖掘技术中的决策树技术能够较好地应用在这一方面。
3.客户的细分。细分是指将一个大的消费群体划分为一个个细分群体的动作,同属一个细分群的消费者彼此相似,而隶属于不同细分群的消费者被视为不同的。通过crm的实施,将产生细分的客户群,企业根据客户提出的要求和实际所做的不断地改善产品和服务,从而使企业不断提高使该客户群满意的能力。
数据挖掘技术中的聚类分析技术能够被运用来从客户信息数据库中发现不同的客户群,并且用购买模式来刻画不同客户群的特征,达到细分客户群的目的。根据客户数据特点,一般可采用聚类技术中的k平均算法来进行划分。其原理为将含原始客户信息的数据库划分成k个聚簇,然后采用一定的算法使得同一簇中的对象是“相似的”,而不同簇中的是“相异的”。
三、推荐系统中的数据挖掘技术
1.贝叶斯网络。贝叶斯网络技术利用训练集创建相应的模型,模型用决策树表示,节点和边表示客户信息。模型的建立可以离线进行,一般需要数小时或数天,得到的模型非常小,对模型的使用非常快,这种方法适合客户的兴趣爱好变化比较慢的场合,推荐精度和最近邻技术差不多。
2.关联规则。关联规则既可用来分析商品间的参考模式,也可以向客户推荐商品,提高交叉销售能力。关联规则的发现可以离线进行,随着商品数目的增加,规则的数量呈指数增加,但通过决策者对支持度和置信度的选择,感兴趣模式以及算法的选取,也可以高效实现。推荐精度比最近邻技术略差。
3.聚类分析。该技术将具有相似爱好、购物兴趣的客户分配到相同的族中,聚类产生之后,根据该族中其他客户对某商品的评价就可以得到系统对该商品的评价,聚类过程可以离线进行,聚类产生之后,性能比较好,但如果某客户处于一个聚类的边缘,则对该客户的推荐精度比较低,推荐精度比最近邻技术略差。
4.推荐系统要兼顾准确性和实时性。一个好的系统可能是多种方法和技术的结合,取长补短。譬如,可以把聚类分析作为最临近算法的预处理,即通过聚类分析来减小候选集,最临近算法就可以在一个较小的数据集合中进行,从而提高了实时性。
参考文献:
[1]周彦晖:电子商务与web数据挖掘.计算机应用.2006(5)
[2]董逸生:web挖掘研究综述.计算机科学,2006(11)
【浅析电子商务中的WEB数据的挖掘论文】相关文章: