基于数据挖掘技术的客户关系管理

2024-09-25

基于数据挖掘技术的客户关系管理(共12篇)

1.基于数据挖掘技术的客户关系管理 篇一

数据挖掘技术在客户关系管理中如何应用

根据波特的影响企业的利益相关者理论,企业有五个利益相关者,分别是客户、竞争对手、供应商、分销商和政府等其他利益相关者。其中,最重要的利益相关者就是客户。现代企业的竞争优势不仅体现在产品上,还体现在市场上,谁能获得更大的市场份额,谁就能在竞争中占据优势和主动。而对市场份额的争夺实质上是对客户的争夺,因此,企业必须完成从“产品”导向向“客户”导向的转变,对企业与客户发生的各种关系进行管理。进行有效的客户关系管理,就要通过有效的途径,从储存大量客户信息的数据仓库中经过深层分析,获得有利于商业运作,提高企业市场竞争力的有效信息。而实现这些有效性的关键技术支持就是数据挖掘,即从海量数据中挖掘出更有价值的潜在信息。正是有了数据挖掘技术的支持,才使得客户关系管理的理念和目标得以实现,满足现代电子商务时代的需求和挑战。

一、客户关系管理(CRM CRM是一种旨在改善企业与客户之间关系的新型管理方法。它是企业通过富有意义的交流和沟通,理解并影响客户行为,最终实现提高客户获取、客户保留、客户忠诚和客户创利的目的。它包括的主要内容有客户识别、客户关系的建立、客户保持、客户流失控制和客户挽留。通过客户关系管理能够提高企业销售收入,改善企业的服务,提高客户满意度,同时能提高员工的生产能力。

二、数据挖掘(DM 数据挖掘(Data Mining,简称DM,简单的讲就是从大量数据中挖掘或抽取出知识。数据挖掘概念的定义描述有若干版本。一个通用的定义是从大量的、不

完全的、有噪声的、模糊的、随机的实际应用数据中提取人们感兴趣的知识,这些知识是隐讳的、事先未知的、潜在有用的信息。

常用的数据挖掘方法有:(1关联分析。即从给定的数据集中发现频繁出现的项集模式知识。例如,某商场通过关联分析,可以找出若干个客户在本商场购买商品时,哪些商品被购置率较高,进而可以发现数据库中不同商品的联系,进而反映客户的购

买习惯。(2序列模式分析。它与关联分析相似,其目的也是为了控制挖掘出的数据间的联系。但序列模式分析的侧重点在于分析数据间的前后(因果关系。例如,可以通过分析客户在购买A商品后,必定(或大部分情况下随着购买B商品,来发现客户潜在的购买模式。(3分类分析。是找出一组能够描述数据集合典型特征的模型,以便能够分类识别未知数据的归属或类别。例如,银行可以根据客户的债务水平、收入水平和工作情况,可对给定用户进行信用风险分析。(4聚类分析。是从给定的数据集中搜索数据对象之间所存在的有价值联系。在商业上,聚类可以通过顾客数据将顾客信息分组,并对顾客的购买模式进行描述,找出他们的特征,制定针对性的营销方案。(5孤立点分析。孤立点是数据库中与数据的一般模式不一致的数据对象,它可能是收集数据的设备出现故障、人为输入时的输入错误等。孤立点分析就是专门挖掘这些特殊信息的方法。例如,银行可以利用孤立点分析发现信用卡诈骗,电信部门可以利用孤立点分析发现电话盗用等。

三、数据挖掘在客户关系管理中的应用 1.进行客户分类

客户分类是将大量的客户分成不同的类别,在每一类别里的客户具有相似的属性,而不同类别里的客户的属性不同。数据挖掘可以帮助企业进行客户分类, 针对不同类别的客户,提供个性化的服务来提高客户的满意度,提高现有客户的价值。细致而可行的客户分类对企业的经营策略有很大益处。例如,保险公司在长期的保险服务中,积累了很多的数据信息,包括对客户的服务历史、对客户的销售历史和收入,以及客户的人口统计学资料和生活方式等。保险公司必须将这些众多的信息资源综合起来,以便在数据库里建立起一个完整的客户背景。在客户背景信息中,大批客户可能在保险种类、保险年份和保险金额上具有极高的相似性,因而形成了具有共性的客户群体。经过数据挖掘的聚类分析,可以发现他们的共性,掌握他们的保险理念,提供有针对性的服务,提高保险公司的综合服务水平,并可以降低业务服务成本,取得更高的收益。

2.进行客户识别和保留

(1在CRM中,首先应识别潜在客户,然后将他们转化为客户

这时可以采用DM中的分类方法。首先是通过对数据库中各数据进行分析,从而建立一个描述已知数据集类别或概念的模型,然后对每一个测试样本,用其已知的类别与学习所获模型的预测类别做比较,如果一个学习所获模型的准确率经测试被认可,就可以用这个模型对未来对象进行分类。例如,图书发行公司利用顾客邮件地址数据库,给潜在顾客发送用于促销的新书宣传册。该数据库内容有客户情况的描述,包括年龄、收入、职业、阅读偏好、订购习惯、购书资金、计划等属性的描述,顾客被分类为“是”或“否”会成为购买书籍的顾客。当新顾客的信息被输入到数据库中时,就对该新顾客的购买倾向进行分类,以决定是否给该顾客发送相应书籍的宣传手册。

(2在客户保留中的应用

客户识别是获取新客户的过程,而客户保留则是留住老顾客、防止客户流失 的过程。对企业来说,获取一个新顾客的成本要比保留一个老顾客的成本高。在保留客户的过程中,非常重要的一个工作就是要找出顾客流失的原因。例如,某专科学校的招生人数在逐渐减少,那么就要找出减少的原因,经过广泛的搜集信息,发现原因在于本学校对技能培训不够重视,学生只能学到书本知识,没有实际的技能,在就业市场上找工作很难。针对这种情况,学校应果断的抽取资金,购买先进的、有针对性的实验实训设备,同时修改教学计划,加大实验实训课时和考核力度,培训相关专业的教师。

(3对客户忠诚度进行分析

客户的忠诚意味着客户不断地购买公司的产品或服务。数据挖掘在客户忠诚度分析中主要是对客户持久性、牢固性和稳定性进行分析。比如大型超市通过会员的消费信息,如最近一次消费、消费频率、消费金额三个指标对数据进行分析,可以预测出顾客忠诚度的变化,据此对价格、商品的种类以及销售策略加以调整和更新,以便留住老顾客,吸引新顾客

(4对客户盈利能力分析和预测

对于一个企业而言,如果不知道客户的价值,就很难做出合适的市场策略。不同的客户对于企业而言,其价值是不同的。研究表明,一个企业的80%的利润是由只占客户总数的20%的客户创造的,这部分客户就是有价值的优质客户。为了弄清谁才是有价值的客户,就需要按照客户的创利能力来划分客户,进而改进客户关系管理。数据挖掘技术可以用来分析和预测不同市场活动情况下客户盈利能力的变化,帮助企业制定合适的市场策略。商业银行一般会利用数据挖掘技术对客户的资料进行分析,找出对提高企业盈利能力最重要的客户,进而进行针对性的服务和营销。

(5交叉销售和增量销售

交叉销售是促使客户购买尚未使用的产品和服务的营销手段,目的是可以拓宽企业和客户间的关系。增量销售是促使客户将现有产品和服务升级的销售活动,目的在于增强企业和客户的关系。这两种销售都是建立在双赢的基础上的,客户因得到更多更好符合其需求的服务而获益,公司也因销售增长而获益。数据挖掘可以采用关联性模型或预测性模型来预测什么时间会发生什么事件,判断哪些客户对交叉销售和增量销售很有意向,以达到交叉销售和增量销售的目的。例如,保险公司的交叉营销策略:保险公司对已经购买某险种的客户推荐其它保险产品和服务。这种策略成功的关键是要确保推销的保险险种是用户所感兴趣的,否则会造成用户的反感。

四、客户关系管理应用数据挖掘的步骤 1.需求分析

只有确定需求,才有分析和预测的目标,然后才能提取数据、选择方法,因此,需求分析是数据挖掘的基础条件。数据挖掘的实施过程也是围绕着这个目标进行的。在确定用户的需求后,应该明确所要解决的问题属于哪种应用类型,是属于关联分析、分类、聚类及预测,还是其他应用。应对现有资源如已有的历史数据进行评估,确定

是否能够通过数据挖掘技术来解决用户的需求,然后将进一步确定数据挖掘的目标和制定数据挖掘的计划。2.建立数据库

这是数据挖掘中非常重要也非常复杂的一步。首先,要进行数据收集和集成,其次,要对数据进行描述和整合。数据主要有四个方面的来源:客户信息、客户行为、生产系统和其他相关数据。这些数据通过抽取、转换和装载,形成数据仓

库,并通过 OLAP 和报表,将客户的整体行为结果分析等数据传递给数据库用户。3.选择合适的数据挖掘工具 如果从上一步的分析中发现,所要解决的问题能用数据挖掘比较好地完成,那么需要做的第三步就是选择合适的数据挖掘技术与方法。将所要解决的问题转 化成一系列数据挖掘的任务。数据挖掘主要有五种任务:分类,估值预测,关联 规则,聚集,描述。前三种属于直接的数据挖掘。在直接数据挖掘中,目标是应 用可得到的数据建立模型,用其它可得到的数据来描述感兴趣的变量。后两种属 于间接数据挖掘。在间接数据挖掘中,没有单一的目标变量,目标是在所有变量 中发现某些联系。4.建立模型 建立模型是选择合适的方法和算法对数据进行分析,得到一个数据挖掘模型 的过程。一个好的模型没必要与已有数据完全相符,但模型对未来的数据应有较 好的预测。需要仔细考察不同的模型以判断哪个模型对所需解决的问题最有用。如决策树模型、聚类模型都是分类模型,它们将一个事件或对象归类。回归是通 过具有已知值的变量来预测其它变量的值。时间序列是用变量过去的值来预测未 来的值。这一步是数据挖掘的核心环节。建立模型是一个反复进行的过程,它需 要不断地改进或更换算法以寻找对目标分析作用最明显的模型,最后得到一个最 合理、最适用的模型。5.模型评估 为了验证模型的有效性、可信性和可用性,从而选择最优的模型,需要对模 型进行评估。我们可以将数据中的一部分用于模型评估,来测试模型的准确性,模型是否容易被理解模型的运行速度、输入结果的速度、实现代价、复杂度等。模型的建立和检验是一个反复的过程,通过这个阶段阶段的工作,能使数据以用 户能理解的方式出现,直至找到最优或较优的模型。6.部署和应用 将数据挖掘的知识归档和报告给需要的群体,根据数据挖掘发现的知识采取 必要的行动,以及消除与先前知识可能存在的冲突,并将挖掘的知识应用于应用 系统。在模型的应用过程中,也需要不断地对模型进行评估和检验,并做出适当 的调整,以使模型适应不断变化的环境。参考文献: [1]罗纳德.S.史威福特.客户关系管理[M].杨东龙译.北京:中国经济 出版社,2002 [2]马刚:客户关系管理[M]大连:东北财经大学出版社,2008

2.基于数据挖掘技术的客户关系管理 篇二

在2002年国家施行电力体制改革以来, 实现了厂网分离、电力行业重组之后, 电价机制改革、电网企业主辅分离、输配分开等方面的改革进程均在逐步推进, 相关的市场化改革也在紧锣密鼓的开展, 国内电力市场化格局基本形成。

随着国内电力市场的不断壮大和繁荣, 人们对电力的需求不断提高, 虽然给各家电力企业提供了前所未有的发展空间和机会, 但也使得各家电力企业都不得不直接面对以下两方面问题:

1、电力改革压力大

随着中国市场经济进程的推进, 中国国电公司适时而动, 通过一系列具体措施逐步构筑现代供电服务机制, 从体制、机制等深层次问题入手, 以服务年活动为载体和开端, 努力构筑现代服务机制。其中尤以建立客户满意度评价体系为核心目标, 通过建立企业与社会的双向互动机制, 正确把握客户需求, 努力贴近客户需求, 及时满足客户需求, 实现与客户的“零距离”, 获得最高的客户满意度, 从而在竞争中赢得先机。从现代营销管理体系的入手, 推进职能分工重构、业务流程整合、管理体系再造, 建立配套联动、规范高效的智能化客户关系管理模式。这既是当前供电行业经营管理的迫切需要, 同时也符合当代国际营销前沿理论规律。

2、恶意欠费比例偏高

另一方面, 值得关注的是我国各供电公司客户拖欠电费、违章用电、窃电等现象相对比较严重。2004年2月10日, 在福州召开的“国家电网公司2004年工作会议”上, 国家电网公司公布截至2005年底, 整个国网系统电费拖欠高达200多亿, 相当于2003全年利润额的两倍。而且窃电行为已经具有多发、主体多元、手段隐蔽而且窃电手段日趋隐蔽并向高科技发展趋势。据国家电业部门统计, 每年的电能损失高达二十亿元。面对如此严重的局面已引起各方的高度重视。基于已有的客户信息和有关数据, 如何利用科学的数据挖掘分析系统有效地评估客户关于用电和盗电的潜在风险?如何了解哪些用电客户缴纳电费最准时?不良客户的特征是什么?更进一步, 如何准确细分客户群体, 从而制定精细的营销计划?如何预测电费拖欠、盗电等恶意行为, 从而提高对恶意拖欠电费、违章用电、窃电等行为的防范?这些都是有效降低供电公司的经营风险, 保护企业合法利益, 为地方电力事业可持续发展创造有利条件所迫切需要解决的问题。因此, 建立一套完整的理论分析模型和成熟的计算机管理系统已经引起各供电公司注意并逐步提上了议事日程。

这些方面问题的存在, 迫使电力企业必须改变原有经营模式, 必须更深入了解和识别客户, 实行全面的以客户为中心的经营方针, 培育和创造出新的差异化的竞争优势。电力企业这种迫切的需求必然促进了数据挖掘技术在电力行业的广泛应用和推广。

二、数据挖掘技术在电力行业的应用

计算机技术的迅速发展使得处理这些大量的数据成为可能, 这就推动了数据库技术的极大发展。但是面对如潮水般不断增加的数据, 人们不再满足于数据库的查询功能, 提出了深层次问题:能不能从数据中提取信息或者知识为决策服务。就数据库技术而言已经显得无能为力了, 同样, 传统的统计技术也面临了极大的挑战。这就急需有新的方法来处理这些海量数据。于是, 融合数据库技术、统计学、机器学习、信息科学等多学科的数据挖掘技术应运而生。

数据挖掘 (Data Mining) , 也叫知识发现、数据开采等, 是指是从大量数据中, 提取正确的、新颖的、潜在有用的并能够被理解的知识的过程。数据挖掘能进行分类预测、聚类分析、关联规则和序列模式的发现、相关分析、异常监测和趋势分析。

作为信息化方面一直处于领先地位的电力行业, 一方面在长期的经营中积累了海量的客户数据, 同时业务经营迫切需要从浩如烟海的数据中获得更多的、更有价值的客户特征信息。因此, 数据挖掘在电力行业得到了广泛重视和大力发展。

国外知名的电力企业都已经建立了基于数据挖掘的商业智能系统:如包括美国供电公司、法国电网公司 (EDF) 等, 并且得到了广泛的应用。

国内电力企业前几年的发展目标主要是硬件系统的架构和铺设, 技术领域主要是业务运营支撑系统BOSS的更新换代, 但是近年来, 上海、江苏等经济发达地区等电力企业也意识到挖掘历史数据对于降低坏帐损失, 识别和防范恶意欠费行为的重要性, 已经着手建立对自己所掌握的客户信息进行挖掘的智能化信息平台。

国外实践证明:建立用电客户欠费风险防范体系, 根据用电企业欠费结构, 可以使供电公司减少15-40%的欠费损失。

三、建立电力客户风险预警系统

客户信用风险管理系统提供符合国际国内标准的客户信用评价体系和模型;提供欠费风险预警机制;在客户用电情况分析的基础上, 提供窃电行为检测手段, 并将窃电行为的查处与客户信用评级联系起来, 形成强大社会监督和威慑作用;利用用电力企业的信用数据和网上公开信息, 将产业政策、经济形势、经营状况、市场环境等外部因数纳入电量的预测中, 建立更加准确的预测方法, 提高用电预测的精度。

客户信用风险管理系统主要包括由四个功能模块构成。四个功能模块包括:信用评价模型、欠费预警模型、窃电检测模型和用电预测模型。 (见图1)

下面我们仅以电力客户信用评级模型为例, 说明模型的运行情况;建立电力客户信用评级体系首先需要建立一套科学的、实用的、精确的和权威的信用评级模型。同时更为重要的是在现行法律法规体系下和供电局现有的数据准备条件基础上具有可操作性。用户信用信息难以征集一直是制约信用评价工作开展的瓶颈。因此, 全面吸收国际著名评级机构的信用风险评价和管理核心技术, 结合中国电力行业实际情况, 运用长期积累的丰富经验和先进方法, 利用现有的营销数据提炼出客户信用信息, 提供既满足中国实际又符合国际惯例的用户信用状况评级方法显得尤为重要。

信用评级模型将客户的个人资料信息、缴费情况、缴费能力、经济实力、资本结构、经营效益、发展前景和社会信用记录等信息纳入信用评级模型。导出客户的违约概率, 并转化成信用积分, 从而根据积分分布制定相应的业务策略。 (见图2)

实施电力客户风险管理系统, 提高用电营销辅助决策水平, 探索电力客户信用评价和窃电检测手段, 具有相当的学术价值, 而且具有较高的经济效益, 符合供电公司的现实和长远利益。该项目的实施将为供电公司电费回收管理工作、反窃电管理工作和用电营销决策带来重大的革新。

1、通过客户信用风险管理系统, 改善电费回收环境

供电公司可以根据不同信用等级, 采用限时缓缴、上门促缴、停电催缴和电费预缴等灵活多样的办法。建立客户信用等级并公示于众, 形成社会监督, 可以帮助企业转变成本观念, 将电费作为一项重要的预算成本, 从而防止电费拖欠和呆死账发生。供电公司在审批申请用电、增容报装、优惠电价时, 优先安排信用等级高的客户, 使企业为了得到优惠的服务, 努力提高自身的信用等级。在电网电力负荷紧张需要采取停、限电措施时按客户信誉等级优先确保信誉高的客户用电安全。

根据国外的应用经验和国内有的省份已经开始试行客户信用评级的供电公司的经验来看, 可以使大部分有意拖欠和恶意欠费的用电单位及时主动交纳电费。

2、通过欠费预警系统, 改善企业经营环境

建立欠费预警系统, 可以及时发现可能欠费或正在实施欠费的用电客户, 提前建立欠费预警机制, 及时采取有效措施, 减少欠费事后清缴的难度和呆帐、坏帐的产生, 最大限度的保护供电公司的经济利益。欠费风险的评价可以给防范和处理用电客户恶意拖欠或拒交电费的防范和处理工作提供科学依据和决策指导。国外实践证明:建立用电客户欠费预警系统, 根据用电客户欠费结构, 可以使供电公司减少15-40%的欠费损失。

3、通过窃电检测系统, 改善用电环境

据国家权威部门统计, 窃电给供电公司带来的直接经济损失已经高达2 0 0亿, 同时带来一系列的安全隐患和社会问题, 危害巨大。基层电管人员普遍感到反窃电管理难度较大, 大家都希望掌握一套切实可行的办法, 打击窃电犯罪行为。大量事实表明, 20%的"电耗子"造成了80%的窃电损失, 能够对这20%的用户检测出来, 有的放矢, 无疑会节省我局大量的人力物力。对解决目前反窃电工作中存在的资金和人力不足的问题将起到积极的作用。

4、通过准确的用电需求预测模型, 提高营销决策水平

准确的用电需求预测可以提供供电公司在安排电力调度和向发电单位购买电量时, 较为准确的科学数据。供电公司在签订向兄弟公司转售或购买电量合同时可以做到胸中有数。

提高用电需求预测的准确性和实时性, 便于供电公司合理安排供电和检修计划, 避免电量过剩或拉闸限电给供电公司带来经济损失和不良的社会影响。

摘要:本文针对当前供电行业经营管理过程中存在改革压力和恶意欠费问题进行深入分析, 引入当前流行的数据挖掘技术监建立电力客户信用风险管理系统, 该系统主要包括信用评价模型、欠费预警模型、窃电检测模型和用电预测模型等四个功能模块。该系统的实施将为供电公司电费回收管理工作、反窃电管理工作和用电营销决策带来重大的意义。

关键词:数据挖掘,客户关系管理,信用风险管理

参考文献

[1]、王芳, 杨奕.论数据挖掘技术在客户关系管理 (CRM) 中的应用[J].现代商贸工业, 2009, (01)

[2]、刘思强, 李湘祁.供电企业客户关系管理探讨[J].电力技术经济, 2005, (01)

[3]、范方.数据挖掘技术在CRM中的分析应用[J].大众科技, 2008, (07)

[4]、郭凯明.基于贝叶斯分类算法的客户流失分析模型研究[J].电脑知识与技术, 2008, (35)

[5]、王森勋, 陈旭东, 付淑文.数据挖掘技术在企业客户关系管理中的应用, 湖南医科大学学报 (社会科学版) , 2009, (01)

3.基于数据挖掘技术的客户关系管理 篇三

[关键字] 数据挖掘;客户关系管理(CRM);房地产

一、引言

数据挖掘是信息领域发展最快的技术,很多不同领域的专家都从中获得了发展的空间,使得数据挖掘成为企业界讨论的热门话题。它的出现为商业决策提供了有价值的知识,让企业获得了利润。房地产行业的竞争越来越激烈,数据挖掘技术作为分析与辅助决策工具,从繁杂的数据中找出真正有价值的信息知识,提高房地产企业对客户了解程度,时时快捷地发现并满足客户的需求,并发掘出潜在的客户群,从而提高企业的竞争力。

二、数据挖掘技术和客户关系管理

(一)数据挖掘(Data Mining)技术及常用方法

数据挖掘是从海量的数据中提取或挖掘知识的技术,是从大数据集中识别出有效的、新颖的、潜在有用的以及最终可理解的模式的技术。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。常用的数据挖掘技术包括关联分析、分类分析、聚类分析、预测、序列分析、孤立点分析等。事实上,解决一个已给的业务问题时,数据挖掘一般混合使用两种及两种以上的技术类别。

(1)关联分析:关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的目的是挖掘出隐藏在数据间的相互关系,它经常被用来描述不同种类的物品经常被一起购买的关系。通过对收集存储的大量历史事务数据进行分析,就可以得到有关顾客购买行为的极有价值的信息。

(2)分类分析:分类分析通过分析具有类别的样本的特点,得到决定样本属于各种类别的规则或方法,利用这些规则和方法对未知类别的样本分类提供依据,是数据挖掘技术中应用最广泛的技术之一,也是商业上应用最多的技术。利用分类技术,可以根据顾客的消费水平和基本特征对顾客进行分类,找出对商家有较大利益贡献的重要客户的特征,通过对其进行个性化服务,提高他们的忠诚度。

(3)聚类分析:聚类分析是根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并对每一个这样的组进行描述的过程,使得类间的相似性尽量小,类内的相似性尽量大。

(4)预测:预测与分类类似,但预测是根据样本的已知特征估算某个连续类型的变量的取值的过程,而分类则只是用于判别样本所属的离散类别而己。预测模型可以使用较为传统的统计回归技术,也可以使用新的分类技术,目前最通用的是决策树归纳技术。

(5)序列分析:序列分析技术主要用于发现一定时间间隔内接连发生的事件,这些事件构成一个序列,发现的序列应该具有普遍意义,其依据除了统计上的概率之外,还要加上时间的约束。

(6)孤立点分析:数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致,这些数据对象称为孤立点。对这些数据的挖掘分析可以用于处理一些罕见事件,比如信用卡欺诈等。

(二)客户关系管理(Customer Relationship Management,CRM)

客户关系管理(CRM)首先是一种管理理念。其核心思想是将企业的客户作为重要的资源,通过完善的客户服务和深入的客户分析来满足客户的需求,保证实现客户的终生价值。

CRM又是一种旨在改善企业与客户之间关系的新型管理机制,它实现于企业的市场营销、销售、服务与技术支持等与客户相关的领域。通过向企业的销售、市场和客户服务的专业人员提供全面、个性化的客户资料,并强化跟踪服务、信息分析的能力,使他们能够维护一系列与客户和生意伙伴之间卓有成效的“一对一关系”从而使企业得以提供更快捷和更周到的优质服务,提高客户的满意度。

CRM也是一种管理软件和技术。它将最佳的商业实践与数据挖掘、数据仓库、一对一营销、销售自动化以及其他信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供了业务自动化的解决方案,使企业能够顺利实现由传统企业模式到以电子商务为基础的现代企业模式的转化。

三、数据挖掘技术在房地产客户关系管理中的应用

(一)数据挖掘在房地产市场分析中的应用

数据挖掘技术在房地产业上实际应用十分丰富。应用数据挖掘技术,可以帮助房地产行业找出有价值的信息,十分有助于企业发现商机、制定开发计划与营销策略。对于房地产市场研究,数据挖掘可以应用于宏观经济形势研究、市场发展趋势研究、楼盘供应研究、竞争对手研究、客户研究等多方面:

(1)宏观经济形势研究:研究房地产波动周期,寻找特定国家或区域房地产波动周期的规律、相似性和特点,分析房地产周期的影响因素和它们之间的关系,对房地产市场的宏观分析很有参考价值。

(2)市场发展趋势研究:分析房地产市场的需求与国民经济增长、人均可支配收入、土地出让面积、房地产投资开发总额等因素之间的关系,通过各种方法得到房地产市场的需求模型,进而对市场进行预测。

(3)楼盘供应研究:通过地理发展空间的多维分析,综合人口住房条件及分布、土地利用现状及政府规划、交通现状分布信息,通过聚集及层次化描述,发掘区域内需建立的高档别墅,高、中、低档公寓的数量及各自的地理位置和发展计划。

(4)客户研究:客户信息的多维关联和序列模式分析,可在客户信息中发现客户的消费行为模式,帮助营销人员找出影响消费者的机会与方式。

目前,专业市场研究公司对房地产行业的调研主要集中在客户需求分析方面,因此,本文接下来主要探讨房地产客户信息管理的数据挖掘。

(二)数据挖掘在房地产CRM中的应用

随着房地产行业竞争的加剧,房地产企业要想在竞争中制胜,必然需要充分的信息支持和准确的市场判断。房地产行业拥有大量的数据积累,包括行业信息、经济环境信息、客户信息等。这些数据是房地产企业市场运作的重要参考。面对海量数据的积累,传统的查询已不能识别其中有价值的信息,数据挖掘技术正是在这种市场需求下逐渐发展并越来越广泛地应用于房地产CRM中。

房地产行业的客户信息有许多特点,一方面房地产行业面对的客户群广泛,而且客户的特征描述的结构复杂,另一方面房地产客户需求的层次不一,且易受外界因素影响,具有多层次性和多变性。对于复杂、多样而且擅变的客户信息,房地产行业客户信息的数据挖掘有助于识别客户购买行为,发现客户购买模式和趋势。从而,帮助房地产企业改进服务质量,取得更好的客户关系和满意程度,设计更好的营销方案,减少商业成本,并帮助企业分析出解决问题所需要的关键因素,使企业处于更有利的竞争位置。数据挖掘在房地产客户关系管理中的应用见表1。

表1 数据挖掘在房地产客户关系管理中的应用

“谁拥有客户信息,谁就拥有未来”。在房地产企业管理客户生命周期的各个阶段都会用到数据挖掘中的各种技术。数据挖掘能够帮助房地产企业确定客户的特点,从而可以为客户提供有针对性的服务。通过数据挖掘,可以发现购买客户的特征,从而可以挖掘出那些也同样具有这些特征却没有购买的客户品;若找到流失客户的特征,也可以在那些具有相似特征的客户还未流失之前,采取针对性的措施。在企业CRM中有效利用数据挖掘技术,可以为企业高层决策者提供准确的客户分类、忠诚度、赢利能力及潜在用户等有用信息,指导企业制订最优的企业营销策略、降低银行运营成本、增加利润,加速企业的发展。

(三)数据挖掘在房地产CRM中应用的具体步骤

(1)明确商业目标

应用数据挖掘的首要任务就是要明确商业目标,描述出需要解决的问题,并且确定所要解决的问题属于哪种应用类型,如上面提到的数据挖掘技术中的关联、分类、聚类、预测还是综合应用。

(2)数据准备

数据挖掘时由可以获取的数据驱动的,其成功很大程度上取决于所收集数据的数量与质量,建立可靠数据资源的第一步就是确定系统将要使用数据的数据字典,在建立数据字典后,要清洗数据,逐列检查数据的完整性、有效性,并验证各数据库之间的一致性。

(3)利用数据挖掘技术建立模型

利用数据挖掘的算法对数据进行分析,建立模型,并选择好相应的实现工具。选择好模型的类型及实现工具后,有时还需对数据进行预处理。

(4)反复验证

验证应从较小的系统(如较小的客户群体)开始,但要完成全过程,即从数据收集和处理,到数据挖掘,最后到产生促销数据结构。通过验证,可以纠正系统中的错误,并有利于用户对系统功能的进一步理解。

(5)实施与维护

在应用模型之后,还要不断监控模型的效果。因为事物在不断发展变化,很可能过一段时间之后,随着购买方式、消费观点的变化,该模型就不再起作用了。因此随着模型使用时间的增加,要不断地对模型做重新测试,有时甚至要重新建立新的模型。

四、结论

房地产行业是一个数据量大、关联性强、影响因素多的复杂非线性系统。数据挖掘技术在房地产行业的应用是一个年轻且充满希望的研究领域,人们对它的研究正日益广泛和深入。数据挖掘是房地产CRM的前提和基础,房地产CRM是数据挖掘的延续和创新,通过将两者进行有效的组合,不断促进企业单个客户价值的提升和客户规模的扩大,有效地推动着企业价值和实力的不断攀升。对于政府部门合理分析产业发展,制定产业政策及开发企业和个人正确判断房地产市场形势、做出投资或购房决策具有重要意义。

[参考文献]

1.李琪.客户关系管理.重庆大学出版社[M],2004.8.

2.[美]迈克尔·贝利,戈登·利若夫.高管商学院数据挖掘[M].袁卫等译.中国劳动社会保障出版社,2004.10.

3.朱惠云.数据挖掘在客户关系管理中的应用[J].企业管理,2003.4.

4.Jona R M Hosking,et al A statistical perspective on data mining[j]. Future Generation Computer Systems,1997,13(2):117-134

5.陈峻青.基于数据挖掘的房地产价格分析与预测[D].广州:中山大学硕士学位论文,2007.

4.基于数据挖掘技术的客户关系管理 篇四

基于数据挖掘粗糙集技术的电信运营商客户价值评价

作者:谭耀武

来源:《沿海企业与科技》2006年第01期

[摘 要]电信行业竞争激烈,国内电信运营商对有效的客户价值评价体系需求极为紧迫。文章结合电信行业实际,通过研究数据挖掘粗糙集技术,提出了电信运营商客户价值评价系统,以提高我国电信运营商的客户关系管理水平,增强竞争力。

[关键词]数据挖掘;粗糙集;客户价值评价;电信行业

[中图分类号]TN943.6;TN914.3

5.基于数据挖掘技术的客户关系管理 篇五

当前,电力企业改革发展面临新的形势和任务,随着电力体制改革的不断升入,尤其是受市场广泛关注的售电公司的出现,电力市场的交易将更加“民主、开放”,交易方式将逐步升级,出现电网+互联网+信用+期货+零售+批发等多种灵活、自主的交易方式,导致电力企业在开拓售电市场、防范经营风险等方面面临的压力与日俱增,同时面临着优质客户减少、市场份额下降及优质人才流失的严峻挑战,尤其对营销服务业务提出了更高的要求和新的挑战。对电力企业来说,利用大数据技术构建营销服务技术支撑平台,对营销客户用电特点及需求进行分析,可以为制定电力营销方案提供数据支持、为电力企业抢占市场及用户提供重要的数据支撑,从而提高企业经济效益,不断提升客户服务水平和服务质量。基于此,此课题的研究具有非常重要的现实意义。

一、大数据概述

“大数据”(big data)是与智能制造、无线网络革命并行的又一次颠覆性的技术变革,“大数据”是指量大、复杂、增长迅速的数据集合,也指在一定时间内无法通过传统的数据库软件工具对其内容进行抓取、管理和处理的数据集合,它涵盖了从生成、采集、存储、加工、转换、计算、分析挖掘、展示到使用整个数据全生命周期管理的过程,以及在这些过程中所用到的各项技术。

大数据技术的重要意义不仅仅在于掌握其中海量的数据信息,而且在于对这些含有重要意义的数据信息进行专业化的加工和处理、对于海量数据进行存储和分析。

二、电力大数据的价值及特征

每一个行业和业务领域都蕴含着大量的数据信息,而且逐渐成为其重要的生产因素。对于电力行业而言,电力大数据综合了电力企业的产、运、销及运营和管理数据,是以行业形势?A判、数据价值的挖掘为目标,利用大数据核心关键技术,实现企业管理模式转变、服务理念的提升,从而完成企业的转型升级,适应新的改革形势和外部环境。

电力大数据的特征主要为:

数据量大。这是电力大数据的一个重要特征。随着电力信息化建设的不断推进,电力数据的增长速度和规模已远超出电力企业的预期。

类型多(Variety),是指电力大数据包含各种各样的数据类型,如结构化、半结构化和非结构化数据。

速度快(Velocity),是指对电力大数据的采集处理和加工分析的速度。

有价值(Value),是指电力数据当中包含有很多有价值的信息。

一方面,随着电力体制改革的不断深入,电力企业将从生产型企业逐步转变为服务型企业,企业的业务流程需要围绕用电客户的需求进行优化和重组,同时,企业内部也需要变革管理模式、进行战略性转型。另一方面,随着“三集五大”体系建设的深入推进,SG186、SG-ERP等系统的建设及推进,已实现了企业级数据资源的初步整合及共享利用,但随着电力数据量的快速增长、数据类型的多样化以及跨专业、跨平台应用的日益深化,电力大数据必将面临着数据的高性能存储及高可扩展性等多项挑战。

因此,通过数据挖掘等技术深入挖掘并分析不同电力客户的需求,把最大限度满足客户的需求同提高企业的经营效益统一起来;站在客户的立场,以客户为中心,及时主动满足用电客户的需求,已成为电力企业的核心竞争点。电力改革环境下,企业必须进行业务流程的变革以适应时代的要求。

三、电力营销面临的机遇和挑战

大数据技术给电力营销带来了新的发展机遇,但也面临着很多挑战。“数据海量,知识匮乏”是大数据时代多数企业的通病。国家电网公司在“十二五”期间提出了“一型五化”的大营销体系(客户导向型、业务集约化、管理专业化、机构扁平化、管控实时化、服务协同化),一方面,随着“大营销”体系的全面建立,各类信息系统数据量多而重复,数据种类繁多,数据量大而冗余,给营销管理和决策者均带来了很大挑战。另一方面,当前营销各类业务的数据信息以业务工单的模式存储在不同的信息单元中,从而形成了多个信息孤岛;且同样的数据信息,不同专业进行统计分析时所采用的信息来源和统计方法都不尽相同,又造成了数据统计口径的不一致,这在很大程度上影响着营销管理服务及决策。

随着智能电网建设的全面开展以及SG186营销业务应用系统的建设完善,海量的业务数据被积累,且当前电力企业的运营方式正在向以电力市场需求和提高客户满意度的方向发展,这就对电力企业的营销服务质量提出了更高的要求,使得电力企业面临了多方面的压力。

一是海量的业务数据分属不同的应用体系,且类型繁杂,不少业务数据也都被分散在各自的系统内,造成了数据孤岛;数据庞大且分散,无法被有效利用与提炼升华;对于同一组数据,由于基于的统计方法、统计背景和数据来源都可能不一致,必定会造成数据统计口径有偏差。

二是售电侧业务放开对公司传统营销模式将带来巨大冲击。新一轮电力体制改革深入推进,公司面临优质客户减少、市场份额下降和优秀人才流失的严峻挑战。电力企业要在市场竞争环境中谋求发展和生存,只有充分了解市场化规则,找准市场定位,变革企业管理机制,才能适应电力体制改革,不被市场所淘汰,稳步向前发展。

三是行业监管和市场竞争给优质服务提出新的挑战。电力改革催生市场主体多元化竞争,不断推动供电服务从“监管+自律”向“监管+竞争”转变,服务风险和舆情预控难度加大。

四是客户提出了更多的服务需求及更高的服务质量。一方面随着市场化经济的不断深入,企业不仅要为用户提供优质的产品,还需要提供越来越优质的服务。另一方面,经济时代逐步向知识经济社会进行过渡,用户对电力企业提供的产品和服务都提出了更高的要求,客户满意度将成为供电企业发展的重要因素,成为供电企业效益的根本源泉。

同时,数据背后隐藏着面对客户越来越个性化、多元化的消费需求,对电力企业的服务内容、服务方式、服务质量、经营管理都提出了更严峻的挑战。

四、大数据的关键技术

电力行业营销系统包含结构化数据,如客户资料、设备记录等,非结构化数据如合同、身份证和其他扫描图片等格式的文件。大数据技术需要加强对电力行业营销类数据存储和分析能力,同时数据挖掘和模式识别技术在客户用电行为分析的应用可以有效支持需求响应。

在电力大数据时代下,大数据已成为电力企业进行决策的基础。只有运用现代化的技术手段,对海量数据进行深度的加工和处理,发现并利用其中蕴含的重要的信息,为电力企业决策者提供数据支撑,才能真正发挥电力大数据的重要作用。

大数据技术分为四层:数据存储层、数据集成层、数据计算层和数据应用层,每一层包含不同的关键技术,其中数据应用层数据挖掘技术需要进行提高及深入应用。数据挖掘是指通过算法发现隐藏于海量数据中信息的过程。数据挖掘需要通过统计、在线分析和处理、机器学习、专家系统(依靠过去的?验法则)、情报检索和模式识别等多种方法来实现目标。

数据挖掘过程的总体目标就是从一组数据中提取信息并将其转换成一个可以理解的结构进行进一步的使用,除了初步的分析,它还包括数据库和数据管理,数据预处理、建模和推理,结构的后期处理,可视化,和在线更新等方面。

数据挖掘使用过去的信息数据来分析一个特定的问题或可能出现的情况的结果。数据挖掘工作分析所有存储在数据仓库中的数据,这个数据可能来自所有的业务,从生产到管理,管理者还可以使用数据挖掘来决定他们产品营销策略,和竞争对手比较。

五、构建统一的数据平台

电力行业每一个业务部门数据相互之间不能相互共享及融合,有些数据形成了信息孤岛,也有些数据存在于多个系统中,且录入、修改的途径有多种,采用不同的采集方式采集相同的数据,得到的结果在一定程度上存在着一些偏差,数据具有广泛的异构。因此需要整合各专业、各平台之间各个环节数据,对数据进行提炼、分析及挖掘,实现跨部门、跨业务、跨平台间数据的共享。如:涉及多专业的电力资产全寿命周期管理、营销、生产等都需要融合不同的来源数据,从而形成以数据为中心的企业信息化管理系统,构建统一的数据管理平台,促进数据资源共享,发挥数据的价值。

基于开展电力营销服务的优势与机遇以及大数据关键技术的研究,提出了利用大数据技术构建营销服务技术支撑平台,依托营销基础数据服务平台、营销业务管理平台建设,整合市场发展、经营活动、客户服务、资产运行等数据信息,研究其多维度分析主题、动态分析评价指标体系,数据的动态采集、合理存储、自动化处理方法,科学分析模型,建立覆盖政策、市场、营业等的营销服务技术支撑平台。平台核心应用应该包括数据采集服务、数据查询服务、数据搜索服务、分布式离线计算服务、分布式实时计算服务、数据挖掘服务、分布式协调服务、分布式队列监控、分布式数据库服务、分布式文档存储服务、数据订阅服务、开发式监控服务及集群管理等核心应用子系统。

六、创新营销服务模式

电力营销要始终把握好“以客户为中心,以市场为向导”的原则,重点做好以下工作:加快转变营销发展方式和服务模式。高度重视市场变化,积极主动,在参与竞争中掌握先机;高度关注客户需求和变化,快速响应,在优质服务中扩大客户群体,切实加强新形势下营销服务体系的建设。

(一)实现电力需求的预测

依托电力大数据技术,整合电力营销各业务系统数据,获取海量的用户数据信息,建立客户的数据关联机制,结合国家政策、经济发展水平、地理环境等因素,对其进行分类、分区域、分行业的数据分析,深入了解不同群体的用电规律和用电行为,实现用户对电力需求的预测,并实现对电力的合理调度以及电力需求的合理管控。

(二)为客户提供差异服务

通过数据分析获得用户的电力消费水平,实现了对用电客户的细分,制定出针对不同客户的行之有效的电力营销策略和服务方案;以客户细分数据为基础,为重要用户提供优质服务,并根据各类客户的特性提供有针对性的、差异化服务。针对重要用户,要主动上门走访,提供技术支撑,并在业务流程、服务机制及服务价格等方面提供高品质的产品和服务,从而满足其对电力企业服务的高需求和高期望。一方面建立业务办理专用“绿色通道”,成立服务工作组,配备专职服务人员为其提供主动式上门服务,另一方面,为这些大客户提供自主式供电时间,提前告知内部消息等服务。同时,供电企业要定期组织开展专业技术及安全知识培训,免费对其各类用电设备进行现场检查,不断提升客户的粘连度、忠诚度和满意度。

(三)降低企业经营风险

根据用户电量电费及缴费习惯等数据进行监测,通过对客户评估与客户行为追踪,预选出一些拒缴、拖欠电费的客户,创建用电客户的信用等级,提高电款回收效率,实现风险的合理规避,有效防止客户风险转嫁,将企业经营风险降为最低;同时需要结合移动互联网技术,深度整合渠道,充分发挥营业厅、95598网站、网上营业厅、掌上电力APP、电e宝、微信等渠道,为用户提供多渠道缴费模式,提高电费回收率,确保经营成果颗粒归仓。

(四)用户服务需求分析

在互联网时代,供电企业的优势更多反映在对用户需求的掌控和生态系统引领上,针对不同类型的用电客户进行创新服务,通过电力企业大数据平台,汇总分析客户需求以及客户投诉等信息,掌握客户关心的中心、投诉集中反映的问题、投诉用户的构成及分布、问题解决效率和追踪,总结、提炼、分析用电客户的聚焦问题。通过建立客户需求导向模型,对用户的需求进行可行性分析,提供一对一的服务,从而提高服务质效;对于用户投诉的共性问题,开展深入的诊断分析,提出有效整改方法,并定时开展供电服务明察暗访及电话回访,收集用户的满意度信息。

(五)建立客户质量评价体系

借助大数据平台,深入分析用户的电费缴费习惯、违约窃电情况以及社会上各行各业的信用评价等信息,建立客户质量评价模型,通过分析和筛选形成优质客户清单,并对其推送个性化信息,提供特殊化服务;同时,对客户信用进行评估,建立用户信用等级,根据其信用等级确定其电费缴纳方式,形成电力企业内部黑名单用户清单,加强此类用户风险防控,提升企业风险控制能力。

(六)支撑营销管理决策

以营销服务技术支撑平台为基础,依托营销基础数据服务平台、营销业务管理平台建设,整合市场发展、经营活动、客户服务、资产运行等数据信息,深度挖掘各类信息数据中的潜在关系,为各类管理和决策者提供多维度、多方位的分析预测性数据,提升工作效率,为企业发展指明正确的方向。

七、总结语

6.基于数据挖掘技术的客户关系管理 篇六

千 学号:10071048 摘 要:获取公交客流信息是公交管理工作的基础,它不仅为日常调度提供依据,也为线网优化提供了参考。公交规划部门和公交经营者必须能够深入了解城市居 民的公交出行特征,及时、准确、全面地掌握公交出行数据,才能做出科学的公 交规划和运营决策。公交数据采集和分析技术正是为公交运营决策提供及时、准 确、可靠的公交运营信息和客流信息的重要方法。因此,一种快速高效的公交数 据采集分析方法,对建立高效合理的城市公交系统具有决定作用,对确立城市公 交的主体地位具有重要意义。公交IC卡数据挖掘技术正是这样一种快速高效的数据采集分析方法,如何处理分析挖掘这些海量公交lC卡数据以获取公交客流信息正是此文研究的目的。

关键词:公交IC卡;聚类分析;数据挖掘;客流

道路交通系统是一个有人参与的、时变的、复杂的非线性大系统,其显著特点之一就是具有高度的不确定性。城市公交系统能否正常和高效地运营,不仅取决于道路和车辆等设施条件,更有赖于运营管理手段和技术手段的先进性。对公交客流的全面、准确把握是公交管理工作的基础,它不仅为日常调度提供依据,也为线网优化提供了参考。公交规划部门和公交经营者必须能够深入了解城市居民的公交出行特征,及时、准确、全面地掌握公交出行数据,才能做出科学的公交规划和运营决策。

公交数据采集和分析技术正是为公交运营决策提供及时、准确、可靠的公交运营信息和客流信息的重要方法。快速高效的公交数据采集分析技术,对建立高效合理的城市公交系统具有决定作用,对确立城市公交的主体地位具有重要意义。

公交IC卡、乘客自动计数系统(APC)等先进技术的应用可以取代传统的调查方法,获取相对实时动态的客流信息。公交IC卡在国内许多城市都有应用,不仅方便了广大乘客,也提供了一种新的客流调查统计手段。IC卡信息量大且全面,技术简单成熟,但目前其作用未得到充分开发。如何充分挖掘IC卡信息,利用IC卡收集的有效数据,为日常调度管理及线网优化服务,成为目前一个比较热门的研究领域。数据挖掘的目标

数据挖掘的目标是从已知的数据中发现隐含的、有意义的知识。通过对公交 IC卡数据分析,可获得城市居民公交出行特征信息以及公交客流量信息,为公交规划及公交运营管理者提供决策支持。

本文拟通过对公交IC卡数据进行挖掘,从而获取有价值的公交出行信息。具体工作包括:

(1)线路站点上下车人数统计;(2)客流量统计分析;(3)线路客流量预测。站点上下车人数统计

全国大多数的城市公交采用全线一票制,下车不需要刷卡,因此刷卡数据没有关于下车站点的记录,不能用判断上车站点的方法,通过刷卡时间判断下车站点。但是由于公交定线定站的运营特征,以及城市居民的出行特点,决定了公交出行在路线的选择和客流的分布上具有一定的规律性和稳定性。

公交乘客每日出行具有偶然性,有时不以通常的线路或交通方式出行,下车站点可采用短期规律和长期归纳相结合的方法。城市居民一日的出行通常具有回归性,即从居住地出发、到居住地结束,使得公交出行站点具有对称特征。以上班出行为例:某人由居住地刷卡乘车到达工作地,完成第一次出行,此时只知道上车站点而不知道下车站点。乘客下班开始第二次出行,由工作地刷卡上车,此次出行的起点站一般可认为是第一次出行的终点。利用多日的数据可帮助判断乘客的出行终点。因此,对每个乘客刷卡数据进行逐个分析,通过上车站点与下车站点的空间关系就能确定下车站点。

2.1 上车站点判断

聚类分析就是将待分析数据根据一定的分类规则,合理地划分数据集合,确定每个数据所在类别。

这里采用聚类分析,是对公交IC卡数据信息中某公交车某一趟运营刷卡记录的分析,由此来确定乘客的上车站点。基本思路是:把每个刷卡记录看作一个样品,刷卡时间作为样品的属性,车辆在某一站最后一个上车刷卡乘客的时间与其下一个站第一个上车刷卡乘客的时间间隔作为类与类之间的距离T,将连续两个刷卡时间间隔小于T的记录归为一类,即归为在同一个站点上车,设线路站点数为N,则把整个记录分成N类。按照时间序列,对这N类进行排序,通过一一对应的关系对应到线路运营站点表,从而得到乘客的上车站点。

利用聚类分析确定上车站点的过程中,T值的选择是关键,过大与过小都会导致上车站点判断错误。如果T取值过大,当公交车在两个站之间运行时间小于这个值时,则会错误判断为这两个站点的刷卡记录属于同一类,即在同一站点上 车。如果T取值过小,当同一个站点上车乘客较多、刷卡时间间隔较长时,则可能出现将同一个站点的刷卡记录错误判断为属于不同的类,即认为在不同站点上车。通常根据公交车平均行驶速度与站点间距推算T。

2.2 基于单张卡的下车站点推算

对大部分的公交出行者而言,其上车站点和下车站点总是相互转换的,即回程时的上车站点就是出发时的下车站点,而出发时的上车站点又是回程时的下车站点。以公交乘客完成一次出行目的作为一次出行,一次出行的第一次刷卡站点作为出行起点,最后下车站点作为出行终点,之间的刷卡站点作为换乘站点。

判断出乘客的换乘站点和出行终点就可以了解某乘客的出行路径。判断乘客的换乘站点和下车站点采用短期规律和长期归纳相结合的方法。公交乘客每日出行具有偶然性,有时不以通常的线路或交通方式出行,此时上面的方法就遇到了困难。公交IC卡信息记录的是乘客很多天的出行数据,一段时间来说乘客的出行路径是基本不变的。利用多日的数据可帮助判断乘客的出行终点。

因此,对同一张IC卡号而言,在连续的两次刷卡记录中,后一次刷卡记录中的上车地点是上一次出行的下车地点,可以通过以下步骤获得下车站点和下车时间:

(1)首先,从IC卡数据库中找出目标卡号在下一次出现时的汽车编号和刷卡时间,通过上车站点的推算方法可以获得此时刷卡的站点。

(2)然后,根据汽车编号、上一步所求的站点及上一次刷卡时间,可以得到在该次车辆运行班次行程内车辆到达站点的时间,此时间即为该乘客上一次出行的下车时间。客流量统计分析

对公交IC卡进行挖掘,能得到用于公交规划的重要指标包括:线路全天客流量、线路高峰小时客流量、线路全天和高峰小时直达乘客客流量、线路全天和高峰小时直达乘客出行矩阵等。

3.1 线路全天客流量

线路全天客流量反映了线路的经济效益情况,也是预测规划年线路客流量必需的基础资料。

3.2 高峰小时客流量

公共交通定位于服务城市居民日常出行,根据居民出行特征分析,得知公交出行存在早晚两个高峰(其中又以早高峰更为显著),并且大部分线路高峰与平峰的客流量差别较大。满足短时间内运送大量乘客到达目的地的居民出行需求,对公交提出了较高的要求。另外,规划年高峰时段的客流量和服务水平决定了线 路的配车数,因此高峰小时客流量是一个必须得到的基础性指标。

高峰时段客流量的计算:首先是利用全日客流量数据确定调查线路的高峰小时。不同线路的高峰小时不太一致,主要是由于城市规模大,区域差别大的原因,比如郊线和市区线路的高峰小时到来和结束的时刻就不一致。具体步骤为:先将调查线路全部车辆的全日刷卡记录存储到一个选择集A中,对记录分组。分组原则为:从清晨线路第一辆车的发车时刻开始,每隔15分钟分成一组,统计各组记录条数,得到各组的持卡客流量n1,n2,,ni。要确定高峰小时,须对小组重新合并。合并原则为:从第四组开始对其上面四组合并,每四小组合并为一大组,统计各大组的记录条数N1,N2,N3,,Ni3。其中

N1n1n2n3n4 N2n2n3n4n5 N3n3n4n5n6



Ni3ni3ni2ni1ni

然后,找出最大值Nmax(Nt)(t1,2,,i3),所对应的时间段,即为高峰小时。

3.3 路段不均匀系数

路段不均匀系数表示统计时间内某一路段的客流量占线路总流量的比例。路段不均匀系数=第i路段客流量/全线单向平均客流量。

可以通过计算路段客流不均匀系数确定区间车开设的必要性。路段客流不均匀系数大于1,就可以视为高峰路段,若路段客流不均匀系数在1.2~1.4,属于正常调节范围,不一定开设区间车;若大于临界值1.4时,就有开设区间车的必要。

3.4 方向不均匀系数

方向不均匀性指一条公交线路同一时段内上行和下行方向客流的不均衡性,方向不均匀系数体现公交线路上下行两个方向客流量差别。在已知上、下行方向的客流量情况下,可以通过计算各时段的高单向客流量与平均单向客流量之比,求得客流的方向不均匀系数Ka。

在现有条件下,线路客流的确定比路段简单易行,且数据较为精确。将数据库中单条线路某日的IC卡记录表与该线路当日的行车调度表以车辆号相关联,即可判断上、下行方向的客流量,进而计算得方向不均匀系数Ka。

3.5 日变动系数

日变动系数i表示一个月中星期序号i相同日期的日客流量平均值与月平均日客流量之比。

1nikiQnk11dj,i1,2,j7;1,2,12Qj

(3-1)

式式中:i为星期序号,周一到周日分别为从1到7;n为当月所含星期序号i的个数;Qj为第j月份的客流量;dj为第j月份的天数。

3.6 月波动系数

定义月波动系数j来描述一年12个月之间的公交客流量差异,j表示月平均日客流量与该年平均日客流量之比。

1dj1dyQj12j,j1,2,,12i

Qj1

(3-2)式中:Qi为一年中各月份的客流量;dy为一年的日历天数,365或366天;Qj,与dj的含义与前式相同。基于BP神经网络的线路客流量预测

准确地做出公交线路客流的预测是实现公交运营调度优化的基础。在提前掌握客流变化规律的情况下,才能做到科学地制定运营计划,合理地调配使用人、车资源。但在实际的运营调度管理中,因为缺乏定量实用的分析预测手段,大多依靠经验和直觉来判断客流的变化,预测的结果同实际往往有着较大的偏差。产生偏差的原因是公交线路客流变化的复杂性和随机性。除去复杂性和随机性,公交线路客流变化的另一重要特性是周期性。常规公交线路客流一般呈7天一个周期循环变化。抓住客流周期性变化的特点,结合神经网络适合描述复杂随机事物变化规律的特点,有人提出了一种基于BP神经网络理论的公交线路客流预测模型,应用该模型可以较为准确地预测的线路客流变化,同时间序列模型相比,该模型具有较强的自适应性,预测的精度较高,是一种能较好满足运营调度管理需要的线路客流预测模型。结束语

城市公交IC卡记录的是城市居民乘车的刷卡信息,包括刷卡时刻、乘车线路等,而进行城市公共交通优化所需要的乘客平均出行次数、起讫点分布、出行 时间、换乘次数、出行距离等信息,与IC卡记录的原始信息有很大差别。

本文所介绍了基于公交IC卡数据挖掘有价值信息的技术,通过该技术可以得到了公交线路站点上下车人数,客流量,还可以预测线路客流量。文献[2]还对公交IC卡在公交调度中的应用进行了探讨,利用IC卡中数据,进行准确的客流预测,确定发车间隔,得到可以较为合理的行车调度方案。文献[4]通过对公交IC卡数据库中大量数据的筛选和处理,分析了不同公交乘客群体的性别、年龄构成,绘制了工作日、双休日及节假日公交客流的时间分布曲线,得到了客流高峰时段的居民公交出行特性。

利用公交IC卡信息进行数据挖掘,具有数据量大,易处理和实时性好等优势,可节省大量的客流调查和数据处理成本。其缺点是多数IC卡系统尚不能提供站点信息和乘客下车信息。应完善公交IC卡数据库结构,建立公交数据仓库,集成包括轨道交通方式的城市公交线网及站点等基础信息、公交IC卡信息、公交企业运营管理信息、城市GIS信息及公交车辆GPS信息等,实现相关信息的融合,对IC卡信息进行有效的综合利用。

参考文献:

7.基于数据挖掘技术的客户关系管理 篇七

客户数据的收集与存储是实施客户关系管理的根基。随着办公自动化的推广,数据库和网络技术的应用,各企业拥有的客户信息越来越多,增长迅速。在这海量的、异构的信息资源中,蕴含着具有巨大潜在价值的信息资源,比如客户的基本资料、产品交易信息及客户反馈信息等[1]。企业要想不陷入信息的沼泽中,必须拥有强有力的数据分析工具,用以实现客户关系管理的目标。而数据仓库和数据挖掘技术的发展可以很好地解决这个问题。

1 数据仓库与数据挖掘技术

1.1 数据仓库

数据仓库是一个在企业管理和决策中面向主题的(Subject-Oriented)、集成的(Integrated)、反映历史变化的(Time Variant)、相对稳定(Non-Volatile)的数据集合[2]。

数据仓库要求数据量大,数据正确全面,所以数据在进入数据仓库前必须经过提取、转换与集成,把数据按主题分类,形成多维数据模型。它以多维数据模型为基础,实现数据的分析处理,主要用于支持管理决策。数据进入数据仓库后,一般会被长期保存,基本不会进行修改和删除操作,主要实现数据的查询。

数据仓库与传统关系型数据库不同,主要区别在于数据仓库打破了关系数据库中数据的规范性,实现了数据的重组,增加了数据冗余度;其次传统关系型数据库为了实现数据处理的及时性,要求数据尽量少,而数据仓库为了更有效的实现数据查询,要求存储的数据尽量多,实现海量存储。

1.2 数据挖掘技术

数据挖掘技术,是近几年国内外迅速发展起来的一门交叉学科,涉及到数据库、统计学、人工智能与机器学习等多个领域,并在金融、商业零售、电信以及生物医学和基因分析等领域得到广泛应用。

1.2.1 数据挖掘的概念

数据挖掘(Data Ming),是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识一般可表示为概念(Conce Pts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式[3]。

数据挖掘是知识发现的过程,是将未加工的数据转换为有用信息的整个过程。该过程包含一系列的步骤:确定业务对象、数据准备、数据挖掘、模式评估和知识表示[4]。

1.2.2 数据挖掘的技术与方法

数据挖掘方法是以数据库为对象,基于机器学习、科学计算、统计分析等技术,形成了数据挖掘方法和技术。一般,数据挖掘常用的技术与方法可以分为以下几个方面:

1)决策树方法

决策树方法是利用信息论的原理建立决策树,主要用于分类和预测。决策树是一种简单的知识表示方法,它将事例逐步分类成代表不同的类别。由于分类规则比较直观,易于理解,实用效果好,影响较大,因而得到广泛应用。决策树最早的算法是Quinlan提出的ID3算法,最流行的是其改进版的C4.5算法。

2)聚类方法

聚类分析是直接分析样本,按照各样本数据间的距离远近将样本数据分成若干个不同的类。一般,同一类中的对象相似度很高,不同类中的对象相似度很差。聚类分析属于无监督的分类方法。

3)统计分析方法

统计分析方法是通过统计学中的技术方法实现数据库的数据分析,发现数据间的关系和规律。常用的方法有:回归分析、相关分析、主成分分析等。

4)关联规则

关联规则通过对给定数据集中的数据进行关联分析,描述一个事物中某些属性频繁同时出现的条件,发现隐藏在其中的有趣的联系或规律。一旦建立起数据项间的关联规则,则其中某一项的属性值就可以依据其他属性值进行预测。

5)可视化技术

可视化数据分析技术在传统图表功能基础上进行了拓展,为用户提供交互式的数据浏览,帮助用户更清楚地剖析数据。当所要识别的不规则事物是一系列图形而不是数字表格时,人的识别速度是最快的。

2 数据仓库与数据挖掘技术在客户关系管理中的应用

2.1 客户关系管理

客户关系管理(CRM)关注的是企业与客户之间实时、方便的信息交互,通过与客户多渠道的接触、交流和沟通,实现从“接触管理”到“客户关怀”的角色转变,企业的经营中心也从产品或市场转变为客户。客户关系管理最核心的任务是对企业运营过程中所得到的各种数据进行分析,进而为企业经营决策提供支持和依据。

从功能上来看,CRM系统可分为三种类型[5]:

1)操作型CRM

操作型CRM也称为流程型CRM,主要用于客户信息的自动集成过程,实现企业各部门对客户信息的协同合作。

2)分析型CRM

分析型CRM用于分析操作型CRM中产生的各种数据,使用数据仓库和数据挖掘技术产生商务智能,为企业决策提供支持。

3)合作型CRM

合作型CRM用于企业与客户的合作服务系统,包括电话、呼叫系统、电子邮件等,它能实现客户信息的全面收集。

2.2 数据仓库的形成

数据仓库是CRM的中央存储系统。在这个信息爆炸的时代,各个企业经过长期经营,收集了大量的客户数据。而这些海量、异构的数据被分散在不同部门,没有得到充分合理的利用。因此,首先要做的是对这些海量分散的数据进行清洗、集成和转换,建立一个整合的、标准化、结构化的数据模型,形成全面、一致和面向决策的数据,即数据仓库。对已形成的数据仓库,按照不同的主题,产生多个对应的数据处理模块,如普通客户数据模块,Vip客户数据模块,团体客户数据模块等,这种多数据模块的建设有利于分析不同客户的行为特点。

2.3 数据挖掘技术的应用

使用数据挖掘技术对企业客户信息进行分析,从而挖掘出对企业发展有价值的信息,如:新客户开发、交叉销售及预测、客户信用分析、客户细分、客户类别分析等客户关系管理功能,为企业决策者提供更有效的的决策支持,最大程度地发挥企业CRM的作用。

近年来,随着市场竞争的加剧,企业要想获得一个新客户,所花费的开销往往是争取留住老客户的几倍。有统计数据表明:

1)公司一般每年平均流失10%的老客户;

2)企业留住5%的老客户,利润提升100%;

3)开发新客户的成本是留住老客户成本的5-8倍;

4)一个公司如果将其客户流失率降低5%,其利润就可能增加25-85%。

因此保持老客户就显得更有价值。那么,如何才能预防、减少客户的流失呢?一个非常重要的工作就是要找出顾客流失的原因。我们可以通过数据挖掘技术实现这一目标。

现以电信公司判断用户离网的可能性来做分析,首先进行数据准备,抽取一定量的用户信息,提取的信息主要包括:用户号码、用户类型、用户状态、话费性质(长话/市话)、欠费情况、投诉次数等,利用这些数据,我们来建立判断用户离网可能性的模型。

在数据准备和适当的预处理之后,我们采用决策树中的C4.5算法建立决策树模型。这里,我们引入了信息论中的信息增益率的概念并以此作为属性选择的标准,其核心是在决策树的各级节点上选择属性时用信息增益率作为属性选择标准。通过计算这些属性的信息增益率,找出“投诉次数”属性作为决策树的根节点。扩展决策树节点,进行分枝,其他中间节点也是选择各节点检测属性增益最大的属性,同级的预选属性的增益相同时,规定选择属性值个数较少的属性作为当前节点的分枝,最后,我们可以生成一棵决策树。

生成的决策树还需要进行进一步验证,才能最终得到可用的分类模型。选择一些具有共同特征的已离网用户作为测试数据,输入属性值进行离网判断,检验模型的正确性,生成最终的决策树模型。

使用生成的决策树模型,对比用户的信息是否贴近离网用户的特征属性值,能大致预测出该用户的离网可能性,对离网可能性高的用户,根据其特征属性进行挽留工作,从而预防、减少客户的流失。

3 结束语

在当前的技术形式下,将数据仓库和数据挖掘技术有效运用在CRM中,对企业收集的大量客户数据信息进行分析,挖掘出对企业发展有价值的客户信息,从而更有效地提升企业的竞争能力,树立企业的品牌形象,帮助企业实现有效的市场营销和客户服务,达到成功挽留客户的目的。相信未来会有更多的行业加入使用客户关系管理的行列中,通过数据仓库和数据挖掘技术挖掘出对自身发展有用的信息,也必使的目标得到更好的实现。

参考文献

[1]白雪.数据挖掘技术在客户关系管理中的应用研究[J].大众科技,2012(2).

[2]Han Jianwei,Micheline Kamber.Data Mining Concepts and Techniques[M].Morgan Kanfmann Publishing,2000.

[3]陈安.数据挖掘技术及应用[M].北京:科学出版社,2006.

[4]董宁.数据挖掘技术在CRM中的应用[J].计算机工程与设计,2007(6).

8.基于数据挖掘技术的客户关系管理 篇八

随着信息技术的不断发展,人们利用信息技术处理数据的能力大幅度提高,越来越多的数据库被应用于商业管理、生产控制和工程设计等各种领域。但是,面对不断增加的各种复杂数据,已存在的数据库的查询功能已经不能满足人们的需要,能不能从数据中提取人们所需要的信息和知识是大家越来越关注的问题。传统的统计技术已面临极大的挑战,集统计学、数据库、知识发现等技术于一身的数据挖掘技术应运而生。近几年来,数据挖掘技术在零售业、直效行销界、制造业、财务金融保险、通讯业以及医疗服务等领域应用广泛。

一、数据挖掘的基本概念

(一)“啤酒尿布”的典型案例

在了解数据挖掘的概念之前,我们先来看一个“啤酒尿布”的故事。故事的主角是沃尔玛这个世界上最大的零售商,在其遍布美国数千家超级市场中,小孩尿布与啤酒居然并排摆放在邻近的货价上一起销售,而且两者销量都还不错。原来沃尔玛通过建立的数据仓库,分析了原始交易数据,按周期统计产品的销售信息,然后利用数据挖掘工具进行分析和挖掘,结果发现,每逢周末沃尔玛连锁超市啤酒和尿布的销量很大。进一步调查表明,在美国有孩子的家庭中,太太经常嘱咐她们的丈夫下班后要为孩子买尿布,而丈夫们在买完尿布后又顺手带回了自己爱喝的啤酒,因此啤酒和尿布一起购买的机会是最多的。之后该店打破常规,将啤酒和尿布的货架放在了一起,使得啤酒和尿布的销量进一步增长。啤酒和尿布这两者看似毫无关联,但在特定的条件下,它们之间却有密切的关系,这就是数据挖掘技术。

(二)数据挖掘的概念

数据挖掘(Data Mining)就是从海量的原始数据中,找出隐含在其中的、我们事先不知道的、但又是潜在的有意义的知识和信息,从而利用这些知识来指导我们的活动。从统计学的角度,数据挖掘可以看成是通过计算机对大量的复杂数据的自动探索性分析。随着信息技术的高速发展,人们积累的数据量急剧增长。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。

二、零售业应用数据挖掘的背景

零售业客户关系管理(Customer Relationship Management,CRM)是一种以客户为中心的市场营销理念和策略。 CRM的目标是缩减销售周期和销售成本、增加收入、寻找扩展业务所需的新市场和渠道以及提高客户的价格、满意度、盈利性和忠诚度。

零售业客户关系管理主要通过条形码、销售管理系统、客户资料管理系统等各种途径获得关于商品信息、客户信息、供应商信息及店铺信息等大量的数据信息,如何利用这些海量数据信息分析出哪些商品好卖、哪些商品不好卖、哪些客户适宜哪些商品、商品之间如何搭配,是令零售商头疼的问题。利用数据挖掘工具对这些数据进行分析,可以帮助零售商进行科学的决策,分析哪些商品顾客最有希望一起购买,从而将这些商品摆放在一起;分析商品的销售趋势,从而给零售商提供进货建议;分析购买商品的人员信息,从而帮助零售商选择店铺的所在

地点等。

三、数据挖掘技术的常用算法

数据挖掘是零售业CRM中的核心技术,通过分析顾客已购买商品及这些商品之间的内在联系,确定顾客的购买习惯和关联购买倾向,从而帮助零售商制定营销策略。为了实现在零售业CRM中的应用,数据挖掘技术中主要涉及以下常用算法:

(一)聚类分析算法

聚类分析算法是根据事物的特征对其进行聚类或分类,即所谓物以类聚,以期从中发现规律和典型模式。在零售业中,聚类分析可以帮助市场分析人员从消费者数据库中区分出不同的消费群体来,并且概括出每一类消费者的消费模式或者说习惯。

(二)决策树算法

决策树算法就是利用训练集生成一个测试函数,根据不同取值建立树的分支;在每个分支子集中重复建立下层结点和分支,这样便生成一棵决策树。然后对决策树进行剪枝处理,最后把决策树转化为规则。决策树算法常用于预测模型,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它分类速度快,特别适合大规模的数据分类处理。

(三)神经网络算法

神经网络算法能够模拟人的神经元功能,经过输入层、隐藏层、输出层等,对数据进行调整、计算,最后得到结果。神经网络算法的优点是它能精确地对复杂问题进行预测。它本身具有良好的鲁棒性、自适应性和高度容错性。

(四)关联规则挖掘算法

关联规则挖掘是用于发现数据库中属性之间的相关联系的一种算法。关联规则发现任务的本质是在数据库中发现强关联规则,利用这些关联规则了解客户的行为,其最典型的例子就是购物篮分析。

四、数据挖掘技术在零售业CRM中的应用

随着日益增长的Web或电子商务方式的兴起,零售业CRM是数据挖掘的主要应用领域。数据挖掘技术可有助于识别客户购买行为,发现客户购买模式和趋势,改进服务质量,取得更好的客户保持力和满意度,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。数据挖掘技术在零售业CRM中的应用主要体现在以下几个方面:

(一)使用多特征数据立方体进行销售、客户、产品、时间和地区的多维分析

多维数据分析是指通过多维的方式对数据进行分析、查询和报表。维是人们观察数据的特定角度。例如,企业在考虑产品的销售情况时,通常从客户、产品、时间和地区等不同角度来深入观察产品的销售情况。这里的客户、产品、时间和地区就是维。根据这些维的不同组合和所考察的度量指标从客户基本库中发现不同的客户群,以便决策者根据主客户群的特征作相应的定货、销售、服务等决策。

(二)利用关联分析挖掘关联信息进行购买推荐和商品参照

关联分析就是利用关联规则进行数据挖掘技术,其目的在于挖掘隐藏在数据间的相互关系,发现数据库中形如“90%的顾客在一次购买活动中购买A商品的同时也会购买B商品”之类的知识。通过从销售记录中挖掘关联信息,可以发现买某一品牌商品的顾客很可能购买其他一些商品。这类信息可用于形成一定的购买推荐。商家通过宣传可改进服务,帮助顾客选择商品,增加销售额和减少库存积压。

(三)使用多维分析和关联分析进行促销活动的有效性分析

利用多维分析和关联分析对数据库的数据仔细研究,以分析顾客的购买习惯、广告成功率和其他战略性信息。利用数据库通过检索数据库中近年来的销售数据,用多维关联分析方法,通过比较促销期间的销售量和交易数量与促销活动前后的有关情况,可预测出季节性和月销售量,对商品品种和库存的趋势进行分析还可确定降价商品,并对数量和运作做出决策。此外,用关联分析可以找出哪些商品可以用于促销活动,便于安排商品货源,提高销售额。

(四)序列模式挖掘可用于客户忠诚分析

序列模式分析和关联分析相似,但侧重点在于分析数据间的前后序列关系。序列模式挖掘可用于分析顾客的消费或忠诚的变化,据此对价格和商品的品种加以调整,以留住老顾客,吸引新客户,保证一定的顾客数量。商家可以从原客户后来却转成竞争对手的客户群中,分析其特征,再根据分析结果到现有客户数据中找出可能转向的客户,然后设计一些方法预防客户流失;也可以根据客户的消费行为与交易纪录对客户忠诚度进行排序,根据流失率的等级进而配合不同的策略。

(五)利用交叉销售模式向老客户销售新的产品或服务

零售业和客户之间的关系是持续不断的、发展的,交叉销售是指向老客户销售新的产品或服务的过程。交叉销售是建立在买卖双方互利原则的基础之上,客户因得到更多更好符合他们需求的服务而获益,企业也因销售增长而获益。交叉销售的优势在于,商家可以比较容易得到老客户较为丰富的信息。企业所掌握的客户信息特别是以前购买行为的信息中,可能正包含着决定这个客户下一个购买行为的关键信息。这个时候数据挖掘的作用就体现为它可以帮助企业寻找到那些影响顾客购买行为的信息和因素。

9.基于数据挖掘技术的客户关系管理 篇九

论文摘要:随着社会主义现代化的发展,计算机技术的进步,信息技术在社会发展的各个领域都扮演着极其重要的角色。信息化建设更是被我国列为经济社会发展的首要内容。网页档案化管理包括文档、文字翻译转换、图片资料、声像资料、多媒体远程会议等。尤其是大学档案馆更侧重教学与科研,网页档案化管理是必然的趋势。

在信息化发展的今天,图书馆,特别是大学图书馆不仅要对信息进行简单的数字转换和管理,更要对新兴事物网络进行档案化管理和归档,包括文档、文字翻译转换、图片资料、声像资料、多媒体远程会议等。所以网络档案化管理,成为当今图书管理的必然趋势,这就必须对档案化管理的技术和法律相关问题进行深入阐述和探讨。

所谓数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是涉及数据库、人工智能、数理统计、机械学、人工神经网络、可视化、并行计算等的交叉学科,是目前国际上数据库和决策支持领域的最前沿的研究方向之一。

一、数据挖掘的功能

数据挖掘通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,按其功能可分为以下几类。

1、关联分析

关联分析能寻找到数据库中大量数据的相关联系,常用的一种技术为关联规则和序列模式。关联规则是发现一个事物与其他事物间的相互关联性或相互依赖性。

2、聚类

输入的数据并无任何类型标记,聚类就是按一定的规则将数据划分为合理的集合,即将对象分组为多个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而在不同簇中的对象差别很大。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。

3、自动预测趋势和行为

数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。

4、概念描述

对于数据库中庞杂的数据,人们期望以简洁的描述形式来描述汇集的数据集。概念描述就是对某类对象的内涵进行描述并概括出这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

5、偏差检测

数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。这常用于金融银行业中检测欺诈行为,或市场分析中分析特殊消费者的消费习惯。

二、数据挖掘在建设现代化高校档案馆中的应用

1、资源类数据包括馆藏档案经过数字化加工而产生的各类电子档案、电子文件中心中存储的各类电子档案、档案软件收集的信息、档案信息网建设和维护信息。我们从研究大学档案用户的信息需求出发,数据挖掘为大学档案馆全面掌握和准确理解档案用户的信息需求提供了方法。

(1) 利用Web访问信息挖掘技术发现其中的关联模式、序列模式和Web访问趋势等,构建多维视图的用户兴趣模型。从而可以确定档案信息或服务受欢迎的程度,发现用户访问模式和用户需求的趋势,从不同侧面来研究用户的信息需求,为优化档案馆的档案信息资源建设提供了科学依据。

(2) 收集大学档案网web服务器保留的用户注册信息、访问记录,以及有关用户与系统交互的信息等原始数据,经过清洗、浓缩和转换形成便于统计分析的用户查阅数据库、日志数据库、用户定制信息库、用户反馈信息等各种数据集合。

2、从建设大学档案馆馆藏信息资源出发,数据挖掘为大学档案馆提供了选择一条科学发展道路的重要依据。

(1) 利用档案网和档案管理软件访问信息的挖掘分析出档案资源的利用率,将利用率高、需求量大的传统载体档案优先数字化。例如:通过对档案信息的访问记录、检索请求中用户请求失败的数据进行分析,按类统计档案拒用集和频繁利用集,结合聚集算法发现馆藏资源的缺漏,有针对性地补充和丰富档案信息资源。

(2) 在大学档案馆藏管理过程中利用文本挖掘,运用关联、分类、聚类等方法,从海量档案信息中按照相关专题进行挖掘、分类、加工、整理和有序化重组,构建特色档案信息库及各类专题档案信息库等。

3、从做好大学档案馆信息管理工作的角度出发,数据挖掘为优化馆藏信息和对未来工作的预测发挥重要作用。

(1) 在提供利用环节中,对用户每次借阅的信息进行关联分析,发现各类档案信息之间的关联规则或比例关系,这样可以进一步优化馆藏信息。

(2) 开展大学档案馆馆藏信息文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价工作,实现对大量文档集合的内容进行总结、分类、聚类、关联分析、分布分析,通过归纳与总结,发现的知识可以为未来档案工作的趋势进行预测。

三、数据挖掘在管理类数据中的应用

大学档案馆的管理类数据包括:智能监控系统、消防系统、温湿度控制系统、智能密集架、数据管理系统、数据利用系统等在日常工作产生大量的管理类数据。我们得用数据挖掘工具在这类看似无用的数据中提取有价值的知识并运用到大学档案馆工作中,并在大学档案馆的现代化建设中发挥作用。

大学档案馆档案工作的重点是为师生服务,以服务为中心开展各项工作,如何使用先进的工具,提高服务的质量是一直困扰我们的难题。数据挖掘为大学档案馆档案工作的智能化、个性化、精品化提供了行之有效的方法。在智能检索系统可调用用户兴趣模型,自动修正检索策略并可依用户兴趣将检索结果迅速聚类和分类,并条理化地排序出来;对于设计院、社科院等科研型档案用户,可借助数据挖掘开展针对性的档案信息挖掘,并将研究成果以概述、成果报告等形式提供给用户。这样不光实现了大学档案的二次开发,也会给用户带来意外的惊喜。

网络最初只是科学家与研究人员之间交换文件的软件,把因特网用于教育和研究可以得到政府的补贴。在中国,大学有拨款,图书馆有大学支持,数字图书馆的网络档案馆是不赢利的,产出是教学和科研的长期社会效益。今天,因特网已经越来越商业化了,网络在数字经济中已成为极具潜力的技术投资对象。大学数字图书馆也可以考虑建立以赢利为目的的网络档案库,采用网络商务中的一些商务模式,例如网络广告、旗帜广告、赞助广告、订阅、B2C等。收入可用于大学数字图书馆网络档案馆建设的滚动发展。目前人们对这些处于萌芽中的经济模式认识甚少。管理网络的公共政策制定主体是政府部门,推行电子政务,开发网络资源,促进从文字印刷向网络出版的转移是当前相关政府部门的重要任务。大学的政策、态度和措施对数字图书馆的发展至关重要。市场手段和政策平衡是网络档案馆建设,网络档案库运行,网上内容传递和保存应该和必须考虑的。

参考文献:

[1]Peer to peer Networking and Digital Right Management,by Michael A. Einhorn, Bill Rosenblatt, Policy Analysis No.534, CATO Institute. Fabruary 17,

[2]What Every Citizen Should Know About DRM, aka Digital Right Management, by Mike Godwin Seuitoo Technology Counsel At Public Knowledge, 30 January, , Ebook-Computer & Internet,

[3]彼得·莱曼.把万维网档案化.信息化参考,(13)

[4]周宏仁等.信息化助建和谐社会的14个着力点.中国信息界,2008(3)

10.基于数据挖掘技术的客户关系管理 篇十

当前,大部分高校都拥有配套的管理系统,该系统具备海量数据储存和管理功能,彻底告别了手工记录信息和数据的年代。不但节约了纸张,更有效提高了高校管理数据和信息的效率。然而我国高校没有有效利用应用数据挖掘技术,因此研究数据库挖掘技术在高校管理中的应用十分必要。

1数据挖掘技术的流程

数据挖掘技术能够将海量数据展开分析和处理,再把整体数据库中存在规律的数据整合起来,实施该技术主要包括以下五个环节。目标定义:该环节中要与有关领域的背景知识相结合,清晰、精确的定义出数据挖掘目标。数据准备:在该环节中要搜集、选取数据源中的数据,处理已选数据,将其转换为适合数据挖掘的形态。数据挖掘:该环节是数据挖掘技术的核心,即采用关联规则法、分类分析法等各种数据挖掘方法把数据中隐藏的知识和规律发掘出来。结果表示:在该环节中可以以用户需求为依据,将挖掘出来的知识和规律转变为用户能接受和理解的形态。知识吸收:该环节中,主要是把挖掘结果与指定领域中的需求相结合,在该领域中应用发掘出来的结果,为决策者提供知识,是数据挖掘的终极目标。

2数据挖掘技术在教学质量评估中的应用

2.1运用关联规则法挖掘数据库中的信息

评估老师教学质量不但是评定教学效果的重要部分,也是评定教师职称的重要根据,因此是高校管理工作中不可或缺的部分。目前评估教学质量的主要措施是搜集、统计学生的成绩和以及对老师的评价,然后加权算出老师的总得分,作为评估该老师教学质量指标。这种方法非但不科学,其权威性也较低,因此需要深挖数据的相关性,本文采用了数据挖掘技术中的关联规法挖掘数据中的规律和知识,为评估老师教学质量提供有力根据。运用关联规则法挖掘数据,其规则方法为“XY,置信度为c%,支持度为s%”。关联规则中置信度为c%:在整体事件D集合中,如果既能够符合事件X中拥有c%的需求,也能够符合Y的要求。那么就用置信度来表示关联规则的强度,被记录为confidence(XY),置信度最小值用minConf来表示,通常置信度最小数值由客户提供。关联规则中置信度为s%:在整体事件D集合中,如果既能够符合事件Y中的s%的需求,又能够符合X要求。用支持度来表示关联规则的频度,把支持度的最小数记录用minsup(X)来表示,通常支持度最小数值由客户提供。频繁项集合:当X项集的支持度大于等于用户设定好的最小支持度时,那么频繁项集是X。通常关联规则包含两个环节:①把全部频繁项集从整体事件集中选出;②运用频繁项集产生关联规则。在这两个环节中关联规则效果和性能是否良好取决于第一个环节。

2.2关联规则分析在评估教学质量中的运用

第一步是准备数据期,在某大学的教学管理系统中将五百条与教学评价有关的记录从数据库中随机抽取,并挑选出老师编号、学历、性别、教龄、评估分和职称这六个属性,并将相关数据从数据库中提取。比如把讲师、副教授和教授等职称转化成11、01、00等编码,表1就是制定的评价教师教学记录表。第二步采用关联规则分析法把90分以上评价分数作为检索目标和判断标准,也就是将≥90分作为判断是否是高教学质量阙值。通过检索有143条记录符合标准,即设定最小的支持度为10%,置信度则为15%,得出下表2的关联规则。最后一步评价本次实验的结果。由上表得知,学生喜欢男老师和女老师的程度大致相同;学历愈高的老师,给予他们的教学评价也就愈高,即学历和教学评价成正比,这也说明了学历高的老师其基本功与学历低的老师相比,前者基本功更为稳固,也有较高的科学研究水平;有较长教龄和较高职称的老师,其教学质量也越高;此外,在支持度中可以看出,高校教授和高学历人才越多,说明其办学能力也就越高。

3结语

高校管理系统作为教学信息化的重要举措,只是起到搜集和储存海量教学信息的作用,并没有挖掘出海量数据之间的相关性,而在本文中把关联规则法运用在教师教学质量评估中,在数据中挖掘有价值的知识和规律,使评估教师教学质量更具有科学性,因此在高校管理中全面应用数据挖掘技术,能为高校深化教学改革提供新的契机。

参考文献

[1]江敏,徐艳。数据挖掘技术在高校教学管理中的应用[J]。电脑知识与技术,2012,(24):541—545+560。

11.基于数据挖掘的客户价值评价 篇十一

[关键词] 客户价值数据挖掘客户价值评价

目前,客户终生价值应用研究的思路是结合客户生命周期理论,研究如何在客户关系发展不同阶段的不同交易期以最优的客户投入实现预期的客户终生价值,特别是客户生命周期中客户投入的调整。该研究主要用于对价值客户未来购买行为的预测分析以及在此基础上的价值客户管理。帮助企业正确认识客户的总体价值(当前价值和价值潜力)贡献,并进行适当的分类,定性和定量化地辅助企业识别、保留和发展价值客户。这方面的研究成果构成了客户关系管理系统中客户价值管理模块的营销理论基础。

一、客户价值评价的必要性

所谓客户价值就是指这些客户能为企业带来的价值,大小等于企业过去、现在、未来从客户身上获得的收益与吸引、发展、保持客户所需的成本之间的差值。这里收益包括货币和非货币两方面;吸引成本是指企业进行投资以便获取客户并使之满意的支出,包括市场营销、广告以及促销等;发展成本是指企业用于加强或维持现有客户关系的支出,包括研发、生产等;保持成本是指企业为延长客户关系持续的时间,降低客户不满意程度,或重新激活客户所进行的活动支出。

虽然客户能给企业带来收益,但由于客户的社会人口特征、个性特征等各不相同,有的客户大量购买企业产品,还可以为企业推荐新的客户;而有的客户却很少购买企业的产品,还提出许多苛刻的要求,因此,不同类型的客户给企业带来的收益是不同的。同时,对企业而言,每一个客户、每一个客户群的增加都是有代价的,这代价不仅仅表现在营销费用上,更多的表现为客户目标不明确,以及目标太多给企业带来的管理成本增加。因此,综合客户收益和客户拥有代价,可以发现客户选择是企业发展的重要因素,客户不是越多越好,而是越准确越好。

目前,对大多数企业而言,通常是各种类型客户并存,企业内客户的价值呈正态分布。由于企业资源的有限性,不可能对每个客户做到面面俱到,因此,通过对客户价值进行评价,并据此对客户进行分类,从而识别和选择企业的客户,将有助于企业把有限的资源用在为企业带来利润的盈利区客户身上,并放弃那些代价高昂、却不能为企业带来太多收益的不盈利区客户,提高企业资源的利用效率和生产经营的针对性,为企业的目标客户带来超出他们期望的价值和体验,创造持久的客户忠诚和企业利润最大化。

客户价值评价,进而展开客户保持是企业实施客户关系管理的主要目标,它对企业的利润有重要影响。资料表明:客户保持率增加5%,行业平均利润增加幅度在25%至85%之间;保持现有客户比获取新客户的成本能够节约4-6倍。但是客户保持也是需要成本的,在现有的客户群体中,并不是所有的客户都会同企业建立并发展长期合作关系。如果不加区别的开展对所有客户的保持努力,势必会造成客户保持成本的浪费。因此,如果事先对客户价值进行评价,预测其是否具有长期价值,识别出具有较大概率同企业保持客户关系的客户,有区别地开展客户保持努力,就会起到事半功倍的效果,大大节省企业的客户保持成本。

二、基于数据挖掘的客户价值评价方法

数据挖掘就是从海量的原始数据中找出隐含在其中的、事先未知的、但又是潜在有意义的知识和信息,从而利用这些知识指导我们的行动。数据挖掘方法以统计方法与人工智能为基础,大致可分为如下5种分析方法:①统计分析:利用统计分析工具中提供的可视化功能和分析功能来寻找数据间的关系,并构造统计模型和数学模型来解释数据;②聚类分析:聚类分析是把整个数据集划分为不同的子集,使子集内的各样本具有较高的相似性,而不同子集样本之间差别明显;③关联分析:挖掘出隐含在数据之间相互关联;④序列分析:重点在挖掘出数据之间基于时间的前后因果关系;⑤分类分析:通过分析已有的数据,揭示客户或事件的特征与结论之间的关系,并按照影响结论的显著程度将这些特征依次排列,进而用来预测未来的客户或事件。

数据挖掘迎合了企业在营销、销售和服务业务中涉及到的客户其数据量大且细节化、分布广泛等的特点,在通过对海量数据的处理估测客户价值、探知金牌客户特征等方面发挥了相当大的作用。

综合国内外的相关文献资料和企业的实际操作,现有的客户价值评价方法可以归纳为以下几种,数据挖掘技术能够有效地支持相应评价方法的运用。

(1)交易量评价法。交易量评价法是以交易额大小来衡量客户价值,进行客户细分。统计分析将客户的交易额进行汇总,并通过可视化工具将客户细分结果以直观的商业图表、图形和表格形式呈现;也可以构造多维表,并通过细剖、排序、旋转等不同操作得到不同地区、不同职业背景、不同收入状况及其它不同人口统计特征的客户群相应的客户价值,便于更深入地把握企业的细分客户群和相应的价值。

(2)ABC评价法。ABC评价法是目前一种较常用的客户价值评价方法,它根据利润额来区分客户。其原理是客户对企业利润额的分布规律:“企业80%以上的利润来源于20%的客户,70%的客户只提供了不足20%的利润,另有10%的客户不仅不会为企业带来任何利益,甚至会削弱企业的盈利水平”。在ABC评价法里,客户被直观地分为A,B,C三类,企业将优先发展A类客户,保持或缩减B类客户,抛弃C类客户。

聚类分析根据事物的特征对其进行聚类或分类,分析基于“物以类聚,人以群分”的朴素思想,认为同类的客户在行为特征上表现出相当的共性,而不同类的客户在行为特征上必然存在着较大的差异。聚类分析问题的实质是一个全局最优问题,利用聚类分析可以自动将样本集按某些特征划分成几类,无需对客户进行事先的指标体系和权重确定,因此基于聚类分析的ABC客户评价比较简单、快捷。

(3)因素组合评价法。因素组合评价法是根据相关因素组合的结果来评价客户价值的大小和对客户进行分类,考虑的因素通常分两种情形,一是考虑客户对企业产品的需求情况;二是考虑客户规模和信用等级情况。

分类分析通过揭示客户内涵特征和结论(客户价值)之间的关系,并按照影响结论的显著程度将这些内涵依次排列,进而用来预测未来的客户的价值。分类分析首先利用分类算法,根据历史客户数据和价值评价结论建立决策树,可称之为“学习”或“训练”阶段。算法寻找历史数据库中具有最大信息量的属性,构造出树根,再根据属性取值大于(等于)或小于树根的属性值建立树的分支,如此下去,直到所有的属性(用户的所有特征)都被用于树形结构中为止。再根据历史经验将决策树转化为分类规则,即对每一个树叶结点得出分类规则。然后,利用分类规则对将来的新客户进行分类,即根据新客户各特征的取值将其归入最接近的树叶结点,并利用分类规则做出相应判断,即得到新客户的价值,同时调整分类树和分类规则。

(4)客户生命周期价值评价法。对于客户生命周期价值的概念,目前基本的共识是:客户生命周期价值是企业在与客户保持长期交易关系的全过程中从该客户处所获得的全部利益的现值。客户生命周期价值评价法不仅考虑到收益流对企业利润的贡献,而且明确地扣除了企业为取得该收益流所付出的代价,同时,充分预计了客户的非货币价值,并兼顾了客户的未来价值潜力,因此,使用客户生命周期价值评价法能够客观、全面地度量客户对企业的贡献。现在,用客户生命周期价值作为客户价值的评价标准,无论在学术界还是企业界都逐渐得到认可。

但是根据客户生命周期价值公式,计算客户生命周期价值,对客户价值进行评价,需要充分估计和计算生命期内企业与客户相关的所有收益和成本,但这在实际操作中是相当困难的,首先因为对生命期内不同时段发生的客户事件及收益的具体预测较为困难;其次因为客户的非货币价值难以量化;再者是因为客户的生命周期跨度难以预测。因此,在理论上虽然可以通过客户生命周期价值模型对个体客户价值进行计算,从而对客户进行分类,找出高价值客户,但实际上实现相当困难。

为克服客户的未来购买产品和服务事件难以预测的困难,客户事件预测法被提了出来。这种方法的基本原理是:针对每一个客户,预测一系列事件发生的时间,并向每个事件分摊收益和成本,从而为每位客户建立一个详细的利润和费用预测表。预测的精度依赖于事件预测的准确性。事件的预测主要基于以下几方面:①产品是有一定的设计和使用周期的,经过一段时间,产品会有检测、维修、更新换代的需要;②一件产品会与其它产品发生若干联系,因此一件产品或服务的购买会引发其它产品或服务的购买;③客户的购买行为具有一定的购买模式,如购买A产品的客户有相当的可能会同时购买B产品,同时客户的购买行为存在着一定的惯性。

关联分析的作用是在客户有关的数据集中挖掘出满足一定条件的依赖性关系,它展示出数据间未知的依赖关系,并有可能描述成关注数据项间的因果关系。因此,关联规则常被用来分析客户的购买模式,而购买模式的揭示有助于预测客户未来的购买行为。

与关联分析有较大相似的是序列分析。序列分析主要针对两个事件在发生时间上有一段间隔的情况,可用来发现符合一定频率规则的购买模式等。例如,用户在购买了打印机后,每隔一定时间就会购买打印纸,一定时间后又会要求产品维修。所以序列分析有助于预测将来客户的购买产品和服务的要求。

三、结论

数据挖掘能帮助企业管理者从海量数据中统计和多维分析客户购买数据,客户分类,识别客户的购买行为特征,发现客户购买模式和趋势,进而展开客户价值评价,达到提升客户层次、保持有价值客户的目的。利用数据挖掘建立客户关系管理系统将极大地提升企业的竞争优势,提高企业的营销水平。本文的探讨将有利于企业建立有效的客户关系管理系统。

12.基于数据挖掘技术的客户关系管理 篇十二

改革开放以来,我国民航快速发展,截至2007年12月,民航全年完成旅客周转量2791.7亿客公里,旅客运输量1.9亿人次,分别同比增长17.8%、16.3%,航空旅客周转量在国际民航组织缔约国中排名第二,增长高于世界平均水平10.4个百分点。但在航空市场需求增加的同时,由于营销和管理水平的不足,以及市场竞争进一步加剧,正班客座利用率平均为76.4%,低于世界平均水平0.6个百分点[1]。如何在遭遇金融危机冲击的情况下,进行有效的营销,提高航空公司收益水平是一个急需解决的问题。

帕累托原则指出:一个公司80%的盈利是由20%的旅客创造的。当前国内航空公司的经营现状就充分说明了这一点:一个航班的主要利润不是来自数量相对较多而票价打折也较多的经济舱,而是来源于数量不多的商务舱[2]。从而可以看出:从收益管理的角度,并非所有的旅客对企业都是同等重要。那么航空公司需要做的就是能够把握住给航空公司带来更多利益的重要旅客,这就要求企业对旅客进行细分,能够有目的性、针对性地把更多的投入放到特定的旅客身上,减少因为盲目投入造成的不必要的浪费,寻找特定旅客的过程本身就是一个对旅客进行分类的过程,而这个过程也是市场营销的基础。

基于上述研究背景,本文提出建立旅客数据仓库,并通过数据挖掘技术和先进的营销观念结合起来,并针对航空领域的具体情况,进行基于客户价值的客户细分,提出适合国内航空企业的全新的营销思想和操作方法。

2 航空旅客关系管理现状分析

现在航空公司所广泛采用的常旅客计划等促销手段,某种程度上对这批客人缺乏吸引力。简单的依据飞行里程将旅客划分不同等级,并没有考虑到旅客为航空公司所带来的盈利价值,它的弊端在于[3,4,5]:

(1)认为高里程等于高收益、高价值,实际上,处于累计里程高位的常旅客经常能够享受到航空公司的折扣机票与其它优惠,因而,比非常旅客但总是购买全价机票的旅客为航空公司带来的收益少。

(2)常旅客所专享的机上免费升舱的待遇,使部分常旅客在购买机票时由高舱位向低舱位倒流,造成与收益系统的明显背离。

(3)航空公司的促销重点常常在累计里程数较大的常旅客群上,容易忽视每公里贡献值大的潜在价值旅客。

由此可见,基于里程的旅客划分不能清晰区分旅客价值,没有针对性的满足旅客的需求,增加了促销成本却达不到一对一营销的理想目标,使航空公司的差异化服务形同虚设,需要进行基于客户价值的旅客细分。

从价值角度进行客户细分的方式是最为科学也最具商业价值的分类方法,能够有效的反映客户的盈利能力,通过关注每个客户的终生价值,将客户以其终生价值的高低加以分类,为那些对公司极为重要的终生价值高的客户提供优质服务,建立良好的客户关系,进而形成稳定的客户忠诚,获得持久的客户价值[6]。

3 航空旅客数据仓库的设计

我国航空公司经过多年来在信息化建设方面的努力,尤其是自1986年民航总局相继建立了定座、离港与货运系统以来,根据自己的业务特点和办公的需要,建立了一批业务处理系统和企业办公自动化系统,积累了大量的业务数据。其中,涉及到旅客各方面的资料有:定座系统中的旅客定座信息、离港系统中旅客乘机信息、客舱乘务员随机收集旅客信息、财务系统中的销售财务数据、常旅客系统中的常客统计信息等信息。而这些信息分别储存在不同的数据库和操作系统中,这些分布于不同应用系统并且逐日增加的数据为各级工作人员的日常访问、管理和决策支持带来了相当大的不便。因此,有必要将这些分布在不同操作系统、不同数据库平台上的数据进行加工、汇总和重组,形成一套高效而方便的分析、决策系统,以满足各级用户越来越多、越来越复杂的统计分析需求。

数据仓库是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。有关旅客背景和细节资料的数据仓库的建立,能够为航空公司做到为旅客提供符合个人偏爱和需求的服务创造条件。数据仓库的目的不只在处理增加、删除和异常情况,其设计理念是强调迅速地获得数据,对大量数据具有分析能力。

研究旅客运输的过程,相关的分析领域包括:旅客和收益。每个主题域有各自独立的逻辑内涵,对应一个分析对象。这两个主题域所包含的内容列出如下:

(1)旅客主题。旅客统计信息:旅客ID,姓名,姓名拼音,出生日期,性别,联系地址,邮编,联系电话,手机号码,Email,工作单位,职业类别等。

旅客购票信息:航班ID,舱位,票价,乘机日期等。

旅客航程信息:旅客ID,姓名,航班ID,航段ID,乘机日期等。

旅客奖励兑换信息:奖励兑换ID,姓名,奖励发放方式,发放时间,发放人工作号等。

(2)收益主题。销售收入信息:航班ID,日期,舱位种类数,种类名称,各舱位票价,各舱位旅客数,航班总收入等。

航空旅客数据仓库事实星座模式如图1,旅客事实表对应旅客主题,航班收益事实表对应收益主题。

4 应用分析

以在A航空公司备有相关资料的旅客作为研究对象。为了更直观的进行分析,需要对数据仓库的字段进行转换,转换过程如下:

乘机日期(旅行次数;

乘机日期,航段(来回程次数,往返周期为一周内的次数,超过一周的次数;

乘机日期(最近一次乘机日期距离统计日期的月份数;

航段(航段种类数;

航程,票价(每公里票价。

初步选择旅客ID、姓名、旅行次数(次)、来回程次数(次)、往返周期在一周内(次)、超过一周的次数(次)、航段种类(个)、距今月份数(月)、累计里程(公里)、累计票价(元)、每公里票价(元/公里)这十一个最体现旅客旅行特征的属性字段,先对旅行次数等七个变量进行聚类,再结合财务指标进行分析。

确定了细分旅客的判别依据,即样本集的列字段,接着随机的从所有的旅客记录中选取125个样本,即样本集的行字段,以旅客ID为序进行排列。

应用SPSS的非系统聚类K-means Cluster过程对125个样本进行聚类,最后的聚类结果为六组,各组的样本容量及最后的聚类中心见表1和表2所示。

在聚类中,如果引入了无关的变量,则会降低聚类的效果。以下方差分析用来检验七个变量能否区分组间的差异。结果如表3所示。

从方差分析表中可知,七个变量中任意一个变量造成的组间均方和均远远大于组内的均方和。从概率值来看,七个变量使组间无差异的假设成立的概率均小于0.1%(在SPSS的方差分析中,F值的显著水平小于0.001的均记做0.000)。方差分析结果表明,参与聚类分析的七个变量能很好地区分组间的差异。因此可以确定,七个变量对聚类分析均有一定的贡献。

基于旅客行为特征划分的六个组各自的特征描述如下表4:

假定每个旅客的成本是相同的,将每个细分旅客实际支付的机票价格分别累加,得到票价总额,作为旅客贡献的等价指标。根据旅客总票价的高低,及前面的数据转换过程,得出:

(1) 1、2类旅客的总票价与每公里票价都将是最高的,因而价值较大,可以成为航空公司的高价值旅客。尤其是第2类旅客每公里所支付的票价是六类旅客中最高的,可以判断他们是最经常乘坐头等舱的核心价值旅客。

(2) 5、6类旅客的每公里票价也较高,原因是这部分旅客只是偶尔乘机所以不大关心票价,尽管这两类旅客创造的总票价金额不高,但航空公司应该看到这部分旅客的潜在价值,通过向他们提供细致入微的关怀来争取他们的好感,从而销售舱中的高价舱位。

(3) 3、4类旅客的每公里票价明显低于其余四类,从而证明了他们的旅行目的是休闲旅游,所以对票价较敏感,虽然经常乘机导致累计票价金额不低,但航空公司从这部分旅客身上取得的利润的空间是很小的,可以认为他们是航空公司的低价值旅客。

5 结束语

本文在分析我国航空公司常旅客计划存在不足的情况下,指出应该基于旅客价值进行客户关系管理,并建立了旅客和收益主题的航空旅客信息数据仓库。为航空公司客户关系管理和市场营销提供了同构的数据源,方便营销人员快速查询、分析,为营销决策提供支持。在航空客户关系管理系统建设中,要合理利用数据仓库和数据挖掘技术,对旅客数据进行分析。这些信息对航空公司进行取得市场竞争优势起着良好的促进作用。

参考文献

[1]中国民航局.中国航空运输发展报告(2007/2008)[EB/OL].http://www.caac.gov.cn/H1/H2/200808/t20080828_18587.html.2009-3-17.

[2]演克武,张磊,孙强.决策树分类法中ID3算法在航空市场客户价值细分中的应用[J].商业研究.2008,(3):24-25

[3]王彦生.对于国内常旅客计划发展现状的思考[J].企业管理,2006,(6):92-93

[4]魏亚波.中外航空公司常旅客计划比较分析[J].空运商务,2007,(10):14-18

[5]王疆民.国内目前常旅客计划的发展情况和趋势[J].空运商务,2006,(25):17-18

上一篇:大班语言公开课教案及教学反思《卖火柴的小女孩》下一篇:仿句练习大全含答案