数据挖掘技术的电子商务系统研究论文

2024-08-03

数据挖掘技术的电子商务系统研究论文(19篇)

1.数据挖掘技术的电子商务系统研究论文 篇一

电力行业节能减排系统中评价指标数据优化技术的研究

摘 要 据权威数据可知,目前我国开发的煤炭大约百分之五十都用于电煤消耗,工业用水中的五分之二也被用作火力发电,与此同时,在排放物当中,二氧化硫含量高达50%以上,烟尘排放量次之,其产生的灰渣能占到全国总灰渣的70%左右,由于电力行业是排放的主力,因此其节能减排工作是当前我国产业结构转型的重要任务。

【关键词】电力行业 节能减排系统 评价指标数据我国电力行业节能减排系统存在的问题

1.1 能源浪费严重

我国的电力工业耗能巨大,电力工业大多采用燃烧煤炭的方式进行发电,这样的比重占到了五分之四以上,消耗了我国近半的煤炭资源。但是这些工业部门并没有完全利用资源,而是造成了相当大的浪费。2009年,该产业平均供电煤耗为320克/千瓦时,厂电率为4%。但是早在十年前,日本就已经达到了这一水平,法国更是超越了这一水平,达到了供电煤耗331克/千瓦时,厂用电率为5.42%(包括脱硫过程消耗的电能)的高水平。不难看出,我国电力工业在此方面还处于起步阶段,能源浪费程度较高,有待改善。

1.2 技术落后,设备陈旧

节能减排工作与技术发展息息相关,如若没有先进的技术与设备,我国根本无法缩小与发达国家的距离,只能一直处于落后阶段,目前我国已经与世界水平拉开了接近二十年的差距。主要是因为国内企业很难获得节能减排方面的融资,以致没有足够的经费进行研究,只能依靠从国外进行技术引进和设备进口。尽管自改革开放以来,我国已经在这方面取得了巨大进步,对许多新的技术、设备和工艺进行了研究开发,但是仍然与发达国家有着巨大的差距,主要体现在投入有限、创新元素相对较少、对市场的适应能力较弱等等。

1.3 数据杂乱

在我国,节能减排工作是以全社会参与的方式进行的,综合了行政、法制以及市场的多种手段。在参与主体当中,政府起到主要的领导作用,通过颁发行政命令统领方向,但是在这个过程中常常出现数据文件多、杂、重复、不协调等问题,致使工作进程缓慢。与之相比,市场的调解与促进作用就显得尤为重要,但是我国在此方面的力度显然不够。

1.4 体系不完善

第一,电力企业需要进改革和完善相关的考核机制和评估体系;第二,强化节能减排系统能力,解决一部分电厂没有完整历史记录,物料分配不均衡,脱硫系统的台账不够明确等相关内容;三是强化节能减排管理人员的个人素质,提高专业化程度的培训。电力行业节能减排系统评价指标数据优化

保证严谨地对于电力行业节能减排工作进行有效测评,本文深入多角度进行分析,提供多元化的分析思路,创建更加完整的电力节能减排评价模型,此模型主要的功能是分析电力行业与政府部门以及企业的节能减排情况,进行评价的思路如下:

2.1 选择评价指标

总结电力领域中节能减排评价的基本目标,重建相关的评价指标体系,得出详细、具有方向性评价指标要具体表现出电力领域进行节能减排的效果,尽量符合节能减排所提出的相关需求。

2.2 将指标数据进行无量钢化

首先,在定量评价指标的无量钢化处理过程中,即是对数据进行求解隶属函数的过程,要根据指标本身的性质来确定相关的函数。其次,定性评价指标的量化处理。对于只能进行定性评价的指标,采用评价等级(差、较差、一般、较好、好)隶属度的方法来确定。

2.3 对节能减排系统中政府层面及企业层面进行分析

深入对电力与涉及到的政府部门以及企业之间的联系进行深入分析,总结各种指标反映出来的评价结果。政府方面,要颁布完整并且极富有执行性的发展规划与保障体系,加大宣传力度,刺激各个监管部门进行严格的监督工作与考核制度。企业方面,一级评价指标是指准入性评价指标,将绩效性评价指标与工作指标相结合在一起,另外一级评价指标值指专家得出的具体结论与分析办法。两级指标共同组成对企业进行全方位的评价。电力行业节能减排系统指标数据优化措施

3.1 完善电力行业节能减排政策机制

节能降低消耗与减少排放在节能行业中都占有重大的分量,两者双管齐下可实现最佳的节能效果。节能工作是一项需要长久的恒心才能实现,完善整个企业的减排规划,让减排工作可以进行科学性的实施。将工作用科学理论进行严格的规划与实践,整个减排工作就会更加有序性。基于电力节能减排工作中的阻碍问题与标准化建设的实际情况进行逐一的解决。

3.2 积极改善产业环境

煤矿行业主要向发电厂实现煤炭供应,这个原因是由于我国的发电技术基本都是通过火力发电实现的。煤炭的储备量相比其他资源较为丰富,但是由于其不可再生的性质,以及目前大规模的开采,使得可利用资源逐渐减少,并且受到运输、资源开发、环境等相关因素的限制。清洁能源相比较而言具有很大的优势,凭借可再生能源、开发机会多、对环境影响较小等优点在目前比较受欢迎。因此,促进清洁能源的迅速崛起,协调企业内部电源结构,让可再生能源消耗保持稳定。

3.3 加大电力企业的政策执行力度

电力企业的节能减排工作还要根据有关部门进行严格的监督与把握。企业也可以采取一些措施进行有效监控,建立减排管理委员会、加强节能减排知识教育、协调资源管理分配等方式,提高企业员工的专业水平,强化环保意识、大力号召人们开展节能减排活动。

参考文献

[1]安乐.辽宁省火电厂节能减排浅析[J].电力技术,2010(3):15-16.[2]余海明.我国电力工业节能减排的现状及技术途径[J].中小企业管理与科技,2009(01):133.[3]孟祥铭,顾英伟.辽宁省节能减排的难点及对策研究[J].沈阳工业大学学报:社会科学版,2012(01):45-49.作者简介

宋飞(1985-),男,山东省泰安市人。大学本科学历。现为平顶山技师学院助理讲师。研究方向为电力电子。

作者单位

平顶山技师学院 河南省平顶山市 467000

2.数据挖掘技术的电子商务系统研究论文 篇二

关键词:web,数据挖掘,电子商务,路径分析,关联分析

一、引言

电子商务作为新兴的商业模式以其高效率、低成本和不受时空限制的特点成为企业商务活动发展的主流。在运行过程中, 电子商务系统产生了海量数据, 如何从大量的数据中获得有利于商业运作、提高竞争力的信息是企业亟待解决的热点。数据挖掘技术的出现为电子商务系统提供了数据分析强大的技术支持。通过挖掘Web上的日志文件, 如客户的访问行为、访问频度、浏览内容及时间等, 提取相关的客户知识, 将客户的访问数据从潜在的、隐含的、无规律的状态, 经过提取、清洗、加工成为企业分析市场、制定经营策略、管理客户关系的有力依据, 从而实现Web上电子商务活动的真正价值。

二、电子商务中的web数据挖掘技术

1. 路径分析。

路径分析技术是一种找寻频繁访问路径的方法, 它通过对web服务器的日志文件中客户访问站点访问次数的分析, 挖掘出频繁访问路径。通过对网站页面之间的关系及超链接之间联系的分析, 判断网站中最频繁访问的路径, 删除其他没有价值的页面。

2. 关联分析。

关联分析的目的是挖掘隐藏在数据间的相互关系, 它能发现数据库中形如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的知识。可以将web挖掘得到的关联规则用于改进电子商务站点的结构, 将相关联的商品放在一起, 减轻用户过滤信息的负担, 增加交叉销售。

3. 序列模式分析。

序列模式分析和关联分析相似, 但侧重点在于分析数据间的前后序列关系。它能发现数据库中形如“在某一段时间内, 顾客购买商品A, 接着购买商品B, 而后购买商品C, 即序列A→B→C出现的频度较高”之类的知识。例如。当客户在网上购买了乒乓球拍时, 那么顾客会在后续的时间里会不断的购买乒乓球。应用序列模式分析技术便于电子商务企业预测客户的行为对客户提供个性化服务。网站可以找出这个访问者的访问序列模式, 将他可能要访问但还未访问的页面放在显眼的位置。

4. 分类分析。

分类分析就是通过分析示例数据库中的数据, 为每个类别做出准确的描述或建立分析模型或挖掘出分类规则, 然后用这个分类规则对其他数据库中的记录进行分类。对于商业网站, 根据访问网站的客户信息和用户的访问模式得出访问网站的用户特征。对用户分类后, 了解各类客户的特点爱好, 就可以发现未来的潜在客户并开展有针对性的商务活动, 提供人性化的信息服务。

5. 聚类分析。

聚类分析通过分析数据库中的记录数据, 根据一定的分类规则, 合理地划分记录集合, 确定每个记录所在类别。在电子商务平台上为用户提供个性化服务, 将需求和爱好类似的用户归为一类, 从而动态地为客户定制商品的内容或提供浏览建议, 同时有利于提高广告的效果, 促进网上销售和提高用户忠诚度等。

6. 知识发现类。

从数据仓库的大量数据中筛选信息, 寻找市场中可能出现的新的运营模式, 发掘出人们所不知道的事实。知识发现类数据挖掘技术包含人工神经网络、决策树、遗传算法、粗糙集、规则发现和关联顺序等。

三、web数据挖掘技术在电子商务中的应用

1. 发现潜在客户和提高客户满意度。

通过数据挖掘, 可以发现使用某一业务的客户的特征, 从而可以向那些也同样具有这些特征却没有使用该业务的客户进行有目的推销;还可以找到流失的客户特征, 在那些具体相似特征的客户还未流失之前, 采取针对性的措施。

2. 优化网站结构。

通过挖掘电子商务站点的日志文件和相关数据来发现该站点上的浏览者和客户的访问模式, 给网站设计者提供改进电子商务网站设计的依据, 进而调整电子商务站点结构, 可以提高电子商务站点的服务质量。比如可以通过数据挖掘发现用户访问页面的相关性, 对密切相关的网页之间增加链接;再比如通过数据挖掘发现用户的期望位置和访问频率, 决定是否在期望位置和实际位置之间建立导航链接。

3. 个性化服务。

智能商务针对单个用户的使用记录对该用户进行建模, 结合该用户基本信息分析其使用习惯、个人喜好, 目的是在电子商务环境下为该用户提供与众不同的个性化服务。根据客户所访问的商品页面内容, 提供大量同类商品的链接页面进行对比选择, 满足客户的不同需求。

4. 网络营销。

数据挖掘能够过发现隐藏在这些数据中对网络营销有意义的信息以及它们之间的联系。对这些信息进行深入的分析, 能够发现市场需求、具有相似购买行为的客户群体等信息, 及时发现这些信息能够帮助企业对市场变化做出迅速的反映, 进行客户预期, 从而制定切实有效的营销计划。

四、小结

电子商务是现代信息技术发展的必然结果, 也是未来商业运作模式的必然选择。利用web数据挖掘技术, 提高了客户关系管理的效率, 优化了电子商务网站, 为网络营销提供了决策支持, 使企业在电子商务的潮流中具有更强的竞争力。

参考文献

[1]林宇.数据仓库原理与数据挖掘实践[M].人民邮电出版社, 2003.1[1]林宇.数据仓库原理与数据挖掘实践[M].人民邮电出版社, 2003.1

[2]朱志国, 孔立平.Web使用挖掘技术在电子商务的研究与应用[J].长沙通信职业技术学院学报, 2007, (1) :32-37[2]朱志国, 孔立平.Web使用挖掘技术在电子商务的研究与应用[J].长沙通信职业技术学院学报, 2007, (1) :32-37

3.数据挖掘技术的电子商务系统研究论文 篇三

关键词 电子商务 数据挖掘 关联分析

中图分类号:TP311.13 文献标识码:A

1 电子商务

电子商务指交易当事人或参与人利用现代信息技术和计算机网络(主要是因特网)所进行的各类商业活动,包括货物贸易、服务贸易和知识产权贸易。①它的飞速发展,促使经销商和客户之间通过互联网进行交易,节省了大量的费用和时间。帮助企业经销商收集了大量的数据,随着电子商务的不断发展,将这些大量数据转化成有价值的信息,以达到企业增加收入,降低成本,使企业处于有利的竞争位置的目的。

2 基于关联分析的数据挖掘

数据挖掘是从大规模的数据中抽取非平凡的、隐含的、事先未知的、有潜在使用价值的信息的技术,是属于发现型的技术。它为解决此类各种应用问题提供了强有力的计算支持。数据挖掘所涉及的学科领域和方法很多,关联分析是最常见的数据挖掘之一。

关联规则就是从一种行为中发现与之相关联的另一种行为,及A→B,并用一定的概率度加以保证。关联分析发现的主要对象是交易型数据库,一个交易一般有交易处理时间,一组顾客购买的物品,有时也有顾客标识号组成。由于电子商务的发展,销售商可以方便地收集存储大量的售货数据。对这些历史交易型数据进行关联分析,则可对客户的购买行为提供极有价值的信息。例如,可以帮助零售商(怎样相互搭配销售),通过关联分析发现交易数据中常常隐含形式的规律,对于改进销售业绩等商业活动的决策是非常重要的。

3 关联分析在电子商务中的应用

本文对关联规则在电子商务中的应用进行讨论,提出了关联规则在电子商务中应用的步骤,得出了基于关联规则的商品销售模式。②电子商务中的数据不仅十分庞大、复杂,而且包含着许多有用信息。随着数据挖掘技术的发展以及各种数据挖掘方法的应用,从电子商务数据库中可以发现一些潜在的、有用的、有价值的信息来。通过对所积累的销售数据的分析,可以得出各种商品的销售信息。从而更合理地制定各种商品的定货情况,对各种商品的库存进行合理地控制。另外根据各种商品销售的相关情况,可分析商品的销售关联性,从而可以进行商品的组合管理,以更加有利于商品销售。

關联规则挖掘问题就是首先确定所要挖掘规则的最小支持度与最小置信度,然后在交易数据库D中找出具有用户给定的最小支持度minsup和最小置信度minconf的关联规则。③

3.1关联规则发现算法描述

关联规则挖掘问题可以划分成两个子问题:(1)发现频繁项目集和生成关联规则。相对于第一个子问题而言;(2)子问题相对简单。因此,第一个子问题是近年来关联规则算法研究的重点。

3.2数据描述及预处理

在电子商务中通过分类分析,得到客户分类模式后,就可以针对不同类客户的特点展开不同的商务活动,提供有针对性的个性化的信息服务;得到客户的分类模式后,还可以对新的客户进行分析,分析新的客户属于哪一个类别,从而有针对性的开展商务活动。

3.4 进一步计算置信度得出关联规则

进一步计算置信度,如表4,中Lk为k-频繁项目集,y为Lk的非空子集。

根据以上关联规则,商家可以将牛奶、火腿、面包放在同一网页上进行销售,而果啤则应该放到另一个网页上销售,可以帮助管理者规划市场,确定商品的种类,价格、质量等。

4 结束语

电子商务过程中的各种信息和数据是电子商务活动能够更好的进行的基础,通过选择合适的数据挖掘技术来挖掘电子商务中有价值的信息,从而使企业在激烈的市场竞争中做出正确的决策,保持有力的竞争优势。随着数据挖掘技术的不断发展,相信它在电子商务中的应用将促使其得到更快更高效的发展。

注释

① 孙海峰.促进我国电子商务发展的思考.经济师, 2007.

② 张爱国,数据挖掘在超级市场中的应用[J].农业网络信息,2005(1):43-44

③ 薛薇,SPSS统计分析方法及应用[M].北京:电子工业出版社,2004.

④ 王国君,段立娟,王实,等.数据挖掘原理与算法[M],北京:清华大学出版社,2005.

4.电子商务中数据库技术的应用 篇四

摘 要随着科技技术不断的发展,在信息化与网络化的今天,电子商务在各行各业中的应用范围越来越广。在电子商务平台的交易过程中,需要对大量的商品数据、销售数据进行读取、修改等操作,面对这种情况数据库作为强大的技术支撑电子商务的交易。本文针对数据库技术在电子商务中的应用情况以及将来的发展方向进行了深入的探讨,为电子商务的应用提供了理论基础与实践指导。

关键词电子商务;数据库技术;web;交易

随着社会科技不断的进步,网络化与信息化社会已经趋于成熟,电子商务也随之发展成熟,其规模和领域也逐渐的进行延伸到很广阔的范围。电子商务凭借着自身的跨地域、交易便捷以及低廉成本等优势,对网络发展具有强大的推动作用,因此,电子商务已经成为新时代的发展的必定趋势之一。在电子商务平台的交易过程中,需要对大量的商品数据、销售数据进行读取、修改等操作,面对这种情况数据库作为强大的技术支撑电子商务的交易。例如,针对客户的需求,对电子商务平台进行分类信息的划分;在购买与销售的过程中,产生的交易信息和物流配送方式以及买家与卖家的基本信息,这些海量的数据均需要数据库技术作为支撑,数据库技术领域已经被广大学者广泛而又深入的进行研究。本文针对数据库技术在电子商务中的应用情况以及将来的发展方向进行了深入的探讨,为电子商务的应用提供了理论基础与实践指导。

5.电子商务数据库技术重点 篇五

基本表的定义:EATE TABLE[<数据库名>]<表名>;删除DROP TABLE[<数据库名>]表名

修改:a增加属性:ALTER TABLE[<数据库名>]表名ADD

B删除属性:ALTER TABLE[<数据库名>]表名DROP

3)视图的定义:REATE VIEW 视图名AS SELECT语句;删除:DROP VIEW 视图名

4)索引的定义:CREATE [UNIQUE] INDEX 索引名ON;删除DROP INDEX 索引名

8SQL查询1)“*”为通配符,表示查找FROM中所指出关系的所有属性的值

1、表、视图、索引的定义及使用:(1)基本表的定义:create table 〔﹤数据库名﹥.〕﹤表名﹥(﹤列名﹥ 数据

类型 ﹝缺省值))eg.建一个学生情况表(student)create table student st-class chat(8),st-no char(10),……(2)视图的定义:create view 视图名 as select 语句eg.从基本表student和score中导出只包括女学生且分数在60分以上的视图create view woman-score as select student.st-class,student.st-no,student.st-name,student.st-age,score.sc-score from student.score where student.st-sex=“女”and score.sc-score>=60 and student.st-no=score.st-no(3)索引的定义:create 〔unique〕index索引名on〔﹤数据库名﹥.〕表名(列名〔ASC/DESC〕,列名〔ASC/DESC〕…)eg.对基本表student中的st-no和st-age建立索引,分别为升序与降序,且索引值不允许重复create unique index stindex on student(st-no ASC,st-age DESC)

2、SQL查询语言的主要应用:(1)无条件查询例子:找出所有学生的选课情况select st-no,su-nofrom score

(2)条件查询例子:找出任何一门课成绩在70分以上的学生情况、课号及分数select unique student.st-class,student.st-no,student.st-name,student.st-sex,student.st-age,score.su-no,score.scorefrom student,scorewhere score.score>=70 and score.stno=student.st-no(3)排序查询例子:查询不及格的课程,并将结果按照课程号从大到小排列select unique su-nofrom scorewhere score<60 oeder by su-no desc(4)嵌套查询例子:查询课程编号为c03且课程成绩在80分以上的学生的学号、姓名select st-no,st-name from student where stno in(select st-no from score from score where su-no=’c03’and score>80)(5)计算查询常用函数有:count(*)计算元组的个数;count(列名)对某一列中的值计算个数;sum(列名)求某一列值的总和(此值是数值型);avg(列名)求某一列的平均值;max(列名)求一列中的最大值;min(列名)求一列中的最小值例子:求男学生的总人数和平均年龄select count(*),avg(st-age)from student where st-sex=’男’

3、SQL数据的主要插入、删除、修改操作:(1)数据插入:将数据插入SQL的基本表有两种方式,一种是单元

6.数据挖掘技术的电子商务系统研究论文 篇六

1.EDI系统要素

构成EDI系统的三个要素是EDI软件、硬件、通信网络以及数据标准化。一个部门或企业若要实现EDI,首先必须有一套计算机数据处理系统;其次,为使本企业内部数据比较容易地转换为EDI标准格式,须采用EDI标准;另外,通信环境的优劣也是关系到EDI成败的重要因素之一。 2.EDI标准

EDI标准是整个EDI最关键的部分,由于EDI是以事先商定的报文格式形式进行数据传输和信息交换。因此,制定统一的EDI标准至关重要。世界各国开发EDI得出一条重要经验,就是必须把EDI标准放在首要位置。EDI标准主要分为以下几个方面:基础标准,代码标准,报文标准,单证标准,管理标准,应用标准,通信标准,安全保密标准。

在这些标准中,最首要的是实现单证标准化,包括单证格式的标准化、所记载信息标准化以及信息描述的标准化。单证格式的标准化是指按照国际贸易基本单证格式设计各种商务往来的单证样式,

备考资料

在单证上利用代码表示信息时,代码应处位置的标准化。目前,我国已制定的单证标准有:中华人民共和国进出口许可证、原产地证书、装箱单、装运声明。

信息内容的标准化涉及单证上的哪些内容是必需的,哪些不一定是必需内容。例如在不同的业务领域,同样的单证上所记载的内容项目不完全一致。 3.EDI在供应链管理过程中的应用

EDI是一种信息管理或处理的有效手段,它是对供应链上的信息流进行运作的有效方法。EDI的目的是充分利用现有计算机及通讯网络资源,提高贸易伙伴间通信的效益,降低成本。EDI主要应用于以下企业:

制造业:JIT即时响应(JustInTime)以减少库存量及生产线待料时间,降低生产成本。

贸易运输业:快速通关报检、经济使用运输资源,降低贸易运输空间、成本与时间的浪费。

流通业:QR快速响应,减少商场库存量与空架率,以加速商品资金周转,降低成本。建立物资配送体系,以完成产、存、运、销一体化的供应线管理。

金融业:EFT电子转账支付,减少金融单位与其用户间交通往返的时间与现金流动风险,并缩短资金流动所需的处理时间,提高用户资金调度的弹性,在跨行服务方面,更可使用户享受到不同金融单位所提供的服务,以提高金融业的服务品质与项目。

7.数据挖掘技术的电子商务系统研究论文 篇七

水利信息化建设的逐步深化,各项业务应用的逐步开展,大大提高了水行政管理和公共服务能力,提升了水利信息化水平。水利部电子政务系统逐渐由单纯的办公自动化系统转变为涵盖综合办公、规划计划管理、人事管理等多种业务的综合性系统。系统规模越来越大、应用范围越来越宽,对数据可靠性的要求也越来越高,数据存储空间不足的矛盾也表现得越来越突出。在此情况下,存储系统的升级改造不可避免,这必然面临一个数据迁移的问题。

在目前数据迁移的案例中,比较常见的是数据库之间和主机之间的数据迁移。而本文提出的数据迁移在不影响水利部电子政务业务的前提下实现存储系统之间的数据迁移。

1 数据迁移技术概述

实现数据从一个存储系统迁移到另一个存储系统的方式有备份恢复、逻辑卷镜像等不同的方法,各种数据迁移方式有不同的特点,适用于不同的数据迁移需求。主要数据迁移技术有以下4种:

1)直接拷贝方式。直接拷贝方式是利用操作系统命令直接拷贝要迁移的数据,复制到要迁移的目的地[1]。如Linux/Unix下的dd命令,作用是将指定大小的输入文件(设备文件)以block为单位拷贝到指定的输出文件(设备文件)中,并在拷贝的同时进行指定的转换。

直接拷贝方式是快速有效的数据迁移方式,原数据卷可用于紧急回退。数据迁移期间需要停止业务,数据迁移时间与数据量大小相关。

直接拷贝方式适合于数据量不大、可以接受业务中断时间较长的系统,这种系统采用直接拷贝的方式就显得简单、快捷。

2)逻辑卷镜像方式。逻辑卷镜像方式是利用操作系统中的镜像管理软件,在主机中同时加载新存储和原存储的数据卷,并将对应的2组数据卷配置成镜像卷,由操作系统自动将原存储系统中的数据复制到新存储系统中。

逻辑卷镜像方式是对现有的数据卷增加镜像卷,不会影响原来的数据卷;操作步骤相对简单、高效。镜像的初始同步会大量占用主机CPU资源,降低源磁盘的IO响应时间,数据同步过程也会影响业务性能;但此方式仅在配置和停止镜像时需要停止业务,业务中断时间短,可以最大限度地保障生产系统的可用性;数据迁移时间与整个数据卷大小相关[2]。

逻辑卷镜像方式通常在有联机迁移要求且迁移数据量大的情况下使用,支持任意存储系统之间的迁移,适合于主机存储的非经常性迁移。

3)备份恢复方式。备份恢复方式是利用数据备份系统将原有数据复制到备份介质,然后再转入新的存储系统中。

备份恢复方式仅从备份系统中恢复数据,风险较低,如果失败,导入原来的数据卷即可还原;数据库恢复的操作步骤比较复杂,需要大量手工操作,恢复时间存在不确定因素;数据全备份时会影响业务性能,恢复过程需要停止业务,业务中断时间较长;数据迁移速度与数据量大小相关。

如果系统没有逻辑卷管理软件,在满足备份窗口要求的情况下,可以考虑采用备份恢复方式实现。

4)直接盘阵复制方式。直接盘阵复制方式是通过盘阵到盘阵的复制软件将数据从一个盘阵复制到另一个盘阵,即写数据到本地盘阵时,同步或异步地将数据写到远程盘阵。

直接盘阵复制方式,复制过程由磁盘阵列完成,不需要消耗主机资源,但是一般需要2个盘阵为同构。

对那些需要在线不停机做数据迁移,同时又要求不占用业务系统主机资源的情况,可以采用直接盘阵复制方法。

2 水利部电子政务系统数据迁移方案

水利部电子政务系统原存储系统为HP EVA3000,新存储系统为H3C IX3240E,共涉及24台主机,包括HPUX小型机和Windows系统PC服务器,其中HPUX小型机为数据库服务器,系统环境为HPUX Service Guard管理的Oracle10g的rac,需要迁移Oracle数据库的数据,Windows服务器主要是文件系统数据迁移。水利部电子政务系统存储升级改造数据迁移工作面临极大的挑战:

1)原存储系统和新存储系统分别为不同的品牌;

2)需要迁移的数据量在TB级别,迁移任务较重;

3)涉及电子政务的很多核心业务,业务连续性要求高,不能长时间中断业务;

4)涉及到多个业务平台,环境复杂,数据迁移过程中存在发生错误及数据不一致的风险;

5)涉及的主机是不同类型的操作系统,有不同的特点,不适合单一的数据迁移方式。

考虑到这些问题,水利部电子政务系统数据迁移根据不同业务情况采用多种数据迁移方式,其中HPUX小型机使用裸设备文件,数据量大,而且要求数据迁移时间尽可能短,不能影响水利部电子办公,因此排除了直接拷贝方式,而采用备份恢复的方式恢复数据库操作步骤相对复杂,并且恢复时间不能确定,因此最终选择逻辑卷镜像方式,以减少因数据迁移而中断业务的时间;Windows服务器设备多,但是迁移的数据量小,迁移的时间也比较短,而且主要是文件数据,因此采用直接拷贝方式,以减化操作,避免风险。

3 水利部电子政务系统数据迁移实施

水利部电子政务系统数据迁移包括HPUX小型机上数据库数据迁移及Windows服务器文件数据迁移,Windows服务器文件数据迁移使用直接拷贝方式,操作相对简单,本文重点介绍HPUX集群环境Oracle rac数据库迁移实施。HPUX环境Oracle rac数据库使用HPUX系统自身的LVM卷管理软件,采用逻辑卷镜像的方式,在数据同步的过程中,业务不中断。

主要实施过程如下:

1)数据迁移前的准备工作,通过这部分工作,可增加对系统环境的了解,降低数据迁移中的风险。

2)将新的H3C IX3240E存储系统分别连接到现有各系统服务器上,使得现有主机既可以看到原有的HP EVA存储系统,亦可看到新连接上的H3C IX3240E存储系统。此后,在LVM管理软件控制下,对建立在原有存储系统上的数据卷与新存储系统上的对应数据卷进行镜像操作,这样只是在主机上增加了原有数据卷的镜像卷,并不会影响原有的数据卷。

3)待数据完全同步后,将HP EVA存储系统上的数据卷从镜像卷中拆除出来,这样即使新存储系统的数据卷有问题,仍可以导入原存储系统的数据卷,从而达到将数据从HP EVA存储系统平稳迁移到H3C IX3240 E存储系统上的目的。

3.1 数据迁移前的准备工作

数据迁移前需要做一些准备工作,具体如下:

1)收集全面的系统背景信息;

2)对硬件安装步骤以及风险进行简单的分析;

3)硬件环境调试及准备;

4)停止业务,对HPUX小型机操作系统及数据库进行完整有效的备份。

3.2 HP EVA上的数据镜像至H3C IX3240E存储系统

为了保证存储的平稳过渡,先将HP EVA上的数据镜像至H3C IX3240E存储系统。主要实施步骤如下:

1)在新的H3C存储系统上创建与原有的HP EVA存储系统同样数量大小的物理单元,并分别表达给主机1,2;

2)在主机上查看新表达的物理单元;

3)把新创建的物理单元转换为物理卷;

#pvcreate/dev/dsk/c?t?d?

4)把新创建的物理卷添加到对应的卷组中;

#vgexend/dev/vgoarac/dev/dsk/c?t?d?/dev/dsk/c?t?d?…

#vgexend/dev/vgpubrac/dev/dsk/c?t?d?/dev/dsk/c?t?d?…

#vgexend/dev/vgoalog/dev/dsk/c?t?d?/dev/dsk/c?t?d?…

#vgexend/dev/vgegov/dev/dsk/c?t?d?/dev/dsk/c?t?d?…

#vgexend/dev/vgoarac2/dev/dsk/c?t?d?/dev/dsk/c?t?d?…

5)用逻辑卷镜像方式将数据从原数据卷复制到新数据卷;

#lvextend–m 1/dev/vgoarac/system/dev/dsk/c?t?d?

#lvextend–m 1/dev/vgoarac/temp/dev/dsk/c?t?d?…

6)检查数据和应用的完整性。

3.3 拆除HP EVA上的数据镜像

HP EVA存储与H3C IX3240E存储经过一段时间的并行使用后,如果状态正常运行稳定,实施替换HP EVA存储系统,拆除HP EVA上的数据镜像,从而彻底过渡到单独使用H3C存储系统的状态。主要实施步骤如下:

1)停止应用程序及操作系统双机集群软件;

#cmhaltcl–fv

2)在主机1上单独激活数据卷组;

#vgchange–c n–S n vg?

#vgchange–a y vg?

3)在主机1上查看HP EVA对应的卷信息;

4)将HP EVA存储系统对应的数据卷从镜像卷中拆除;

#sldb1_lvreduce.sh

5)把HP EVA存储系统划分的物理卷从对应的卷组中删除;

#sldb1_vgreduce.sh

6)在主机上删除相应卷组;

7)卸载HP EVA多路径软件;

#swremove

8)安装H3C IX3240E多路径软件;

#swinstall

9)调整光纤交换机,从原有的HP光纤交换机迁移到新的EMC光纤交换机;

10)在主机2上导入上述卷组,创建/etc/lvmpvg配置文件;

11)调整双机配置并重新应用;

12)启动操作系统双机集群软件;

#cmruncl–fv

13)在主机1,2上以共享方式激活数据卷组;

#vgchange–c y–S y vg?

#vgchange–a s vg?

14)在主机1,2上启动双机应用包;

#cmrunpkg ora

#cmrunpkg ora2

15)启动数据库及应用;

16)检查数据和应用的完整性。

3.4 数据迁移后的数据一致性检验[2]

在数据迁移完成后,对Oracle数据库基本信息进行一致性测试。对比数据库迁移前后的执行结果,查询结果是否完全吻合。对于存储上的系统文件,主要看物理信息在迁移前后是否完全吻合。在任何一种数据迁移完成后都将进行检查以验证迁移的数据一致性。

数据库基本信息的一致性测试检查主要包含以下几个方面:

1)Oracle数据库版本的检查

select*from v$version;

2)Oracle数据库实例状态的检查

select instance_name,version,status,database_status from v$instance;

3)Oracle数据库控制文件的检查

select*from v$controlfile;

4)Oracle数据库重做日志文件的检查

select*from v$logfile;

5)Oracle数据库所有数据文件的状态检查

select name,status from v$datafile;

6)Oracle数据库所有表空间的状态检查

select tablespace_name,status from dba_tablespaces;

7)Oracle数据库表空间管理方式的检查

select tablespace_name,extent_management from dba_tablespaces;

8)Oracle数据库所有用户状态的检查

select username,password,account_status,lock_date,default_tablespace,temporary_tablespace,created from dba_users;

9)Oracle数据库各个用户下所有表总数的检查使用不同的应用的用户连接到数据库,执行

select count(*)from user_tables。

4 结语

水利部电子政务系统数据迁移是一个复杂的过程,数据迁移的成败直接影响系统的运行情况,因此需选择一个安全可靠的方案,能在保证数据完整性和安全性的前提下,实现数据的平稳迁移,减少水利部电子政务系统的停机时间。实际运行情况表明,HPUX小型机采用逻辑卷镜像方式,Windows系统PC服务器采用直接拷贝数据迁移方式实现了水利部电子政务系统数据的可靠和较快速的迁移,为系统的正常运行提供了重要保障[3]。数据迁移完毕之后,H3C存储系统成为水利部电子政务系统存储的核心,实现了信息的最大程度共享,提高了整个系统的可用性和可靠性。

参考文献

[1]百度文库.数据迁移方法概述[EB/OL].[2012-11-10].http://wenku.baidu.com/view/d874e719964bcf84b9d57b3f.html.

[2]上海怡德数码技术有限公司.Delteq-EMC数据迁移方案[EB/OL].[2012-11-10].http://wenku.baidu.com/view/3f9a8918650e52ea551898e5.html.

8.数据挖掘技术的电子商务系统研究论文 篇八

关键词:可扩展标识语言、关系型数据库、数据交换

一、引言

异构数据库分布在网络的不同位置,其异构性体现在DBMS(Database Management system)运行的系统环境和使用的数据模型的不同,以及用户各自独立对数据进行建模而引起的数据结构和数据语义表达的差异。系统异构给数据库间跨网络的互操作带来困难,模型异构使得用户无法使用本地的数据库语言访问异构数据库中的数据,结构异构和语义异构则使应用系统难以理解异构数据库中的数据并对其进行分析和处理。因此,这些异构数据库就象一个个“信息孤島”,彼此间的共享存在困难。

数据交换是实现异构数据库共享的途径之一。解决异构数据库的共享主要有远程访问、数据库集成、数据交换等方式,其中数据交换是用源数据库的使双方的数据互为补充,达到异构数据库共享的目的。

二、研究内容

XML是一种数据格式描述的元语言标准,具有系统独立性、可扩展性、自描述性、遵循严格的语法规范以及支持多语种等特点,自产生之后就迅速被作为中间数据格式标准应用到数据交换领域。作为数据交换的中介,XML不仅能够提供对数据的存储,还包含对数据结构的描述回。XML的系统独立性使得XML数据能够在不同的系统中使用各种编程语言解析和处理,屏蔽了异构数据库间系统环境的差异。因此,基于XML的数据交换方案已经被广泛用于解决网络环境下异构数据库的共享。

本文主要研究如何实现各个关系型数据库之间的信息交换。XML是一种新型的数据交换标准,通过XML和JDBC,Hibernate,J2EE等技术的应用可以实现不同数据库间信息的交换。为完成数据库到XML和XML到数据库之间数据的交换与传递,系统解决了XML文档结构和数据库结构之间的映射,研究XMLSchema与关系模式之间的映射,这一步采用的是Xmlbeans与Java反射机制。还研究了基于XML的数据交换系统的设计、运行机制等。

三、XML技术

XML为ExtensibleMarkupLanguage的简称,即可扩展标记语言。XML的出现就是为了要应用于各个不同的层面,可根据应用领域的不同,而以不同的方式来描述文件。简单地说,对XML是以一种简单、标准、并可扩充的方式,将各种信息如文本、表格,甚至图形等以原始数据的方式储存。在储存的过程中,加入一些可供识别的标记,而凭借这些可供识别的标记,在网络上的服务器可将信息内容做进一步的处理,从而得到所需的信息。

四、XML数据交换方案设计

(一)系统设计

基于XML的数据交换方案使用较为广泛,方案是实习依赖与XML模式与关系模式,在进行关系模式与XML模式转换时,需要对数据进行操作和处理以消除异构性,因此灵活性较差。针对这一问题,利用XMLSchema对数据的结构、类型和约束的强大表达能力,由源方和目标方分别对各自的关系模式进行描述,构造源XML模式和目标XML模式,然后在源XML模式和目标XML模式间建立匹配规则来实现异构数据库的交换。数据交换过程中,源方将关系数据转换为源XML模式的数据,然后由按照匹配规则将源XML数据映射为符合目标XML模式的数据,消除数据异构性,交付给目标方,目标方再将目标XML数据转换为关系数据入库。

异构数据库交换方案包括三个部分,源数据库方、数据转换方和目标数据库方。源数据库方负责提供源XML模式以及将关系数据封装为源XML数据交付给数据转换方;目标数据库方负责提供目标XML模式,按该模式接收XML数据并转换为关系数据装载入库;数据转换方负责将源XML数据映射为目标XML数据并交付到目标数据库方。数据转换方根据源XML模式和目标XML模式与目标数据库方交互生成,并保存在数据转换方,用于数据映射。由于数据交换是双向的,因此这里所说的源方和目标方是相对的,可以根据实际的数据交换方向来确定。所以,源方是交换中提供数据的一方,目标方是接收数据的一方,数据转换方则是提供交换服务功能的一方。

(二)系统实现研究

1、数据提取模块的实现

该模块完成从源数据库中提取数据的功能。本模块中我们用到了Hibernate框架,通过Hibernate建立关系——对象映射,方便数据的存取。

2、模式转换模块的实现

该模块是本系统的核心模块。该模块完成源数据库模式到目标模式的转换。消除数据库表结构,数据类型的异构性,达到数据库间进行数据交换的目的。

模式匹配的具体实现分两个步骤:

1)XML模式到JAVA对象的映射。

这一步是通过Apache的开源项目XMLBEANS来实现的。利用XMLBEANS,我们能很方便的完成XMLSCHEMA到JAVA对象的映射。

2)通过反射机制实现源方与目标方的模式匹配。

反射机制是java中十分重要的特性,利用它可以在运行时进行必要的处理。通过反射,我们可以得到源模式下的javabean对象的字段与目标模式下的javabean对象的字段,通过字段的对比以及预先定义的规则可以完成简单的映射,消除数据的差异。

3、生成目的XML数据文件及其入库

本模块通过数据转换模块的对象把数据提取模块的数据转换为目标模式下的javabean对象。然后再通过XML文档处理对象把javabean对象写入目标XML文档。最后,将目标XML文件导入目标数据库。

(三)模式转换

系统核心模块-模式转换的流程。这个过程是完全封装的,实现了平台和网络的透明性、数据模型的转换、模式转换和分布环境的支持的透明性。

第一步Hibernate把源数据库中的表关系映射到具体的Java对象,通过操作Java对象来处理关系数据库;第二步通过Xmlbeans处理目标XMLSchema的结构、元素等信息,建立目标XML模式到Java对象的映射以及目标XML文件处理对象;第三步通过反射机制,分析Hibernate映射对象与目标XML模式的Java映射对象,把Hibernate映射对象的数据信息转入目标XML模式的Java映射对象中,这样就能在第四步使用目标XML文件处理对象生成基于目标模式的XML文件;最后目标XML文件处理对象完成XML文件处理,得到目标数据库映射对象,再通过Hibernate存入目标数据库。

由于系统在不同的数据库间进行数据交换,可能由于数据库地址变化,或者数据库名称改变,所以系统提供了数据库配置功能,完成数据库配置,基本实现数据库位置的透明性。

五、总结

目前,对异构数据库的研究还处在发展阶段,它的研究不仅仅涉及到不同的数据库系统本身,还要考虑到许多复杂的因素:平台和网络的透明性、数据模型的转换、模式转换和分布环境的支持、位置的透明性等。

9.数据挖掘技术的电子商务系统研究论文 篇九

随着大数据时代的到来和市场经济的高速发展,各行业数据源的增长呈现指数级趋势,数据的规模和复杂程度迅速扩大,从海量数据中提取有效信息并加以精确化正日益成为企业战略决策的必要因素[1]。电子商务企业预算管理实施过程中大数据所具有的战略意义不仅仅局限于收集和整理庞大的数据信息,更在于如何有效且精确化处理和分析该数据,尤其是将精确数据结合到预算管理方面,改变传统数据分析存在的滞后性和低频性等问题,从而有效地组织和协调电商企业的经营活动,实现企业战略目标。近年来,随着当当、阿里巴巴和京东商城的陆续上市,中国电子商务企业在大数据的浪潮中不得不审慎面对海量的财务数据,因此,基于精确数据的基础构建有效的财务预算管理体系势在必行。

10.数据挖掘技术的电子商务系统研究论文 篇十

Web挖掘技术在远程教学系统中的应用

远程教学系统是从事远程教学的重要环境.本文分析了传统远程教学系统的不足,给出了一种基于Web挖掘技术的远程教学系统模型,并对组成该系统的关健模块进行了介绍.利用Web挖掘技术,提高了系统的`整体性能,满足了远程教学的个性化需求.

作 者:侯雪亚 HOU Xue-ya 作者单位:江苏技术师范学院,计算机科学与工程学院,江苏,常州,213001刊 名:电脑知识与技术英文刊名:COMPUTER KNOWLEDGE AND TECHNOLOGY年,卷(期):5(5)分类号:G43关键词:Web挖掘技术 数据挖掘 远程教学系统

11.数据挖掘技术的电子商务系统研究论文 篇十一

关键词:应用系统;数据整合;实现策略

中图分类号:TP393.18

经过多年的发展和累积,各高校的基础硬件环境已经有了大幅度的提升,各类应用系统投入使用,信息化建设取得了较好的成果。但是,某些关键性的问题依然有待研究和解决,例如,信息标准规范不够统一,导致现有的数据较为混乱,严重影响了学校数据资源的使用效率。为了充分利用学校现有的数据资源,提高现有应用系统数据资源的使用效率,数据资源的一体化整合成为高校信息化建设中的重点问题。

1 数据整合技术在高校中的必要性

1.1 应用系统与数据之间的分布

为了满足高校信息化建设的发展需求,高校陆续完成了多套应用系统的开发设计,各系统在使用的过程中聚集了许多基础数据。但由于这些基础数据在开发时间、开发厂商以及存储设备上的差异,使得数据管理极为不便,很多数据出现了重复性或不一致性的状况。这些现象导致各系统间的数据无法直接实行对比解析,严重影响了高校领导对决策性数据的查询和使用。

1.2 信息资源利用率较低

目前,高校信息化经过建设与积累,已形成了百兆与千兆相结合的网络主干结构,并具备一定冗余的小型机服务器作为应用服務器。然而,因为早期开发的系统环境比较分散,系统之间缺乏数据上的交换,很多信息资源无法实现共享,导致高校信息统一平台及各种信息管理系统缺少完整、实时的数据。

1.3 支持决策能力较低

由于不能使用统一的标准和规范来定义数据,因而无法提供统一的数据接口来共享通用数据源,这样就造成了不同的应用系统间的相互隔离,形成了“信息孤岛”。“信息孤岛”是高校信息化校园建设中亟待解决重要问题,所以,怎样消除“信息孤岛”,并将现有及未来即将建立的应用系统数据资源有效快捷整合,已成为目前高校信息化校园建设的至关重要的关键所在。

2 数据整合的模式

2.1 数据集中模式

为了满足各部门的应用需求,使应用数据的管理与维护工作更加便捷,必须要严格遵守高校制定的信息化建设标准,搭建全院共享的数据中心,用以存储各应用部门的数据信息。需要应用平台的统一设计,而应用子系统构建在统一的框架中。其优势在于各子系统间存在较高的耦合度,数据中心与子系统之间的无缝连接易于实现。但这样就造成开发周期相对较长,因为数据的交换是通过数据中心与各部门所有业务间进行,如此用户的需求不好准确把握,适应用户的灵活度较低。

2.2 共享数据中心

信息资源的整合建立在现有应用系统不变的条件下,抽取应用系统中具备共享价值的数据信息,进行共享数据中心的搭建工作。各部门还在原来的应用系统中进行数据的读写操作,只有在某些数据操作涉及到其他部门时,应用系统才会通过前期的部署工作录入共享数据,达到数据层的互联实现。

2.3 分布式资源整合

分布式资源整合的操作与共享数据中心类似,如果在本地操作数据,应用系统则只涉及本地数据访问;如果是与数据中心进行互联,那么则是涉及与其他部门的数据访问。然而,分布式资源整合的方式是搭建资源索引库,这种方式与搜索引擎极为相似,它是对各部门共享的数据进行收录,同时确定数据在网络中实际所处的方位,但原始数据仍然保存在各部门内部,这就是资源索引库与共享数据中心的区别所在。

3 数据整合的实现策略

3.1 数据交换模式

应用系统与数据中心的数据交换方式,一般有两种:

(1)与企业服务总线直接连通,从而进行应用系统数据库的访问。

(2)新建应用系统数据库中的数据交换中间表,经过企业服务总线的客户端,与共享数据中心数据库相关联的对象实现共享,并进行数据交换。

3.2 创建数据交换中间表

数据交换中间表是一种数据字段表,它是按照应用系统与共享数据中心的数据交换要求而建立的,字段中所对应的数据都来自共享数据中心,同时也来自所建立中间表的应用系统,它是应用系统与数据中心之间同步操作的桥梁和纽带,同步原理图如图1所示。

3.3 同构数据库的整合

同构数据库是指数据中心的数据库软件及版本与应用系统的数据库完全相同。但由于应用系统数据安全性和共享的系统数据的独立性方面的考虑,建议数据整合使用在应用系统中建立数据中间表的方式来完成。

3.4 异构数据库的整合

异构数据库是指共享数据中心与应用系统所使用的数据库软件厂商不同。对于异构数据库的数据整合,通常采用两种方法:一是需要建立数据中间表的方式,进行异构数据库系统与共享数据中心数据库间的数据交换。二是使用数据交换工具配置数据交换流程,抽取共享数据进行清洗、转换、存储共享等操作,实现同步并交换数据的过程。

4 数据整合的实际应用

4.1 连接异构数据库

如何与整合后的应用系统数据库进行连接,是搭建统一身份库之前需要解决的问题。在Identity Manager体系结构中,Metadirectory引擎模块起着关键性的作用,在不同数据系统之间如果想实现数据的共享,只要通过Metadirectory引擎模块提供的接口,Identity Manager驱动程序就会与中央身份库目录树(Identity Uault)进行信息的同步,最终实现数据的共享。Metadirectory 引擎如图2所示。

4.2 差异数据同步

针对大批量的数据同步,最关键的环节是如何将每次同步的数据量尽可能的降到最低,以实现带宽损耗量的降低,从而提高数据的同步效率。合理的解决这个问题的方法就是Identity Manager,Identity Manager Driver为了获取差异数据会定时进行数据库的扫描,若扫描结果为空,则不会执行同步操作。

4.3 单点登录系统

单点登录系统建立在统一身份库的基础之上,它主要是为了统一身份库中的用户身份,使其能够实现进行一次系统登录后就能访问平台中相互信任的应用系统的目的。同时,还能通过外网登录访问校园网资源,因此该系统必须建立在基于反向代理服务的基础上。

4.4 共享数据平台

建立好统一认证平台后,需要搭建共享数据平台,共享数据平台同样是应用系统的重要部分,在相当程度上奠定了之后的数据挖掘和大数据仓库工作的基础。共享数据平台的建设主要使用数据抽取技术,主要是从各应用系统中提取所需数据,使用预先制定好的规则转换所抽取到的数据,之后把转换后的数据按照计划增量或全部导入到其共享数据库或数据仓库中。数据整合的流程如图3所示。

5 结束语

在高校环境下的信息化发展中,整合应用系统不仅是一项十分繁杂的工作,也是一项必不或缺的重要环节。各个应用系统通过数据底层实现相互连通,达到实现数字化校园的真正意义,从而实现教学统一、教管统一的真正目的。进一步从人、财、物、管等四方面实现信息高标准,并对统一信息标准的支持,实现学校全局的多维度多视角的信息采集与分析过程,为学校的进一步发展提供综合而全面的信息资源大环境。

参考文献:

[1]陈敏,周江波,高晖.大型数据资源的整合共享与利用研究[D],电子政务,2013(03):44-50.

[2]郭丹,高校教育管理信息资源整合的研究[J],东北石油大学,2012.

[3]冯晓娟,校园信息建设中的数据整合[J],中国科教创新导刊,2012(17):6-11.

作者简介:吴士杰(1978—),男,天津人,讲师,主要研究计算机信息管理及网络技术。

12.数据挖掘技术的电子商务系统研究论文 篇十二

利用商务智能系统进行企业决策性分析已经成为众多企业提高竞争力的重要方法之一。但随着信息量的快速增长和市场竞争的日趋激烈,传统意义上通过历史性数据分析来帮助企业进行决策支持已经无法满足用户需求,企业能否快速获取实时业务数据进行分析,并作出准确的反应决定了企业的存亡。由于企业各类信息获取平台的异构性,往往开发麻烦并且不好维护,同时这一过程需要频繁的手工处理[1]。

本文提出了利用变化数据捕获技术构建数据仓库,并通过反向分发将信息推送到需要的系统的思想,改变了数据从前台到后台的单向瀑布,是一个闭合的数据价值过程。前台作业变化之后,及时捕捉到这个变化,将它交给相关作业系统或商务智能平台进行分析,升华出一定知识和经验。但这个价值过程没有结束,这些提炼出的知识和经验的变化后续再次被抓取出来,重新作用于前台作业。

1 商务智能

商务智能是一套完整的解决方案,是提升决策能力的概念、工具、方法以及应用软件的一整套组合,从软件系统应用角度看是数据仓库、联机分析处理、数据挖掘等技术方法和工具在商业活动中的集中应用。其工作原理是从企业各类数据源收集数据,经过抽取(Extract)、转化(Transform)、加载(Load),送入数据仓库,使用数据查询分析工具、数据挖掘工具和联机分析处理工具对信息进行处理,并以定制的动态报表实时展示,从而将信息转变为辅助决策的知识,最终呈现给用户。商务智能软件的功能有:多维数据分析及展现、报表工具、趋势分析、可视化工具、数据挖掘等。

在满足商务智能各基本功能的前提下,企业对如何保证获取和分析数据的实时性更为关注。即:数据抽取、转换、加载、集成的实时性和分析,以对决策提供实时支持。

2 动态数据仓库

动态数据仓库是对传统数据仓库的延伸和扩展,通过动态数据加载,动态事件驱动和动态数据访问,对不同用户群体(管理层、分析师、业务员)进行分门别类的决策支持,将原来后台的商务智能推向前端,使实时商务智能[2]成为可能。

2.1 数据实时加载

数据仓库作为商务智能的重要依托,是对“海量数据”、“大数据”进行分析处理的核心物理架构。借助数据仓库技术,可以将来自于不同数据源平台(如CRM、SCM、ERP、OA以及企业外部的系统和零散数据)格式不一的数据处理成语义格式一致的多源数据进行存储。以往数据仓库很强调海量,但随着商业机会出现的周期越来越短,只有少数行业垄断企业凭借海量数据获得商业智能素材,对于大多数企业而言必须快速地掌握信息变化,即便是小量、甚至个别的信息也有商机可挖。由此可见,更快的动态数据日益成为今后的主流。相比传统数据仓库,动态数据仓库强调数据的及时性和同步,其实质是将数据仓库和一个运作数据存储结合起来,以便对数据同时更新,并从同一个中央仓库中获得时间敏感性数据和详细历史数据。

动态数据仓库关键是动态加载数据,也就是数据仓库的ETL过程。ETL是将业务系统的数据源按一定顺序进行采集,然后按照数据存储结构进行合理的转换,并将源数据中出现的二义性、重复、不完整、违反业务或逻辑规则等问题统一进行处理,最后按照数据仓库的结构进行数据加载,也就是常说得数据抽取、转化、装载。这一过程实现了多种类、多平台数据源的整合,解决数据在时间、不稳定性、依赖性等方面的差异,保证数据一致性,达到正确理解数据业务含义的目的,这也是ETL技术核心所在。数据的实时加载有多种方法,早期有短时间间隔内批量数据抽取盒利用EAI消息队列的数据传输,后有利用SOA框架和XML统一数据格式解决数据与数据源的实时同步问题[3,4]。

随着数据库技术的发展,变化数据捕获已成为帮助我们迈向数据仓库之父Inmon描述的DW2.0技术时代。变化数据的捕获、存储、抓取的内容不限于关系数据表、文件、消息队列等,SOA环境下的消息落地机制一样可以被集成[5,6]。在新的数据架构中,动态更新数据将成为驱动企业整个服务环境的触媒。

变化数据捕获的常用方法有:(1)基于快照差分的抓取方法[7]:先生成两个数据源快照,然后比较并计算出变更数据,这种方法对信息源依赖弱或没有依赖,但是抓取变更数据的效率低,延迟时间较长;(2)基于触发器的抓取方法:使用信息源数据库的触发器机制抓取变更数据[8],抓取的变更数据实时性较高,但对信息源数据库的事务处理影响较大;(3)基于事务日志的抓取方法:利用数据库日志机制,分析数据库的事务日志,计算出变更数据,抓取变更数据的效率相对较高,并且对信息源数据库的事务处理影响较小;(4)数据库管理系统提供的变化数据捕获方法[9]:现在主流的商业数据库厂商都推出了基于日志的数据抓取工具,Oracle、DB2、SQL Server均为比较成熟的关系型数据库系统,且具有完备的日志结构,在数据库的适当配置下,数据库中的Delete/Insert/Update操作都将在其日志文件中有足够的信息去记录。通过对日志的读取和分析,就可以实现变化数据捕获。

2.2 事件检测处理

动态数据仓库另一个特征是在事件发生时,主动进行检测,对其进行相应处理,并将结果自动反馈给用户或业务系统,使用户作出快速响应。事件可以是根据业务规则所定义的事件,也可以是基于时钟的事件[10,11],一般包括同步事件处理和异步事件处理:(1)同步处理要按照各步骤之间的依赖关系顺序执行,即每一步动作都要等上一步动作执行完成后再进行;(2)异步处理中各个动作之间是松耦合的,每一步操作并不依赖上一步的动作是否完成。

3 基于动态数据仓库的商务智能系统设计

3.1 框架设计

商务智能系统从企业项目管理、资源规划、客户关系、供应链、OA等各系统中获得数据。通过智能分析工具挖掘企业现状,发现商机进行决策。

基于动态数据仓库的商务智能系统架构包括源数据、动态数据加载、数据仓库、应用层(OLAP、数据挖掘、报表工具等)以及用户层。源数据来自于企业现有的各异构数据库;动态数据加载则是通过变化数据捕获实现异构数据源数据的集成过程,完成数据抽取、清洗/转换、实时加载与索引等数据调和工作,目的是为运营分析与决策应用提供一个单一的、权威的数据仓库;顶端数据共享与分析展示包括应用层和用户层,应用层包含数据挖掘、智能分析、报表展示等一系列前端分析工具,用户层是对分析结果的多样化展示。

动态数据仓库根据数据获取、存储和数据分析分为两层:中央数据仓库层、数据分析层。

中央数据仓库作为数据模型的核心又包括周期数据、实时数据和汇总数据。周期数据以批量形式采用传统ETL进行加载,加载的数据包括一次性导入和定期更新的数据,一般为相对稳定、面向主题及细节的数据,经过数据的抽取、清洗/转换、加载与索引等工作后成为历史的、规范的数据;实时数据采用CDC技术从各数据源实时抓取,主要是敏感的、其变化对决策影响较大的数据。由于结构和表示的不同,要经过清理,然后加载到数据仓库中;汇总数据从周期数据和实时数据中按照业务需要进行多维建模,在数据分析前进行的数据汇总整理,以提高数据分析效率。

图1 基于动态数据仓库的商务智能系统架构

数据分析层为主题应用提供服务,满足特殊的商务需要,用于支持查询、分析、报表、数据挖掘等功能,同时也包括用于预警分析和风险分析的数据模型。

3.2 数据抓取

数据抓取过程按频率不同分为周期性和实时抓取两种。周期性抓取按天、周或月进行数据抽取。时间间隔越小,数据同步越接近实时,但利用成熟商用数据库提供的数据抓取方法基本可以实现实时数据同步。变化数据捕获原理是采用基于主动规则的事件触发机制,当检测到定义的事件发生时,按照定义好的规则执行相应的动作,进行数据更新。可以把业务数据库的某些特定数据变化定义为事件,事件可以通过监控数据库事务日志来实现检测。

下面介绍基于日志的变化数据捕获方法[12]。基于日志的变化数据捕获,是通过分析基表变化的日志,获得所需要的变更数据。数据库中的插入、更新和删除操作都在日志文件中进行。通过读取日志,把捕获源表的变更数据存入跟踪的变更表中,并在更改表中添加有关更改信息,利用函数查询变更数据,给出筛选结果,将其加载到数据仓库中。目前SQL Server、Oracle、DB2都提供事务日志异步读取的CDC产品,可以用于构建动态数据仓库。

图2 数据抓取和反向分发

变化数据捕获CDC为商务智能系统实时同步数据提供了新模式,解决了传统ETL难以处理的一些集成问题,实现持续集成,与触发器、快照查分等方法比较,基于日志的变化数据捕获方法具有对数据性能影响较低、获取数据延迟时间短、保证了事务特性等优点,可以广泛应用于动态数据仓库数据集成。

3.3 数据反向分发

动态数据仓库中各类变更数据可以反向抓取到其它应用系统。此时的变更数据可以包括业务系统的变更,也可以是商务智能平台执行的决策信息以及总结的经验知识。这是一个事件主动检测过程,使得在突发事件发生时,各应用系统相应时间和决策处理的起步时间相同,在为高层提供数据决策支持的同时,也满足了一线用户进行动态访问快速了解事件的需要,为商业决策和后续处理争取了宝贵时间。另一方面,通过商务智能平台形成的经验知识也可作用于前台系统。

4 应用实例

下面以企业项目管理系统、财务预算系统、报销系统、合同系统、采购系统说明基于变化数据捕获构建动态数据仓库,通过商务智能系统分析,反向限定企业各类业务,保证企业正常运转之过程。

挣值原理是指引入已完成工作的预算值即挣值(EV),用来对项目费用/进度进行综合评估,即在项目实施过程中任一时刻,已完工作的预算值与该时刻此项工作计划的预算值(PV)进行对比,以评估和预测其工作进度,并将已完成工作的预算值与工作实际消耗值(AV)作对比,以评估和预测其费用的执行效果,其中EV=PV×计划完成百分比。同时还可计算出CV(费用偏差)、SV(进度偏差)、CPI(费用绩效指数)、SPI(进度绩效指数)等值,进行企业运营情况评估[13,14]。

通过上述分析,要计算挣值,需要有企业工作分解结构(WBS)、计划完成百分比、基于工作分解结构的预算、支出等信息。计划完成百分比通过计划预计工作量和实际工作量以及计划权重计算得来。

图3 动态数据仓库实例

动态数据仓库的周期数据、实时数据主要包括项目工作分解结构表、工作量表、财务预算表、网报表、合同表、采购表。其中工作分解结构、网报、合同、采购数据需要实时更新,实时反映企业工作计划和各类支出信息,工作量数据每月定期更新,预算数据每年更新两次。根据上述基础数据形成汇总数据,包括计划预算值(PV)、工作实际消耗值(AV)、计划完成百分比等。

工作分解结构是反馈工作量、预算、各类支出费用的基础,工作分解结构通过数据抓取实时同步到数据仓库中,同时将其反向抓取到合同、采购和报销系统,用于将预算、支出费加载到各计划节点上,累计得到计划工作的预算值(PV)和实际消耗值(AV),存储到汇总表,明确各项工作任一时刻的财务收支情况。项目管理系统中每月工作量反馈完成后,根据预计工作量、实际工作量和计划权重计算完成百分比,最后计算挣值(EV)。这样在商务智能系统前台展板即可绘制出针对项目及各关键计划节点的PV曲线、AV曲线和EV曲线,进行挣值分析。此时一旦发现支出费用超标,则在BI系统中提出预警。据此修改数据仓库的预警系数,该预警系数通过数据抓取实时分发到合同、采购、网报系统,以有效控制企业资金流。

5 结语

13.数据挖掘技术的电子商务系统研究论文 篇十三

电子商务的大规模快速发展已经改变了制造业务,大家都可以发现无论是B2C的京东、天猫还是B2B的淘宝等电子商务公司实际上销售的基本上是制造业的产品,如鞋子、电器、笔记本以及衣服等等,这些电子商务平台上销售的产品基本上可以通过物流实现邮寄和其他服务,而且基本上采用的是第三方支付平台。

但是在实际生活中,我们除了消费各种制造业厂商的鞋子、帽子和电器外,还在大量消费美容、教育、保健、火锅以及各种服务,那么这些产品和服务无法通过物流和邮寄实现,那么如何通过电子商务平台进行销售和营销呢?

因此,当电子商务平台从销售制造业产品到销售服务类产品的时候,电子商务就从B2B/B2C/C2C模式演进到O2O模式,即Online to Offline。但是我们在实际O2O业务运营过程存在非常难以解决的问题,即O2O闭环服务问题,如何将第三方电子商务平台、服务商家以及消费者很好的捆绑在一起,实现如京东商城、淘宝商城的产品销售-支付模式,这是摆在众多电子商务厂商目前的核心问题。

随着各种智能终端渗透率提高,移动电商生态体系逐渐成熟,用户支付习惯逐渐养成,人们发现了二维码这个O2O市场重要的平台、入口和工具,其商业价值逐渐凸显。二维码最大的价值在于其平台化的特点,最大的商机在于其典型的O2O模式,特别是二维码作为一个线上的入口,与手机支付相结合,通过手机就能完成支付过程,让O2O成为了一条完整产业链。因此,二维码实际就是O2O中连接线下商家与线上信息的中间平台。

综上,我们提出了基于二维码技术的电子商务O2O闭环服务系统项目,其主要作用是实现一条完整的可以在服务类电子商务平台上使用和运营的O2O支付和服务系统,其将能够有效解决O2O平台的电子支付和服务问题。

二、项目主要研究内容与框架

基于二维码技术的电子商务O2O闭环服务系统项目主要研究内容:

(1)二维码技术的深入研究,主要研究内容是二维码的技术实现、安全问题以及二维码传输和保存技术、二维码验证技术等。

(2)O2O电子商务平台的开发和实施,将以美容院优惠卷为案例开发和实现一个O2O类电子商务平台,作为验证和实施O2O闭环服务的实验和管理平台。

(3)基于二维码技术的O2O闭环实现流程,主要研究内容包括商家二维码生成和管理、二维码发布、二维码下载以及二维码保存、二维码验证等完整的基于二维码技术的O2O闭环流程。

(4)二维码和手机支付软件的接口技术,主要研究和实现二维码验证技术以及后续的手机支付接口,实现二维码验证后的费用支付手段和过程。

(5)电子优惠卷业务的开发和实现,主要基于二维码技术开展各种商家的优惠卷服务,主要研究内容包括平台开发和业务推广等工作。

14.数据挖掘技术的电子商务系统研究论文 篇十四

取消方案一中的中间库数据迁移工作,采用数据同步技术,提前将老系统的数据同步至中间库,在老系统业务停机几小时后即可完成数据同步,开始进行数据转换,既降低方案一中的网络带宽花销,又减少了方案一中老系统至中间库的数据迁移时间。数据同步需在老系统数据库与中间库上部署数据同步软件,该软件从老系统生产数据库中获取实时数据,与中间库建立连接,将实时数据同步发送至中间库[2]。

数据同步包含首次数据同步与增量数据同步,首次数据同步指数据同步软件将有迁移需求的数据以某时间点为截止全量迁移复制至目标数据库,增量数据同步指首次数据同步结束后到业务系统停止时将所产生的新增数据实时同步至目标数据库。增量数据同步的原理为实时分析源端数据库的日志,生成数据变动的压缩表,以捕获增量数据,数据经压缩和加密后传送至目标数据库,经过目标库数据同步软件的.装载后,即实现了增量数据的同步。

2.2.2、分库并行数据转换

在采用实时数据同步的基础上,放弃使用原有中间库,新建 4 个中间库进行数据转换及校验工作,中间库既作为数据源也作为数据迁移中间库,可实现 4 个中间库并行的数据转换及迁移工作。在此过程中需要数据同步软件将老系统数据实时同步到 4 个中间库 , 正式数据迁移开始之后即可开展数据转换、校验、整改与迁移工作。按此方案,采用并行的数据迁移方式,可在不同的中间库分配不同的供电局业务数据,相较之前的单链路串行数据迁移方式,即需要按顺序依次进行各局数据迁移、转换的方式,此方案极大程度提高了数据迁移所需时间,方案二如图 2 所示。

2.3、对比结论

试点局上线进行数据迁移工作时采用数据迁移方案一,数据迁移时数据量约为 1 T,耗时为 4 天。由于南方电网营销管理系统后续上线供电局较多,迁移数据量较大,约为 2 T,采用方案一耗时较长。在数据迁移过程中,为保障新老系统数据的一致性及数据迁移的成功率,需要对老系统进行业务系统停机处理,若按方案一,需要对老系统停机 7 天或更久。停机时,无法进行客户算费收费工作,而电网公司业务上不允许长时间对业务系统停机。为保障电网公司利益不受损失,市场营销业务能正常快速开展,综合对比后正式数据迁移采用数据迁移方案二。

3、数据迁移改进方案实施应用

3.1、数据迁移方案实施

3.1.1、全量数据实时同步

通过对业务数据量及服务器性能分析后,4 个分库的建设工作顺利完成。在正式数据迁移开始前,需完成全量数据实时同步工作。同步过程需要使用数据同步软件将数据从老系统同步至 4 个中间库,因此需要在老系统数据库服务器上及 4 个中间库上分别安装部署数据同步软件。此次同步为异构服务器且不同数据库之间的数据同步,源端(老系统)为 AIX 服务器,目标端(中间库)服务器为 LINUX 服务器;源端数据库版本为 oracle10g, 目标端版本为 oracle11g。

由于分为 4 个中间库,首先需在源数据库和目标数据库创建 4 个同步队列,随后在源端数据库与 4 个目标端数据库创建同步用户,最后在源端导出数据库结构并在目标端进行导入。上述准备工作完成后即可开始同步数据,同步完成后进行同步数据比对工作,比对内容为源端与目标端核心数据表的记录数与内容。针对比对后遗漏或缺失的数据表,采取两种方式进行修复:对于数据量比较小的表,通过ORACLE DBLINK 技术进行修复;对于数据量比较大的表,采用数据同步软件进行重新同步。

正式上线前一天,首次数据同步开始,通过数据同步软件将老系统数据库数据从 AIX 主机(老系统数据库)同步至 4 台 LINUX 主机(4个中间库)。首次数据同步完成后,开始增量数据同步。在老系统业务停止后,实时增量数据同步结束,开始进行数据比对与修复工作,约两小时后,数据比对修复工作完成,一致率100%,数据同步工作顺利完成。

3.1.2、并行数据转换与迁移

数据同步完成后,在 4 个中间库同时开展数据转换与迁移工作,根据“南方电网营销系统物理数据模型”为标准,开展新老系统数据转换与迁移工作,将老系统数据编码通过数据库脚本转换为新系统所支持的数据编码。为提升数据迁移脚本执行效率,在数据迁移脚本中适当加入索引能提高数据库的性能,建立索引之后,可以合理的使用资源;此时同样需要由良好的 SQL 语句进行支持[3],进行 SQL 语句优化之后,可进一步提升数据迁移时的效率。

在数据同步开始前,针对不同的分库分配了不同的业务数据,如不同的分库同步不同供电局的老系统历史数据,且每个分库的数据量基本一致,因此可以实现四库并行的同步数据转换与迁移工作,与之前方案相比,数据转换将近提升了 4 倍。

在正式数据迁移时,应设计南方电网营销管理系统的应用级灾备切换场景[4],当数据迁移过程中发生灾难且无法恢复时,致使营销服务中断,应快速切换回老系统,确保公司核心业务系统运行的连续性。

3.2、核心数据功能验证质量提升

迁移完成后,对南方电网营销管理系统数据库与《南方电网营销系统物理数据模型》进行完整性对比,保证数据的安全、完整、真实,如图 3 所示。

4、结束语

本文通过分析南方电网营销管理系统迁移现状,结合业务现状、技术现状等角度提出了两种数据迁移方案,进行了详细的分析与阐述,并重点描述了方案二的设计原理与实施应用。本文所提出的历史数据迁移改进方案已经应用于云南电网公司南方电网营销管理系统的实施上线工作中,并取得了工程实际的应用经验。

该方案为大规模企业级管理信息系统的上线实施数据迁移工作提供了高效实用的技术支持,减少了不必要的损失,节省人力资源。

参考文献:

[1] 田V. ERP系统集中部署模式下的历史数据迁移方案研究[J]. 电力信息与通信技术, , 12(8): 77-81.

[2] 陈然. 大规模电网运行数据实时同步技术研究[J]. 云南电力技术, 2015, (5):24-26.

[3] 罗伟,蒋苏湘,周沿东,魏鹏飞. 湖南电力营销系统数据库性能优化研究[J]. 电力信息与通信技术, 2014, 12(4): 30-34.

[4] 郭晓艳,王扬,孙轶凡,侯丹,章斌. 营销系统应用级灾备体系研究及建立[J]. 电力信息与通信技术, 2014, 12(10): 13-17.

15.数据挖掘技术的电子商务系统研究论文 篇十五

在电子商务活动过程中, 需要传送各种数据。这些数据分别由不同的商业应用产生, 具有不同的数据格式和商业意义。如果没有统一的数据交换标准, 采购方、供货方、运营商及中介等从事电子商务贸易的各方之间就不能实现有效的信息共享, 也就无法很好地利用对方提供的信息, 导致工作效率降低、错误率提高, 甚至很多商业机会被无端地浪费掉。因此, 如何在不同行业、不同领域和不同企业之间传输这些商业数据, 实现企业之间的交互, 是企业电子商务需要解决的一个关键问题。

基于XML的数据交换技术屏蔽了企业与企业之间的通信方式和数据格式的差异, 提供了一个基于XML的文档接收、转换、转发和管理的集成框架, 能够在电子商务应用之间存储、转换和传送数据, 数据不必因软件或平台的变化而改变。XML为基于Web的电子商务带来了新的机遇, 为平台的独立性、系统的兼容性、资源的整合和物流管理等电子商务应用, 提供了完整的解决方案。

二、电子商务的异构数据

电子商务异构数据的产生来自于以下几方面:

(1) 由于数据源所依赖的业务应用系统、数据库管理系统乃至操作系统之间的不同而产生了系统异构数据。

(2) 数据源的存储模式有关系模式、对象模式、对象关系模式和文档嵌套模式等几种, 其中关系模式 (关系数据库) 为主流存储模式。同时, 即便是同一类存储模式, 它们的模式结构可能也存在着差异。例如不同的关系数据管理系统的数据类型等方面并不是完全一致的, 如DB2、Oracle、Sybase、Informix、SQL Server、Foxpro等。由于数据源在存储模式上的上述不同而产生了模式异构。

(3) 由于电子商务企业内部数据源和外部数据源之间的异构而形成的来源异构。

(4) 电子商务中本身存在着纯文本文件、静态网页、交互式的网上表格、不同数据管理系统的数据类型等异构数据。这些异构数据在Internet传输中由于异构系统环境, 数据管理系统异构, 数据交换协议异构等原因造成数据交换不利。

三、电子商务中的XML数据交换技术

1. XML数据交换技术

可扩展的标记语言XML是1998年2月由W3C组织制定的一种通用语言规范, 与以HTML格式传送数据的传统电子商务平台相比, 它克服了HTML缺乏可扩展能力, 数据的可重用性和结构化程度差, 缺乏表达数据语义的能力等局限, 具有开放性、平台无关性、自描述性、灵活的可扩展性、高度结构化和层次化的数据组织形式等特点。XML语言采用标记来表示信息的内容, 使用者可根据需要自由定义这些标记, 生成结构化的信息, 使其非常适用于不同应用间的数据交换。因此, 基于XML的异构数据交换技术已成为电子商务应用的关键技术。

基于XML的数据交换系统一方面在企业与企业之间充当一个桥梁, 使有不同的通信方式的企业和企业之间可以方便地进行信息交流;另一方面, 它提供一个文档管理机制, 以XML格式集中存放企业与企业之间进行商务活动的各种文档。

2. 基于XML的电子商务网站平台系统架构

基于XML的电子商务网站平台以XML作为数据的传输格式, 极大地改善了电子商务平台的性能。其系统架构为如图所示的显示层、中间层和数据存储层三层架构。

(1) 显示层位于客户端, 其任务是将接收到的XML文档转换成HTML页面形式在浏览器上显示。由于XML定义的数据, 其显示与内容是分开的, 因此允许对同一数据指定不同的显示方式。转换与显示XML数据可利用CSS和XSL, 数据到达客户端后, 能够以客户配置、使用者选择或其他标准决定的方式动态地表现出来。

(2) 在中间层, Web服务器对来自于客户端的XML文档进行解析, 利用XML语法分析程序读取文档、生成结构树并检查其中包含的XML是否结构完整, 加以验证后取出所需的参数, 将参数传递给服务器端程序执行。如果需要, 再向数据库存储层提出查询请求, 再由数据库服务器对请求进行处理, 将处理结果以XML文档格式返回到中间层。中间层对XML数据进行处理, 再将结果传送到客户机的浏览器。

(3) 数据存储层主要实现数据的存储管理, 一般由后台数据库系统实现, 存储的数据可以有各种各样的数据库资源, 如Sybase、Oracle、SQL Server, 以及XML文档, 甚至可以将WWW上的HTML转为XML后存入数据库。

四、XML在电子商务中的应用

1. 利用XML技术实现异构数据库间互访

电子商务中主要存在系统异构、模式异构, 同时目前网上很多信息格式是半结构化或非结构化的, 其来源亦极端异构。异构数据库的跨库检索是电子资源整合的核心技术, 异构性是企业异构数据集成必须面临的首要问题。一个较好的应用方案是利用XML作为中间件, 对这些信息进行元数据搜索。

XML的开放性, 自描述性决定了它可成为异构应用之间进行数据通信的媒介。XML使用的是公开的, 非专有的格式, 允许各个机构方便地创建自己特定的标志, 用以描述其各自特殊商务需求。XML提供描述诸如数据库记录、图形、声音等不同类型数据的标准格式, 各系统只要装上XML解析工具, 便可一致而正确地解码、管理和显示信息、理解以XML为中介由其他系统传送的信息并加以利用, 而不用考虑对方的信息格式和使用的特殊软件, 从而完成跨平台的交流。

2. 利用XML技术实现数据的多样显示

商务数据发送到客户端后, 往往希望能够用多种方式显示, 由于数据显示与内容分开, HTML描述数据的外观, 而XML描述数据本身, 使数据更合理地按用户的需求表现出来, 另外CSS和XSL为数据的显示提供了公布的机制, 可以定义各种XSL或CSS对XML文档进行多种样式的显示。

3. 利用XML技术进行电子商务数据检索

随着电子商务的发展, 强大的数据检索已成为其内在的需求, 用户只要在XML文档中定义一系列有意义的标记, 依据这些标记就可以按照任意的条件进行复杂的查询和检索, 甚至实现计算机自动检索。

4. 利用XML技术实现不同来源的商务数据集成

商务数据库的发展十分迅速, 而这些数据库往往分散于关系数据库、文件系统、Word文档、电子表格、HTML或XML文档中。XML能够将不同来源的结构化的数据结合在一起, 通过在中间层的服务器上对从后端数据库和其他应用处来的数据进行集成, 就可以对数据进行多样的搜索和集成。

5. 利用XML技术实现企业间电子商务自动化

企业间正在从原有的广泛使用的EDI技术转向XML技术, 即利用Web实现商品信息的交换和接发定单, 从而使通信成本和软件成本都降低。由于原有的HTML应用的限制, 使用XML成为大势所趋, 利用XML进行电子目录等产品信息的交换和自动更新, 可以实现目录的自动分类处理和服务。实现企业间电子目录的分配、更新以及市场与库信息的共享, 提高企业的效率。

6. XML为IT业带来新的商机

Microsoft建议的XML Data方案, 使用XML写XML元数据, 快速开发XML应用, 并简化对结构和内容的确认。XML为Web数据带来了结构化、智能化和互操作性, 将会引发Web查询技术、Web数据库技术乃至Web数据交换技术的全面革新, B to C和B to B模式的电子商务的数据将更加容易交换。

参考文献

[1]但正刚李顺等:XML高级网络应用[M].北京:清华大学出版社, 2001

[2]李雯谢辅雯邹道明:XML数据交换技术的应用与研究[J].计算机与现代化, 2008, 1

[3]方美琪:XML及其在电子商务中的应用[M].北京:清华大学出版社, 2003:

16.数据挖掘技术的电子商务系统研究论文 篇十六

关键词:分布式;数据库;医院信息管理

中图分类号:TP315 文献标识码:A文章编号:1007-9599 (2011) 03-0000-01

The Research of Distributed Database in Hospital Information Management System

Sun Xiyi

(Kunshan City,Jiangsu Province, the First People's Hospital Information Branch,Kunshan215300,China)

Abstract:Hospital information management systems are distributed and complicated. The data cannot be dealt with and analyzed synthetically after it is gathered. The coordination and cooperation among every node is quite difficult; and therefore influences efficiency.This paper combines the characteristic of the distributed multi-database system, designs the database systematic model, develops the hospital system based on the distributed multi-database systems.

Keywords:Distributed;Database;Hospital Management

一、分布式数据库

分布式数据库系统是计算机网络系统与数据库系统与协作与融合的产物,具有数据独立性、事务管理的分布性、集中与自治相结合的系统控制方法、存在适当的数据冗余等主要特点。在分布式数据库系统的运行过程中,数据独立性除了数据的物理独立性与逻辑独立性以外,还有关于数据的分布透明性,即用户不必去关注数据是如何被逻辑分片的;不必关注数据及其分片是否被复制,若被复制的话,副本的个数是多少;也不必去关注数据及其分片的物理位置分布的细节问题;最后,也不必关注某个局部的数据库系统究竟支持哪种数据模型。所以,我们可以把分布式数据库系统看成是数据库系统和计算机网络的有机结合。在分布式数据库系统中,被计算机网络连接的逻辑单位称为站点或节点。

(一)分布式数据库系统的实现方案

1.使用分布式数据库系统,将物理上分布在各地,但是在逻辑上相关联的数据库进行统一管理。分布式数据库系统具有透明性和独立性等特点,如前所述,用户对数据库的任何操作都形同在本地进行,不必关注其数据模型、物理位置等细节问题。2.建立用户交互接口来联合分布在各个节点上的数据库,而数据库之间则不进行任何模式的集成。各个成员数据库采用区域分段管理策略,对本区域以外的数据操作,全部通过远程登录的方式来进行,从而隔离了区域间的影响。3.采用联邦数据库系统模型,在维持局部成员数据库自治管理的前提下,对其他异构的成员数据库进行部分的集成,提供数据的共享,并且采用数据转储技术来解决多节点的分布数据处理及数据一致性维护等问题。

(二)分布式数据库体系结构

分布式数据库体系结构由下述几部分组成:1.多台计算机及其配套设备,并由计算机网络进行连接。2.计算机网络设备及其相关的软硬件和配套通信协议。3.分布式数据库管理系统,它包括全局数据库管理系统、局部数据库管理系统、通讯管理程序,除了具有由GDBMS链接的全局用户接口外,还具有由节点LDBMS链接的自治节点用户接口。4.分布式数据库包括全局数据库和局部数据库。5.分布式数据库管理者可分为二级,一级为全局数据库管理者,另一级为局部或自治节点数据库管理者,称为局部数据库管理者。

二、系统总体设计方案

(一)医院分布式数据库系统的设计目标:1.实现跨地域型企业的资源共享、统一管理和局部控制。2.满足具有分布式存取需求的企事业机构并且为其提供一种经济、可靠、实用的分布式数据管理系统。3.充分利用先进成熟的计算机网络、通信技术和原有的设备,确保医院收费系统的网络先进性,实现医院管理规范化、网络化、智能化。

(二)总体结构本系统设计时使用C/S和B/S混合模式,实现了医院系统的综合管理。

1.门诊挂号:分配门诊号记录病人的自然情况。2.药库管理:登记进库药品,根据药房的提药申请向药房发药。3.药房管理:领药等级,并按领药单划价发药。

4.住院管理:(1)入院登记:记录患者详细情况,并为其分配住院号和病区。(2)病区管理:在病区内分配患者病室以及床位,录入相关医嘱和医嘱确认,生成请药单,以及办理同意出院。(3)取药管理:根据请药单取药、收费。(4)出院管理:显示出院病人的相关信息和各项费用,核对并结清费用,打印出单据。

5.院长查询:医院领导有权随时对医院的财务收支、药品库存及病人的入住院情况等信息进行查询,这可以帮助领导层及时地了解医院的整体情况,从而做出准确的判断。

三、数据库设计

(一)医院系统功能非常繁多,由于篇幅所限,这里仅列举出最为复杂的收费系统功能框架。医院计费系统的主要功能如下:

1.信息显示、查询、检索;2.输出各种收费、管理报表;3.系统智能识别功能;4.身份识别

(二)数据库系统事件或用户事件:系统事件包括系统启动或退出、异常错误等,用户事件包括用户登录或注销。触发约束为一布尔表达式,只有当该表达式的值为TRUE时,触发事件才能够激活触发器使其执行触发动作;否则,当触发事件发生时,触发器并不执行其动作。触发器动作作为触发器要执行的程序块,其中包含SQL语句和其他代码。

创建表触发器的语法格式为:

CREATE [OR REPLACE]TRIGGER trigger_name

{BEFORE|AFTER}tirgger_event ON table_reference

[FOR EACH ROW [WHEN trigger_condition]]

trigger body ;

其中BEFORE和AFTER指出触发器的触发时序分别为前触发和后触发方式,前触发是在执行触发事件之前触发当前所创建的触发器,而后触发则是在执行触发事件之后触发触发器。FOR EACH ROW选项说明触发器为行触发器,行触发器要求当一个DML语句操作影响数据库表中的多行数据时,对于其中符合触发约束条件的每个数据行均激活一次触发器;而语句触发器将整个语句操作作为触发时间,当它符合触发约束时,激活一次触发器。

四、结束语

本文以分布式数据库技术为基础,开发了一套具有使用价值的医院信息管理系统,可较为有效的提高医院业务的处理速度,对促进医疗机构的自动化、信息化具有一定的参考价值。

参考文献

[1]张震.异构数据库同步系统的研究与实现[J].计算机应用,2002,10

[2]邵佩英.分布式數据库系统及其应用[M].北京:科学出版社,2005.

17.物流车辆监控系统的数据组织研究 篇十七

基于简单通用、安全、便于移植的原则,结合物流车辆监控电子地图的实际需求,本文提出了一种采用二进制文件存储地图数据的数据组织格式,此格式存储量小、显示速度快,并可与MIF数据相互转换.该数据格式已应用于邯郸物流车辆监控系统,跟其原有系统相比显示、查询速度加快,数据占有量大幅减少.

作 者:江文浦 邓淑丹 JIANG Wen-pu DENG Shu-dan  作者单位:江文浦,JIANG Wen-pu(福州市勘测设计院,福州,350002)

邓淑丹,DENG Shu-dan(福建省基础地理信息中心,福州,350002)

刊 名:测绘科学  ISTIC PKU英文刊名:SCIENCE OF SURVEYING AND MAPPING 年,卷(期):2009 34(6) 分类号:P208 关键词:空间索引   逻辑模型   物理模型   spatial index   logical model   physical model  

★ Windows7系统怎么快速输入数学公式?

★ 电火花加工放电状态的检测及神经模糊控制

★ 脑电物理头模型数据采集系统的研究

★ Excel中快速输入有规律的数据

★ 地理信息系统数据字典生产研究

★ ARINC629航空数据总线研究

★ Excel 输入新数据时图表自动更新EXCEL基本教程

★ 海洋水色遥感元数据及其系统设计

★ [软件]网上直报/数据分析系统

18.数据挖掘技术的电子商务系统研究论文 篇十八

1.大数据对电子商务的影响

1.1大数据带来的风险与机遇

不管是即时通信工具还是社交网络等,所有方面都会涉及到海量的数据,这使得大数据环境下安全形势与传统安全相比,变得更加复杂。大数据为传统安全带来的挑战表现在以下几点:

(1)大数据对数据的完整性与可用性带来了冲击,在防止数据丢失、被窃取以及被破坏的问题上存在着一定的难度,以往的安全工具已经满足不了大数据环境下的需求。

(2)数据中包括大量的企业数据、用户数据、个人数据以及各种行为数据等,这些数据都是集中储存,提高了数据泄露的概率,倘若这些数据被滥用,将会对企业的信息安全带来不利于影响。另一方面,大数据也促进者信息安全的发展。大数据为安全分析提供了新的可能,对于海量数据的分析能够促进信息安全服务提供商更好的规划网络异常行为,从而找到数据中的风险[1]。对实时安全与商务数据结合在一起的数据展开预防性研究,能够识别攻击的性质,防止被非法者入侵。网络被攻击后会留下种种痕迹,这些痕迹都以数据的方式隐藏在大数据中,运用大数据技术整合计算与处理资源能够更有效地应对信息安全威胁,促进找到攻击的源头。

1.2大数据对电子商务发展的影响

根据有关报告显示,从2012年至2020年,我国的数据将增加数十倍,数据将从346艾字节到8.6万亿千兆字节。这些数据主要来自不断增长的`互联网使用数据、社交网络、智能手机以及移动电视等。在互联网使用数据中最具有发展前景以及研究价值的领域体现在电子商务方面。淘宝每天新增的交易数据有10TB之多,eBay分析平台每天处理数据高大100PB,超过了许多交易所全天的数据处理量。在海量的交互数据中隐藏着重要的数据价值,数据已经成为所有经济领域的重要构成部分。大数据渐渐地成为了电子商务企业的重要部分,它也是体现公司价值的关键因素[2]。通过对数据展开收集、整合与分析,电子商务企业能够挖掘出新的商机,使得企业在激烈的竞争中立于不败之地。

2.大数据在电子商务中的应用

信息时代的主要特征就是数据与信息的快速发展与快速传播。这方面在电子商务领域也实现了深刻的体现。随着电子商务在各行和业尤其是零售行业的快速发展,并发访问量迅速增加,并且数据的类型也呈现出了复杂多变的发展趋势。大数据的核心价值就是细致地分析与利用信息。互联网中融入了由用户产生数据的模式,此模式提供了低成本、实时性强的数据。然而数据的真实性与可靠性还有待提高。电子商务与以往的销售方式相比具有数据的可获得性。在以往的销售过程中,企业很难掌握顾客购买的源头,倘若现在不购买以后是否会购买等问题,而在电子商务中能够掌握到顾客购买、收藏以及浏览等行为。通过这些信息能够促进企业更好地认识自己的产品,了解到自身在销售中存在的问题,从而可以为客户提供更加优质的服务。例如,在人们在逛淘宝时,会产生一些购买、浏览、收藏以及加入购物车等行为,这些行为都能够在服务器中留下痕迹[3]。这样可以帮助卖家去推测顾客的心理,比如是由于商品价格高、商品描述不完善以及缺货等问题。因此,企业就可以通过降价促销、上新品等策略去应对,帮助企业实现销售,提高利润。此外,在电子商务中企业还可以分析得出顾客的购买习惯等,从而依据顾客的购买习惯适当提醒顾客购买。

3.大数据环境下的电子商务安全问题

3.1电子商务的安全需求

目前,全球的各行各业都涉及了电子商务,然而所有的企业都面临着一个共同的问题,即电子商务的安全问题。因此,应当采用先进的安全技术,对网上的数据与信息的收发进行身份确认,从而保证双方信息传递的安全性、完整性等。

3.2大数据环境下的电子商务安全结构

在大数据环境中可以通过网络的安全基础设施GSI建立电子商务平台,可以提供共享的电子交易市场。各商家在自己的网站展现货物资源,货物资源由资源代理管理,形成局部的管理局,有规定的交易安全策略以及货物名称。在这个基础建立一个虚拟的电子交易市场,提供虚拟的货物资源以及全局安全侧裂,由交易代理管理交易。

3.3大数据环境中电子商务所面临的问题

大数据促进了电子商务的发展,然而同样也存在着许多问题,主要包括以下几个方面:(1)用户数据的安全与隐私问题。数据的开放性是大数据环境的特征之一,也是大数据实现个性化服务的重要因素,然而开放的同时应当保护数据的安全性与隐私性。用户在网络上的所有信息都可能被截取,并且用户本人可能不知道。(2)IT技术问题。电子商务大致包括“电子”与“商务”两部分,其中电子指的是计算机技术与网络技术,商务是其核心内容,电子商务倘若没有技术的支撑很难实现商务活动。然而大数据的数据量大等特点使得传统的关系数据库很难达到要求,并且没有合适的存储技术与分析处理技术。

4.结束语

在大数据环境下,数据是企业的资源也是企业的重要财产。大数据为电子商务企业带来了准确的营销定位以及崭新的商务模式,并且也带来了许多问题。安全问题是所有企业都十分关注的问题,因此相关技术人员应当深入研究出解决安全问题的方法,从而促进电子商务企业能够更好的发展。

参考文献:

[1]胡亚慧,李石君,余伟.大数据环境下的电子商务商品实体同一性识别.[J].计算机研究与发展,2015,(08),1794-1805

[2]杜艳绥.云计算环境下的电子商务安全问题及对策.[J].中国管理信息化,2015,(02),156

19.数据挖掘技术的电子商务系统研究论文 篇十九

电子政务 (e-Government affair) 是政府在其管理和服务职能中运用现代信息和通信技术, 实现政府组织结构和工程流程的重组优化, 超越时间、空间、和部门分割的制约, 全方位地向社会提供优质、规范、透明的服务, 是政府管理手段的变革。

随着电子政务建设的不断发展, 政府拥有越来越多的应用数据, 如何建立政府信息资源采集、处理、交换、共享、运营和服务的机制和规程, 实现分布在各类政府部门和各级政府机关的信息资源的有效采集、交换、共享和应用, 是电子政务建设的更高级的阶段和核心任务。

2. 电子政务系统数据交换平台网络安全需求

从技术层面讲, 除了传统的防病毒、防火墙等安全措施以外, 电子政务特殊的安全需求主要表现在以下几个方面。

2.1 内外网间安全的数据交换。

电子政务应用中势必存在内网与专网、外网间的信息交换需求, 然而基于内网数据保密性的考虑, 我们又不希望内网暴露在对外环境中。解决该问题的有效方式是设置安全岛, 通过安全岛来实现内外网间信息的过滤和两个网络间的物理隔离, 从而在内外网间实现安全的数据交换。以隔离网闸技术为核心, 通过添加VPN通信认证、加密、入侵检测和对数据的病毒扫描, 就可构成一个在物理隔离基础上实现安全数据交换的信息安全岛。

2.2 网络域的控制。

电子政务的网络应该处于严格的控制之下, 只有经过认证的设备可以访问网络, 并且能明确地限定其访问范围, 这对于电子政务的网络安全而言同样十分重要。

2.3 标准可信时间源的获取。

电子政务系统需要建立全系统可信、统一的时间源, 这是保证电子政务系统不致出现混乱的关键因素。

2.4 信息传递过程中的加密。

电子政务系统涉及到部门与部门之间、上下级之间、地区与地区间的公文流转, 在信息传递过程中, 必须采取适当的加密方法对信息进行加密。

2.5 操作系统的安全性考虑。

网络安全的重要基础之一是安全的操作系统, 因为所有的政务应用和安全措施 (包括防火墙、防病毒、入侵检测等) 都依赖操作系统提供底层支持。

2.6 数据备份与容灾。

在电子政务安全体系中必须包括数据的容灾与备份, 并且最好是异地备份。

3. 电子政务系统数据交换平台设计方案

根据电子政务系统网络安全的要求, 文章设计了六层数据共享交换平台, 其总体框架如下:

由上图可以看出, 数据共享交换平台交换体系共分为六个层次, 分别是安全和标准体系、网络基础设施、信息资源中心、共享交换平台、应用层和展示层。

(1) 展示层。通过建立综合信息集成门户系统为用户提供统一的用户界面, 信息和应用通过门户层实现统一的访问入口和集中展现。

(2) 应用层。应用层提供满足面向各类用户依据实际需求开展业务的需要。如支撑城市应急联动应用、辅助领导决策应用、城市管理应用、社会救助应用等。

(3) 共享交换平台层。共享交换平台层为城市数据共享交换平台所在位置, 连接各类应用和应用所需的信息资源, 组织和整合各类数据、组件和服务。数据共享交换平台层为实现应用层各种应用系统的搭建和运行提供支撑服务, 包括目录服务系统、交换服务系统、安全服务系统和平台管理系统等。交换平台还提供了资源目录管理体系。目录服务主要提供目录注册、目录发布、目录查询、目录维护等功能, 能够实现各类基础资源和共享资源目录信息的统一汇集和管理

(4) 资源层。资源层通过定义数据模型, 实现数据组织、存储和管理, 为平台层和应用层提供数据服务。主要包括元数据库、四大基础信息库、平台日志库、各类主题信息库以及其他数据库等。根据应用的深入和信息量的增加需要建设的共享信息库以及数据中心等, 都作为资源层为各类应用提供数据支撑。

(5) 网络基础设施层。基础设施层提供各类系统的承载网络、所需的系统软件和硬件设备及其运行环境。

(6) 安全、标准体系层。信息安全保障体系、法规与标准体系提供电子政务应用系统安全稳定运行的保障。标准规范建设是政务信息资源共享交换平台建设的基础性工作, 是接入城市平台的各个节点之间实现互联互通、信息共享、业务协同和安全可靠运行的前提条件

参考文献

上一篇:如何做好通讯宣传工作下一篇:保育新学期工作计划2022年