数据中心基础知识

2024-09-07

数据中心基础知识（共10篇）

1.数据中心基础知识篇一

中国数据中心基础设施技术年会召开

近日，由中国数据节能协会和中国电源学会主办的2015第五届数据中心基础设施技术年会在北京万豪酒店隆重举行。中国数据中心基础设施大会已经成了数据中心基础设施领域一年一度的行业盛会。本次大会围绕“高效节能驱动未来”这一主题进行了深入探讨。

在上午的“节能、创新型数据中心如何实现专题峰会”上，中科院计算所张广明老师发表《数据中心规划设计存在的若干问题》的主题演讲，来自国家高性能研究中心技术研究所、北京节能环保中心等单位的专家从数据中心节能环保的建造技术谈到了绿色数据中心的节能设计新趋势，全面展现了当前中国绿色数据中心技术的发展态势，为数据中心节能高效提供了有益的建议。节能减排补贴政策成了上午论坛的热点话题，吸引了众多听众，会后许多听众想索取更多更详细的资料信息。

下午的两个分论坛主题分别为“数据中心标准推进与节能新技术应用”和“数据中心供配电系统发展与变革”。在“数据中心标准推进与节能新技术应用”分论坛上，企业的领导和专家主要介绍了当前数据中心制冷系统、散热系统、电源管理、机柜微环境，为与会观众分享了数据中心绿色节能的经验。“数据中心供配电系统的发展与变革”这个分论坛主要探讨了模块化数据中心节能实践和大数据时代数据中心基础设施的思考。参会观众从头至尾认真地聆听促使演讲嘉宾的讲解更为精彩。除了内容丰富的主题演讲，本次大会还设立了企业展示区。

从斯诺登事件到赛门铁克“数据防泄漏（DLP）”产品存在窃密后门和高危安全漏洞，随着信息化的发展，国家信息安全被日益重视。因此，未来在IT行业的投资方向可以聚焦在军工领域、互联网领域，智慧城市以及信息消费这几个方向。

然而国家大力提倡智慧城市和信息消费，搭建行业云、政务云、公共云等最终的数据和信息节点都落地在了数据中心里，数据中心迎来较大的发展空间。信息技术产业网络、平台化、服务话的趋势愈加明显，对大规模、高性能数据中心的需求愈加迫切，也推动了数据中心建设与服务需求的大幅增加。

中国数据中心基础设施技术年会”自2011年创办以来，迄今已举办了5届，成为中国数据中心行业基础设施领域最具影响力的盛会，更是中国数据中心基础设施核心群体回顾梳理发展历程，交流验证节能创新技术，明确前瞻发展方向的高层聚会。中国数据中心基础设施技术年会也被认为是牵引中国数据中心产业中基础设施未来发展和市场走向、探索数据中心节能创新方略和节能技术及产品深入应用的关键标杆，成为中国数据中心产业力量和各行业用户彰显价值、沟通交流的桥梁。

2.数据中心基础知识篇二

数据中心基础设施建设需要有全面的理论基础、严格的行业标准、系统的设备配置要求、科学的管理措施和安全的运行机制。对于数据中心基础设施的建设者来说实施方案的选择是非常关键的, 我们认为马斯洛需求层次理论在数据中心基础设施建设中的应用具有重要的指导意义, 本文从需求层次理论的角度出发, 探讨数据中心基础设施的需求层次。

一、马斯洛需求层次理论

需求层次理论是由美国著名心理学家马斯洛 (Maslow) 在1943年所著的《人的动机理论》一书中首先提出的。他将人的多种需求由低到高归纳为五个层次, 即生理需求、安全需求、情感需求、尊重需求和自我实现的需求, 并阐明了它们的内在联系。低一层次的需要获得满足后, 就会向高一层次的需要发展。一般来说, 只有在较低层次的需求得到满足之后, 较高层次的需求才会有足够的活力驱动行为。

二、基础设施建设的需求层次理论

如图1所示, 可知道数据中心基础设施所包含的主要内容, 如何根据需要进行数据中心的基础设施建设呢?结合马斯洛需求层次理论对数据中心基础设施的需求进行了如图2所示的划分, 希望能够对数据中心基础设施的建设提供参考, 下面结合马斯洛需求层次理论分析数据中心基础设施建设的层次需求:

2.1运行需求。

对任何一个企业而言, 数据中心的存在与否就像马斯洛需求层次理论的第一个需求层次一样, 是企业各项业务的运行根本。如果只要求一个数据中心满足一些简单的数据交换、信息处理, 那么这样的数据中心就能够容忍一些中断和停机;建设这样的数据中心, 对基础设施而言就非常简单了, 在对其进行评估时就只需要看能否提供电源系统、能否提供局部热点的简单制冷设备就可以了, 对其它方的要求就相对较低。因为正如生理需求一样, 电源和制冷是最基本的需求和最低级的需求, 只要有满足这两个方面的需求的基础设施, 数据中心就有运行的保证。从国内数据中心使用需求来看, 建设这种需求层次的企业有:小型企业、SOHO、部门级数据中心 (评估标准如图3) 。

2.2冗余需求。

正如马斯洛需求理论所分析的一样, 某一层次的需要相对满足了, 就会向高一层次发展, 追求更高一层次的需要就成为驱使行为的动力。对已经拥有最低层次数据中心的企业而言, 随着企业的不断发展, 对数据中心的要求也在不断提高, 在这个阶段对数据中心的建设和改造, 其基础设施又需有更高层次的要求:冗余, 特别是电力和制冷的基本冗余, 因为随着需求的不断增加, 数据中心的服务器和存储设备增长较多, 数据的额外保护和安全需求也在不断增加。对这个层次的数据中心做需求评估, 其基础设施的需求改变体现在以下几个方面:1) 数据中心需配备架空地板, 解决综合布线及制冷通道问题;2) 用UPS或备用发动机来处理电力负荷, 设计容量满足单回路的N+1;3) 制冷系统在满足制冷需求的同时有一定冗余, 设计容量满足N+1;4) 有可靠的信息系统接入;5) 消防报警系统及简单的手持式灭火装置;6) 对关键电路和其他基础设施进行维护需要程序式的关闭设备。总结其对基础设施的要求, 此种层次需求的数据中心有单点的中断可能, 该类型数据中心包括:中等规模的企业级数据中心、与外界业务交往少的数据中心或机房 (评估标准如图4) 。

2.3恢复需求。

满足冗余需求的数据中心有单点中断的可能, 为了进一步提高数据中心的可靠性及可用性, 满足数据中心恢复需求, 在满足冗余需求的前提下, 还需要加强以下几个方面的要求:1) 数据中心选址需要考虑:可用电源的接入、建筑物抵御风险的能力、通讯设施的接入等因素;2) 以主动-被动或是双主动模式提供冗余电源和制冷设备;3) 能够为需要的计算机设备提供双电源;4) 冗余的信息系统接入;5) 消防系统方面需配置有效的检测和灭火装置以满足一个小时的防火等级;6) 有较好的环境保障;7) 系统运行要求为:满足365*24小时不间断运行。此类数据中心的基础设施要求已经达到了较高的标准, 拥有以上基础设施的数据中心主要有:有影响力的信息工厂、不能够承受不定期停机的数据中心、国有集团公司的数据中心、省部级的数据中心等 (评估标准如图5) 。

2.4灾备需求。

一般来说, 数据中心的基础设施建设达到恢复需求已可以满足需求了, 但对于一些要求特别高、有灾备需求的数据中心而言, 其基础设施需求除了满足上面各项需求等级外, 还需要在基础设施方面考虑如下需求保障:1) 基础设施能保证任何计划性活动不会引起关键性负载中断;2) 需要有来自不同电力公司的电力供应及需要两个独立的 (N+1) UPS系统;3) 制冷系统来讲需要满足N+X (X>1) 的系统冗余;4) 信息系统的提供需要具备相互独立的公司提供的网络线路;5) 消防系统能满足最低两个小时的防火等级;6) 在不同的区域之间设隔离区和分配区;7) 物理结构能够抵御绝大多数自然灾害的威胁;8) 拥有24小时现场电子监控和安全监控系统。此类数据中心主要包括:证券、电力、商业银行、保险公司、大型跨国公司的销售公司、国家级数据库等数据业务非常重要的数据中心 (评估标准如图6) 。

2.5生存需求。

按照马斯洛需求层次理论, 对个人而言最高需求是个人价值的作为实现, 对数据中心的建设来说, 其基础设施建设的最高需求有哪些特殊要求呢?关系国家军事安全, 金融安全、科研保密等相关的数据中心, 因为其关系到一个国家的政治、经济、军事安全, 关系一个国家的生存和发展, 就需要考虑关系国泰民安的生存需求, 因此数据中心基础设施建设的最高需求从某种意义来讲就是生存需求。能够参与设计和施工这类数据中心基础设施的人很少, 但不影响我们对于其基础设施需求的研究, 其对基础设施的研究除了前面几种需求, 还需要提高的包含以下几个方面:1) 数据中心选址的安全性、可靠性及保密性;2) 电力供应拥有自己独立使用的发电系统;3) 数据中心的信息交换和获取必须通过专用通道进行;4) 除了电子监控系统和安全监控系统外, 须有专业的安保人员24小时进行安全保卫工作。

此类数据中心主要包括:国家银行、国家军事、国家安全及国家级科研等数据中心。

三、马斯洛的需求层次理论对数据中心基础设施建设的意义

数据中心的建设与一个企业的经济实力、科研力量等因素息息相关, 虽然数据中心的基础设施建设根据年代的早晚大致可以分为四个等级, 但根据自己数据中心的使用要求和需要, 数据的集中程度以及对数据依赖度将决定构建或者采用哪一个级别的数据中心, 就像马斯洛需求层次理论阐述的一样, 满足自己的需求层次就可以了;根据实际的需求灵活运用层次理论、不用按部就班和墨守成规才是运用层次理论去指导数据中心基础设施建设的最终目的和意义。

参考文献

[1]王其英.机房与UPS选型技术手册[M].中国电力出版社, 2008.

[2]Greg Schulz (美) .绿色虚拟数据中心[M].人民邮电出版社, 2010.

[3]马斯洛 (美) .马斯洛人本哲学[M].九州图书出版社, 2003.

3.用软件定义基础架构重塑数据中心篇三

以我国为例，我国现在大约拥有8.38亿中国互联网用户、7.19亿中国博客用户、4.68亿微信活跃用户，有超过4亿台智能手机，还有超过2000万新的PC和平板电脑。支撑如此巨大的用户群体需要强大而且灵活的数据中心（大约每400台智能手机设备或者100台可穿戴设备就需要1台服务器），而传统的数据中心是很难满足需求的。比如，传统数据中心提供一项新服务平均需要2～3周，但市场的瞬息万变需要尽快将服务推出。

“在一个SMAC（‘S’指社交、‘M’指移动、‘A’指分析、‘C’指云计算）主导的时代，建设开放、高效、按需提供、弹性的数据中心势在必行，英特尔提出的软件定义基础架构（Software-defined Infrastructure，SDI）正是在这个背景下提出的。它的目标就是通过重构数据中心，使数据中心能够敏捷、自动和高效。”英特尔（中国）有限公司行业合作与解决方案部高级经理、行业资深架构师龚毅敏告诉本报记者。

龚毅敏介绍说，基于软件定义基础设施构建的数据中心应该是动态的、高度自动化和软件定义的，这和传统的数据中心有很大不同，传统数据中心是一种静态、手动和硬件定义的，这样的传统数据中心根本无法满足云时代不断变化的需求。在按照软件定义基础架构构建的数据中心中，软件主导硬件，硬件只提供重要的基础架构属性，用软件来实现实时、智能和完全自动化。

具体而言，软件定义基础架构包含三个方面的内容，即计算、存储和网络。在这三个方面，英特尔分别都有相对应的产品。比如，在计算方面英特尔推出了名为RSA（Rack Scale Arch）的架构来重新定义服务器，RSA采用分离的部件和预定义的机架，各个部件单独集成，可扩展，且便于构建基于机架的资源池。

龚毅敏表示，RSA架构可以很好地支持当下流行的模块化数据中心概念。在模块化数据中心，计算、网络和存储都可以和配电、制冷等设备集合成一个个独立的可插拔模块，方便扩展，也方便维护。

而在网络方面，英特尔也是软件定义网络（SDN）的大力推动者和实践者，同时在网络功能虚拟化（NVF）和虚拟化网络方面都推出了自己的产品。同样，在存储方面英特尔也是软件定义存储的领导者，英特尔有高速缓存加速（iCAS）、下一代NVM以及英特尔存储加速库等相关技术。

龚毅敏强调说，英特尔的SDI是一个开放的架构，英特尔正在为之构建一个广泛的生态系统。“不管是开源的OpenStack还是VMware、微软等，SDI都可以很好地支持其产品。”龚毅敏说，“简化、弹性、互操作性以及基于开放的工业标准建设正是SDI的主要特点。”

4.数据分析基础方法篇四

对于很多没有数学基础和数据敏感度的人而言，面对庞杂的数据常常感到头痛。为了得到更深入的信息，我们需要用到很多的分析工具，比如googleanalytics、百度统计、站长工具以及自己网站分析系统，在收集客观的数据后，我们需要对数据进行分析，这里我们介绍最常用和基础的分析方法：拆分。（以下内容摘自艾瑞学院《蜕变——传统企业如何向电子商务转型》）

一、看数据分布

最简单的拆分方法就是不看平均值，看数据分布。因为凡是“总和”或者“平均”类的统计数据都会丢失掉很多重要的信息。例如李嘉诚来我们公司参观，这一时间我们公司办公室里的“平均资产”就会因为李嘉诚一个人被抬高到人均几亿身家。如果有人根据这个“平均资产”数据来判定说我们办公室的人都是豪华游艇的潜在顾客，这自然是荒谬的。

可实际上，我们每天都在做着类似的判断，比如当我们听到说顾客“平均在线时间”是3分34秒，就可能根据这个时间来进行业务决策，例如设置“停留时间超过3分34秒为高价值流量”，或者设置系统，在用户停留了3分34秒还没有下单的话就弹出在线客服服务窗口。我们设置这些时间点的根据是“平均停留时间”，在我们的想象里，我们的每个顾客都有着“平均的”表现，停留时间大致都是3分34秒，可实际上真正的顾客访问时间有长有短，差别巨大：

从上图我们可以看到绝大部分访问时间非常短暂，而少数人访问了大量时间，综合起来平均停留时间3分多，用

3分34秒来做为一个关键判定点是不合适的。

再举一个例子，比如我们看到上个月平均订单金额500元/单，这个月也是500元/单，可能会觉得数字没有变化。可是实际上有可能上个月5万单都是400～600元，而这个月5万单则是2万单300元，2万单400元，5千单500元，5000单超过2500元——客户购买习惯已经发生了巨大变化，一方面可能是客户订单在变小（可能是因为产品单价下降，采购数量减少，或者客户选择了比较便宜的替代品），另一方面出现了一些相对较大的订单（可能是中小企业采购，或者是网站扩充产品线见效了）。——看数据分布可以让我们更容易发现这些潜在的变化，及时的做出应对。

二、拆因子

很多时候我们很难直接从数据变化中分析出具体的原因，这时可以考虑拆分因子，将问题一步步细化找寻原因。

例如网站转化率下降，我们要找原因。因为“转化率”=“订单”/“流量”，所以“转化率”下降的原因很可能是“订单量下降”，“流量上升”，或者两者皆是。按照这个思路我们可能发现主要的原因是“流量上升”和“订单量升幅不明显”，那么下面我们就可以来拆解“流量”的构成，例如拆成“直接访问流量”、“广告访问流量”和“搜索引擎访问流量”再看具体是哪部分的流量发生了变化，接下来再找原因。

这时我们可能看到说是搜索引擎访问流量上升，那就可以再进一步分析是付费关键词部分上升，还是自然搜索流量上升，如果是自然流量，是品牌（或者网站名相关）关键词流量上升，还是其他词带来的流量上升——假如最后发现是非品牌类关键词带来的流量上升，那么继续寻找原因——市场变化（淡季旺季之类），竞争对手行动，还是自身改变。假如刚好在最近把产品页面改版过，就可以查一下是不是因为改版让搜索引擎收录变多，权重变高。接下来再分析自己到底哪里做对了帮助网站SEO了（比如把页面导航栏从图片换成了文字），把经验记下来为以后改版提供参考；另一方面还要分析哪里没做好（因为新增流量但是并没有相应增加太多销售），研究怎样让“产品页面”更具吸引力——因为对很多搜索引擎流量来说，他们对网站的第一印象是产品页面，而不是首页。

三、拆步骤

还有些时候，我们通过拆分步骤来获取更多信息。

举两个例子：第一个例子：两个营销活动，带来一样多的流量，一样多的销售，是不是说明两个营销活动效率差不多？

如果我们把每个营销活动的流量拆细去看每一步，就会发现不一样的地方。营销活动B虽然和营销活动A带来了等量的流量，可是这部分流量对产品更感兴趣，看完着陆页之后更多的人去看了产品页面。可惜的是虽然看产品的人很多，最后转化率不高，订单数和营销活动A一样。

这里面还可以再深入分析（结合之前提到的分析方法，和下一章要说的细分方法），但是光凭直觉，也可以简单的得出一些猜测来，例如两个营销活动的顾客习惯不太一样，营销活动B的着陆页设计更好，营销活动B的顾客更符合我们的目标客户描述、更懂产品——但是我们的价格没有优势等等这些猜想是我们深入进行分析，得出行动方案的起点。至少，它可以帮助我们

更快的累计经验，下次设计营销活动的时候会更有的放矢，而不是仅仅写一个简单report说这两个营销活动效果一样就结案了。（注：这是个简化的例子，实际上还可以分更多层）

第二个例子可能更常见一些，比如网站转化率下降，我们可以拆成这样的漏斗：

这样拆好之后，更能清楚地看到到底是哪一步的转化率发生了变化。有可能是访客质量下降，都在着陆页流失了，也可能是“购物车–>登录”流失了（如果你把运费放到购物车中计算，很可能就看到这一步流失率飙升），这样拆细之后更方便我们分析。

曾经有一个例子就是转化率下降，市场部查流量质量发现没问题，产品经理查价格竞争力也没问题——最后发现是技术部为了防止恶意注册，在登录页面加了验证码（而且那个验证码极度复杂），降低了“登录页面–>填写订单信息“这一步的转化率。

四、细分用户族群

很多时候，我们需要把用户行为数据拆分开，看不同族群的人有什么不同的表现，通过比较异同来获取更多的洞察。从实践出发，客户族群细分的方法主要有三种：

按照客户属性细分：根据客户“是谁”来划分族群，例如把客户分成“新客户”和“老客户”。按照客户行为来细分：根据客户上网行为来细分，例如把客户分成“浏览服装专区的客户”和“浏览数码专区的客户”。很多时候“根据客户行为”和“根据客户属性”这两者会混在一起，比如一个客户的行为是“每个月都来买一次东西而且只买最贵的”，可能我们就会在数据库里给他标记上“有钱人”，之后“有钱人”就成了这个客户的属性之一。

5.数据中心基础知识篇五

3.2数据电文的书面形式

3.3数据电文的效力

教学目的：知识目标：了解数据电文形式问题的解决方案，掌握数据电文的基本含义，掌握数据电文的法律效力，掌握数据电文的功能等同原则。

能力目标：培养学生能用专业知识分析、解决问题的能力

情感目标：激发学生的学习兴趣

教学重点：数据电文的基本含义，电文的法律效力，数据电文的功能等同原则教学难点：电文的法律效力教学方法：讲授法、案例法教学课时：2课时

教学过程：

每课一案：（由学号2号同学提供）

8月14日上午10时许，王先生收到其父亲的QQ信息，要求其汇款3万元给其父亲的朋友。由于王先生开启了视频聊天，发现显示的是其父亲的图像，便深信不疑。随后，王先生通过网络银行将3万元汇到对方账号。汇款后，父亲的QQ又发来消息要求汇款5万元，这引起王先生的警觉，马上电话联系父亲，结果发现父亲根本没有让其汇款，同时得知父亲的QQ号码于三天前被盗.民警在调查中发现，犯罪分子常常是利用黑客软件盗取他人的QQ后冒充受害人熟人与事主聊天，继而利用受害人对该QQ熟人的信任，以种种理由诱骗受害人汇款到指定账户或进行网上购物。犯罪分子还利用一种叫强制视频的软件，强行把对方电脑上的摄像头打开，拍下对方的一举一动，然后通过截取QQ所有人图像进行视频聊天，因此，具有很强的欺骗性。由于网速的问题，视频画面在传输过程中会出现停顿，导致音画不同步，骗子正是利用这一点，钻了空子。更有甚者，一些骗子在作案时还利用了视频传输时声音失真的效果进行语音聊天，让人防不胜防。

讲授新课：

一、数据电文的概念

关于数据电文的具体含义，联合国贸法会《电子商务示范法》第2条指出：

“数据电文，是指以电子手段、光学手段或类似手段生成、发送、接收或储存的信息，这些手段包括但不限于电子数据交换、电子邮件、电报、电传或传真。”

注：数据电文是一种新的意思表示方式；数据电文是一种信息

二、传统书面形式与数据电文的矛盾及其解决方案

（一）数据电文与传统书面形式的矛盾（自主学习）

（二）数据电文形式问题的解决方案

1、解决方案之二：法律扩充解释方法

2、解决方案之三：当事人约定的方式

三、数据电文的功能等同原则

（一）功能等同原则的含义

所谓功能等同原则，是指只要数据电文符合书面形式的功能，即符合法律规定的书面形式要求，而不管它是“纸面的”还是“电子的”。

（二）数据电文的书面形式功能

1．电子商务环境中书面形式的基本标准

2．确定书面形式基本标准的意义

3．书面形式功能的界定

（三）数据电文的原件功能

1．数据电文中“原件”的界定

2．数据电文的原件功能

3．我国的现状

值得注意的是，我国《电子签名法》对数据电文的原件问题作出了规定：

符合下列条件的数据电文，应当视为满足法律、行政法规规定的原件形式要求：

（1）自最终形成之时起，其完整性即有可靠保障；

（2）能够有形地表现所载内容。

四、数据电文的法律效力

（一）数据电文的法律承认

1、非歧视原则的确立

《电子商务示范法》承认了数据电文的一般效力，该法第5条规定：

“不得仅仅以某项信息采用数据电文形式为理由，而否定其法律效力、有效性或可执行性。”该条的规定实质上是在法律上，为数据电文争取与纸介形式同等地位做出了原则性规定。

2、我国法律的态度

我国《合同法》也承认数据电文的一般效力。

（二）数据电文在订立合同时的效力

我国《合同法》规定：采用数据电文形式订立合同时，接收人指定特定系统接收数据电文的，该数据电文进入该特定系统的时间，视为到达时间；未指定特定系统的，该数据电文进入接收人的任何系统的首次时间，视为到达时间。

我国在法律上承认了数据电文在订立合同上的效力，而且对在订立合同时数据电文的发送和到达及其时间做出了界定。

（三）数据电文的证据效力

《电子商务示范法》第9条规定：

1、在任何法律诉讼中，证据规则的适用在任何方面均不得以下述理由否定一项数据电文作为证据的可接受性（a）（b）（参见教材P38）

2、对于以数据电文为形式的信息，给予应有的证据力。

课堂小结：数据电文的基本含义，电文的法律效力，数据电文的功能等同原则作业布置：

1、思考题1

6.呼叫中心知识库篇六

中文词条名：知识库

呼叫中心-知识库

英文词条名：Knowledge Base 名词解释

一种商业应用软件，也称为专家系统，可以帮助客户分析和解决基于逻辑树或已知问题的事件。它包含了诸如问题分析和解决等功能。计算公式：无

应用范围：知识库作为呼叫中心重要的业务支撑平台，其主要作用为提高来电处理效率、统一业务处理流程、保持信息界面一致性、与业务培训形成互补并有效缩短培训周期等。一个知识库通常包含以下的模块：

搜索和浏览——利用各种搜索方式如标题、关键字等迅速找到正确的答案，是知识管理的关键模块。

信息管理——维护知识库的内容，如产品信息、常见问题（FAQ）、业务流程等具体信息。

操作员管理——管理知识库的使用者（操作员），设置用户帐号、密码、访问权限等。统计分析——统计知识库的访问情况，如最常访问的问题、答案有效性等，以便客服代表更有效地找到相应内容，也为企业提供产品、服务改进的方向。

广义上的知识库还可以和CRM系统集成，及时显示客户的分类、习惯及价值信息，以方便地进行客户关怀和交叉销售。

历史与发展早期的知识库系统只是简单的树形结构的FAQ文件系统，客服代表在树形目录下寻找合适文件，最多有简单的内容搜索功能。

随着数据库技术的发展以及知识管理的理念为越来越多的企业所接受，现代化的知识库采用了信息采集、自动分类、数据挖掘、智能分析、多维展示等先进技术。知识库可以同时为外部客户（最终用户）和内部客户（客服代表）服务，提供多样化的搜索方式，快速响应用户需求，实现知识共享和知识沉淀。参考词条：知识管理（Knowledge Management）

7.数据中心基础知识篇七

澳大利亚高端托管服务提供商RackCorp开始将其数据中心业务迁移到一个基于博科以太网矩阵基础设施的新网络基础。RackCorp总部位于悉尼, 公司在九个国家的21个数据中心运营业务, 已采用支持软件定义网络 (SDN) 的博科VDX交换机和VCS矩阵技术来满足其全球客户群的高可用性需求和与日俱增的高带宽需求。

RackCorp总监兼网络运营经理Stephen Dendtler表示:“建设新网络的主要原因是为更高的带宽做准备。尽管RackCorp网络目前并没有遇到影响性能的大负载, 我们可以看到, 我们之前的容量将会在未来两到三年面临很大压力。迁移到可提供有效功能以及未来路线图的博科解决方案是一个纯粹的战略性部署。”

“我们将重点转移到数据网络容量市场, 我们必须不断扩展才能满足高容量需求。这意味着要通过博科以太网矩阵解决方案迁移到10 GbE网络。过去, 我们可能低估了博科矩阵技术的优势。现在, 我们更加赞赏博科以太网矩阵技术更轻松地添加更多交换容量和云功能的能力。博科以太网矩阵技术“即插即用”, 灵活扩展网络, 助力RackCorp大踏步前进。还能够帮助我们以自动化的方式为更复杂的客户需求提供解决方案。”

Dendtler表示, 之所以选择博科解决方案, 是因为它在合理的价格范围内提供最高性能, 为RackCoro保障价格优势, 最终实现双赢。他说:“这也更好地激励我们提高内容交付网络和高容量网络服务。”

博科VDX交换机的SDN功能是RackCorp购买决策中的另一个关键考虑因素。公司自2004年起一直运行内部开发的SDN系统来自动处理澳大利亚的网络运营。Dendtler表示, 自从新的博科交换机集成到当前网络, 进行配置更换所花的时间从几秒缩短至几毫秒。

博科澳大利亚和新西兰高级总监Gary Denman表示:“市场上对于SDN热议不断, 但是到目前为止, 鲜有能够富有成效地利用该技术的案例。RackCorp对博科VCS矩阵的部署表明, 博科的SDN实施非常成熟, 足以支持动态24×7软件即服务功能, 金融服务客户每小时能够交易数百万美元。”

8.数据中心基础知识篇八

关键词：大数据知识服务知识库数据清洗非清洁数据清洁度

中图分类号： G302；TP391 文献标识码： A 文章编号： 1003-6938（2013）05-0016-06

1 引言

随着以微博、社交网络等为代表的新型信息发布方式的不断涌现，人类社会的数据种类和规模正以前所未有的速度在不断地增加和累积，大数据时代正式到来[1]。在大数据环境下探讨知识服务，不再局限在传统的文献服务，而必须同步数据的爆发式增长与社会化趋势，将视角瞄准大量的碎片化信息、用户行为、用户关系，并将焦点汇聚在由此产生的实时数据、非结构化数据及机器数据。知识服务的内涵，将随着大数据的驱动而深刻发生变化，它将帮助一个组织更好地调用内部、外部以及公共信息，并进行数据分析，做出前瞻性的数据判断。

美通社最新发布的《大数据市场：2012至2018年全球形势、发展趋势、产业分析、规模、份额和预测》报告指出，2012年全球大数据市场产值为63亿美元，预计2018年该产值将达483亿。2012年，美国政府拨款2亿美元启动“大数据研究和发展倡议”计划。IBM、微软、Google等国外IT巨头早已嗅到了“大数据时代”的商机，这些国际巨头借助自己拥有领先技术和丰富资源，以及稳定的大客户群，实力雄厚，率先涉足。

我国互联网数据中心（IDC）对中国大数据技术和服务市场2012～2016年的预测与分析指出：该市场规模将会从2011年的7760万美元增长到2016年的6.17亿美元，未来5年的复合增长率达51.4%，市场规模增长近7倍。在国内，大数据正在引起越来越多的企业关注。不但阿里巴巴、腾讯等把大数据当成近期的重点项目。作为国内互联网产业的发源地和创新高地，中关村也在抢抓大数据发展机遇，着手布局大数据产业。

学术界、工业界甚至政府机构都已经开始密切关注大数据问题，并对其产生了浓厚的兴趣。大数据是新一代信息技术的集中反映，表现在数据从简单的处理对象转变为一种基础性资源，大数据的规模效应正在给数据存储、管理以及数据分析带来了极大的挑战，知识管理方式上的变革正在酝酿和发生。如何有效存储、管理、组织和更新大规模的数据，如何有效利用存储的数据进行推理获取知识并求解问题，这也是目前图书情报领域一个重要研究课题，正如Google的首席经济学家Hal Varian所说[2]，数据是广泛可用的，所缺乏的是从中提取出知识的能力。由此，可以认为数据收集的根本目的是根据需求从数据中提取有用的知识，并将其应用到具体的领域之中。大数据环境下，更需要高效的知识提取手段，使得大数据源源不断提供有用的知识，而非知识被“淹没”在大数据中。在“数据海洋”中对大数据进行知识提取，最有可能的手段是讓大数据“缩水”，祛除一些噪声数据，对剩下的那些蕴含所需知识的数据进行提取，这也是进行知识管理的前提，更是知识服务的基础。

而在大数据环境下，要做好数据分析并以此做出数据判断的基础工作是数据清洗。大数据的维度包含了数量、多样性、速度、精确性等，在如此大维度中不可避免的存在着粗糙的、不合时宜的数据，如何将这些非清洁数据有效转化成高质量的干净数据，涉及到知识组织中的数据清理。数据的质量体现出数据的价值，更是知识服务水平的保障。数据清洗的最终目的就是提高数据的质量。

2 相关研究综述

系统科学理论对知识组织研究过程中一些问题和现象进行了科学的阐释和有效地引导。借助控制论（Control Theory）可为实现知识服务提供理论支持，具体而言过程化的控制思想对数据加工处理环节的数据质量控制、加工处理环节的时间、进度等控制，为知识组织工程的时间、进度和质量的控制提供了有效地理论支撑。在系统科学理论的指导下，就可从控制论角度出发采用数据清洗手段解决在知识组织过程中数据的质量控制、数据和知识生产流程控制等难题，并能基于控制论基本原理解决知识组织过程中大量复杂问题。

在数据清洗问题上，王曰芬教授[3]领衔的研究团队就从问题产生的背景和国内外研究现状进行了系统的综述研究，并给出数据清洗的定义和对象且说明了数据清洗的基本原理、模型，以及分析相关算法和工具，进一步给出了数据清洗评估方法。他们的成果对今后数据清洗的研究奠定了基础。曹建军等[4]认为数据清洗是数据质量研究的起点，从数据质量的角度明确数据清洗的作用，并提出了数据清洗的一般系统框架，该框架具备了柔性、可扩展性、交互性好、松耦合的特点。叶焕倬等[5]研究了相似重复数据清理方法，重点对检测和清除算法按照算法类型及相关改进思路进行分类综述，值得注意的是他们的视野已关注到将知识和语义的概念引入到数据清理框架中。王宏志等[6]的研究在一定程度上容忍非清洁数据的存在，侧重研究包含非清洁数据的数据库管理技术，提出了非清洁数据的表示方法，支持非清洁数据的数据操作，这样的非清洁数据模型包括一个以关系操作为核心的操作代数，可以有效地支持非清洁数据的各种该应用。而介于清洁数据与非清洁数据中间的不确定数据，周傲英教授等[7]注意到数据的不确定性普遍存在并且表现形式多种多样，提出了针对不确定数据的数据模型运用排序、剪枝等启发式技术设计新型算法，进一步综述了数据模型、数据预处理与集成、存储与索引、查询处理等方面的工作。张岩等[8]的研究中，给出了衡量数据质量的方法，并且可根据用户对结果质量的需求给出达到一定质量的查询结果。叶鸥等[9]的研究瞄准中文数据清洗问题产生的背景、国内外研究现状与研究热点，突出了中文数据清洗基本原理、模型及算法并着重阐明了中文数据清洗的方法，也总结中文数据清洗研究的不足，并对中文数据清洗的研究及应用进行了展望。

nlc202309030515

已有的研究成果，对本文展开数据清洗的研究在模型、技术、方法奠定了基础，控制论又从知识服务方向提供了从事数据清洗的理论指导。现阶段，针对数据清洗的研究不多，从知识服务的角度探究数据清洗的研究成果更少。而大数据引来了国内外越来越多的关注，逐渐发展成国民经济中一个重要产业，标志性的特征就是：①数据种类和规模正以前所未有的速度在不断地增加和累积；②数据分析的深度需求与知识服务广泛整合的鸿沟在拉大。在如此大数据的环境下，以知识服务为目的，深入研究数据清洗，将面临的问题：一方面是在知识组织过程中很多非清洁的数据是很难被彻底清洗干净；另一方面，对非清洁数据的清洗可能造成部分知识的丢失或失真；再一方面，知识库中信息更新频繁，要同步执行非清洁数据的辨识与清洗将极大影响知识库系统的效率，以致知识组织的过程低效。

针对面临的问题，本文从容忍非清洁数据存在的研究视角试图解决从包含非清洁数据的知识库中获取满足清洁度要求的查询结果的问题，也就是要给出非清洁数据的清洁度的描述。而非清洁来自两个方面，一方面是数据本身的非清洁，表现特征是数据的错误、不准确、不完整；另一方面是数据间的非清洁，表现特征是数据的重复、冗余、不一致。针对非清洁的两个方面，本文的研究工作将从元组上添加清洁度来描述数据清洁度，以此实现非清洁数据的清洁度的描述。

3 大数据对数据清洗的基础性需求

大数据不仅数量大，而且是异构和多媒体的。在大数据环境下探讨知识服务的解决方案、实现途径和方法，以及实现知识服务涉及到的技术问题。首先在宏观层面明确大数据对实现知识服务的要求，其次在技术实现层面找到支持数据处理、信息分析和知识服务涉及的基础性突破，即数据清洗。

3.1 大数据对知识服务的要求

大数据的价值在于提炼其中隐藏在数据中的规律和有关知识，它对知识服务的要求集中体现在两个方面：首先是大数据环境下的数据整合与规划。大数据不仅仅是容量大、内容丰富，而且其结构是异构的，数据产生的速度也是飞速的，数据中蕴含的知识也是无法衡量的。数据的繁杂、良莠不齐，使数据的利用效率受到影响。通过整合与规划提高数据的利用效率、提升数据的使用价值；其次数据的知识关联与组织。孤立的数据价值低，也只能完成传统的信息服务。针对大数据的知识服务必须将数据进行关联，使之能够为解决问题直接提供知识。通过分析知识组织的关联机制，构建以知识服务为目标的知识地图，确保从传统的信息服务能够上升到知识服务层面。

3.2 知识服务对数据清洗的需求

在知识组织过程中，知识库“吸收”数据且“供给”知识，最终目的是为知识服务提供满足应用所要求的合适的查询结果，数据是知识的基础，数据质量决定了知识的价值，而数据质量问题是由非清洁数据造成的。为此，知识服务若要实现高端的服务水平，基础在于知识组织，瓶颈在于数据清洗。数据清洗的目的是检测数据本身的非清洁和数据间的非清洁，剔除或者改正它们，以提高数据的质量。知识服务不仅需要分析非清洁数据的各种类型不一致、不精确、错误、冗余、过时等的解决方案，更需要追溯非清洁数据的形成源头，如：①数据本身来源不清洁导致的非清潔数据，例如数据采集和录入的精确；②数据模式的不清洁和信息集成中模式不匹配导致的非清洁数据；③数据的查询请求本身是不清洁的，导致获取了非清洁的查询结果。最终结合不同来源与不同类型，反馈修正解决方案使之能配合知识表示效用，以及在提高知识服务水平的同时，保障知识服务的效率。

4 数据清洗的基本框架模型

以一个非清洁数据的片段为例，如表1所示，可以很容易判断：①不完整的数据有：（ID：3、字段：City）“BJ”；②错误的数据有：（ID：6、字段：Name）“Mal-Mart”；③冗余的数据：（ID：1、3、6）表示同一个实体。

对非清洁数据，数据清洗的框架模型分5个部分逐步进行，整个框架如图1所示。

4.1 准备

包括需求分析、大数据类别分析、任务定义、小类别方法定义、基本配置，以及基于以上工作获得数据清洗方案等。通过需求分析明确知识库系统的数据清洗需求，大数据类别分析将大数据归类以便同类数据进行分析，任务定义要明确具体的数据清洗任务目标，小类别方法定义确定某类非清洁数据合适的数据清洗方法，基本配置完成数据接口等的配置，要形成完整的数据清洗方案，并整理归档。上述案例，可以看出表1描述的是超市的相关信息。

4.2 检测

对数据本身及数据间的预处理检测包括相似重复记录、不完整记录、逻辑错误、异常数据等，并且对检测结果进行统计，全面获得的数据质量信息，并将相关信息整理归档。上述案例（表1）检测出存在有：①不完整的数据、②错误的数据、③冗余的数据。

4.3 定位

对检测结果的归档信息进行数据质量进行评估，获得非清洁数据的定位并进行数据追踪分析，分析非清洁数据及由此可能的知识表示的影响，分析产生非清洁的根本原因；进而确定数据质量问题性质及位置，给出非清洁的修正方案，并将相关信息归档。根据定位分析情况，可能需要返回“检测”阶段，进一步定位需要修正数据的位置。上例中非清洁数据片段的位置：（ID：3、字段：City）、（ID：6、字段：Name）、（ID：1、3、6）。

4.4 修正

在定位分析的基础上，对检测出的非清洁数据进行修正，包括非清洁数据标记、不可用数据删除、重复记录合并、缺失数据估计与填充等，并对数据修正过程进行存储管理。上例中在定位后，修正上述三类数据，经过修正后，得到如表2所示数据片断。

4.5 验证

对修正后的数据与任务定义的符合性进行比对验证，如果结果与任务目标不符合，则做进一步定位分析与修正，甚至返回“准备”中调整相应准备工作。表2反映出经过一轮修正后的数据片断，与表1相比部分不完整的数据、错误的数据、冗余的数据得到了清洗，但清洗过后的数据显然还不完美，依然有明显不一致的地方。

nlc202309030515

5 基本框架模型的局限

实际大数据应用中，前面提出的基本模型具有局限性：首先，大数据通常是异构且碎片化的，多数情况下这些类型的非清洁数据是难以被彻底清洗干净的；其次，对非清洁数据的清洗可能会造成蕴含知识的损失，以致知识的失真；最后，对于知识库频繁更新，同步执行非清洁数据的辨识和清洗将极大地减低系统的效率。

再如上例中，从表1到表2，在一定程度是进行了数据清洗，但深入观察可以发现（ID：6、字段：Name）“Walmart”虽然不存在拼写错误，但表示方式与其他的“Wal-Mart”并不一致，还有（字段：Phn）的表示也不一致，这些不一致的地方阅读者容易理解，而机器很难“理解”。也就是，经过一轮的数据清洗，出现了知识内涵一致的元组（“Walmart”与“Wal-Mart”），却存在表示字符上的差异，这是否意味着需要进一步进行数据清洗？如果由机器进行更细腻的数据清洗，必然将出现一部分信息的丢失或失真，并且带来机器计算上的负担。因此，数据清洗是必要的，但清洗过后，依然存在非清洁数据也是必然的。

从上述分析可以看出，非清洁数据的辨识与清洗很难保证彻底消除非清洁数据，特别大数据的多维度性，给清洗带来了困难，且随着清洗的细腻程度逐步提高，知识库系统的运行性能将逐步降低伴随将逐步丢失数据中蕴藏的信息，不能快速有效地解决非清洁数据带来的问题。为此，大数据的存在，需要在一定程度上容忍非清洁数据的存在。这样，研究管理包含非清洁数据的知识库系统成为了重要的问题，其核心在于如何从包含非清洁数据的知识库中得到满足应用所要求清洁度的查询结果。

6 非清洁数据的清洁度的机制

6.1 清洁度获取

清洁度本质上反应的是数据质量。目前，清洁度定义可以用两种方法描述：一种是概率的方法，即将元组清洁度定义为该元组准确的概率；另一种是相对误差的方法，即定义元组对于真实值的相对误差。其中应用最为广泛的是概率的方法。如表1中，可以判断元组1、3和6表示同一个实体，因此，可以合并这3条元组，根据这个数据片段只能判断“Name”取值更可能为“Wal-Mart”，但机器无法完全排除“Mal-Mart”，为了描述每个可能取值的质量，赋予每个值一个概率值，表示该值的清洁度。如“Wal-Mart”在同一个实体3条元组出现了2次，则清洁度为2/3，从而得出该条实体各元组的清洁度，如表3所示。

在实际应用中，元组的清洁度可以通过人工或者自动的方法获取，主要来源包括：

（1）人工添加。最直接的方法是由用户根据领域知识和数据的来源添加数据的清洁度。这种方法的问题在于，当数据量很大时，需要大量的人力。

（2）属性清洁度组合。由于一些属性的清洁度是可以预知的，比如在科学统计数据库中描述某仪器采回数据的关系，模式为（Time，Value），其中：Value 列来源于数据采集设备，该设备的相对误差是知道的；而 Time列是在采样时由系统添加，可以看成清洁的列。因此，该关系中元组的清洁度定义为 Value 列的清洁度。

（3）模式转换。在信息集成中，在数据之间进行模式转换会产生清洁度的损失，在一些信息集成方法中会给出模式转换时数据的损失，经过归一化以后，该损失可以用作表示数据清洁度。

（4）信息提取。信息提取的过程中，一些技术会根据原始数据的特点或者机器学习的方法求得某数据属于某元组概率或者准确率，这个值可用作数据清洁度的描述。

（5）实体识别。当前，有很多实体识别的方法将数据集合划分成为实体，通过描述同一实体的不同元组之间的不一致性来描述实体的清洁度。

以上多种方法在一些应用中是可以结合使用的，根据本模型的特点，在结合使用时，元组的清洁度应为多来源清洁度的乘积。一方面使得元组的清洁度满足取值在[0，1]之间；另一方面，这样的方法体现了多种清洁度的复合。例如信息提取系统中，首先进行信息提取，然后进行实体识别，则最终结果的清洁度可以定义为信息提取步骤的清洁度与实体识别步骤清洁度的乘积。

6.2 操作的实现策略

通过在每个关系中添加描述清洁度的列（如表3），现有的關系数据库系统可以对本模型所描述的数据进行管理。然而，现有关系数据库中的管理机制不足以支持所有的操作。考虑到随着操作的进行数据清洁度是递减的，因此根据查询的需求，在操作执行的过程中某些环节需要过滤掉清洁度不可能满足查询要求的中间结果，这样可以减小中间结果的数据量，从而加速查询的处理。例如，对于如果查询要求结果中每条元组的清洁度在 0.5 以上，则在查询处理的过程中可以过滤掉清洁度小于 0.5 的中间结果，因为由这些中间结果生成最终结果的清洁度一定小于 0.5。

6.3 基于阀值的相似连接算法

相似连接是在两个元组集合中选择出满足相似性下界（阀值）的元组对。目前已经有很多衡量相似性的方法：编辑距离、Hamming距离、杰卡德相似度以及余弦相似度等。本小节考虑的是基于编辑距离的相似连接。对于给定的两个字符串r和s，r和s的编辑距离ed（r，s）是指从r变为s所需要的最少的编辑操作（包括：删除、插入和替换）次数。如表4中，ed（Wal-Mart，Mal-Mart）=1，ed（80103389，010-80103389）=4。在实体关系数据库中，属性值可能含有多个取值，本书对相似连接算法给出如下定义。

定义1：相似连接。给定两个属性值集合R和S及编辑距离阀值k，R和S的相似连接是指选出所有的属性值组合（r，s），其中r∈R，s∈S，而且r和s满足至少存在一组可能取值r1和s2。它们的编辑距离ed（r1，s2）≤k。

以表4为例，给出两个集合R和S。若编辑距离阀值k设为3，则对应相似连接结果仅为（r1，s1）与（r2，s2），因为ed（Wal-Mart，Mal-Mart）=1≤3，ed（Jerry Strauss，Jerry Strauss）=0≤3。其余相似连接中（r2，s1）、（r1，s2）显然其编辑距离均超过阀值3，表5给出了连接结果。

nlc202309030515

其中，第二条元组（ID=2），ed（Jerry Smith，Jerry Strauss）>3、ed（Jerry Smith，Jeff Strauss）>3，故第二条元组对应清洁度为1/5*2/5+1/5*3/5=0.2。

在实际关系数据库中，所有可能值都有对应的清洁度，所以，所有相似连接结果也都会有一个清洁度，表示该结果的质量，如表5结果所示，而在实际应用中，我们只对清洁度比较高的结果感兴趣，对于那些较低清洁度的结果可以忽略。

定义2：基于阀值的相似连接。给定两个属性值集合R和S及编辑距离阀值k和清洁度阀值α， R和S的阀值相似连接是指选出所有的属性值组合（r，s），其中r∈R，s∈S，而且r和s连接结果的清洁度不低于α。

上例中，如果清洁度阀值α设为0.3，表5中两个集合R和S的阀值的相似连接结果不再是（r1，s1）与（r2，s2），因为第二条元组对应清洁度为1/5*2/5+1/5*3/5=0.2，该结果不满足清洁度阀值要求。

基于阀值的相似连接算法的特点是当编辑距离阀值k较大且清洁度阀值较小时，连接结果大小将接近于n2（n是连接集合的大小），反之连接结果集比较大。

6.4 清洁度的机制的研究不足

目前关于非清洁数据的清洁度机制的研究成果非常少，汇聚在图书情报领域的成果更少。而事实上，知识来源于数据的提炼，大数据大维度与碎片化中蕴含了丰富的知识内涵。上一节的探讨，只描述了清洁度机制的框架，研究也還停留在数据本身的处理，而清洁度机制是一项复杂的研究，还有深入优化的研究空间。譬如，将清洁度机制与知识的语义距离结合，如ed（Wal-Mart，Mal-Mart）=1，ed（80103389，010-80103389）=4，虽然存在编辑距离，其实它们都是同一个知识点，进一步的研究将涉及到是先进行知识的语义距离计算还是先进行清洁度计算，或者两者并行计算，这将是图书情报领域又一个难点。

7 结语

大数据时代的到来给知识服务带来了变革，迫使其将碎片化信息、社会化的信息提炼成描述用户行为、用户关系，并能解决问题的知识。为此，本文从大数据的研究背景下提出了对知识服务的要求，并面向知识服务，数据清洗的过程又是大数据环境下的瓶颈。给出了数据清洗的基本框架模型及其局限性，针对大数据的多维度性，在元组上增加了清洁度的描述，基于此研究了应对大数据环境下的非清洁数据的清洁度机制。

通过研究也发现了不足，下一步针对大数据的数据清洗将从知识的概念层次性入手，能体现知识之间的语义交叉这样更适用于大数据的大维度，根据知识的概念层次，通过消除知识的重复应用，建立原子知识序列，优化了用户的请求，减少了对知识库扫描的次数，从而提高了数据清洗效率。

参考文献：

[1]孟小峰，慈祥.大数据管理：概念、技术与挑战[J].计算机研究与发展，2013，50（1）：146-169.

[2]The Economist.Data，data，everywhere-A special report on managing information[EB/OL].[2013-04-26].http：//www.economist.com/node/15557443.

[3]王曰芬，章成志.数据清洗研究综述[J].现代图书情报技术，2007，（12）：50-56.

[4]曹建军，刁兴春，陈爽.数据清洗及其一般性系统框架[J].计算机科学，2012，39（11）：207-211.

[5]叶焕倬，吴迪.相似重复记录清理方法研究综述[J].现代图书情报技术，2010，（9）：56-66.

[6]王宏志，李建中，高宏.一种非清洁数据库的数据模型[J].软件学报，2012，23（3）：539-549.

[7]周傲英，金澈清，王国仁等.不确定性数据管理技术研究综述[J].计算机学报，2009，32（1）：1-16.

[8]张岩，杨龙，王宏志.劣质数据库上阈值相似连接结果大小估计[J].计算机学报，2012，35（10）：2159-2168.

[9]叶鸥，张璟，李军怀.中文数据清洗研究综述[J].计算机工程与应用，2012，48（14）：121-129.

作者简介：蒋勋（1980-），男，南京大学信息管理学院博士后，无锡城市职业技术学院电子信息工程系讲师，研究方向：知识工程与信息智能处理；刘喜文（1983-），男，南京大学信息管理学院博士研究生，研究方向：本体技术。

9.疾控中心文明单位创建计划知识篇九

为进一步加强单位精神文明建设，促进单位三个文明建设的协调发展，引导和激励全体干部职工统一思想，开拓创新，不断提高全体职工思想道德素质、科学文化教育水平、文化生活质量等整体文明程度，积极营造良好的发展环境，为实现经济社会的快速发展提供强有力的思想保证、精神动力和智力支持，培养出一支有理想、有道德、有文化、有纪律，政治坚定、业务技术精良的干部职工队伍，以推动全县疾控事业的跨越式发展，促进和谐发展，中心研究决定：在多年来三个文明建设取得一定成绩的基础上，再次创建市级文明单位。结合我单位实际，制定2012疾控中心精神文明创建计划：

一、目标

争取在2012年年底通过市级文明单位的检查验收。

二、组织实施

1、成立创建市级文明单位领导小组，由中心主任XXX同志担任组长，由XXX同志任副组长，中心各职能科室负责人任成员。中心办公室负责创建日常工作。

2、中心领导每月召开一次会议，不断进行研究，总结经验，找出差距，团结协作、同心同德，共同抓好单位建设，为实现文明单位奠定可靠的基础保证。将创建工作纳入2012工作计划和目标管理，要求干部职工个个参与。并且加大创市级文明单位工作的考核力度，作到年初有计划、年中有检查、年终有总结、层层落实、奖惩兑现。

三、具体创建安排

（一）、建设一支强有力的领导班子。

中心以创“四好”班子为主要形式，狠抓领导班子建设。抓理论武装，提高领导干部的理论素养和工作水平。坚持领导干部理论学习的“五个一”制度、理论学习的领导责任制、领导干部定期脱产培训制度、领导干部调查研究制度、领导干部密切联系群众制度等，通过加强制度建设，确保领导干部的理论学习落到实处，收到实效。抓团结协调，形成强有力的领导核心。坚持把领导班子成员的职责、权限、议事规则、工作作风、思想行为的规范化作为制度建设的重点，贯穿到各项工作的始终，保证和巩固了领导班子成员间良好的团结协作关系。抓基层班子，提高班子整体功能。

（二）、认真搞好行风政风建设。

1、为了加强行业行风政风建设，落实“为民、务实、清廉”的要求，提高职工的职业道德水平，继续在行业开展行风政风集中评议活动，接受社会的监督，杜绝违法乱纪现象的发生。严格执行《中心请销假制度》等19项制度，狠抓作风、纪律、效果、质量的督查和考核，强化廉政建设和政务公开，严禁吃、拿、卡、要，规范文明言行举止，积极开展优质服务，切实转变作风，服务社会、服务基层、服务群众，提高服务技能，改善服务态度，达到社会满意、基层满意、群众满意。满意率达85％以上。

2、开展文明行医、礼貌待患活动。树立全心全意为人民服务的宗旨，开展假如我是一名患者的讨论，提高医德医风，开展尊老爱幼活动，做到文明礼貌服务，举止端正、语言文明、态度和蔼，同情体贴和关心患者。

3、开展“卫生服务禁语”和“卫生服务文明用语”活动，做到有组织、有部署、有检查，行之有效，改变“冷、硬、顶、”等不良现象

4、实行挂牌服务，设立监督台，招聘社会人员为医德医风监督员，定期召开座谈会，征求社会各方意见，提高我们工作中的透明度。

（三）、坚持卫生改革，提高两个效益

1、坚持卫生改革方针，实行目标化管理，落实卫生局的“目标岗位责任制”，制定疾控中心2012年综合目标管理及实施方案”。

2、根据目标完成情况实行半年的自查评估，年末总结，不断总结、找出差距，提高工作效率。

3、完成县委和卫生局及各级部门下达的工作任务，力争达全县中上游水平。

（四）、学习普法知识，做遵纪守法的模范

1、响应党委号召，成立普法知识领导小组，作出学习计划，组织全体职工积极参加学习、答卷等活动，使全体职工普遍受到并提高法律知识教育。

2、制定“廉政制度”、“党员干部工作守则”来约束全体职工，使之做到廉洁奉公，自觉遵守法律，不以医谋私，不行贿受贿，自觉抵制不正之风，实行拒腐蚀文明行医、廉洁为公、无私奉献。

3、教育职工学法懂法，做到全年内无违纪现象，无刑事案件，无责任事件发生。

4、纠正行业不正之风，杜绝开假诊断书，人情处方，大药方等错误行为。发现对患者进行“吃、拿、卡、要”等现象，保证患者用药安全有效。

二、广泛宣传，营造爱国卫生好氛围。

（五）、搞好职教、综合治理、安全及绿化工作

1、积极选派干部职工参加上级单位组织的各类业务培训等，支持职工参加各种继续教育学习和考试。

2、认真搞好综合治理，保持经常性的环境卫生和室内外清洁整齐，保证工作区绿化美化。清洁卫生区域按科室分片包干，责任到人，坚持每日小扫，间周大扫，纳入机关综合考评，奖惩兑现。

（1）成立卫生领导小组，制定卫生规划，建立卫生工作制度，划分卫生分担区，每月进行一次检查，年末进行评比，列入年末考核内容。

（2）建立垃圾箱，自行车、摩托车停放棚，汽车停放位。

（3）落实卫生责任制，做到责任到人，消灭卫生死角，做到室内无灰尘，窗明几净，物品摆放整齐有序，树立大卫生观念，创造清洁优美的卫生环境，并且做到经常化、正规化。

（4）清除“四害”，加强环境卫生工作

积极开展以灭鼠、灭蝇为中心的除四害活动。为确保除四害活动有效开展，在每一次活动中要做到有计划、有要求、有部署，有专人负责、有专人投药。同时认真做好检查，及时掌握情况，保证灭鼠除害的工作效果，使鼠、蟑、蝇密度要控制在上级规定要求之内。在做好自身卫生工作的同时，积极参加爱卫办组织的义务劳动和植树活动以及门前三包、路段管理工作。

3、做好控烟工作。中心做为省级示范控烟单位，一方面对社会各单位创建无烟单位给予技术指导；另一方面在中心内部大力开展无烟单位、无烟科室创建活动，按照创建标准起草了活动实施工作方案，在单位院内、科室、卫生间以及会议室、办公室、走廊过道等公共场所常年张贴禁止禁烟标示、标语，健康教育宣传版面，控烟领导小组及巡视员经常深入科室对科室人员和病人及社会人员进行控烟宣传，使我中心始终保持了无烟状态。

4、做好安全保卫工作。认真落实社会治安综合治理工作。做好机关及家属区的防盗、防火、防事故工作，保证工作区和生活区的安全。

5、加大资金投入，打好硬件基础建设

美化办公环境是中心创卫工作的重要组成部分。近年来，我们先后投资数万元用于美化、绿化、亮化单位办公环境，为我县创卫工作打好硬件基础。在往年绿化、美化的基础上，今年我们又投资两万余元，对办公楼、卫生间、走廊等公共部分进行了彻底改造，改善了办公楼内部环境。每年花费数千元聘请绿化公司人员对单位园林进行维护保养，始终保持着市级园林单位称号。

（六）、积极培养和树立先进典型

在单位评选3名先进党务工作者、6名优秀共产党员，并对其进行表彰，开展1次文明科室、“五好家庭户”的评选活动。

四、开展评奖活动，实行奖惩办法

为保证本方案的实施以及文明单位的实现，要根据总体目标，实行季度的体查评估、半年总结的办法，对任期目标完成较差、出现违纪现象等按医院规章制度进行处罚，对于工作积极、贡献较大的给予精神及物质奖励，以促进文明建设工作的开展。保持文明单位是我单位全体职工的心愿，也是我们的荣誉，全体职工都在岗位上积极努力工作，创造条件，为早日使我单位跨入省级文明单位行列奉献一切！

10.数据中心基础知识篇十

（56学时）

主讲：专业：班级：

第1章数据库系统概述（4学时）

教学目标：了解数据库技术的发展史，了解每个阶段具有代表性的数据库管理系统的特点和划分依据，了解关系运算和关系规范化。

教学重点：

 掌握关系数据库的基本概念和发展历史；  掌握数据模型的组成及组成要素；

 掌握概念模型的表示方法及转化为数据库模式的方法  掌握关系运算的方法，了解各种关系运算的作用；  掌握函数依赖及关系规范化；教学难点：

 数据模型的含义  关系运算的运算规则  E-R图及转化规则

 函数依赖及关系规范化教学建议：

查看一些有关计算机科普方面的书籍或刊物或网站，多了解一些计算机的科普知识。知道一些计算机领域中的科学家的故事，对掌握本节内容有很多好处。本讲内容概述：主要介绍了数据库技术的发展所经历的三个阶段，并简单介绍了分布数据库、并行数据库、多媒体数据库的基本特点。详细介绍了关系数据库的数据模型、关系运算，阐述了关系数据库的概念和函数依赖及关系规范化。

涉及章节及安排：

1.1数据库与数据库系统（1学时）1.2数据模型（1学时）

1.3 关系运算及关系完整性（1学时）1.3 函数依赖及关系规范化（1学时）思考与训练：

（1）进行表的关系运算的作用是什么？

（2）如果要显示所有数据库课程的成绩，需要进行什么运算？

（3）如果要显示所有学生的姓名、课程名称和成绩，需要进行什么运算？

课后练习：第1章习题第二章关系数据库（6学时）

教学目标：了解Access2003的新特点及开发环境，掌握Access2003数据库的设计方法及步骤，结合图书借阅管理系统了解数据设计的步骤及安全管理。

教学重点：

 Access的工作环境  Access的数据库对象  Access数据库设计步骤

 Access数据库的管理与安全教学难点：

 Access2003数据库的设计步骤  Access2003数据库的管理和安全教学建议：

结合图书借阅管理系统的实例，课下设计学生成绩管理系统的设计，并实施数据库的管理与安全。

本讲内容概述：主要介绍了数Access2003的特点及开发环境，阐述了数据设计的步骤及方法，演示并练习数据库的管理与安全。涉及章节及安排：

2.1Access2003基础（1学时）

2.2 Access2003开发环境（1学时）2.3 Access2003数据库设计（2学时）2.3 数据库的管理与安全（2学时）思考与训练：

（1）学生成绩管理系统数据库的设计；（2）图书借阅管理系统的管理与安全练习；课后练习：第2章习题

第三章数据库和表(10学时)教学目标：

1)学习并掌握数据库的创建方法；掌握打开数据库的常用方法；理解并掌握数据库对象的删除、复制重命名、保存，并会用组来组织数据库对象； 2）学习并掌握使用向导创建表、使用输入数据创建表以及自定义表的方法，要求掌握字段名称定义、设置字段类型以及设置字段大小、格式字段属性的方法；

3)学习并掌握在设计视图中进行小数位数、输入掩码、标题、默认值、有效性规则等字段属性设置的方法，掌握查阅列表和主键的创建方法，学会使用Access 2002的导入表、链接表和导出表功能。

4)理解主键和外键的概念，了解表的关联类型，掌握定义表之间关联关系的方法。理解和掌握参照完整性的概念和设置方法。

5)熟练掌握直接向表添加记录、用自动窗体录入数据的方法，学会使用查找和替换功能提高数据修改的效率，理解排序和筛选的概念和实现它们的方法，能够根据实际需要设置表的外观教学重点：

 掌握使用向导创建数据库的方法；  了解并掌握常见的数据库打开方法；

 了解数据库对象管理的意义和作用，掌握复制、删除、重命名、保存等基本操作；

 理解数据库对象管理中“组”的含义，掌握用“组”组织数据库对象的方法。

 使用向导创建表的方法；  使用输入数据创建表；

 使用设计器创建表的方法；  设置字段类型的方法；

 设置字段大小、格式的方法。 主键和外键；  表的关联类型；  定义表之间的关系；  参照完整性。 在表中录入数据；

 使用自动窗体录入数据；  修改数据；  查找和替换；  排序与筛选；  表的行列操作。教学难点：

 数据库对象管理中“组”的感念及使用方法  使用设计器创建表；  设置字段格式。

 输入掩码、有效性规则和有效性文本字段属性的设置；  创建查阅列表；  导入表和链接表。 表的关联类型；

 定义和修改表间关系；

 参照完整性的含义和设置方法。 排序与筛选。本讲内容概述： 1）介绍在Access 2003中创建数据库的方法、打开数据库的方法及数据库对象的复制、删除、重命名和保存等操作方法 2）在Access 2003中使用向导创建表、使用输入数据创建表和使用设计器自定义表的方法，要求掌握对表字段大小和字段格式这两种字段属性进行设置和修改的方法以，熟练掌握对表中字段的各种操作。

3）介绍小数位数、输入眼码、标题、默认值、有效性规则、有效文本以及索引等字段属性的设置方法。介绍了查阅列表、主键的创建方法，此外还要了解使用Access 2003的导入功能利用外部数据创建表的方法和过程，介绍了链接表的概念和使用方法，并对Access 2003的导出功能作了介绍。

4）介绍了主键和外键的概念、创建索引的方法和过程，讲解数据表之间关联关系的建立和修改的方法，并讲述了参照完整性的概念。5）介绍在数据表视图下对表中数据进行各种编辑的方法，此外还介绍了查找和替换数据的方法，讲解了排序和筛选的作用和用法，最后介绍了表的外观设置方法。

涉及章节及安排：

3.1创建数据库（2学时）3.2建立表（2学时）3.3维护表（2学时）3.4操作表(2学时)3.5数据表的关联(2学时)思考与训练：

（1）使用向导创建的数据库有什么优、缺点？

（2）使用向导创建表与使用设计器创建表有什么不同？使用设计器创建表有什么优势？

（3）设置字段格式的重要性是什么？（4）先输入数据还是先建立关系？

（5）参照完整性和级联更新的关系是什么？（6）修改表中数据的字体样式有哪些方法？（7）冻结列和隐藏列有什么作用？课后练习：第3章后习题第四章数据查询和第五章SQL语言(10学时)教学目标：

1)理解查询的概念及其意义，了解选择查询、参数查询、交叉表查询和操作查询的基本概念。熟练掌握使用向导和使用设计器创建选择查询的方法。2)理解参数查询的含义，掌握参数查询的操作过程，明确参数查询在查询准则确定方面的不同之处。理解交叉表查询的概念和创建方法，并会使用交叉表查询实现字段数据的汇总。

3)介绍查询表达式中的运算及查询表达式的构建方法，介绍表达式的常见应用；详细介绍计算字段的含义及创建、使用方法。

4)理解并掌握四种操作查询的创建方法，了解使用SQL可以实现所有查询这一事实；理解各种操作查询的使用场合和功能；掌握使用SQL创建联合查询、传递查询、数据定义查询、子查询等特定查询的方法和相应的SQL语句格式。

教学重点：

 查询的定义和作用；  查询的种类；

 使用向导创建选择查询；  使用设计器创建选择查询。 创建参数查询；

 使用向导创建交叉表查询；  使用设计器创建交叉表查询。

 表达式中的算术运算符、比较运算符、逻辑运算符和连接运算符；  表达式在查询中的应用；

 用设计视图在查询中创建计算字段。 创建生成表查询；  创建更新查询；  创建追加查询；  创建删除查询；  SQL语句介绍；  创建SQL查询。教学难点：

 在设计视图中创建和修改查询的方法；  创建单表和多表查询的方法；  查询准则的确定方法。 创建参数查询；

 使用设计器创建交叉表查询。 查询表达式；  计算字段的创建。 SQL语句格式；  创建SQL查询。本讲内容概述：

1)主要介绍查询的定义和作用，介绍常见查询种类。重点讲述选择查询的创建方法，创建方法主要有两种：使用向导创建和使用设计器创建选择查询。2)介绍主要介绍选择查询之参数查询的实现方法，并详细介绍交叉查询的含义和创建方法。

3)介绍查询表达式中的运算及查询表达式的构建方法，介绍表达式的常见应用；详细介绍计算字段的含义及创建、使用方法。

4)介绍生成表查询、更新查询、追加查询、删除查询这四种操作查询的含义和创建方法，并介绍了SQL结构化查询的主要语句，详细说明使用SQL实现联合查询、传递查询等特定查询的方法。涉及章节及安排：

4.1 查询的概念和目的(1学时)4.2 建立查询的方式(1学时)4.3 查询设计器的使用(2 学时)4.4设计各种查询(2学时)4.5 查询的保存与运行(2学时)4.6创建SQL查询(2 学时)4.7创建操作查询(2学时)思考与训练：

1）在查询向导中，明细与汇总的含义和区别是什么？ 2）怎样在未建立关系的表间建立临时关系？

3）参数查询在查询准则的确定上有什么特点和好处？

4）交叉表查询中，对于交叉表中主题“值”部分的对应“总计”单元格能否设置为“Group By”？

5）计算字段的本质是什么？

6）操作查询与其它查询有什么不同？起什么作用？ 7）使用SQL语句可以实现所有查询吗？课后练习：第4、5章习题

第六章窗体(6学时)教学目标： 1）了解窗体的作用和分类，熟悉各种窗体的用途。掌握创建窗体的两种方法：使用向导创建窗体和使用设计器创建窗体。

2）了解常用控件的种类和用途，掌握常用控件的使用方法及属性设置方法，学会使用控件实现常见功能。了解窗体上控件布局调整的方法。3）了解子窗体的概念，掌握嵌入式子窗体和弹出式子窗体的概念和使用方法；掌握使用窗体添加、删除和编辑数据的方法；掌握在窗体中实现对记录的查找、筛选和排序的方法。教学重点：

 窗体的定义和作用；  窗体的分类；

 使用向导创建窗体；  使用设计器创建窗体。 常用控件的种类和用途；

 常用控件的功能和属性设置；  窗体控件布局调整方法。

 子窗体的种类、用途和创建方法；

 使用窗体向数据库中添加、删除和编辑记录；  在窗体中实现查找、筛选和排序。教学难点：

 使用向导创建窗体；  使用设计器创建窗体。

 常用控件的使用方法和用途；

 嵌入式子窗体、弹出式子窗体的使用；  在窗体中实现筛选和排序。本讲内容概述：

1)主要介绍了纵栏式窗体、表格式窗体、数据表窗体、子窗体、弹出式窗体、数据透视表窗体、数据透视图窗体七种类型的窗体。并介绍了两种创建窗体的方法：使用向导创建窗体和使用设计器创建窗体。

2)主要介绍了常用控件的种类和用途，并详细介绍了常用控件的使用方法，说明了窗体上调整控件布局的方法。

3)介绍了嵌入式子窗体和弹出式子窗体的概念及创建、使用方法，介绍了在窗体中实现对记录数据进行常规操作的方法。涉及章节及安排： 6.1认识窗体(1学时)6.2 创建窗体(1学时)6.3 窗体的设计与技巧(2学时)6.4 创建主子窗体及设计(2学时)思考与训练：

（1）窗体的作用是什么？（2）窗体控件可分为几大类？（3）如何设置控件属性？

第七章报表(8学时)教学目标：

1)理解报表的定义和作用，熟悉报表的结构和各部分的作用；熟练掌握使用向导设计报表和使用设计器设计报表的方法；了解使用报表的用途。2)掌握利用对记录排序和分组来设计报表的方法，理解排序和分组对报表的重要性；理解条件格式、控件和函数对增强报表的作用并掌握其使用方法；了解特殊报表的设计方法。教学重点：  报表的定义；

 报表的构成及各部分作用；  使用向导创建报表；  使用设计器创建报表。 对记录排序和分组；  使用条件格式增强报表；  使用空间和函数增强报表；  创建特殊报表。教学难点：

 使用向导创建报表；  使用设计器创建报表。 设计排序和分组报表；  创建特殊报表。本讲内容概述：

1)主要介绍了数据库应用系统实现报表打印功能的主要对象--报表对象，介绍了报表的定义、构成方式及创建报表的方法。2)介绍了通过向报表中添加分组和排序、设置条件格式和使用空间来增强报表的逻辑性、功能和层次感。此外，还介绍了创建和设计特殊报表的方法。涉及章节及安排： 7.1 认识报表(2 学时)7.2 创建报表(2 学时)7.3 编辑报表、报表排序和分组,使用计算控件(2学时)7.4 创建子报表、多列报表（2 学时）思考与训练：

（1）报表与窗体有什么不同？（2）报表的作用是什么？

（3）怎样对分组的数据实现强制分页？作业:第7章习题

第八章数据访问页(2学时)教学目标：了解数据访问页的概念和作用，熟悉数据访问页的类型分类，掌握使用向导和设计器创建和设计数据访问页的方法，并了解数据访问页的使用。此外，了解并掌握利用控件设计特殊的数据访问页的方法，学会分组数据访问页的设计方法。教学重点：

 数据访问页概述；  数据访问页类型；

 使用向导创建数据访问页；  使用设计器创建数据访问页；  数据访问页的编辑；  分组数据访问页的设计。

教学难点：

 创建数据访问页；  数据访问页的设计。

本讲内容概述：主要介绍数据访问页的概念和作用，数据访问页的种类；阐明了数据访问页的创建方法和过程；说明了如何在数据访问页中使用控件的方法和作用。涉及章节：

8.1数据访问页概述（1学时）8.2创建数据访问页（1学时）

8.3使用设计视图修改数据访问页（1学时）8.4数据访问页的使用（1学时）思考与训练：

（1）数据访问页的文件格式？（2）数据访问页的作用是什么？课后习题：第8章习题

第九章宏(4学时)教学目标：理解宏的本质和定义，了解宏的作用，熟悉宏组和条件宏的基本概念；掌握创建宏、宏组和条件宏的方法及其应用方法。学会创建和使用AutoExec宏。教学重点：

 宏、宏组和条件宏的概念；

 创建宏、宏组和条件宏的方法，理解其用法；

 理解AutoExec宏与AutoKeys宏的使用方法和创建过程；  能根据需要创建宏。

教学难点：  宏的原理；  宏的创建。

本讲内容概述：主要介绍宏的基本概念以及宏组、条件宏的定义；详细介绍了创建宏的基本方法和使用方法。涉及章节及安排

9.1宏的基本概念与分类（1学时）9.2创建宏（1学时）9.3宏的运行（0.5学时）9.4常用宏操作（0.5学时）

9.5对象事件属性简介及宏的综合应用（1学时）思考与训练：

（1）宏的本质是什么？课后练习:第9章习题0

第十章 VBA编程(6学时)教学目标：

1)理解模块的本质和定义，了解模块与宏的区别，理解VBA的程序框架，熟悉并掌握VBA的编程环境。了解并掌握VBA中的数据类型、常量、变量、数组等基本概念，并熟练掌握它们的定义、使用方法。2)理解并掌握VBA程序设计中的顺序结构、选择结构和循环结构的语法定义和使用特点，会设计实现基本的算法，能实现二选

一、多选一及迭代等常用程序结构。

3)理解并掌握VBA中Sub过程、自定义函数及事件过程的创建方法，了解创建类模块的过程，掌握类模块的用法，同时掌握标准模块的创建方法；此外，理解并掌握将宏转换为VBA代码的原理和方法；掌握简单登陆界面的设计和实现方法。

教学重点：

 模块的概念；  过程与函数；

 Visual Basic开发环境；

 VBA的数据类型、变量、常量、数组。 顺序结构语句；

 条件结构语句与选择结构语句；  循环结构语句。

 创建自定义Sub过程；  创建自定义函数；  创建事件过程；

 创建于窗体和报表相关的类模块；  创建与窗体和报表无关的类模块；  创建标准模块；

 宏转换为VBA代码。教学难点：

 过程与函数的定义与使用；

 VBA的数据类型、变量和数组。 条件结构语句与选择结构语句；  循环结构语句。 创建过程和函数；  创建类模块。本讲内容概述：

1）主要介绍模块的定义、模块与宏的区别、过程、事件过程等模块的基本概念，讲述了VBA的Visual Basic的开发环境，重点介绍VBA程序设计基础中的数据类型、常量、变量、数组等概念。2）介绍VBA程序设计中的三种基本控制结构语句的格式和使用方法，介绍数据的输入和输出方法，阐明了程序中基本算法的设计与实现方法。1 3)介绍自定义Sub过程、自定义函数和事件过程的创建过程和方法，创建与使用类模块的方法，标准模块的创建方法；此外还介绍了将宏转换为VBA代码的方法。

涉及章节：

10.1 VBA概述（1学时）

10.2 VBA编程语言基础(2学时)10.3 模块的使用(2学时)10.4事件过程及应用举例(2学时)思考与训练：

【数据中心基础知识】推荐阅读：

中国数据中心基础设施技术年会召开10-05

数据中心手册10-23