idc机房运维工作内容

2024-10-12

idc机房运维工作内容(共6篇)

1.idc机房运维工作内容 篇一

IDC运维 目 录 1信息系统运维服务内容 4 1.1服务目标 4 1.2 服务内容 5 1.3信息资产统计服务 8 1.4网络、安全系统运维服务 8 1.5主机、存储系统运维服务 11 1.6数据库系统运维服务 15 1.7终端运维服务 17 1.8综合布线系统服务 17 1.9大屏幕显示系统的维护 19 1.10视频会议系统维护 20 1.11中心机房维护内容 20 1.12 UPS系统 23 2运维服务流程 25 2.1设备每月定检计划 25 2.2设备维修及更换流程 26 3服务管理制度规范 28 3.1服务时间 28 3.2行为规范 29 3.3 现场服务支持规范 29 3.4问题记录规范 29 4应急服务响应措施 31 4.1 应急基本流程 31 4.2 预防措施 31 4.3 突发事件应急策略 32 附件一 机房日常巡检表 35 附件二 服务器设备维护表 36 附件三 网络设备维护表 37 附件四 日常问题申报表 38 1信息系统运维服务内容 1.1服务目标 信息系统运行维护服务包括,信息系统相关网络及主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。

用户信息系统的组成主要可分为两类:硬件设备和软件系统。

n 硬件设备包括:网络设备、安全设备、主机设备、存储设备等;

n 软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。

通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。

信息系统服务的目标:

n 对用户现有的信息系统基础资源进行监控和管理;

n 及时掌握网络信息系统资源现状和配置信息;

n 反映信息系统资源的可用性情况和健康状况;

n 创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。

服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:

Ø 运行状态、故障情况 Ø 配置信息 Ø 可用性情况及健康状况性能指标 1.2 服务内容 1、客户端常用应用软件维护及系统维护 →客户端常用应用软件的安装、调试、管理、更新、升级、故障检测及排除。

→客户端操作系统的调试、管理、更新,升级,故障检测及排除。

→客户端操作系统包括winXP win7等。

→常用应用软件包括Office 2003、office2010、翻译类软件、阅读类软件、下载类软件等,但不包括某些专业应用软件,如专业财务软件、排版软件、工程计算软件等,以及客户自行开发使用的系统客户端应用程序。

→建立常用应用软件及驱动程序库。(视客户情况而定)2、客户计算机硬件维护及升级(不含设备费)→客户端计算机硬件设备的维护、保养、更新、升级、故障检测及排除。

→对于需要更换的设备,提供设备选型建议及市场参考价格,并可代为购买(设备采购费用另计)。

→建立电脑硬件配置档案,实行标准化管理。(视客户情况而定)3、单机计算机病毒防护 →安装、管理、维护客户端计算机的病毒防护系统。

→培训用户计算机病毒的防护知识以及防病毒软件的使用,建立用户的防病毒意识。升级、更新、优化用户已有的病毒防治系统。

→定期提供病毒检测、告警及最新预防措施。

→提供紧急病毒故障处理服务,对突发的新计算机病毒进行及时响应。

4、网络防病毒系统的维护 →对用户的网络防病毒系统进行维护,升级版本,更新病毒库从而确保网络、系统及数据资料的安全。

5、综合布线系统维护 →利用专业测试仪器提供对铜缆、光纤的布线故障检测处理。

→对现有综合布线系统中存在的缺陷、问题提供合理化改造或升级方案,并可提供专业水平的工程施工(工程费用另计)。

6、网络打印的故障处理 →解决驱动程序/软件设置/网络设置问题造成的网络打印故障。

7、非网络打印机的故障处理(非硬件损坏)→解决驱动程序/软件设置问题造成的打印故障。

8、其它外置设备的故障处理 →解决扫描仪、手写板、摄像头、外置硬盘、刻录机等外置设备由于驱动程序/软件设置问题造成的故障。

9、局域网系统的故障诊断 →检查由于网络设备(如网卡、网线、交换机等)或网络设置造成的局域网络通信故障。

10、配线架及机柜的维护 →整理并规范配线架及机柜内的走线,对于存在的缺陷和问题提供合理化改造方案。

11、服务器系统维护 →从服务器硬件选型、软件安装(限微软产品)、管理到软硬件更新、升级,提供全程维护服务。

→对操作系统提供性能监测、系统优化、故障检测、故障排除、用户管理、资源分配、安全性控制等。

→服务器软件安装(限微软产品)安装配置、维护、故障排除等。

12、服务器安全漏洞修补 →及时对各台服务器提供最新的安全漏洞修补程序,以避免服务器及内部网络遭受到黑客的攻击,对用户造成损失。

13、网络交换机维护 →提供网络交换机的调试、故障诊断、日常维护保养、更换升级建议。对于突发的紧急硬件故障可以提供匹配的设备进行临时替代,保证用户网络的正常运转。

14、路由器维护 →提供用户端路由器的调试、故障诊断、日常维护保养、更换升级建议。对于突发的紧急硬件故障可以提供匹配的设备进行临时替代,保证用户网络的正常运转。

15、办公自动软件的安装及维护 →对办公自动软件系统的数据库备份、客户端安装、软件故障排除等进行办公自动软件整体维护。

16、计算机机房及综合布线系统改造 →对用户现有计算机房及综合布线系统可能存在的线路混乱、不规范等问题提供合理化解决方案。

17、网络防病毒系统的建设 →按用户需求,规划、建设网络防病毒系统,实现全方位病毒防护,确保网络、系统及数据资料的安全。

18、单机备份网/ 络备份系统的选型及建设 →为需要单机备份或网络备份的用户提供专业的全套服务,包括系统及设备选型、策略制定、灾难恢复等。

19、路由器及交换机调试 →提供路由器及交换机进行实际操作调试。

→调试以基本的安装调试应用为主。

1.3信息资产统计服务 此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。

服务内容包括:

Ø 硬件设备型号、数量、版本等信息统计记录;

Ø 软件产品型号、版本和补丁等信息统计记录;

Ø 网络结构、网络路由、网络IP地址统计记录;

Ø 综合布线系统结构图的绘制;

Ø 其它附属设备的统计记录;

1.4网络、安全系统运维服务 从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容:

序号 服务模块 内容描述 提供方 1 现场备件安装 配合用户进行,按备件到达现场时间工程师到达现场 2 现场软件升级 首先分析软件升级的必要性和风险,配合用户进行软件升级 3 现场故障诊断 按服务级别:7×24小时 5×8小时 4 电话远程技术支持 7×24小时 5 问题管理系统 对遇到的问题进行汇总和发布 网络核心交换机巡视典型作业计划书 系统管理单位:

维保单位:

设备名:

设备型号:

管理IP:

检查内容 参考标准 检查结果 检查结论 巡视方法描述 巡检周期 硬件运行状态 电源运行状态 □正常 □异常 风扇运行状态 □正常 □异常 模块运行状态 □正常 □异常 系统运行状态检查 VLAN 状态 □正常 □异常 配置 状态 □正常 □异常 OSPF 状态 □正常 □异常 日志检查 日志 状态 □正常 □异常 其他检查内容 □正常 □异常 □正常 □异常 □正常 □异常(1)用户现场技术人员值守 根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。

现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。

同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:

Ø 配置数据 Ø 性能数据 Ø 故障数据(2)现场巡检服务 现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。

巡检包括的内容如下:

编号 巡检内容 1 硬件运行状态检查项目 单板状态检查 电源模块状态检查 风扇状态检查 整机指示灯状态检查 机框防尘网检查 机房温度、湿度检查 设备地线检查 2 软件运行情况检查项目 设备运行情况检查 网络报文分析 设备对接运行状况检查 路由运行情况检查 3 网络整体运行情况调查 网络运行问题调查 网络变更情况调查 网络历史故障调查(3)网络运行分析与管理服务 网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:

服务内容 服务优点 向客户提供网络专家电话号码。

保证重大问题第一连线至网络专家。

网络专家组每周与客户进行不少于30分钟的电话技术交流 以最小成本保证及时解答客户关心的技术问题,并就某一领域技术问题展开深层次沟通。

每月向客户提交CASE汇总分析报告,并可扩展到每年 使客户了解网络历史故障情况以及故障预防建议,最大程度减少网络故障隐患,更高效的进行网络管理。

17次(月度、季度、)(4)重要时刻专人值守服务 保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户提供重要时刻的专人现场值守支持,包括政府的重大会议期间、突发公共事件及其它任何客户认为可能对其工作产生重大影响的时刻。

如需专人值守,客户需至少提前2周与授权服务商客户服务经理联系。授权服务商均需按事先合同约定提供专人值守服务。客户如需超出合同约定范围的更多值守支持,需额外支付相应人力和差旅费用。

1.5主机、存储系统运维服务 主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。

硬件维护包括增加设备、卸载设备、更换设备、除尘等,下面做一简要的叙述。

1.设备的增加 内存和硬盘的增加是服务器最常见的,安装的应用软件、资源库越来越多,服务器需要更多的内存和硬盘容量。增加内存前需要认定与服务器原有的内存的兼容性,最好是同一品牌的规格的内存。如果是服务器专用的ECC内存,则必须选用相同的内存,普通的SDRAM内存与ECC内存在同一台服务器上使用很可能会引起系统严重出错。在增加硬盘以前,需要认定服务器是否有空余的硬盘支架、硬盘接口和电源接口,还有主板是否支持这种容量的硬盘。尤其需要注意,防止买来了设备却无法使用。

2.设备的卸载和更换 卸载和更换设备时的问题不大,需要注意的是有许多品牌服务器机箱的设计比较特殊,需要特殊的工具或机关才能打开,在卸机箱盖的时候,需要仔细看说明书,不要强行拆卸。另外,必须在完全断电、服务器接地良好的情况下进行,即使是支持热插拔的设备也是如此,以防止静电对设备造成损坏。

3.除尘 尘土是服务器最大的杀手,因此需要定期给服务器除尘。尤其是在炎热的夏季,对于服务器来说,灰尘甚至是致命的。除尘方法与普通PC除尘方法相同,尤其要注意的是电源的除尘。

主机存储系统基本服务内容:

序号 服务模块 内容描述 提供方 1 现场备件安装 配合用户进行。按备件到达现场时间工程师到达现场 设备厂商及 2 补丁服务 消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。

设备厂商及 3 升级服务 对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。

设备厂商及 4 现场故障诊断 按服务级别:7×24小时 5×8小时 5 电话远程技术支持 7×24小时 6 问题管理系统 对遇到的问题进行汇总和发布 7 系统优化 对客户系统的括主机、存储设备、操作系统、提供优化服务。

现场值守人员可进行监控管理的内容包括:

Ø CPU 性能管理;

Ø 内存使用情况管理;

Ø 硬盘利用情况管理;

Ø 系统进程管理;

Ø 主机性能管理;

Ø 实时监控主机电源、风扇的使用情况及主机机箱内部温度;

Ø 监控主机硬盘运行状态;

Ø 监控主机网卡、阵列卡等硬件状态;

Ø 监控主机HA运行状况;

Ø 主机系统文件系统管理;

Ø 监控存储交换机设备状态、端口状态、传输速度;

Ø 监控备份服务进程、备份情况(起止时间、是否成功、出错告警);

Ø 监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;

Ø 对存储的性能(如高速缓存、光纤通道等)进行监控.小型机及服务器系统巡检典型作业计划书(HP服务器部分)系统管理单位:洛阳市人防办 设备名:

设备型号 设备序列号 管理IP:

检查内容 参考标准 检查结果 状态是否正常 巡检方法描述 巡检周期 硬件运行状态 电源指示灯 □正常 □异常 面板指示灯 □正常 □异常 内置磁带机 □正常 □异常 CPU 状态 □正常 □异常 内存状态 □正常 □异常 磁盘状态 □正常 □异常 网卡状态 □正常 □异常 HBA卡运行状态 □正常 □异常 系统检查 系统日志 □正常 □异常 Mail □正常 □异常 文件系统,包括磁盘卷剩余空间 □正常 □异常 硬件检测 □正常 □异常 交换分区 □正常 □异常 固件版本 □正常 □异常 补丁包版本 □正常 □异常 系统镜像 □正常 □异常 存储磁盘 □正常 □异常 检查内容 参考标准 检查结果 状态是否正常 巡检方法描述 巡检周期 设备名:

设备型号 设备序列号 管理IP:

系统管理单位:洛阳市人防办 小型机及服务器系统巡检典型作业计划书(HP服务器部分)存储驱动 □正常 □异常 进程状态 □正常 □异常 系统性能检查 CPU利用率 □正常 □异常 内存利用率 □正常 □异常 磁盘I/O性能 □正常 □异常 数据库运行状态 数据库安装目录 □正常 □异常 数据库进程状态 □正常 □异常 集群检查 集群进程状态 □正常 □异常 集群日志 □正常 □异常 存储检查 存储设备故障灯状态 □正常 □异常 SAN交换机端口状态 □正常 □异常 存储交换机环境状态 □正常 □异常 系统故障报告 □正常 □异常 1.6数据库系统运维服务 数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。

数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。

数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率。

具体数据库运行维护监控的基本服务内容包括:

1.操作系统相关维护 DBA要注意对操作系统的监控:

※文件系统的空间使用情况,必要时对ORACLE的警告日志及TRC文件进行清理 ※如果ORACLE提供网络服务,检查网络连接是否正常 ※检查操作系统的资源使用情况是否正常 ※检查数据库服务器有没有硬件故障,如磁盘、内存报错 2.数据库相关维护 序号 服务模块 内容描述 提供方 1 Oracle数据库 7*24电话支持服务 每周7天,每天24小时支持中心电话,电子邮件答询,以满足业务发展的需要。

Oracle产品技术专家直接同客户对话,帮助解决客户提出的疑难问题。

根据问题的严重程度,将优先解决客户认为是关键而紧急的任务。

对客户提出的一般性问题进行技术咨询、指导。

定期的客户管理报告, 避免问题再度发生。

Oracle数据库产品 现场服务响应 数据库宕机 数据坏块 影响业务不能进行的产品问题 软件产品的更新及维护。

Oracle数据库产品 系统健康检查 对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境 降低系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧张 检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患 检查数据库系统是否需要应用最新的补丁集 检查数据库空间的使用情况 序号 服务模块 内容描述 提供方 协助进行数据库空间的规划管理 检查数据库备份的完整性 监控数据库性能 确认系统的资源需求 明确您系统的能力及不足 优化Oracle Server的表现 通过改善系统环境的稳定性来降低潜在的系统宕机时间 4 Oracle数据库产品 性能调优 分析用户的应用类型和用户行为 评价并修改ORACLE数据库的参数设置 评价并调整ORACLE数据库的数据分布 评价应用对硬件和系统的使用情况,并提出建议 利用先进的性能调整工具实施数据库的性能调整 培训用户有关性能调整的概念 提供用户完整的性能调整报告和解决方法 1.7终端运维服务 作为整体信息系统维护方案,终端设备维护必不可少。各种局部服务器、工作站、台式机、笔记本、显示设备等,除了必要保修外,需要进行日常的系统维护、系统调试和培训。

1.8综合布线系统服务 布线管理是针对设备间、交换间的工作区的配线设备、线缆、信息插座等设施,按照一定的模式进行标识和记录,内容包括:管理方式、标识、色标、交叉连接、跳线等这些内容的实施给系统维护、管理创造方便,提高了管理水平和工作效率,从而实现了综合布线系统的灵活性、开放性和扩展性。

综合布线线缆是综合布线系统的基础设施,是整个网络的中枢神经系统,它能为智能建筑提供语音、数据、图像、多媒体等系统的应用,并在不断的扩展中。这得益于综合布线系统网络灵活性及高可靠性,但也带来新的问题,主要表现在随着系统的使用、网络的发展,用户不 可避免的要对连接的缆线移动、添加、改动,使得跳线不断变更,在设备间主配线架及楼层配线架将会出现跳线管理的问题,众多的缆线很难避免出现混乱,这一直是用户极为关注的问题。

1.维护管理执行的标准 目前电信基础设施管理的标准是:

TIA/EIA—606标准,该标准是商业建筑物电信基础设施管理标准,是目前国际上有关商业建筑物电信基础结构的唯一管理标准。管理基础设施包括有以下范围:

※位于工作区、配线间、设备间和引入设施的终端部件;

※电信布线缆线和连接件;

※电信布线缆线路径、连接件位置、终端部件所在的位置:

※电信的接地与连接。

2.彩色标识维护管理方式的实施方法 彩色标识管理是在每个交接区实现线缆管理的方式,是在各色标区域之间按照应用的要求采用跳线连接。色标作为用来区分配线设备的性质,标识按性质排列的接线模块,表明端接区域、物理位置、编号、容量、规格等,以便管理人员一目了然地加以识别。即在配线架上将来自不同方向或不同应用功能设备的线路集中布放,并按规定不同颜色的标记区域,当一个工程内有多个设备问、交换间、楼层配线问,应采用统一的色标区别各类用途的配线区,综合布线管理系统通常使用三种标记:缆线标记、区域标记和插接件标记。

1、配线架面板为端口单独管理方式,因而可以轻松完成每一个端口的检查、替换或纠正。端口的易接近性是配线系统的重大创新,因而所有管理和维护操作都可在前端完成。

2、在IU高度的19”空间中,可以同时支持超五类、六类、七类信息模块、光纤管理单元和语音配线单元的管理,且每个端口的功能均可由客户自由制定。

3、电缆的管理:配线架后端带加长电缆托架并预留线槽,还可采用电缆管理条紧固及标识电缆。

4、光纤管理单元:光纤管理单元为防尘封闭式设计,单元内预留光纤盘绕位置,3口及6口光纤管理单元可分别实现6芯、12芯光纤的管理,还可以管理各类通用的光纤连接器(如6MT—RJ、LC、SC、ST等),在IU机柜空间上管理多达48芯光纤。

5、配线架信息端口采用免工具安装管理信息模块,所有维护操作均在配线架前端完成,每个端口单独管理,维护时仅取下对应端口的支件,不需任何工具。

1.9大屏幕显示系统的维护 1)维护周期的确定 维护周期应根据设备的工作环境来确定,如工作在环境条件较好灰尘较少(如调度指挥中心,监控中心等),建议设备的维护时间为6个月维护一次,如果环境较差应该缩短维护周期,建议3个月一次。(如车站,机场,购物娱乐场所等)。

2)常见故障现象及处理方法 a)色轮故障 现象——屏幕图像色彩不正常﹐偏蓝﹑偏绿﹑偏红或者颜色不稳定﹐忽蓝忽绿。打开内置状态15(按ADJUST-SHIFT-1-1-5-SHIFT)﹐可以发现颜色不正常(正常应为100%白色)。

处理方法——将色轮拆下﹐用棉签沾无水酒精擦拭色轮片和光耦探头或更换色轮。

b)DMD板故障 现象——屏幕图像呈黑白色﹐机器死机﹐不接受遥控器指令或屏幕底色有3条隐约可见的白线。

处理方法——更换DMD板。

c)控制模块故障 现象——屏幕中有一片图像颜色不稳定﹐此现象关机后再开机可能消失﹐ 但运行一段时间后会再次出现或屏幕图像有纹路。

处理方法——更换控制模块。

d)灯泡故障 现象——黑屏或屏幕象不稳定的日光灯一样忽明忽暗 处理方法——检查Power灯是否正常﹐Fan灯是否正常﹐Lamp灯是否闪烁﹐观察灯泡是否已碎﹐如是则需更换灯泡。

e)点灯器故障 现象——屏幕象不稳定的日光灯一样忽明忽暗﹔点灯器有无间隔发出丝丝的声音。

处理方法——先检查灯泡是否正常﹐如正常则需更换点灯器。

f)Digital线故障 现象——在串接状态下屏幕图像颜色有时偏蓝﹐有时偏绿﹐有时又正常﹔打开内置状态10﹐颜色正常。

处理方法——更换Digital线 g)遥控器故障 现象——遥控器控制无反应或不按控制动作。

处理方法——首先使用对其他屏进行控制﹐ 确定遥控器无问题后﹐ 检查红外接收板与电子模块联机﹐ 如无改善﹐ 则需更换红外接收板和电子模块。

h)颜色复位 现象——开机后屏幕突然出现色差(多发生在突然断电后)。

处理方法——检查gain及offset值﹐是否已恢复为初始值(gain为32,offset为127)﹐重新设定gain及offset值。

i)灰尘污染 现象——画面边缘出现蓝紫色斑﹐ 边缘不清。处理方法——调整光机内的小反射镜并清除小反射镜上的灰尘。

3)十大常见问题 序号 故障种类 故障现象 解决方案 1 色轮故障 屏幕图像色彩不正常﹐偏蓝﹑偏绿﹑偏红或者颜色不稳定﹐忽蓝忽绿。打开内置状态10﹐可以发现颜色不正常。

将色轮拆下﹐用棉签沾无水酒精擦拭色轮片和光耦探头或更换色轮。

DMD板故障 屏幕图像呈黑白色﹐机器死机﹐不接受遥控器指令或屏幕底色有3条隐约可见的白线。

更换DMD板 3 控制模块故障 屏幕中有一片图像颜色不稳定﹐此现象关机后再开机可能消失﹐但运行一段时间后会再次出现或屏幕图像有纹路。

更换控制模块 4 灯泡故障 黑屏或屏幕象不稳定的日光灯一样忽明忽暗﹔点灯器有时会间隔性发出丝丝的声音。

检查Power灯是否正常﹐Fan灯是否正常﹐Lamp灯是否闪烁﹐灯丝是否已碎﹐如是则需更换灯泡。

点灯器故障 屏幕有间歇性自动开关机现象﹐有时开机时会出现倒影。

先检查灯泡是否正常﹐如正常则需更换点灯器。

Digital线故障 屏幕图像颜色有时偏蓝﹐有时偏绿﹐有时又正常﹔打开内置状态10﹐颜色正常。

更换Digital线 7 遥控器故障 遥控器控制无反应 首先使用对其他屏进行控制﹐ 确定遥控器无问题后﹐ 检查红外接收板与电子模块联机﹐ 如无改善﹐ 则需更换红外接收板和电子模块。或与DMD芯片过热有关﹐需关机等待少时。

内部设置故障 开机后屏幕突然出现色差 检查Drive﹑Cutoff﹑Gain及Offset值﹐是否已恢复为初始值﹐需重新设定Drive﹑Cutoff﹑Gain及Offset值。

设备污染 画面左边出现蓝紫色斑﹐边缘不清 一般为光机内小反射镜积灰所致﹐ 可用皮吹吹去灰尘。

电源模块故障 暂无   1.10视频会议系统维护 1.常规检查:从用户终端手动呼叫打环测试设备:172.19.0.35,如果能握手成功并看到打环视频,说明终端、网络没有大问题。

2.用户打环成功但是无法从MCU发起呼叫:既然打环成功,说明路由、终端没有大问题,往往问题在区县信息中心或者用户终端前增加了防火墙,对外部发起的访问进行了限制或者nat转换不正确,请用户协助变更。如果会议比较着急,可以在MCU上把该终端模式改为“dial in”,让用户手工参加会议暂时解决问题。

3.双方向均无法呼叫:请网管检查网络问题,往往和上述问题有关。

4.MCU发动呼叫的时候,链接后马上断开:正常情况下链接有一段时间,或者链接成功或者断开,如果马上就断开,说明对方占用了终端IP地址或者链接到别的会议上。

5.如何测试MCU端口情况:一般我们要求开放所有端口,或者针对172.19.0.254开放tcp 3230-3231 1720,udp 3230-3235,注意要在终端上设置固定端口(防火墙中)。另外大部分设备提供了web管理模式,方便更改配置,也可以用作测试。

1.11中心机房维护内容 机房环境检查就是对机房的温度、湿度、照明、防鼠、防水、防尘、消防、卫生、门窗的关闭进行检查,主要通过检查以下设备或项目去完成:

1.机房空调 ※检查空调是否正常运行、制冷温度是否在规定范围内 ※检查空调设备断电后再通电的自动投运状况 ※检查空调是否有漏水现象 ※检查空调电源插头是否稳固、是否出现老化现象 ※检查空调设备卫生情况 ※填写巡检记录 2.照明设备 ※检查照明设备是否都能正常运行、照明光度是否足够 ※检查机房事故照明断电后的工作情况 ※检查照明设备是否出现老化迹象 ※检查照明设备的控制开关是否能正常使用、灵敏度 ※填写巡检记录 3.消防设备 ※检查消防设备合格证、是否通过安全定检 ※消防设备是否配备足够 ※消防设备是否完好(外观)※检查机房消防系统是否能正常运行 ※清洁消防设备 ※填写巡检记录 4.抽湿机 ※检查机房抽湿机是否正常运行 ※检查机房抽湿机设定的湿度是否在规定范围内 ※填写巡检记录 5.机房防鼠 ※检查机房所有与外界有联系的孔洞是否已严密封堵 ※检查机房门窗是否已关闭 ※检查机房门的防鼠板是否已装上并安装稳密 ※填写巡检记录 6.机房防水、防尘 ※检查机房空调是否有漏水现象 ※检查机房墙壁是否有渗水现象 ※检查机房门窗是否已关闭 ※填写巡检记录 7.机房卫生 ※检查机房是否有垃圾、杂物 ※清洁门窗、地柜;

整洁办公用品,清洁地面 ※负责施工后机房地面清洁工作 ※填写巡检记录 8.电池 ※检查蓄电池外观完好性 ※检查蓄电池是否有变型、渗液等状况 ※清洁蓄电池 ※填写巡检记录 9.防雷设备 ※检查防雷设备运行是否正常,能否实现防雷功能 ※检查、测试设备运行的相关参数是否正常并记录 ※检查设备的外观完好性 ※检查设备是否出现老化迹象 ※检查防雷设备接线是否牢固,线缆是否出现老化迹象 ※清洁防雷设备 ※填写巡检记录 1.12 UPS系统 主机的维护及注意事项 UPS主机一般是智能型的,它对环境温度要求不高,但要求室内清洁卫生否则灰尘遇潮湿会引起主机工作紊乱;

主机中的参数在使用中不能随意改变;

在断电时,应避免带负载启动UPS电源,应先关掉负载,等UPS启动后再开启负载,否则会有多负载的冲击电流和供电电流造成UPS电源瞬间过载,严重时会损坏变换器;

不能让UPS电源经常处于满载或过载。

1.蓄电池的维护及注意事项 尽管使用的是免维护蓄电池,但从广义来说一定的维护还是必要的。首先它对环境温度要求较高,工作环境一般要求在20℃—25℃之间,低于15℃时,其放电容量下降,温度每降低1℃,其容量下降1%,而温度过高(大于30%℃)其寿命就会缩短;

其次,要防止电池短路或深度放电,深度放电会造成电池内阻增大或充电电压过低从而导致降低甚至失去充电能力,放电程度越深,循环寿命越短;

第三,要避免大电流充放电,否则会造成电池极板膨胀变形,使得极板活性物质脱落,内阻增大,容量下降,寿命缩短;

第四,由于组合电池电压很高,存在电击危险,因此装卸导电联接条、输出线时应有安全保障;

第五,对于不经常停电的地区,建议用户每隔一个月对UPS进行一次人为的断电,让UPS电源在逆变状态下工作一段时间,防止电解液沉淀,以便让蓄电池维持良好的充放电特性,延长使用寿命;

第六,搬运电池时不要触动极柱和安全排气阀;

第七,不能用二氧化碳灭火器,一旦发生火灾,可用四氧化碳之类的灭火器;

第八,不能把不同容量、不同厂家、不同性能的电池联在一起,否则会影响整组蓄电池的性能。

同时,要定期对电池进行检查、测量,并做好记录。检查项目包括:整组电池的浮充电压,单体电池浮充电压,测单体电池电压时,应在电池放电状态下进行,否则测得的结果会是假电压,经验作法是在测量时,万用表两端并联一个1—3欧母的电阻丝;

检查电池是否损坏,壳、盖间有无泄漏,表面是否有灰尘等杂物,电池架、连接线、端子是否有松动或锈蚀等。雾溢出主要是排气阀附近。

2运维服务 建议洛阳市人防办采用的服务方式为一种为技术人员现场值守。

人员常驻服务 l 企业内建立服务中心,派驻专业人员与队伍来保证对客户的服务。

l 企业设备出现问题和故障,直接对常驻人员申报故障维护人员根据反映情况,马上作出处理及给予回复判断故障范围,根据故障难度,调度工程师现场服务查看现场问题,判断类别,报告相关技术问题故障实施处理,完成后清理现场 1)机房的日常维护 2)硬件设备的常规检查 3)系统软件的常规检查 l4)填写维护报告 5)填写相关日志报告,存案留底 根据洛阳市人防办的具体情况,结合洛阳市人防办的实际需要,我公司建议企业使用人员长驻服务方式,提供7×8小时的即时响应服务,更及时更快速的作出处理 2.1设备每月定检计划 每月对设备定检一次,检查服务器、电脑、打印机、路由器、交换机、视频会议设备、网络设备等维护内容中的所有设备的使用状况,集中处理相关故障,并严格按照相关表格填写局域网及各设备的运行状况,并做出分析意见与建议。

测试记录各设备的运行状态,如正常,则在对应的维护检查表内写测试数据,如有异常,则在表格内写测试数据,在备注栏内写原因;

并在遗留问题中总结测试结果。对非测试项目的问题在检修过程中是否发现新的问题及对内容作填写,同时在相应的设备记录表上填写详细的异常内容,并按相关规定进行处理。

2.2设备维修及更换流程 甲方与我公司签订维护合同后,维护内容中的设备,在维护合同内出现损坏需要维修或更换,将由我公司代为负责处理。

l 保修期内返厂维修:指企业需要维修或更换的设备在厂家规定的标准保修期内,坏件返回工厂维修,维护人员跟进全返厂维修过程,直至设备正常投入使用。

l 保修期外返厂维修:对已过保修期的坏件,由维护人员联系厂家,根据厂家的维修费用收费要求向甲方提交《设备维修费用申请报告》,获得批准后,维护人员将坏件送入工厂进行维修,跟进全过程,直至设备正常投入使用。

技术人员现场值守运行维护服务的基本操作流程如下图所示:

3服务管理 3.1服务时间(1)接收服务请求和咨询:

n 在5*8 小时工作时间内在现场值守,设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。

(2)在非工作时间设置有专人7*24 小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24 小时机房监控人员的机房突发情况汇报。

(3)服务响应时间:

故障级别 响应时间 故障解决时间 I级:属于紧急问题;

其具体现象为:系统崩溃导致业务停止、数据丢失。

30分钟,2小时内提交故障处理方案 12小时以内 II级:属于严重问题;

其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。

30分钟,2小时内提交故障处理方案 24小时以内 III级:属于较严重问题;

其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。

30分钟,2小时内提交故障处理方案 48小时以内 IV级:属于普通问题;

其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。

30分钟,2小时内提交故障处理方案 3天内 n 技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,公司将在16小时内提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。

3.2行为规范(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。

(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。

(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。

(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。

(5)遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

3.3 现场服务支持规范 运维服务人员要做到耐心、细心、热心的服务。工作要做到事事有记录、事事有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。

(1)现场支持工程师应着装整洁、言行礼貌大方,技术专业,操作熟练、严谨、规范;

现场支持时必须遵守用户单位的相关规章制度。

(2)现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作。

(3)现场支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。

(4)故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧。

3.4问题反馈 根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要IT系统运维服务项目组的分析确认,问题有解决方案后,将解决方案反馈给用户。具体提交流程如下:

(1)问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心。

(2)问题分析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)。属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;

属于业务问题,提交服务中心业务人员进行处理;

属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单。

(3)问题确认、解决。服务中心的技术人员和业务人员收到系统缺陷类问题提交单后,对提交的问题进行归类汇总和分析、确认。可以解决的,明确问题解决的具体处理建议和措施,经主管领导签字同意后,交实施人员进行解决方案的实施。服务人员确认是否解决,并将解决方法附在系统缺陷类问题提交单上反馈给问题提出人员。

(4)问题上报。服务人员收到经业务或技术人员确认的系统缺陷类问题提交单后,上报服务中心。

(5)问题回复。服务中心根据提交问题的进行分析,制定解决方案并进行实施的解决,同时做好变更记录。将解决方案汇总后及时向问题提交单位或问题交办单位作出回复,并将分析过程和问题产生原因一并提交。

4应急服务响应措施 公司已经针对本项目制定了详尽的设计、应急处理预案,整个流程严谨而有序。但是,在服务维护过程中,意外情况将难以完全避免。下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。

4.1 应急基本流程 维护服务应急处理流程 4.2 预防措施 针对上门服务过程中可能遇到的各种各样的风险,公司总结多年维护服务经验,针对一些可能出现的情况,制定了一系列预防处理措施,举例如下:

类型 事件 预防措施 处理 应用软件 无法启动软件可执行文件 上门人员提前准备好各类需维护软件安装程序 将应用软件数据文件备份后,重新安装 软件打开过程中或运行中异常错误关闭 上门人员准备好安装程序,操作系统优化和修补软件,查杀病毒软件 判断出错原因,备份数据,采取相关修复措施 操作系统 使用者本机操作系统异常或系统资源占用严重 准备好系统检查程序及修补程序,以及查杀病毒软件 告知使用者错误原因可能类型,提出解决方案,经使用者认可后采取相应措施 B/S结构系统,IE浏览器异常或无法下载控件 准备流氓软件清理程序、修复浏览器软件、查杀病毒软件 检查IE浏览器选项设置,分析原因进行修复 网络或服务器 B/S结构系统网络流量异常或服务器登录异常 判断服务器是否异常,否则准备杀毒软件 检查网络流量,流量异常小则报修网络服务商,流量异常大则查杀病毒 4.3 突发事件应急策略 系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,公司设计了完善的突发事件应急策略。

系统巡检人员要定期规范检查各硬件设备的运转情况和应用软件运行情况,同时做好日常的数据增量备份和定期全备份。对发现的问题在报各级负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。

对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。

公司不但拥有经验丰富的技术支持工程师,而且根据长期以来的客户服务工作经验,建立了常用知识库,其中包括多种常见技术故障和突发事件的应急策略。当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户日常应用的影响。

紧急情况 预防措施 应急策略 硬件损坏 项目单位操作用电脑硬件损坏 在磁盘数据未丢失情况下,保证数据安全性,建议项目单位替换相关硬件。

操作失误 加强培训力度,掌握培训效果,检验操作人员操作水准,提示注意事项。

操作失误未造成即成结果或数据未丢失情况下,保障数据安全,反之,协调相关部门,进行补救。对操作人员强调注意事项 配置丢失 培训时强调使用前配置方法和步骤,并特别提示需在使用前按要求操作 派出上门维护、培训人员重新配置,并耐心讲解。

数据丢失 培训时强调使用过程中注意定期备份重要数据,日常维护过程中,上门服务人员实时备份数据并告知用户 协调有关部门,进行补救,无法补救,提交报告说明原因。

突发事件应急策略服务流程图如下:

2.IDC机房管理制度 篇二

① 所有出入IDC机房的人员(包括客户,参观者等)都必须佩戴相关部门发放的机房出入证,无证者,恕不能进入IDC机房,多谢合作!

② 进入IDC机房的所有人员必须穿戴鞋套或机房提供的拖鞋。有鞋套的,请穿鞋套,无鞋套请穿拖鞋,多谢合作!

③ 进入IDC机房的外来人员,必须填写相关的出入机房登记表。不填写者,恕不能方便。多谢合作.④ 出入IDC机房,必须遵守相关机房安全制度不能抽烟,不能在机房内饮水等,更不能在机房内拍照等,多谢合作!

⑤ 到IDC机房内维护服务器或入机,迁出等事宜的客户,都必须在IDC收到相关工作单,并进行客户身份确定后,才可以进行上述操作,如有不便,敬请原谅!

⑥ 在IDC机房内进行施工或验收工程等项目的单位或个人,都必须带有施工证,并出示相关人员证件,以便检查,多谢合作!

二、设备出入IDC机房制度

① 设备入机或迁出都必须有工作单证明,若无者,请先补,后操作,如不能补单的,请恕不能进行相关操作,多谢合作!

② 出入IDC机房维护人员,请恕不能携带较大的附属品(如背包,箱子等)进入机房内,如有不便,敬请原谅!

③ 有关由IDC机房人员代为签收的用户设备等物件。这些物件如有任何问题情况,签收人员及IDC机房对此将不负任何责任,敬请原谅!

④ 客户装机后或维护后所剩下的物件,请及时清理,请多多配合!

三、IDC机房值班人员制度

① 值班人员必须礼貌接待每个出入IDC机房的客户,做到文明有礼,遵守各项制度。

② 值班人员在值守期间,必须履行相关工作职责,特别在接待人员方面,需要核对相关证件,监督客户填写出入机房登记(并且要求客户填写字迹工整)。

3.IDC机房设备的维护及管理 篇三

IDC机房维护方法具体如下:

1、UPS及电池维护:根据实际情况进行电池核对性容量测试;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验。

2、机房空调及新风维护:检查空调运行是否正常,换风设备运转是否正常。从视镜观察制冷剂液面,看是否缺少制冷剂。检查空调压缩机高、低压保护开关、干燥过滤器及其他附件。

3、IDC机房除尘及环境要求:定期对设备进行除尘处理,清理,调整安保摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备内部。同时检查机房通风、散热、净尘、供电、架空防静电地板等设施。机房室内温度应控制在+5℃~+35℃,相对湿度应控制在10%~80%。

4、消防设备维护:检查火警探测器、手动报警按钮、火灾警报装置外观及试验报警功能;检查火灾警报控制器的自检、消音、复位功能及主备用电源切换功能。

5、电路及照明电路维护:镇流器、灯管及时更换,开关更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路。

6、IDC机房基础维护:静电地板清洗清洁,地面除尘;缝隙调整,损坏更换;接地电阻测试;主接地点除锈、接头紧固;防雷器检查;接地线触点防氧化加固。

4.idc机房运维工作内容 篇四

3.1一体化机房

一体化机房主要以先进的设计理念,标准化的设计程序和系统配置来实现标准化的工作模式。这种理念是集装箱数据中心和一体化机柜以及所有子系统在一个狭小的空间,只需供电就可以稳定运行。但它具有一定的封闭性,且设备密度较高,从而导致PUE水平较低。某厂商在一体化机房实际应用当中,通过利用这门技术将PUE值降至1.18。目前,集装箱数据中心和一体化机柜在各领域中得到广泛的应用。

3.2高压直流供配电

PUE作为一种乘数因子,其值大于1。因此,要实现IDC机房节能,一点降低IT设备的功耗。例如,当PUE为1.6,1W的IT设备电能耗量为1.6W,若将IT设备功耗降低至0.8W,将会降低IDC机房总功耗量至0.8×1.6=1.28W。可见,当IT设备功耗降低0.2W时,其电能耗量降低0.32W。这就是乘数因子效应。近年来,高压直流供电受到了互联网企业的关注,它不仅能够大幅度地降低IT设备功耗,而且大大提升直流供电的可靠性,减少谐波问题,提高运行效率,且扩展性较好,因此成为了未来数据中心供电模式的发展方向。

4结语

综上所述,在IDC机房节能建设过程中,要实现数据机房运行节能,我们需要结合实际情况,合理地选择不同技术、设备,并根据实际需求,选用最优化的节能方案。本文结合工作实践,针对IDC机房节能减排技术的应用进行了分析,旨在为IDC机房设备的节能建设提供依据。

参考文献:

[1]尚兴源.IDC机房节能减排技术的应用实践探讨[J].电源技术应用,,(3):476.

5.idc机房运维工作内容 篇五

关于RFID技术应用在IDC机房资产精确定位管理应用的调查报告

一、前言

RFID(Radio Frequency Identification)是一种非接触式的自动识别技术,它通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预。作为条形码的无线版本,RFID技术具有条形码所不具备的防水、防磁、耐高温、使用寿命长、读取距离大、标签上数据可以加密、存储数据容量更大、存储信息更改自如等优点,已经被世界公认为本世纪十大重要技术之一,在生产、零售、物流、交通等各个行业有着广阔的应用前景。

IDC即互联网数据中心。它是伴随着互联网不断发展的需求而迅速发展起来的,成为了新世纪中国互联网产业中不可或缺的重要一环。它为互联网内容提供商(ICP)、企业、媒体和各类网站提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、网络批发带宽以及ASP、EC等业务。

IDC机房资产精确定位管理是RFID技术应用的一个重要方面,据调研分析,目前全国共有近54万家IDC机房,且大多数机房已经从人工管理方式过渡到了控管向集中化发展。虽然采用了许多现代化技术,但还是有许多问题困扰着机房的管理及工作人员。例如,机房的服务器安全性和监控等问题还是没有很好地得到解决,阻碍了IDC机房进一步提高管理和服务水平。RFID 所具备的独特优势是其他识别技术无法比拟的, RFID 可以让IDC机房实现真正的智能化管理, 通过RFID 技术可以使定位精确到机柜内部厘米级别, 全景实时动态可视化的监控系统可以提高机房服务器的稳定运作,为服务器托管及运营商带来便捷, 为服务器提供安全的环境。可以说RFID 系统是机房资产管理系统的发展趋势。

二、调查目的和内容

对于RFID技术应用的前景,它的发展是一片光明的,不可置否,目前RFID普及应用的最大难关还是在于成本,比方说在物流行业,一般传统都是使用条形码来记录每个货物的信息,而作为新的识别技术的RFID,它的优势在于工作人员可以在一定距离之外对商品进行扫描识别,大大提高了货物的处理效率和信息准确率。且还具有可应用于潮湿、多尘等恶劣环境中和存储信息量大,还可以任意修改等优势,条形码则容易因恶劣环境污损而无法扫描识别该商品。但是,条形码作为识别手段可以单独使用且成本低廉,而RFID涉及到整个供应链的信息系统问题,其难度远高于条形码,对于一般企业来讲,贴无线标签其作用与条形码并没有实际分别,RFID的成本如何分摊解决也成为了一个关键问题。

所以,目前要拓展RFID技术应用的市场,必须克服成本给RFID技术应用的所造成的难题。因此,我们应该选择IDC机房这个对成本不敏感且使用量大的行业作为调查方向。IDC是对入驻(Hosting)企业、商户或网站服务器群托管的场所;是各种模式电子商务赖以安全运作的基础设施,也是支持企业及其商业联盟其分销商、供应商、客户等实施价值链管理的平台。而IDC机房服务器的稳定运作是关键。而RFID技术在此方面可以达到3点:

1.提高资产管理对环境的适应能力,提高管理的自动化程度,大大缩短资产管理各环节的时间,提高整个业务操作效率

2.具有大批量数据实时采集能力,缩短统计和清查时间,增强盘点的准确性

3.借助于行业标准和信息共享,可以实现资产在整个流通环节的跟踪,明确出错环节,进一步提升管理水平

三、调查对象和结果

根据上述的情况,我们选择了三家上海机房进行市场调查:

1.上海外高桥双线机房的管理

上海外高桥机房乃上海电信投资建设,总共有40G 接入骨干网。可供对外使用机柜1000余个,乃上海规模最大的数据中心,电信体系中价格居中,运营经验丰富,服务体系相对比较灵活,6名工程师驻守。7X24小时高效服务。2006年曾荣获中国电信集团公司/国家电子计算机质量监督检验中心颁发的四星级数据中心认证。

外高桥机房多年来一直致力于解决这个问题。近年采用了无线射频技术RFID。专业机房监控系统提供全智能化管理。现此机房因使用全智能化管理,业务操作效率调高,2.上海沈家弄机房的管理

上海沈家弄机房是由中国电信为配套陆家嘴金融中心日益膨胀的IDC接入需求而兴建的,该机房核心客户定位于陆家嘴金融中心内各金融、软件等高新技术企业。机房拥有6根独立千兆光纤直连骨干网络,双路供电系统,在网络扩展性和供电稳定性上具有巨大的优势。

沈家弄机房目前采用生物识别技术,结合门禁系统,进行严格的身份控制,对不同的功能区和不同的客户系统进行物理隔离,同时加以严格的管理制度;对环境(温度、湿度)进行严格的指标限制,有完善的环境控制系统;配备报警系统和消防系统。但是其并没采用全智能化管理,基本还是处于人员配合监控的管理模式,从效率上说与其他两家IDC机房是有一定差距的。

3.上海南汇机房的管理

上海南汇机房位于中国电信信息园区内,充分依托中国电信信息园区平台,机房内带宽充裕,40G的带宽直通Chinanet骨干网,全面领先上海,全冗余网络结构,杜绝单点故障,千兆级带宽,突破网络瓶颈,挑战速度极限,采用CISCO高性能路由器和交换机为各种服务提供快速可靠的支撑。是最早使用RFID技术的IDC机房,同时也是上海最大的机房,采用基于RFID技术的IDC机房资产精确定位管理等相关先进技术,在三家机房中业务效率是最高的。

四、调查结论与分析

目前我国多数IDC机房正处于向智能化管理的过渡阶段,他们对机房的安全性及服

6.idc机房运维工作内容 篇六

(一)国外IDC机房评测分级的标准(T4标准数据中心)根据美国标准TIA-942《数据中心的通信基础设施标准》,考量基础设施的“可用性”、“稳定性”和“安全性”,将IDC分为四个等级:Tier1,Tier2, Tier3, Tier4。T4机房最大的特色在于可以提供容灾服务。而目前国内所提供的数据中心服务以IDC为主,从级别上多为T2级水平,T3与T4级的差别主要表现在配电和数据中心规模上。

1.针对数据中心建设标准定义了四个级别: T1数据中心:基本型

T1数据中心可以接受数据业务的计划性和非计划性中断。要求提供计算机配电和冷却系统,但不一定要求高架地板、UPS或者发电机组。如果没有UPS或发电机系统,那么这将是一个单回路系统并将产生多处单点故障。在检修和维护时,这类系统将完全宕机,遇紧急状态时宕机的频率会更高,同时操作故障或设备自身故障也会导致系统中断。T2数据中心:组件冗余 T2数据中心的设备具有组件冗余功能,以减少计划性和非计划性的系统中断。这类数据中心要求提供高架地板,UPS和发电机组,同时设备容量设计应满足N+1备用要求,单路由配送。当重要的电力设备或其他组件需要维护时,可以通过设备切换来实现系统不中断或短时中断。T3数据中心:在线维护(全冗余系统)

T3级别的数据中心允许支撑系统设备任何计划性的动作而不会导致机房设备的任何服务中断。计划性的动作包括规划好的定期的维护、保养、元器件更换、设备扩容或减容、系统或设备测试等等。大型数据中心会安装冷冻水系统,要求双路或环路供水。当其他路由执行维护或测试动作时,必须保证工作路由具有足够的容量和能力支撑系统的正常运行。非计划性动作诸如操作错误,设备自身故障等导致数据中心中断是可以接受的。当业主有商业需求或有充足的预算追加,T3机房应可以方便升级为T4机房。T4数据中心:容错系统

T4级别的数据中心要求支撑系统有足够的容量和能力规避任何计划性动作导致的重要负荷停机风险。同时容错功能要求支撑系统有能力避免至少1次非计划性的故障或事件导致的重要负荷停机风险,这要求至少两个实时有效地配送路由,N+N是典型的系统架构。对于电气系统,两个独立的(N+1)UPS是一定要设置的。但根据消防电气规范的规定,火灾时允许消防电力系统强切。T4机房要求所有的机房设备双路容错供电。同时应注意T4机房支撑设备必须与机房IT设备的特性相匹配。2.建筑定级 建筑T1级别

对于可能引起数据中心瘫痪的人为地或自然灾害不做任何建筑防护措施;设备区地面活荷载不小于7.2kPa,同时楼面另需满足1.2kPa的吊挂活荷载。建筑T2级别

T2机房应满足所有T1机房的要求外应有建筑防护用于避免由于自然灾害或人为破坏造成的机房瘫痪;机房区域的隔墙吊顶应能阻止湿气侵入并破坏机械设备的使用;所有安防门应为金属框实心木门,安防设备间和安保室的门应提供180度全视角观察孔;所有的安防门必须为全高门(由地面到吊顶);安保设备间及安保室的隔墙必须为硬质隔墙并加装厚度不小于16mm三合板,至少每隔300mm要用螺丝固定;设备区地面活荷载不小于8.4kPa,同时楼面另需满足1.2kPa的吊挂活荷载。建筑T3级别

除满足T2要求外还应满足如下要求:需提供备用的出入口和安全监察点;提供备用安全出入道路;机房外墙上不能有外窗;建筑系统应提供电磁屏蔽保护;钢结构应提供电磁屏蔽保护;屏蔽层可以是贴铝箔的板材或金属网;机房入口应设置防跟入系统;对于冗余的设备应提供物理隔断以降低同时宕机的可能性;应设置防护栅栏以控制非正常侵入事件,同时建筑外围应设置微波探测和视频监控系统;厂区应设置门禁控制系统;机房区,动力区应设置门禁系统,并提供门禁控制中心监控系统;设备区地面活荷载不小于12kPa,同时楼面另需满足2.4kPa的吊挂活荷载。建筑T4级别

除满足T3要求外还应满足如下要求:考虑对于同一灾害的冗余保护措施;考虑潜在的地震、洪水、火灾、暴风、暴风雨以及恐怖主义者和精神病人防护措施;柴油发电机应位于室外或其他建筑内;在室外规划油罐区且尽量靠近柴油机;位于地震带0,1和2上的数据中心建筑按地震带3的要求设计抗震,位于地震带3和4上的数据中心抗震按地震带4的要求设计抗震,所有的设备设计重要系数取1.5;位于地震带3和4上的数据中心设备和机架应设计顶安装的抗震支架;设备区地面活荷载不小于12kPa,同时楼面另需满足2.4kPa的吊挂活荷载。3.电气定级 电气T1级别

T1级别的机房只需要提供最低的电气配电以满足IT设备负荷要求;供电容量少量或无冗余要求;单路供电;供电回路无检修冗余要求;单套等容量柴油发电机系统可以安装用于容量备用,但不需要冗余;ATS开关用于柴油发电机系统和变压器系统的电力切换;ATS并不是强制要求的;需要提供模拟负载;需要提供单套等容量UPS系统;UPS系统应与柴油机系统兼容;UPS应带有维修旁路以确保UPS检修时正常供电;应急电源可以来至不同的变压器和配电盘;变压器应能满足非线性负载使用要求;要求提供PDU和现场隔离变压器;配电系统不需要冗余;提供接地系统;数据中心接地干网不需要,但应满足设备制造商的接地要求;防雷保护应满足NFPA780相关规定; 电气T2级别

T2级别数据中心除满足T1要求外,还应满足如下要求:T2机房应提供N+1的UPS系统。提供发电机系统,其容量应满足所有数据中心负荷要求,备用发电机是不需要的。动力设备和配电设备不需要冗余设计。发电机和UPS系统测试时应提供模拟负载连接。重要的机房设备配电应提供集中地PDU配电。PDU出线应配置分支回路。两个冗余的PDU应由不同的UPS系统供电,并为同一IT配线架供电。单相或三相IT机架供电来源于两个不同的PDU,且双路电源可实现静态无间隙转换。双进线静态转换PDU供电来自不同的UPS系统,并可为单相或三相设备供电。颜色标示标准被用来区分A,B两路供电电缆。每个回路只能为一个配线架供电,防止单回路故障影响过多的配线架。为实现配电冗余,每个机架或机柜配电回路开关容量为20A,来源于不同的PDU或配电盘。满足NEMA L5-20R标准的工业自锁插座被要求应用于机架配电系统,同时配电开关容量应根据设备容量调整放大,并标明配电回路来源。机械设备配电不需要冗余设计。要求提供接地系统,接地电阻小于5欧姆。要求消防电力系统强切。电气T3级别

T3级别数据中心除满足T2要求外,还应满足如下要求:T3数据中心要求所有的机房设备配电、机械设备配电、配电路由、发电机、UPS等等提供N+1冗余,同时空调末端双电源配电,电缆和配电柜的维护或单点故障不影响设备运行。中高压系统至少双路供电,配置ATS,干式变压器,变压器在自然风冷状态下满足N+1或2N冗余,在线柴油机系统用于电力中断时电源供应。储油罐就近安装于厂区,并满足柴油机满载72小时运行。市电失电时通过ATS自动将油机系统电力接入主系统。

双供油泵系统可以手动和自动控制,配电来自不同电源。提供独立的冗余的日用油罐和供油管路系统,以确保故障或油路污染时仍能正常的为油机供油,不影响油机运行。油机应装备双启动器和双电池系统。ASTS用于PDU实现双路拓扑的配电体系用于重要IT负荷配电。设置中央电力监控系统用于监控所有主要的电力系统设备如主配电柜、主开关、发电机、UPS、ASTS、PDU、MCC、浪涌保护、机械系统等。另外需提供一套独立的可编程逻辑控制系统(PLC)用于机械系统的监控和运行管理,以提高系统的运行效率,同时一套冗余的服务器系统用来保证控制系统的稳定运行。电气T4级别

T4级别数据中心除满足T3数据中心要求外,还应满足如下要求:T4机房所有设备、系统、模块、路由等需设计成2(N+1)模式;所有进线和设备具有手动旁路以便于设备维护和故障时检修;在重要负荷不断电的情况下实现故障电源与待机电源的自动切换;电池监控系统可以实时监视电池的内阻、温度、故障等状态,以确保电池时刻处于良好的工作状态;机房设备维修通道必须与其他非重要设备维修通道隔离;建筑至少有两路电力或其他动力进线路由并相互备用。4.机械定级 机械T1级别

空调系统设置单台或多台空调设备集中制冷用来维持重要区域的温湿度,设备不需要冗余;如果空调系统采用水冷设备如冷冻水系统或冷却水系统,那么在满足设计条件的前提下,尽量采用相同规格的设备,设备不需要冗余;管路系统采用单回路系统,因此管路故障或维修时,将导致局部或全部的空调系统停机;如果有发电机系统,那么空调设备容量将被记入发电机容量内。机械T2级别

T2级别的数据中心空调系统是采用多台空调设备集中制冷来维持重要区域的温湿度控制要求;一般采用N+1的备用方式;如果采用水冷系统,相关设备需要采用相同规格,并提供额外1台设备用于备用;管路系统采用单回路系统,因此管路故障或维修时,将导致局部或全部的空调系统停机;机房空调系统应设计成全年365天,每周7天,每天24小时连续运行模式;机房空调至少采用N+1备用模式,同时每三台或四台设备要求至少提供一台备用;机房及其辅助区域相对于室外要求维持一定的正压;所有的空调设备配电容量应被记入发电机容量;为降低电气系统故障对空调系统的影响,空调设备供电尽量来源于多组配电盘的多条回路;温度控制系统配电应来源于UPS且提供冗余的备用电源;数据中心的送风形式应根据机架和服务器的排布来调整;空调机房设备应有充足的容量来抵消所有发热设备和热传导负荷,同时维持一定的机房湿度要求;设备的制冷量应基于KW而不是KVA计算,且设备由UPS供电;被处理的空气将通过安装了平衡风阀的穿孔高架地板送到设备处;发电机系统用来给UPS系统和其他机械设备提供电力;厂区内需安装储油罐系统,以满足额定工况下24小时发电机运行;需设计双路供油系统,且可以提供手自动控制,每路供油泵供电来源于独立的配电系统;设计冗余的和相互隔离的储油系统以保证油路污染或其他机械故障时不影响整个发电机系统的运行。机械T3级别

T3级别的数据中心空调系统是采用多台空调设备集中制冷来维持重要区域的温湿度控制要求;设备冗余的方式是允许单台配电盘故障时空调系统仍能满足制冷需求;如果空调系统采用水冷设备如冷冻水系统或冷却水系统,那么在满足设计条件的前提下,尽量采用相同规格的设备,设备冗余的方式是允许单台配电盘故障时空调系统仍能满足制冷需求;这个级别的冗余要求要求空调及其相关设备末端双回路供电;管路系统采用双回路路由,任何管路维护或故障时不会引起空调系统的中断;机房空调电源采用双回路供电,电源来自不同的配电系统;所有的机房空调容量需要记入发电机容量;数据中心制冷设备N+1,N+2,2N或2(N+1)的冗余方式都是可行的,前提是设备维护和故障时不影响正常的制冷要求;针对精密空调的安装数量,考虑到维护和备用的因数,精密空调冷却回路应尽量细化分组;如果使用了冷冻水或冷却水,每个数据中心应有专用的分支回路,并由独立的泵系统从主供水环路上引出;水环路应位于数据中心周边下夹层水槽中,以确保漏水被收集在水槽中,漏液侦测传感器安装于水槽中,检测管路漏水状态;应考虑冷冻水管路的冗余和充分隔离。机械T4级别

上一篇:童年的相册下一篇:网点转型心得