首页 理论教育 HPC集群机房建设与日常管理工作细化

HPC集群机房建设与日常管理工作细化

时间:2023-11-23 理论教育 版权反馈
【摘要】:HPC机房的日常管理工作,重点要注意如下内容:保持机房整洁卫生,管理人员负责日常维护及机房卫生工作,做到一天一小扫,一周一大扫。机房计算机只供机房工作人员使用。外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后机房工作负责人才能开具放行条。如机房发现意外和紧急情况要及时报告,对重大事故要注意保护好现场。

HPC集群机房建设与日常管理工作细化

HPC机房的日常管理工作,重点要注意如下内容:

(1)保持机房整洁卫生,管理人员负责日常维护及机房卫生工作,做到一天一小扫,一周一大扫。保持机房清洁干净,防尘防潮,防止鼠虫进入。

(2)不准在机房内会客,谢绝外单位人员进入机房,禁止聊天、喧哗、吃零食、抽烟、乱扔杂物等,保持机房整洁安静。

(3)严禁携带易燃、易爆及强磁性物品进入机房。

(4)设备一般不得用于私事,严禁在设备的计算机终端上玩游戏,禁止装入其他无关的软件或将计算机挪作他用。

(5)日常检测,包括对设备运作情况及系统应用情况的检测。

①设备运行情况检测:

·每日分8次(每3h)定时进行主要网络设备的检测。做好每日网络巡查与服务器运行情况记录。

·每日对外网服务器日志进行分析,对长时间扫描的IP做好记录,并采取跟踪,一旦发现问题及时处理,把隐患消灭在萌芽状态。

·定期运用系统的网络监视器、网管软件,对网络漏洞进行自我扫描检测,进行分析,做好相应记录。

②系统应用情况检测:

·对应用软件要每天进行检测,及时升级,特别是防毒软件的升级。

·各种应用功能配置参数进行修改时必须与值班人员一同进行,并登记记录。新增加功能必须经过主管领导签字同意。

(6)如发现机器故障应及时向主管及上级领导报告,并负责计算机及外设的日常维护与排除故障,处理不了的问题应立即向有关单位联系解决。遇到紧急情况不要慌张,切忌手忙脚乱。在遇到三包范围内的故障时,应及时督促公司上门或将机器送公司维修。

(7)机房计算机只供机房工作人员使用。未经负责人同意,任何人不准随意删改和增加系统文件,不得将机房内资料、工具等物品带出机房。(www.xing528.com)

(8)机房内的一切公用物品(包括低值易耗品、软件及资料)未经许可一律不得私自挪用和外借。外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后机房工作负责人才能开具放行条。未经主管领导同意,不准自行复制系统内所有的软件和数据或将其赠送、转借给外单位人员。

(9)经常检查网络和各设备运行情况,发现问题及时解决,并向主管领导报告。

(10)其他人员需使用机房内设备应征得管理人员许可,并报经主管同意后方可进入机房。

(11)对机房内网络与设备的运行、应用、维护、查看等情况,建立档案,做好系统日志。

要对发生的故障(隐患)以及排除故障情况做好详细记录;值班人员必须认真、如实、详细填写《机房日志》等各种登记簿,详细记录来人、事件、处理经过等,以备后查。定时做好服务器的日志和存档工作,任何人不得删除运行记录的文档,否则追究责任。如机房发现意外和紧急情况要及时报告,对重大事故要注意保护好现场。

(12)要统一管理机房内的设备,计算机及其相关设备的驱动程序、保修卡等随机文件与资料要保存完整。要明确专人负责计算机文档、信息化等资料的保管,要做到资料齐全,存放安全。

(13)机房内的交换机和服务器是办公自动化的关键设备,任何人不得自行配置或更改系统参数。

(14)各客户机应及时做好自身数据的保存工作,不得擅自更改系统及网络设置。如确有工作需要应报至办公室,由办公室指派专人进行,并记录在案。

(15)要做好机房的安全工作,对服务器的各种账号、密码严格保密。对网络运行做好临控、做好记录。

(16)要及时做好各服务器系统的补丁修正与升级工作。

(17)管理人员要有较强的病毒防范意识,要定期对病毒库进行检测,并做好病毒库系统的定时升级工作。发现病毒应及时处理,并做好记录。

(18)未经许可,不得在各服务器上安装新软件。如确实工作需要安装,要经过有关领导批准。

(19)应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全地恢复。所有备份数据不得更改,并要求做到本地和异地双备份保存。

(20)机房内所有设备应妥善保管,任何人不得擅自开关、移动或者使用机房中的任何设备,如有此方面的需要,需有主管领导的批示。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈