首页 理论教育 Linux集群技术在校园网应用探析

Linux集群技术在校园网应用探析

时间:2026-01-26 理论教育 小龙哥 版权反馈
【摘要】:(一)设计思想设计一个基于Linux的集群系统,打破在校园网中以单机为主的传统服务器方式,以Linux集群技术为基石,构成一个高可扩展、高可用的操作平台。这种基于Linux集群技术构成的系统属于松耦合集群系统,不需要在集群中部署特殊的中间件层或者O/S扩展,对服务器节点操作系统的兼容性比较好。在校园网中,究竟选择哪种负载均衡模型,要根据网络的流量和具体的应用进行考虑。

(一)设计思想

设计一个基于Linux的集群系统,打破在校园网中以单机为主的传统服务器方式,以Linux集群技术为基石,构成一个高可扩展、高可用的操作平台。该系统能够提供负载平衡的功能,能够不断监视集群中各台实际服务器的负载状况,并且将来自外部网的多种请求转发到内部网中的某一台实际服务器上执行,以解决校园网服务器面临的大量并发访问造成的CPU或I/O的高负载问题。

(二)解决方案

1.负载均衡器

这是集群的唯一入口,校园网就是通过该设备接入Internet的。从校园内的单个客户端来看,集群通过这一层的服务体现为一个基于IP地址的单一系统映像,整个校园网络共用这个虚拟地址,通过它可以把整个集群看作一个独立的具有合法IP地址的主机系统,客户端的所有访问都发往这个虚拟IP地址,可以有效地解决学校IP地址的短缺问题。

如果仅有一台负载均衡器,容易造成负载均衡器的单点失效,使其成为集群中最脆弱的环节。因此,有必要提供容错机制,能够在负载均衡器失效的时候进行自动检测并平滑替换。在实际处理过程中增加一个辅助均衡器,可以实时地监控负载均衡器的运行状态,并根据检测到的状态做出报警、接管、恢复等响应。

2.服务器池

这是一组真正执行客户请求的服务器。客户端发出的服务请求经过均衡器处理以后,转交到服务器池由具体的服务器响应请求并返回数据。在校园网中一般提供WWW、FTP、邮件和课件点播等服务,使用单一的服务器系统无法应付高峰时的数据访问,通过多台服务器分担这些负载是比较经济可行的。

服务器节点也有可能会出现暂时失效的情况,特别是在节点提供多种服务的时候,系统的随机故障或外部环境的突变都可能造成该节点的某个服务暂时不可用。这需要由负载均衡扩展出的容错机制识别出这种错误并及时进行处理;当错误排除后,集群能够自动识别恢复事件,把好的节点重新纳入集群继续运行。

3.存储系统

存储系统主要为整个集群内部运行提供稳定、一致的文件存取服务。该系统可以为集群服务器池提供单一的文件系统入口,即在每一台服务器上都共用同一个根;并且自动完成不同节点访问文件系统所引发的文件锁定、负载均衡、容错、内容一致、读写事务等底层功能,为应用层提供一个透明的文件访问服务。这种基于Linux集群技术构成的系统属于松耦合集群系统,不需要在集群中部署特殊的中间件层或者O/S扩展,对服务器节点操作系统的兼容性比较好。

(三)关键技术(https://www.xing528.com)

这种解决方案所运用的技术,实际上是借助于网络接入协议层的负载均衡技术,将网络请求化整为零,由大量集群的服务器节点来共同分担,以实现性能最大化的一项集群技术。因此,该方案的关键技术是网络接入协议层的负载均衡技术。该负载均衡技术的特点是:

执行效率高。因为基于底层的协议,可以通过硬件体系进行部署,也可以在操作系统的核心层实现。

兼容性强。接入协议往往能够兼容大多数现有的主流网络应用,如IPv4体系中的IP层。

体系实现相对简单。比起基于内容的高层交换,它不需要复杂的模式匹配机制,主要通过端口映射进行数据交换,因而规则简单。

从根本上讲,该负载均衡技术的实现基础是IP交换,只是在Linux平台下IP的交换具备了一定的可扩展性,可以实现高性能、高可扩展性、易管理性等诸多特点,成为一个以负载均衡为核心的真正意义上的集群系统。Linux支持三种负载均衡模型,分别是地址转换(NAT)、IP隧道(IPIP)和直接路由(DR)模型。

NAT是通过内部IP地址,将服务节点池同互联网隔离开来。服务节点和客户端不能直接通信,不论是请求数据还是应答数据,都需要经过负载均衡器进行IP包处理工作

IPIP采用的是开放的网络结构,服务节点拥有合法的互联网IP地址,可以通过路由路径将应答包直接返回给客户端。负载均衡器收到客户端的请求包后,通过IPIP协议为该IP包进行重新处理,形成以选定的服务节点为目的IP的新的IP包,原有的IP包数据则封装在新的IP包里。服务节点收到均衡器发来的IPIP数据后,将该包解开,根据其内的客户端地址(源地址)将处理结果直接返回给客户端,而应答包的源地址则成为集群的虚拟地址VIP。

DR模式的工作方式是负载均衡器接收到客户端请求后,选择合适的服务节点,然后改写该请求包的MAC地址部分,使之成为目的服务节点的MAC地址,再将此包广播到均衡器所在的网段。由于每个服务节点都拥有一个虚拟的网络设备,这些设备上绑定了和均衡器一样的VIP,只是该设备并不响应对VIP的RAP解析,不会和均衡器的VIP地址冲突。负载均衡器收到符合自身MAC的IP包后,经过处理后直接将应答数据返回给客户,而此时的源地址仍然是VIP。这样,在客户端看来,访问的和接收响应的始终是集群的VIP地址。

在三种负载均衡模型中,NAT是双工连接处理模型,要对进入和流出集群的网络包进行改写包头地址的工作,在负荷比较重的时候会影响整个集群的性能,负载均衡器容易成为瓶颈;IPIP和DR是一种单工模型,负载均衡器仅仅处理进入集群的IP请求包,而对IP的应答数据则不处理,对于大量的返回数据,都由服务节点通过路由器、交换机等设备直接返回给客户端,具有较强的可扩展性。但使用NAT模型在网络的安全性方面具有较强的 优势。

在校园网中,究竟选择哪种负载均衡模型,要根据网络的流量和具体的应用进行考虑。一般来讲,在校园网中,大多数的网络请求比较小,无非是一些URL页面请求、GET或者POST表单,或者就是某些指令等,这些数据基本上在几百到几千个字节。相反,Web中的应答数据通常很大,一个普通的Web页面也要一万多个字节,而且在校园网中返回的很多内容都是视频、音频流量,加上日益“疯狂”的网络下载,大大增加了应答数据的流量。在这种情况下使用IPIP或者DR模式是一个非常好的选择。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈