Google 是当前最有影响的 Web 搜索引擎,它利用一万多台廉价 PC 机构造了一个高 性能、超大存储容量、稳定、实用的巨型 Linux 集群。本文是从计算机系统结构的角度分析 Google 集群系统的逻辑和物理构造方法、可靠性、可扩展性、可用性、并行性。文中重点 介绍了 Google 集群的逻辑结构和物理结构、 分布式文件系统和超大容量存储器的实现方法。 文中分析认为 Google 集群针对 Web 搜索需求的特征,用低成本实现了高可用、高性能集群 的方法是并行机设计、开发一个成功典范,
1 名词解释 1.1 单元Cell 单元是整个分布式网络中一个或多个节点的逻辑分组。单元是一个配置概念,是管理员将节点间逻辑关联起来的实现方法。管理员根据具体的业务环境,制定对其整体系统集成环境有意义的条件来定义和组织构成单元的节点。如图1所示,就一般情况来说,可以将单元看作是最大的作用域。 在IBM WAS ND产品中,管理配置数据都存储在 XML 文件中。单元保留了它每个节点中每台服务器的主配置文件。同时每个节点和服务器也有其自己的本地配置文件。如果服务器已经属于单元,则对于本地节点或服务