Google 是当前最有影响的 Web 搜索引擎,它利用一万多台廉价 PC 机构造了一个高 性能、超大存储容量、稳定、实用的巨型 Linux 集群。本文是从计算机系统结构的角度分析 Google 集群系统的逻辑和物理构造方法、可靠性、可扩展性、可用性、并行性。文中重点 介绍了 Google 集群的逻辑结构和物理结构、 分布式文件系统和超大容量存储器的实现方法。 文中分析认为 Google 集群针对 Web 搜索需求的特征,用低成本实现了高可用、高性能集群 的方法是并行机设计、开发一个成功典范,
The World Wide Web is growing in size at a remarkable rate. It is a huge evolving system and its data are rife with uncertainties. Probability and statistics are the fundamental mathematical tools that enable us to model, reason and infer meaningful
前言 在我的上一篇文章《使用Nginx提升网站访问速度》中介绍了Nginx这个HTTP服务器以及如何通过它来加速网站的访问速度。在实际的网站运营中,我们经常需要了解到网站的访问情况,例如每天有多少IP在访问、PV数是多少、哪个URL访问量最大、用户使用最多的浏览器是哪个、都是通过什么方式知道这个网站的以及有多少用户访问出错等等,通过掌握这些信息来提高用户的体验,从而改善网站的质量。一般我们可以通过一些免费的访问统计网站例如 Google Analytics来或者这些信息。但不足之处是这类网站只