1.3 谷歌的三把利剑
1998 年,斯坦福大学的博士生拉里·佩奇和谢尔盖·布林在车库里创建了谷歌(Google)
公司。15 年后的今天,google.com 成为全世界访问量*高的站点之一。Google 在全球部署了
约200 多万台服务器,每天处理数以亿计的搜索请求和存储24PB 用户生成的数据,这些数据
还在不断地迅速增长中。
成就这一切的秘密正是Google 被称为“三把利剑”的三项核心技术,即分布式文件系统
GFS、Map/Reduce 编程模式和分布式数据库BigTable。Google 一直不保守,从2003 年开始
连续几年发表论文,向世人揭示了这三项核心技术。一些开源组织和大公司基于这三项核心
技术的原理,也纷纷开发了自己的产品,比如**的Hadoop 系统。目前Hadoop 已成为企业
构建大数据平台的**产品。大数据成为当下*热的领域,*值得称道的还是Google 公司的
这种分享精神。
1.4 智慧改变世界
从上面的两个小故事和一个传奇的创业经历中不难发现,无论什么时代都需要智慧的人
做智慧的事。
孟德尔的智慧在于用了假说演绎的方法,发现了遗传学的秘密,但其前提是大量实验数
据的积累和后期的分类归纳,用当下时髦的话可以说这是一个“应用大数据”的经典案例,
只是可惜孟德尔没有生活在今天这个大数据时代。
曹冲称象的智慧在于采取了分而治之的方法,用多杆小秤同时分别称出多个石块的重量,
然后将所有石块的重量合加就是大象的重量。曹冲在小小年纪能把一个不可分的整体(大象)
看成由另一个可由多个部分构成的可分整体(一堆石块),这是需要一种大智慧的。这种分
而治之正是分布式的核心理念,在这个小故事里分拆和归纳的用法道出了MapReduce 的本质。
开一句玩笑的话,可以说MapReduce 的这种模式是中国古代人发明的。
Google 的智慧可以说是逼出来的智慧,如果当时有大笔投资给这两个年轻人,他们不一
定会用廉价PC 和自己动手做的小软件来构建网站,也就不会有今天这个人人称颂的创业传奇
故事的存在。Google 用分布式文件系统GFS、MapReduce 编程模式和分布式数据库BigTable
这“三把利剑”征服了世界,改变了IT 领域的格局,让许多传统的IT 巨头低下了昂贵的头
颅,不得不重新审视自身对技术的认知。Google 更被人称颂的是,他们没有把这三把利剑藏
起来据为己用,而是拿出来与全世界共享。
孟德尔的豌豆杂交实验让人们知道如何使用大数据,曹冲称象让人们知道处理大数据的
方法,而Google 告诉了人们如何构建一个大数据系统。