Google Megastore系统事务机制

近日,Google 发布了 Megastore 的论文,Megastore是谷歌内部的一个存储系统,它的底层是Google 的 Bigtable,Megastore 被认为是结合了 NoSQL 与 RDBMS 的一个产品,与大多数NoSQL 产品不同的是,Megastore 提供强一致性的保证,下文推荐的是一篇讲 Megastore 的事务机制的文章,相当不错。

解读Google分布式锁服务

在2010年4月,Google的网页索引更新实现了实时更新,在今年的OSDI大会上,Google首次公布了有关这一技术的论文。

在此之前,Google的索引更新,采用的的批处理的方式(map/reduce),也就是当增量数据达到一定规模之后,把增量数据和全量索引库Join,得到最新的索引数据。采用新的索引更新系统之后,数据的生命周期缩短了50%,所谓的数据生命周期是指,数据从网页上爬下来,到展现在搜索结果中这段时间间隔,但是正如Google所强调的,这一系统仅仅是为增量更新所建立的,并没有取代map/reduce的批量作业处理模式。