动态Schema的传说

原文地址:http://forchenyun.iteye.com/blog/1018324

众所周知,对于海量数据的schema修改是一个极其昂贵的代价,MySQL分表的很大原因其实就有500w数据一个表,DDL会比较快。

一般来说,动态schema是指的非固定表结构,schema字段(有时也指索引)的增删对于正常的读写没有任何影响。一般有两个方向的表现形式:

Online Schema Change
Schema-Free

NoSQL中一般采用后者,而关系型数据库可能会采用前者,两者的区别是,前者虽然是固定表结构,但是可以通过一定的方式进行在线修改,同时尽可能不影响服务,而后者是原生支持动态schema,是很多NoSQL产品所支持的feature之一,也是它们之于开源关系型数据库的优势所在。下面我将就目前比较通用的动态schema解决方案就一一介绍。

又一个NoSQL知识清单

下面介绍的一篇长文,对NoSQL的各个方面做了系统深入的介绍,提纲明晰,知识量大,非常值得一看。

Facebook游戏开发商wooga的架构:基于MySQL和Redis

这是wooga从之前的基于分片(Shard)的MySQL迁移到基于Master/Slave的Redis和MySQL混合的一些经验教训:
原文地址:http://nosql.mypopescu.com/post/4788119911/woogas-architecture-facebook-games-on-mysql-and-redis

Groupon使用Cloudera 的Hadoop服务进行数据分析

用户数据分析在当下已经越来越受到重视。而 Hadoop 几乎成了大规模并行计算的首选。下面一个例子是当前红得发紫的全球第一团购网Groupon的数据分析中心。

在 VMware CloudFoundry 平台上构建 MongoDB + Rails 应用

VMware 推出了其云平台 CloudFoundry,存储服务上包括MongoDB,MySQL和自家的Redis。下面推荐的是MongoDB官方博客上的一篇文章,描述了如何在CloudFoundry 平台上使用Rails + MongoDB构建应用程序。

(dbthink)对后端优化的一点想法

dbthink4.16日在ITPUB数据库大会的演讲稿..

由于部分地方说明不清楚,以及我自己有一点点紧张, 演讲中出现了一点断点,,请在现场的朋友原谅,此处的ppt中对这部分信息做了修正..
原文地址:http://www.dbthink.com/?p=691

基于Flume和Cassandra的实时日志处理

这是Gemini Mobile Release的一个Flume的Plugin.以Cassandra做为其数据的目地的,关于Flume可以参见前文的介绍,它可以收集数据放到指定的目地的,原生的只支持HDFS,但是你可以在上面开发Plugin以支持各种数据结构。关于Flume Plugin的细节可以参考:

https://github.com/cloudera/flume/wiki

推荐:长达150页的NoSQL论文

在 Stuttgart Media 大学的 Christof Strauch 历时8个月(2010年6月-2011年2月)完成了一篇150页长的NoSQL相关的论文,对NoSQL的各个方面做了探讨。当然,由于NoSQL相关的技术日新月异,论文中不免有些已经不再“过时”的内容,但相信仍然会是值得一读的好文章。

Graylog2:一个使用MongoDB的开源syslog存储系统

Graylog2 是一个开源的日志存储系统,它由下面几部分组成:

一个由Java写的server,接受TCP、UDP及AMQP的syslog日志信息
用来存储日志内容的MongoDB服务器
一个web管理界面,让你可以可视化地管理你的日志

MongoDB1.6版本与最新1.8版本性能测试——写入篇

本文转自淘宝数据库技术团队博客。对MongoDB最新的稳定版1.8版本和上个稳定版本1.6版本做了写入性能的测试对比。从测试来看,1.8版本对性能的改进还是卓有成效的。

下一页 »