Open Source
NinGoo's blog

NoSQL,关系数据库终结者?

作为一个DBA,几年走过来,工作中历经MS SQL Server 2000/2005,Oracle9i/10g/11g,MySQL5.0/5.1等不同的数据库产品和版本,对于关系型数据库系统(RDBMS)应该说有了一定的了解。从一个数据库切换到另外一个数据库,虽然有些许艰难,却谈不上抗拒,甚至乐意主动去深入了解其他的数据库产品。关系理论的成熟,造就了这三十年来关系数据库在数据领域的绝对地位。

这两年在互联网行业,时间虽然不长,却深切的感受到了一个大型网站真实的压力。随着业务滚雪球式的增长,关系数据库由于对数据一致性的强硬要求(ACID),在扩展性方面天生不足,可以预见的天花板犹如达摩克利斯之剑,随时可能落下。SQL优化,应用重构,硬件升级,垂直拆分,能用的武器轮番上场,也不过救急于一时。要能做到系统随着网站压力几乎无限制的扩展需求,水平拆分横向扩展是不可避免的终极魔法。过去一年,我们也在一些应用上逐步尝试水平拆分,遇到过各种各样的问题,当然也有很大的收获,积累了很多的经验。MySQL作为开源的关系数据库,也开始得到大规模的应用,毕竟水平拆分后数据库的规模将是指数级的增长,商业数据库如Oracle的成本,是不得不考虑的一个问题。

我们所遇到的问题,相信所有大型的互联网站都会碰到。关系数据库有其不可替代的特性,但是,我们真的所有的数据都需要使用关系数据库么?或许一个简单但是更加容易扩展的key-value存储更能够满足很多互联网应用的数据存储需求,Google和Amazon相继推出BigTableDynamo,可以说是在分布式数据库方面一个开荒式的尝试。2009年初,一个叫做NoSQL的组织开始出现并运作,纠集了一支优秀的开源部队想要革了关系型数据库的命,至少是想革了关系型数据库在互联网行业的命。不管NoSQL是不是关系型数据库的终结者,却确确实实在推广一些优秀的开源分布式数据库产品,作为DBA,或许我们是时候花点时间去了解一下这个对手了,不然饭碗丢了可能还不明白是谁抢去了,呵呵。

下面是wikipedia上列出了NoSQL的一些开源项目,有时间应该去了解一下。实际上,淘宝也有在开发并使用自己的一套分布式cache和持久化系统,不知道什么时候也能看到开源版本的出现,呵呵。
* Cassandra
* Chordless
* CouchDB
* Db4o
* GT.M
* Hbase
* Hypertable
* Memcachedb
* Mnesia
* MongoDB
* Neo4j
* Project Voldemort
* Redis

发现有半个月没写blog了,这篇比较水,充一下数。

开源,是一种精神

毫无疑问,开源运动最初更多的是一种精神运动,虽然最终不可避免的被商业化。Sun显然没有真正的理解开源,甚至没能合格的利用开源。虽然Sun一直在抱怨说向开源社区贡献了最多的源代码却没有得到应用的尊重,虽然已经将压箱底的JavaSolaris都整成了OpenJavaOpenSolaris,但看起来这更多的是被逼无奈,而不是真心的拥抱开源。

现在Sun说要对MySQL选择性开源,一些企业级新特性的源代码将不再开放,患得患失的小家子气一下表露无遗。保留的这些代码未必能吸引更多的客户,却让原本对于Sun收购MySQL持观望态度的开源人士找到了攻击和离开的借口,如此费力不讨好的事情,Sun居然能堂而皇之的在The 2008 MySQL Conference & Expo期间干出来,真是脑子进水了。

开源是一种精神,半推半就是不能赢得人心的。