路杨之博友聚合|Easun‘s Bookmarks,(2010年03月12日)

2010年03月12日

暂缓迷恋 Cassandra

作者:Fenng 发布在 dbanotes.net. BLOG 墙外订阅数量,点击则可进行订阅

最近 Twitter 和 Digg 的技术团队都放出话来说要从 Mysql + Memcached 的组合迁移到 Cassandra 环境(Refer 12),这些消息又会让不少人跃跃欲试,恨不得也把自家网站迁移到 Cassandra 下面过把瘾,我相信有些公司的团队又要言必称 Cassandra 了。

Twitter 和 Digg 对数据存储引擎的需求相当独特:写操作密集,基本无修改需求,读操作则多数是分散多次读取汇总展示(想象一下你 Twitter页面上同时显示好友们的 Tweet 内容)。对 MySQL 来说,Sharding 后几乎是被当作简单的存储引擎来用的,即使是加上 Memcached ,对数据读取开销相当大(Refer),因为这时候即使是最合理用索引,I/O开销也不是最优的--走的是索引范围扫描嘛。Cassandra 则相当于预存了计算结果,这要得益于其 Flexible schema 特性,按照既定规则写入,读取直接取预排序的范围键值结果(这其实是偏 OLAP 的应用,而非 OLTP)。

Twitter 和 Digg 这两家网站的数据结构其实并不复杂,尤其是 Twitter ,相当的简约(当然并不简单)。或许有人说,把 Cassandra 开源的 Facebook 不也在用呢吗 ? Facebook 数据结构不复杂么?没错,Facebook 数据结构很复杂,不过使用 Cassandra 的场景其实和 Twitter / Digg 几乎一致的---只是用在 inbox 这个地方的数据处理而已。

不要迷恋 Cassandra ,如果应用场景不合适,那么对你来说永远都只是个传说。。

--EOF--


最近文章|Recent Articles

本站赞助商:豆瓣网

评论数(9)|添加评论 | 最近作者还说了什么? Follow Fenng@Twitter
本文网址:

DBA Notes 理念: 用简约的技术取得最大的收益...

站点链接|Blogroll

Blogger
  • Ikias.com | IKias的Blog,大量MT资源和一些软件技巧
  • 月光博客 | 月光:关注互联网和搜索引擎的IT评论博客
  • 原生脑浆 | Just 平生一笑,MT资源,中文化,MT Hack
  • Yang Kang | 杨康的Blog : MT资源
  • AnySQL | MyDUL工具,关注 Oracle数据库恢复与服务
  • Fenng | DBA notes, ALi Fenng 的Blog,技术性很强
  • 车东[Blog^2] | Che, Dong 车东大侠
  • 雪雾雰霏 | BB's Blog,雪雾雰霏,关注 MT ,中移动
  • LifeTyper | LifeTyper,毕勤,观点尖锐
  • 曙光博客 | Jackie,曙光博客,MT之旅
PerlChina
  • Fayland | Fayland and Perl Programming, 非四.
  • cnhackTNT | -=-atZone-=-
  • Chunzi | 三下五除二,春子,PerlChina 站点发起者之一
  • cnangel | My Study , 北京Yahoo. Perl fans
Friends
  • 东博 | 智能算法博客,关注智能算法,东风大哥,老朋友
  • 芳华 | 一个人的歌,刹那回首,芳华依旧,玫瑰满院 :D
  • 圈圈 | 轻松Cookies,圈儿妹,才女华服,天使白衣
Give Me a cup of Coffee Blogging and Coding is a hard work. Why not Give Me a cup of Coffee? (Suggested: $3 for a coffee)