Hadoop的五个典型应用场景

Hadoop作为大数据存储及计算领域的一颗明星,目前已经得到越来越广泛的应用。下面PPT主要分析了Hadoop的一些典型应用场景,并对其进行了深入分析。

HBase中文官方文档

HBase – Hadoop Database,是一个构建在Apache Hadoop上的列数据。Hbase有很好的扩展性,被认为是BigTable的一个克隆,可以存储数以亿计的行。在HBase的官网,我们看到一篇很好的官方文档。我花了很长的时间,把他汉化了。

HBase运维实战:disable table失败的处理

相信每一个维护hbase集群的运维人员一定碰到过disable失败,陷入无穷的”Region has been PENDING_CLOSE for too long…”状态,此时没有什么好的办法处理。经常需要重启集群。
这个问题产生的原因非常讨厌,经过一段时间的分析和验证,得到了根本原因。

HBase 增量备份和还原工具

HBase自带的export/import机制可以实现Backup Restore功能。而且可以实现增量备份。下面设增量备份的python脚本,在这个脚本中,每天做增量备份,每个月15日做全备份。

HBase随机读写性能测试

本文转载自淘宝网BlueDavy同学的博客,文章基于淘宝对HBase的大量应用,给出了一个HBase的随机读写性能测试结果,对测试环境、配置及性能参数分析都有较详细的描述,推荐给各位NoSQL Fans。

关于HFile的思考

本文是一篇转载文章,原文作者郭鹏(@逖靖寒),国内Cassandra领域的先驱者和实践者。资深软件开发工程师,擅长分布式应用程序的开发和使用,实践经验极其丰富。在本文中,作者推荐了HFile文件格式的经典论文,并对HFile的block size的应用进行了实例探讨。

yfrog的HBase应用经验

yfrog是一个多媒体分享平台,最初基于twitter,下面是一个yfrog使用HBase的经验分享PPT,虽然简短,但是都是一些干货,比较有意思的数据有以下一些:HBase集群承担每秒大约10000次的请求,四个HBase 集群,大小从50TB到1PB,大量廉价机器组成的集群要比更少的高性能机器要好,他们的机器大多是1k美元以下的廉价机,硬盘也都是便宜的日立2TB盘,用了YCBS来做性能测试:保证连续测试一周没问题。

Java开源NoSQL数据库大全

本文转自Java开源大全,列举了与Java相关的NoSQL数据库,其中包括Java写成的,Java版本的,或者能与Java紧密结合的各种NoSQL数据库。对列举到的NoSQL都进行了比较详尽的描述。推荐给各位使用Java的朋友们。

HBase简介与实践分享

正面Slide来自淘宝技术嘉年华的iDataForum专场,是淘宝高级技术专家毕玄带来的演讲搞,内容包括HBase介绍和HBase的一些应用经验分享。

论文:Hadoop在Facebook的实时应用

Facebook在其最新的消息系统中使用了HBase,这已经不是什么新闻了,而HBase与其基础设施HDFS也因此越来越受追捧,下面是Facebook在SIGMOD 2011大会上发表的论文,描述了Hadoop系列工具在Facebook中的应用情况。

共 3 页123