非关系型数据库

// 关系型数据库对象关系映射（Object Relational Mapping，简称ORM，或O/RM，或O/R mapping）

// DAL(Data-Access Layer)，数据库操作隐藏在代码外观之后，ORM 是一种 DAL，但并非所有 DAL 都是 ORM

// 关系数据库（Relational database），是创建在关系模型基础上的数据库，借助于集合代数等数学概念和方法来处理数据库中的数据。标准数据查询语言SQL就是一种基于关系数据库的语言，这种语言执行对关系数据库中数据的检索和操作。

两者存在许多显著的不同点，其中最重要的是NoSQL不使用SQL作为查询语言。其数据存储可以不需要固定的表格模式，也经常会避免使用SQL的JOIN操作，一般有水平可扩展性的特征。NoSQL的实现具有二个特征：使用硬盘，或者把随机存储器作存储载体。

HBase、Redis、MongoDB、Couchbase、LevelDB对比

HBase：

优势

1. 存储容量大，一个表可以容纳上亿行，上百万列（基于列）；

2. 可通过版本进行检索，能搜到所需的历史版本数据；

3. 负载高时，可通过简单的添加机器来实现水平切分扩展，跟Hadoop的无缝集成保障了其数据可靠性（HDFS）和海量数据分析的高性能（MapReduce）；

4. 在第3点的基础上可有效避免单点故障的发生。

缺点

1. 基于Java语言实现及Hadoop架构意味着其API更适用于Java项目；

2. node开发环境下所需依赖项较多、配置麻烦（或不知如何配置，如持久化配置），缺乏文档；

3. 占用内存很大（性能高），且鉴于建立在为批量分析而优化的HDFS上，导致读取性能不高；

4. API相比其它 NoSql 的相对笨拙。

适用场景

1. bigtable类型的数据存储；

2. 对数据有版本查询需求；

3. 应对超大数据量要求扩展简单的需求。

Redis

优势

1. 非常丰富的数据结构；

2. Redis提供了事务的功能，可以保证一串命令的原子性，中间不会被任何操作打断；

3. 数据存在内存中，读写非常的高速，可以达到10w/s的频率。

缺点

1. Redis3.0后才出来官方的集群方案，但仍存在一些架构上的问题（出处）；

2. 持久化功能体验不佳——通过快照方法实现的话，需要每隔一段时间将整个数据库的数据写到磁盘上，代价非常高；而aof方法只追踪变化的数据，类似于mysql的binlog方法，但追加log可能过大，同时所有操作均要重新执行一遍，恢复速度慢；

3. 由于是内存数据库，所以，单台机器，存储的数据量，跟机器本身的内存大小。虽然redis本身有key过期策略，但是还是需要提前预估和节约内存。如果内存增长过快，需要定期删除数据。

适用场景

适用于数据变化快且数据库大小可遇见（适合内存容量）的应用程序。

会话缓存（Session Cache）

全页缓存（FPC）

队列

排行榜/计数器

发布/订阅

MongoDB

优势

1. 强大的自动化 shading 功能（将数据水平切分到不同的物理节点，更多戳这里）；

2. 全索引支持，查询非常高效；

3. 面向文档（BSON）存储，数据模式简单而强大。

4. 支持动态查询，查询指令也使用JSON形式的标记，可轻易查询文档中内嵌的对象及数组。

5. 支持 javascript 表达式查询，可在服务器端执行任意的 javascript函数。

缺点

1. 单个文档大小限制为16M，32位系统上，不支持大于2.5G的数据；

2. 对内存要求比较大，至少要保证热数据（索引，数据及系统其它开销）都能装进内存；

3. 非事务机制，无法保证事件的原子性。

适用场景

1. 适用于实时的插入、更新与查询的需求，并具备应用程序实时数据存储所需的复制及高度伸缩性；

2. 非常适合文档化格式的存储及查询；

3. 高伸缩性的场景：MongoDB 非常适合由数十或者数百台服务器组成的数据库。

4. 对性能的关注超过对功能的要求。

// 大数据（如谷歌用户）还是用关系型数据库比较方便