关系型数据库与非关系型数据库


2019-07-02  16:34:48  by冲冲

1. 关系型数据库

1.1 概念

关系型数据库,是指采用了关系模型来组织数据的数据库。关系模型指的就是二维表格模型,因此一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。

目前十大主流的关系型数据库:MySQL、Microsoft SQL Server、Oracle、SQLite、MariaDB(MySQL的分支)、PostgreSQL、Microsoft Access、Teradata、SAP。

1.2 结构

(1)关系:可以理解为一张二维表,每个关系都具有一个关系名,就是通常说的表名。
(2)元组:可以理解为二维表中的一行,在数据库中经常被称为记录。
(3)属性:可以理解为二维表中的一列,在数据库中经常被称为字段。
(4)域:属性的取值范围,也就是数据库中某一列的取值限制。
(5)关键字:一组可以唯一标识元组的属性,数据库中常称为主键,由一个或多个列组成。
(6)关系模式:指对关系的描述。其格式为:关系名(属性1,属性2, … … ,属性N),在数据库中成为表结构。

1.3 优点

① 容易理解:二维表结构是非常贴近逻辑世界的一个概念,关系模型相对网状、层次等其他模型来说更容易理解。
② 使用方便:通用的SQL语言使得操作关系型数据库非常方便。(SQL语言通用)
③ 易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率。(表结构易于维护)

1.4 瓶颈

① 高并发读写需求:网站的用户并发性非常高,往往达到每秒上万次读写请求,对于传统关系型数据库来说,硬盘I/O是一个很大的瓶颈。
② 海量数据的高效率读写:网站每天产生的数据量是巨大的,对于关系型数据库来说,在一张包含海量数据的表中查询,效率是非常低的。
③ 高扩展性和可用性:在基于web的结构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,数据库却没有办法像web server和app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移。

1.5 非必要性功能

(1)对于网站来说,关系型数据库的很多特性不再需要了:
① 事务一致性: 关系型数据库在对事物一致性的维护中有很大的开销,而现在很多web2.0系统对事物的读写一致性都不高。
② 读写实时性: 对关系数据库来说,插入一条数据之后立刻查询,是肯定可以读出这条数据的,但是对于很多web应用来说,并不要求这么高的实时性,比如发一条消息之后,过几秒乃至十几秒之后才看到这条动态是完全可以接受的。
③ 复杂SQL,特别是多表关联查询: 任何大数据量的web系统,都非常忌讳多个大表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询,特别是SNS类型的网站(SNS,专指社交网络服务,包括了社交软件和社交网站),从需求以及产品阶级角度,就避免了这种情况的产生。往往更多的只是单表的主键查询,以及单表的简单条件分页查询,SQL的功能极大的弱化了。

(2)在关系型数据库中,导致性能欠佳的最主要原因是多表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询。为了保证数据库的ACID特性,我们必须尽量按照其要求的范式进行设计,关系型数据库中的表都是存储一个格式化的数据结构。每个元组字段的组成都是一样,即使不是每个元组都需要所有的字段,但数据库会为每个元组分配所有的字段,这样的结构可以便于标语表之间进行链接等操作,但从另一个角度来说它也是关系型数据库性能瓶颈的一个因素。

注:数据库事务必须具备ACID特性,ACID是Atomic原子性,Consistency一致性,Isolation隔离性,Durability持久性。


2. 非关系型数据库

2.1 概念

NoSQL最初指的是一个没有SQL功能,轻量级的,开源的关系型数据库。随着时代需求的发展,我们要的不是“no sql”,而是“no relational”,也就是我们现在常说的非关系型数据库。2009年明确NoSQL,用于指代那些非关系型的,分布式的,且一般不保证遵循ACID原则的数据存储系统。非关系型数据库的理念,例如,以键值对存储,且结构不固定,每一个元组可以有不一样的字段,每个元组可以根据需要增加一些自己的键值对,这样就不会局限于固定的结构,可以减少一些时间和空间的开销。使用这种方式,用户可以根据需要去添加自己需要的字段,这样,为了获取用户的不同信息,不需要像关系型数据库中,要对多表进行关联查询。仅需要根据key取出相应的value就可以完成查询。但非关系型数据库由于很少的约束,他也不能够提供像SQL所提供的where这种对于字段属性值情况的查询。并且难以体现设计的完整性。他只适合存储一些较为简单的数据,对于需要进行较复杂查询的数据,SQL数据库显的更为合适。

非关系型数据库严格意义上,不是一种数据库,而应该是一种数据结构化存储方法的集合,可以是文档或者键值对等。

2.2 分类

非关系型数据库,都是针对某些特定的应用需求出现的,因此对于特定应用,专门的非关系型数据库会具有极高的性能。依据结构化方法以及应用场合的不同,主要分为以下几类:
(1)面向高性能并发读写的key-value数据库:以键值对存储数据的一种数据库,类似Javamap,整个数据库就像一个map,每个键都会对应一个唯一的值。该数据库的特点是,具有极高的并发读写性能。典型代表为Redis、Tokyo Cabinet、Flare、Amazon DynamoDB、Memcached、Microsoft Azure Cosmos DB、Hazelcast。
(2)面向海量数据访问的面向文档数据库:该类数据库的特点是,可以在海量的数据中快速的查询数据。文档存储通常使用内部表示法,可以直接在应用程序中处理,主要是JSON,而JSON文档也可以作为纯文本存储在键值存储或关系数据库系统中。典型代表为MongoDB、Amazon DynamoDB、Couchbase、Microsoft Azure Cosmos DB、CouchDB。
(3)面向可扩展性的分布式数据库:普通的关系型数据库都是以行为单位来存储数据的,擅长以行为单位的读入处理,比如特定条件数据的获取。因此,关系型数据库也被成为面向行的数据库。相反,面向列的数据库是以列为单位来存储数据的,擅长以列为单位读入数据。该类数据库想解决的问题就是传统数据库存在可扩展性上的缺陷,该类数据库可以适应数据量的增加以及数据结构的变化,将数据存储在记录中,能够容纳大量动态列。由于列名和记录键不是固定的,并且由于记录可能有数十亿列,因此可扩展性存储可以看作是二维键值存储。典型代表为Cassandra、HBase、Microsoft Azure Cosmos DB、Datastax Enterprise、Accumulo。
(4)面向搜索数据内容的搜索引擎数据库:专门用于搜索内容。主要是用于对海量数据进行接近实时的处理和分析处理,可用于机器学习和数据挖掘。典型代表为Elasticsearch、Splunk、Solr、MarkLogic、Sphinx。

 

  

2.3 优点

① 格式灵活:存储数据的格式可以是key-value形式、文档形式、图片形式等等,使用灵活,应用场景广泛,而关系型数据库则只支持基础类型。
② 速度快:NoSQL可以使用硬盘或者随机存储器作为载体,而关系型数据库只能使用硬盘。
③ 高扩展性。
④ 成本低:NoSQL数据库部署简单,基本都是开源软件。

2.4 缺陷

① 不支持SQL语句,学习和使用成本较高。
② 无事务处理。
③ 数据结构相对复杂,复杂查询方面稍欠。


3. 关系型数据库 PK 非关系型数据库

① 关系型数据库的最大特点就是事务的一致性:传统的关系型数据库读写操作都是事务的,具有ACID的特点,这个特性使得关系型数据库可以用于几乎所有对一致性有要求的系统中,如典型的银行系统。但是,在网页应用中,尤其是SNS应用中,一致性却不是显得那么重要,两个人看到同一好友的数据更新的时间差那么几秒是可以容忍的,因此,关系型数据库的最大特点在这里已经无用武之地,起码不是那么重要了。相反地,关系型数据库为了维护一致性所付出的巨大代价就是其读写性能比较差,而像微博、facebook这类SNS的应用,对并发读写能力要求极高,关系型数据库已经无法应付(在读方面,传统上为了克服关系型数据库缺陷,提高性能,都是增加一级memcache来静态化网页,而在SNS中,变化太快,memchache已经无能为力了),因此,必须用新的一种数据结构存储来代替关系数据库。
② 关系数据库的另一个特点就是其具有固定的表结构,因此,其扩展性极差,而在SNS中,系统的升级,功能的增加,往往意味着数据结构巨大变动,这一点关系型数据库也难以应付,需要新的结构化数据存储。因此,非关系型数据库应运而生。由于不可能用一种数据结构化存储应付所有的新的需求,所以,非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合。
③ 必须强调的是,数据的持久存储,尤其是海量数据的持久存储,还是需要一种关系数据库这员老将。

① 成本:NoSQL数据库简单易部署,基本都是开源软件,不需要像使用Oracle那样花费大量成本购买使用,相比关系型数据库价格便宜。
② 查询速度:NoSQL数据库将数据存储于缓存之中,而且不需要经过SQL层的解析,关系型数据库将数据存储在硬盘中,自然查询速度远不及NoSQL数据库。
③ 存储数据的格式:NoSQL的存储格式是key-value形式、文档形式、图片形式等等,所以可以存储基础类型以及对象或者集合等各种格式,而数据库则只支持基础类型。
④ 扩展性:关系型数据库有类似join等多表查询机制的限制,导致扩展很艰难。NoSQL基于键值对,数据之间没有耦合性,所以非常容易水平扩展。
⑤ 持久存储:NoSQL不使用于持久存储,海量数据的持久存储,还是需要关系型数据库。
⑥ 数据一致性:非关系型数据库一般强调的是数据最终一致性,不像关系型数据库一样强调数据的强一致性,从非关系型数据库中读到的有可能还是处于一个中间态的数据,NoSQL不提供对事务的处理。

4. CAP理论

NoSQL的基本需求就是支持分布式存储,严格一致性与可用性需要互相取舍。

CAP理论:一个分布式系统不可能同时满足C(一致性)、A(可用性)、P(分区容错性)三个基本需求,并且最多只能满足其中的两项。对于一个分布式系统来说,分区容错是基本需求,否则不能称之为分布式系统,因此需要在C和A之间寻求平衡。

C(Consistency)一致性:一致性是指更新操作成功并返回客户端完成后,所有节点在同一时间的数据完全一致。与ACID的C完全不同。

A(Availability)可用性:可用性是指服务一直可用,而且是正常响应时间。

P(Partition tolerance)分区容错性:分区容错性是指分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性和可用性的服务。

5. 数据库排名查询

网站地址:https://db-engines.com/en/ranking

看图可知:当前主流的还是关系型数据库,非关系型数据库中RedisMongoDB最受欢迎。


参考博客:

https://blog.csdn.net/m0_37947204/article/details/81047934

https://www.cnblogs.com/zylq-blog/p/7595979.html

https://www.jianshu.com/p/fd7b422d5f93

【Redis】(1)-- 关系型数据库与非关系型数据库的更多相关文章

  1. 数据库基础 非关系型数据库 MongoDB 和 redis

    数据库基础 非关系型数据库 MongoDB 和 redis 1 NoSQL简介 访问量增加,频繁的读写 直接访问(硬盘)物理级别的数据,会很慢 ,关系型数据库的压力会很大 所以,需要内存级的读写操作, ...

  2. Java Redis系列1 关系型数据库与非关系型数据库的优缺点及概念

    Java Redis系列1 关系型数据库与非关系型数据库的优缺点及概念 在学习redis之前我们先来学习两个概念,即什么是关系型数据库什么是非关系型数据库,二者的区别是什么,二者的关系又是什么? ** ...

  3. Mysql-关系型数据库与非关系型数据库

    一.什么是数据库 数据库是数据的仓库. 与普通的"数据仓库"不同的是,数据库依据"数据结构"来组织数据,因为"数据结构",所以我们看到的数据 ...

  4. NoSQL:从关系型数据库到非关系型数据库

    关系型数据库 所谓关系型数据库,,就是指采用了关系模型来组织数据的数据库. 什么是关系模型,简单说,关系模型就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织. 关系模 ...

  5. MongoDB(一):关系型数据库和非关系型数据库

    一.关系型数据库 1.概念 关系型数据库:是指采用了关系模型来组织数据的数据库,是目前各类数据库中使用最为广泛的数据库系统.简单的说,关系模型指的就是二维表格模型,一个关系型数据库就是由二维表及其之间 ...

  6. python 之操作redis数据库(非关系型数据库,k-v)

    数据库: 1. 关系型数据库 表结构 2. 非关系型数据库 nosql (k - v 速度快),常用的时以下三种: memcache 存在内存里 redis 存在内存里 mangodb 数据还是存在磁 ...

  7. 关系型数据库 VS 非关系型数据库

    一.关系型数据库? 1.概念 关系型数据库是指采用了关系模型来组织数据的数据库.简单来说,关系模式就是二维表格模型. 主要代表:SQL Server,Oracle,Mysql,PostgreSQL. ...

  8. 关系型数据库 和 非关系型数据对比 以及 MySQL与Oracle对比

    一.关系型数据库 关系型数据库,是指采用了关系模型来组织数据的数据库.    关系模型1970年提出的,关系模型的概念得到了充分的发展并逐渐成为主流数据库结构的主流模型.    简单来说,关系模型指的 ...

  9. Python进阶----数据库的基础,关系型数据库与非关系型数据库(No SQL:not only sql),mysql数据库语言基础(增删改查,权限设定)

    day37 一丶Python进阶----数据库的基础,mysql数据库语言基础(增删改查,权限设定) 什么是数据库:    简称:DataBase ---->DB    数据库即存放数据的仓库, ...

随机推荐

  1. Java基础之(六):变量、运算符与JavaDoc

    变量.常量 一.变量的命名规范 首字母只能以字母(A-Z或者a-z)或者美元符($)或者下划线(_)开头,不能以数字开头,首字母之后只能跟字母(AZ或者az)或者数字,不能跟美元符或者下划线 源码 p ...

  2. 洛谷4219 BJOI2014大融合(LCT维护子树信息)

    QWQ 这个题目是LCT维护子树信息的经典应用 根据题目信息来看,对于一个这条边的两个端点各自的\(size\)乘起来,不过这个应该算呢? 我们可以考虑在LCT上多维护一个\(xv[i]\)表示\(i ...

  3. uoj279题目交流通道(dp)

    题目大意: 神犇星球有 \(n\) 座小城.对于任意两座小城 \(v,u\)\((v≠u)\),吉米多出题斯基想在 \(v,u\) 之间建立一个传送时间为 \(w(v,u)\)的无向传送通道,其中 \ ...

  4. 其他css属性和特性

    其他css属性和特性 设置元素的颜色和透明度 下表列出了这些属性. 颜色相关属性 属 性 说 明 值 color 设置元素的前景色 <颜色> opacity 设置颜色的透明度 <数值 ...

  5. 用 @Value("${xxxx}")注解从配置文件读取值的用法

    1.  用法: 从配置properties文件中读取init.password 的值. @Value("${init.password}") private String init ...

  6. 这部分布式事务开山之作,凭啥第一天预售就拿下当当新书榜No.1?

    大家好,我是冰河~~ 今天,咱们就暂时不聊[精通高并发系列]了,今天插播一下分布式事务,为啥?因为冰河联合猫大人共同创作的分布式事务领域的开山之作--<深入理解分布式事务:原理与实战>一书 ...

  7. 源码解析-Abp vNext丨LocalEventBus

    前言 基础篇已经更新完了,从本篇开始我们进入,中级篇(学习部分源代码)我会挑一些我个人认为比较重要的知识点结合部分开源项目进行源码讲解,咱们废话不说直接上车. Abp vNext的事件总线分2种,一种 ...

  8. JAVA String、StringBuffer、StringBuilder类解读

    JAVA String.StringBuffer.StringBuilder类解读 字符串广泛应用 在 Java 编程中,在 Java 中字符串属于对象,Java 提供了 String 类来创建和操作 ...

  9. 【数据结构与算法Python版学习笔记】查找与排序——散列、散列函数、区块链

    散列 Hasing 前言 如果数据项之间是按照大小排好序的话,就可以利用二分查找来降低算法复杂度. 现在我们进一步来构造一个新的数据结构, 能使得查找算法的复杂度降到O(1), 这种概念称为" ...

  10. HZOI帝国2019欢乐时刻

    前言: update 只是恢复一下原来手残删掉的博客,不是在水,嘤嘤嘤 update 以后改成Stack,但是之前的就懒得改了... by 10.31 为了窝的访问量大家的好心情,模仿学长搞了一个这个 ...