SQL VS NoSQL 如何选择数据库
在前一篇文章中我们主要的讨论了SQL与NoSQL数据库之间的主要的差别。接下来,我们将会利用上一篇中的知识来确定在特定的场景中如何确定比较好的选择。
首先我们先来总结一下:
SQL数据库:
使用表存储相关的数据
在使用表之前需要先定义标的模式
鼓励使用规范化来减少数据的冗余
支持使用JOIN操作,使用一条SQL语句从多张表中取出相关的数据
需要满足数据完整性约束规则
使用事务来保证数据的一致性
能够大规模的使用
使用强大的SQL语言进行查询操作
提供大量的支持,专业技能和辅助工具
NoSQL数据库:
使用类JSON格式的文档来存储键值对信息
存储数据不需要特定的模式
使用非规范化的标准存储信息,以保证一个文档中包含一个条目的所有信息
不需要使用JOIN操作
允许数据不用通过验证就可以存储到任意的位置
保证更新的单个文档,而不是多个文档
提供卓越的性能和可扩展性
使用JSON数据对象进行查询
是一种新型的技术
SQL数据库适合那些需求确定和对数据完整性要去严格的项目。NoSQL数据库适用于那些对速度和可扩展性比较看重的那些不相关的,不确定和不断发展的需求。简单来说就是:
SQL是精确的。它最适合于具有精确标准的定义明确的项目。典型的使用场景是在线商店和银行系统。
NoSQL是多变的。它最适合于具有不确定需求的数据。典型的使用场景是社交网络,客户管理和网络分析系统。
很少有项目能够很好的适用于一种数据库。如果你对数据的需求比较小或是非标准化的数据任何一种数据库都是可以的。你比我更了解你的项目,我不建议你将SQL上的数据移植到NoSQL上反之亦然,除非它能够提供非常可观的收益。当然选择权在于你自己。在项目的一开始就要考虑好使用它们的利弊,这样才不会导致选择错误。
场景一:通讯记录
我们来重新的定义操作并基于SQL实现通讯录系统。我们初始简单的定义contact
表拥有如下几个字段;
id
title
firstname
lastname
gender
telephone
email
address1
address2
address3
city
region
zipcode
country
问题一:很少有人只拥有一个手机号。或许我们可以再添加三个字段:固定电话,移动电话和工作电话,但是无论我们给一个联系人分配了多少个字段总会有人需要更多。我们需要创建一个单独的telephone
表,这样就可以给一个联系人存多个号码了。这样也就规范化了我们的数据— 我们不需要一个没有电话的联系人:
contact_id
name (说明字段:固定,工作,私人等.)
number
问题二:对于联系人邮箱我们也会遇到上述问题,因此我们也需要创建一个email
的表:
contact_id
name (说明字段:固定,工作,私人等.)
address
问题三:我们在填写联系人信息是我们并不希望填写他的地理位置,或者我们想记录他工作、生活、旅游的地方等。因此我们需要一个address
表:
contact_id
name (text such as home, office, etc.)
address1
address2
address3
city
region
zipcode
country
我们原先设计的contact
表就精简为:
id
title
firstname
lastname
gender
好了,我们已经设计了一个规范化的数据库,可以用来存储任何一个联系人的电话号码,邮箱地址和住址了。但是......
模式是固定不变的
我们并没有考虑到联系人的生日,公司或者职位。不管我们添加多少个字段,我们会得到更多的需求:备注,周年纪念日,关系,社交账号,喜欢巧克力的种类等等。预测每一个需求对于我们来说是非常困难的,因此我们需要创建一张表其中存储的形式是键值对来应对不断增加的需求。
数据是碎片化的
对于开发人员和系统管理员来说不断地检查数据库是比较麻烦的。程序的逻辑会变得更复杂效率更慢,因为使用一条select
语句来JOIN
多个表来取出一个联系人的全部信息不太实际。(当然这也是可以实现的,但是当一个联系人中国包含电话号码,邮件地址和住址信息时:如果一个人有3个电话号码,五个邮箱和两个住址,那么SQL查询会产生30个结果,也就是说说这样的效率会很慢。)
最后,全文搜索是非常困难的。如果一个人要查询一个字符型:favorite,我们需要依次查询上述的四张表判断是否是一个联系人的姓名,电话,邮件或者地址依据这些把结果进行排序。如果你使用过WordPress
的搜索,你就会发现是都么的烦人了!
使用NoSQL来替代SQL
我们的联系人关注的是人这个实体。然而关于人的信息是不可预测的并且在不同的阶段的需求也会不一样。如果我们使用NoSQL数据库会比较方便,NoSQL将一个人的信息存储为一个文档并放入contacts
的集合中:
{
name: [
"Billy", "Bob", "Jones"
],
company: "Fake Goods Corp",
jobtitle: "Vice President of Data Management",
telephone: {
home: "0123456789",
mobile: "9876543210",
work: "2244668800"
},
email: {
personal: "bob@myhomeemail.net",
work: "bob@myworkemail.com"
},
address: {
home: {
line1: "10 Non-Existent Street",
city: "Nowhere",
country: "Australia"
}
},
birthdate: ISODate("1980-01-01T00:00:00.000Z"),
twitter: '@bobsfakeaccount',
note: "Don't trust this guy",
weight: "200lb",
photo: "52e86ad749e0b817d25c8892.jpg"
}
在这个示例中,我们没有存储这个人的性别和职衔,并且可以添加一些别的联系人没用的信息。在NoSQL中这样的存储是合法的,并且我们可以按照各人的意愿来添加和删除一个字段。
因为一个联系人存储在一个文档中,因此我们可以使用一个查询语句取出一个人的所有信息。对于全文搜索,在MongoDB中我们可以在contact
的字段中定义一个索引:
db.contact.createIndex({ "$**": "text" });
然后我们就可以使用如下的语句进行全文搜索:
db.contact.find({
$text: { $search: "something" }
});
一个典型的社交网络使用的联系人的信息是相似,但是也会增加一些新的功能例如:社交网络,状态更新,私信和点赞。这些功能会根据用户的需求进行添加或者删除,预测用户的需求对开发人员来说是非常困难的。
另外:
大多数的更新都有一个原始的出发点:用户。但是,对于开发人员来说一次性的把所有的回馈都进行更新是不可能的。
不管用户怎么想,一个失败的版本并可能造成太大的经济损失。一个应用的接口设计和功能表现是比数据的完整性的优先级要高。
因此,NoSQL是一个不错的选择。数据库允许我们存储不同类型的数据以便于我们快速的开发出新的功能。例如,因为所有的数据状态的更新都可以在status
的集合中的一个文档中进行:
{
user_id: ObjectID("65f82bda42e7b8c76f5c1969"),
update: [
{
date: ISODate("2015-09-18T10:02:47.620Z"),
text: "feeling more positive today"
},
{
date: ISODate("2015-09-17T13:14:20.789Z"),
text: "spending far too much time here"
}
{
date: ISODate("2015-09-17T12:33:02.132Z"),
text: "considering my life choices"
}
]
}
尽管对于这个文档来说数据会变得多一些,但是我们可以仅仅取出文档的一个子集,例如:最新的状态等。对于每一个用户来说历史记录也会很容易搜索的到。
场景三:仓库管理系统
现在,我们来分析一下一个仓库的管理系统。我们需要记录如下的信息:
货物入库的信息和存放的位置信息
货物在仓库中的移动,例如:为相同的货物分配相邻的位置存放
货物的摆放顺序以及配送货物之后的一系列问题。
数据需求:
保存货物的基本信息例如:尺寸、大小、颜色等,这些不相关的数据我们要能够用到任何的货物上。我们不可能去考虑一些货物个性化的信息例如:笔记本处理器的速度或者是一部手机电池的寿命。
我们要尽可能的避免错误的发生。我们不能让货物凭空消失或者将货物存放到已经存放货物的位置上去。
以更加简单的方式操作。我们记录将一件货物从一个位置移动到另一个位置或者从A移动到B的操作是相同的。
因此,我们需要考虑对数据的完整性和对于事务的支持。目前来说也就是SQL能够很好地满足我们的需求。
总结
我希望上述的案例能够对你有一定的帮助,但是每一个实际的项目都是不同的,对一无二的你需要自己去做决定选择一种适合的。(尽管,对于我们开发人员来说我们不太愿意去改变我们现有的选择,无论新的技术有多好!O(∩_∩)O)
建议:去尝试了解更多新的技术。这样我们就可以非常有理由的选择一种数据库进行开发。祝你好运!
SQL VS NoSQL 如何选择数据库的更多相关文章
- SQL USE语句(选择数据库)
对于大型的软件系统,会存在多个数据库,用来存储不同的数据,那么我们在开始操作之前,需要选择一个需要操作的数据库,进行后续数据的增.删.改.查工作. SQL USE语句用于选择SQL模式中的任何现有数据 ...
- 使用PL/SQL连接远程的Oracle数据库
PL/SQL不仅可以连接本机的oracle数据库.也可以连接远程的数据库. 需要修改一个文件:在本机oracle 数据库的安装目录下找到这个文件: /oracle/ora92/network/admi ...
- SQL与NoSQL(关系型与非关系型)数据库的区别
永远正确的经典答案依然是:具体问题具体分析. 数据表VS.数据集 关系型和非关系型数据库的主要差异是数据存储的方式.关系型数据天然就是表格式的,因此存储在数据表的行和列中.数据表可以彼此关联协作存储, ...
- SQL 、NoSQL数据库教程
前言: 嗯,先说说数据库的分类吧,其实主要大的分类就是关系型数据库(SQL)和非关系型数据库(NoSQL); 实验楼上有常见的数据库教程,这里做一个整理,希望对你学习数据库方面的知识有所帮助: 关系型 ...
- 如何选择RDBMS关系型数据库和Nosql非关系型数据库?
RDBMS关系型数据库和Nosql非关系型数据库区别: 一.RDBMS是关系型数据库模式: 1.二维模式,由行列组成. 2.非常强调事务原子性,例如用户提出一个请求,DB完整的去执行,如果报错就全部回 ...
- 技术分享|SQL和 NoSQL数据库之间的差异:MySQL(VS)MongoDB
在当今市场上,存在各种类型的数据库,选择适合你业务类型的数据库对应用的开发和维护有着重要意义.本篇文章,将为大家分享SQL和NoSQL语言之间的区别,同时还将比较这两种类型的数据库,以帮助小伙伴们选择 ...
- 4.MySQL连接并选择数据库(SQL & C)
在连接了MySQL数据库之后,可以通过SQL命令或者C.PHP.JAVA等程序来指定需要操作的数据库.这里主要介绍SQL命令和相应的C程序. 首先创建用户rick(赋予所有权限) mysql> ...
- 数据库 --> SQL 和 NoSQL 的区别
SQL 和 NoSQL 的区别 一.概念 SQL (Structured Query Language) 数据库,指关系型数据库.主要代表:SQL Server,Oracle,MySQL(开源), ...
- 数据库ACID,SQL和NoSQL
数据库中的事务(transaction)有ACID4个基本特性,可以类比交易: 1,A(Atomicity)原子性 事务里的事情要么全部做完,要么执行过程中失败,此时回滚. 2,C(Consisten ...
随机推荐
- spring的annotation-driven配置事务管理器详解
http://blog.sina.com.cn/s/blog_8f61307b0100ynfb.html ——————————————————————————————————————————————— ...
- VoToucher
VoToucher package com.isoftstone.pcis.policy.common.utils; import com.isoftstone.pcis.policy.common. ...
- linux 下查找大于100M的文件
命令行如下 find . -type f -size +100M Linux系统下查找大文件或目录的技巧 当硬盘空间不够时,我们就很关心哪些目录或文件比较大,看看能否干掉一些了,怎么才能知道呢?以易读 ...
- STL学习系列八:Set和multiset容器
1.set/multiset的简介 set是一个集合容器,其中所包含的元素是唯一的,集合中的元素按一定的顺序排列.元素插入过程是按排序规则插入,所以不能指定插入位置. set采用红黑树变体的数据结构实 ...
- android 小知识点
小知识点总结 1. android中MotionEvent.ACTION_CANCEL事件如何被触发? 对于这个问题,android文档的说明很简短,想看明白很难.国外一网页说的还比较详细,写在这里分 ...
- UI:页面传值、单例模式传值、属性传值、NSUserDefaults 数据持久化
<单页面传值> 页面传值,从前向后传值,使用属性,在后一个页面定义属性,在前一个页面,用点语法,获得值,在适当的时候传值 页面传值,从后向前面传值,使用协议和代理,在后一个页面指定协议,定 ...
- gdb简单调试~core文件
1.打开终端,进入项目目录,输入ulimit -a ,可以看core文件大小设置(第一行),若为0, 则没有打开core dump设置. 2.ulimit -c unlimited ,core文件大小 ...
- Tomcat创建虚拟目录和程序热部署
虚拟目录的设置 方法一:在${tomcat安装目录}/conf/Catalina/localhost目录下添加与web应用同名的xml配置文件,这里站点名称为test为例子. test.xml内容:& ...
- NotePad++ 列模式(在多行开头统一添加相同内容)
==> 按住Alt键不放,用鼠标左键从第一行的开头处按住向下拉,直到所有行 松开Alt键和鼠标左键,你会发现光标变成了一条跨越所有行的竖线 ==> 如果不想使用鼠标操作,可以使用 Alt+ ...
- 终于可以发布Delphi下收点OSGI精髓皮毛而设计的插件框架WisdomPluginFramework
这是一个Delphi实现的插件框架,我耗费了相当相当相当多的精力来设计她,虽然仅闪着点我微薄智慧的光芒,但我还是决定用Wisdom来命名她,也因它是我绝无仅有的,在完成1年多后回头来看仍能相当满意的作 ...