初识SQL Server2017 图数据库（一）

背景：

　　图数据库对于表现和遍历复杂的实体之间关系是很有效果的。而这些在传统的关系型数据库中尤其是对于报表而言很难实现。如果把传统关系型数据库比做火车的话，那么到现在大数据时代，图数据库可比做高铁。它已成为NoSQL中关注度最高，发展趋势最明显的数据库。伴随SQL Server 2017的出现，在SQL Server上面有了专门的图数据库，那么以往需要其他数据库或者效率低下地处理这些工作，现在是否可以让我们容易的实现了那？

　　接下来我会用三个篇幅介绍SQLServer 图数据库以及它的优缺点。

介绍：

　　简单定义：图数据库是NoSQL数据库的一种类型，它应用图形理论存储实体之间的关系信息。图形数据库是一种非关系型数据库，它应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好，其查询复杂、缓慢、超出预期，而图形数据库的独特设计恰恰弥补了这个缺陷。

　　SQL Server 2017将带来新的功能之一就是图数据库。图数据库不像关系型数据库在一张“图”内将数据表现为节点，边和属性，而是一种抽象的数据类型，通过一组顶点节点、点和边来表现关系和连接，就像一个缠结的渔网。使我们用简单的方式来表现和遍历实体间的关系。图对象被用来表示复杂的关系。一层就是一个特定的图，记录如论坛帖子和回复之间的关系，以及人与人之间的关系。多层有一个根节点（例如，论坛中的帖子和回复），但是多个图不一定有根节点（例如人们之间的关系）

　　本文中，我们一起使用一个论坛数据例子，使用新型的图模型。也会比较图和关系型模型的查询复杂度。

演示环境

　　SQL Server 2017 CTP 2.1下载地址: https://www.microsoft.com/en-us/sql-server/sql-server-2017

　　使用SSMS 17.0，下载地址: https://docs.microsoft.com/en-us/sql/ssms/download-sql-server-management-studio-ssms

创建模型

　　下图是一个关系型实体的模型，以此作为比较:

　　如果想要比较，可以使用下面的脚本创建，或者直接创建图模型。但是，需要用SSMS创建一个新的数据库“GraphExample”。代码如下：

create database GraphExample

  go

  -- Trying an entire graph model

  use GraphExample

  go

  create schema Forum

  go

  create table Forum.ForumMembers

  (MemberId int not null primary key Identity(1,1),

  MemberName varchar(100))

  go

  create table Forum.ForumPosts

  ([PostID] int not null primary key,

  PostTitle varchar(100),

  PostBody  varchar(100),

  OwnerID int,

  ReplyTo   int)

  go

  Create table Forum.Likes

  (MemberId int,

  PostId int)

  go

  create table Forum.LikeMember

  (MemberId int,

   LikedMemberId int)

   go

  INSERT Forum.ForumMembers values('Mike'),('Carl'),('Paul'),('Christy'),('Jennifer'),('Charlie')

  go

  INSERT INTO [Forum].[ForumPosts]

             (

             [PostID]

             ,[PostTitle]

             ,[PostBody],OwnerID, ReplyTo

                   )

       VALUES

           (4,'Geography','Im Christy from USA',4,null),

             (1,'Intro','Hi There This is Carl',2,null)

  INSERT INTO [Forum].[ForumPosts]

             (

             [PostID]

             ,[PostTitle]

             ,[PostBody],OwnerID, ReplyTo

                   )

       VALUES

          (8,'Intro','nice to see all here!',1,1),

          (7,'Intro','I''m Mike from Argentina',1,1),

           (6,'Re:Geography','I''m Mike from Argentina',1,4),

          (5,'Re:Geography','I''m Jennifer from Brazil',5,4),

                (3,'Re: Intro','Hey Paul This is Christy',4,2),

                   (2,'Intro','Hello I''m Paul',3,1)

  go

  INSERT Forum.Likes VALUES (1,4),

   (2,7),

   (2,8),

   (2,2),

   (4,5),

   (4,6),

   (1,2),

   (3,7),

   (3,8),

       (5,4)

  go

  Insert Forum.LikeMember VALUES (2,1),

   (2,3),

   (4,1),

   (4,5)

图模型

　　图模型的计划与关系型模型完全不同。表在图模型中可能是边或者节点。我们需要决定哪些表是边，哪些表是节点。

　　图具有如下特征：

包含节点和边；
节点上有属性（键值对）；
边有名字和方向，并总是有一个开始节点和一个结束节点；
边也可以有属性。

　　下图表现了图模型:

　　如图所示，在模型中节点和边很容易确定：逻辑模型中的所有实体就是节点，而所有关系就是边。这里有“Posts”和“Members”两个实体, ‘Reply To’, ‘Like’ 和 ‘Written By’三个边。

注意

　　节点和边不过是带有特殊字段的表。没有任何限制禁止我们创建常规的表之间的关系，以便将模型转化为关系和图模型的组合。

　　例如，‘Written By’ 是 ‘Posts’ 和 ‘Members’的关系，可以转化为一个一对多的关系。通过创建一个边的关系表，我们可以用常规的关系表来表现所谓的图模型中的表。也就是组合模式了。

　　当我们创建一个根节点实体，这个实体接收一个叫做‘$node_id’的计算字段。我们可以使用这个字段作为主键，SQL Server 允许计算字段作为主键：如果这个主键是一个JSON字段，就不适合作为主键了。因此我们的节点必须包含两个键：业务键，整型字段，以及‘$node_id’ 键，包含整型字段自增长的JSON键。

　　下面为节点实体的脚本:

Use GraphExample

  go

  CREATE TABLE [dbo].[ForumMembers](

         [MemberID] [int] IDENTITY(1,1) NOT NULL,

         [MemberName] [varchar](100) NULL

  )

  AS NODE

  GO

  CREATE TABLE [dbo].[ForumPosts](

         [PostID] [int] NULL,

         [PostTitle] [varchar](100) NULL,

         [PostBody] [varchar](1000) NULL

  )

  AS NODE

注意

　　在创建对象后，在对象浏览器中检查对象。或许此时注意到一个新的文件夹在‘Tables’文件夹里面叫做‘Graph’。同时也注意到自增字段的名字，尽管我们可以用简称来引用这些字段，例如$node_id，但是真实的字段名称包含了GUID。这个简称字段其实是一个假的名字，称之为“伪列”（可以理解为别名），我们能在查询中使用。

　　如图，插入数据到节点表：我们只需要忽略$node_id，写出插入其他字段的语句即可，语句如下:

INSERT ForumMembers values ('Mike'),('Carl'),('Paul'),('Christy'),('Jennifer'),('Charlie')

  INSERT INTO [dbo].[ForumPosts]

             (

             [PostID]

             ,[PostTitle]

             ,[PostBody]

                   )

       VALUES

          (8,'Intro','nice to see all here!'),

          (7,'Intro','I''m Mike from Argentina'),

           (6,'Re:Geography','I''m Mike from Argentina'),

          (5,'Re:Geography','I''m Jennifer from Brazil'),

           (4,'Geography','Im Christy from USA'),

                (3,'Re: Intro','Hey Paul This is Christy'),

             (1,'Intro','Hi There This is Carl')

                   (2,'Intro','Hello I''m Paul')

使用查询语句可以看到ForumPosts表的结果。你会发现$node_id字段,是一个JSON字段包含了实体类型和一个自增整型ID，它就是自增长ID。

创建边表

　　这个操作很简单，边表有属性，属性就是表中的常规字段。脚本如下:

Create table dbo.[Written_By]

  as EDGE

  CREATE TABLE [dbo].[Likes]

  AS EDGE

  CREATE TABLE [dbo].[Reply_To]

  AS EDGE

　　每个边表有三个伪列，我们需要处理:

$edge_id: 边记录的ID
$from_id:在边中记录的节点ID
$to_id:在边中记录的其他节点ID

注意这个定义，最为重要的一点就是：我们需要用一种合乎逻辑的方式定义 $to_id and $from_id 字段对于每条边意味着什么？你可以观察之前定义的边表如何定义的边，这是一种双向的合理选择，使得我们更容易使用和理解。

以下是我们的合理定义:

Written_By:

$from_id will be the post

$to_id will be the member

Likes:

$from_id will be who likes

$to_id will be who/what is liked

Reply_To:

$from_id will be the reply to the main post

$to_id will be the main post

这些选择没有技术限制，但我们需要在插入新记录时保留它们，永远不要混淆关系的每一方的含义。

注意

　　除了三个伪列以外，所有的表表都有额外字段，并且全是隐藏字段。我们可以在字段属性中看到隐藏的定义，并且这些隐藏字段不会出现在查询结果中。

插入边记录

插入边表的语句需要边的两端ID，$From_id and $To_id。这些字段需要用$node_id的值来填充。例如，对于一个帖子的成员，‘Written_By’包含post 的$node_id 作为$From_id 并且有member的$node_id作为$To_id字段。

下面是插入语句:

Insert into Written_By ($to_id,$from_id) values

   (

   (select $node_id from dbo.ForumMembers where MemberId= 1 ),

   (select $node_id from dbo.ForumPosts where PostID=8 )

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId=1  ),

   (select $node_id from dbo.ForumPosts where PostID=7 )

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId= 1 ),

   (select $node_id from dbo.ForumPosts where PostID= 6)

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId=5  ),

   (select $node_id from dbo.ForumPosts where PostID=5 )

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId=4  ),

   (select $node_id from dbo.ForumPosts where PostID=4 )

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId=3  ),

   (select $node_id from dbo.ForumPosts where PostID=3 )

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId=3  ),

   (select $node_id from dbo.ForumPosts where PostID=1 )

   ),

   (

   (select $node_id from dbo.ForumMembers where MemberId=3  ),

   (select $node_id from dbo.ForumPosts where PostID=2 )

   )

注意

　　这样插入是不是感觉很麻烦？未来我们可以使用一个对象框架用以支持图对象，目前还不支持这个功能。

　　插入Reply_To脚本如下:

	INSERT Reply_To ($to_id,$from_id)

   VALUES

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 4),

         (SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 6)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 1),

         (SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 7)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 1),

         (SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 8)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 1),

         (SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 2)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 4),

         (SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 5)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 2),

(SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 3))

最后，再插入Likes:

INSERT Likes ($to_id,$from_id)

   VALUES

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 4),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 1)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 7),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 2)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 8),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 2)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 2),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 2)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 5),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 4)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 6),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 4)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 2),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 1)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 7),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 3)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 8),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 3)),

   ((SELECT $node_id FROM dbo.ForumPosts WHERE PostID = 4),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = 5))

Likes 边很好的说明了边的功能作用。仅仅插入几个menbers和post表的关系，但是我们可以确定在应用中成员也可能喜欢另一个成员。当然，我们也能用这个边去关联这个成员和其他成员的关系。在关系型模型中我们需要两个表完成这个操作，在图数据库我们只需要一个边。

下面我们在论坛的成员之间插入更多的Like:

INSERT Likes ($to_id,$from_id)

   VALUES

   ((SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = ),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = )),

   ((SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = ),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = )),

   ((SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = ),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = )),

   ((SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = ),

         (SELECT $node_id FROM dbo.ForumMembers WHERE MemberID = ))

小结

　　本篇介绍了图数据库的一些简单定义和理解，概述了SQLServer2017中如何创建图数据库的基本步骤和语句。这只是一个初步版本必然有很多缺点，当然也有一些优点，下一篇我将先介绍优点再说一下有哪些不足。

参考文献：https://www.red-gate.com/simple-talk/sql/t-sql-programming/sql-graph-objects-sql-server-2017

初识SQL Server2017 图数据库（一）的更多相关文章

关系型数据库查询语言 SQL 和图数据库查询语言 nGQL 对比
摘要:这篇文章将介绍图数据库 Nebula Graph 的查询语言 nGQL 和 SQL 的区别. 本文首发于 Nebula Graph 官方博客:https://nebula-graph.com.c ...
SQL Server2017还原数据库时指定mdf文件及日志文件的名称
由于需要还原同一个数据库的不同备份到不同数据库中,可是在还原的时候,可是在指定目标数据库时,填写不同的数据库名称,在SQL Server Data文件夹中生成的.mdf文件还是同一个,如图,虽然是很简 ...
SQLServer图数据库一些优点
上一篇简要介绍了图数据库的一些基本内容(初识SQL Server2017 图数据库(一)),本篇通过对比关系型一些语法来体现图数据库模式的一些优点,比如查询方便,语句易理解等. 在图数据库模型上构建查 ...
{MySQL数据库初识}一数据库概述二 MySQL介绍三 MySQL的下载安装、简单应用及目录介绍四 root用户密码设置及忘记密码的解决方案五修改字符集编码六初识sql语句
MySQL数据库初识 MySQL数据库本节目录一数据库概述二 MySQL介绍三 MySQL的下载安装.简单应用及目录介绍四 root用户密码设置及忘记密码的解决方案五修改字符集编码六 ...
微软亚洲研究院开源图数据库GraphView
我们很高兴地宣布,由微软亚洲研究院系统算法组开发的图数据库GraphView通过GitHub平台开源.GraphView是一款中间件软件,方便用户使用关系数据库SQL Server 或Azure SQ ...
用JDBC连接SQL Server2017数据库
用JDBC连接SQL Server2017数据库 2018年03月26日 17:40:47 yasinzhang 阅读数:8346 安装完SQL server2017之后,选择SQL 身份验证登录,可 ...
使用SQL语句在SQL server2017上创建数据库
软件基础:在电脑上提前安装好SQL server2017,并且安装好其中的SSMS(SQL server Management Studio) 创建方式:SQL语句操作内容:创建零件供应数据库系统 ...
使用交互式方式在SQL server2017上创建数据库
软件基础:在电脑上提前安装好SQL server2017,并且安装好其中的SSMS(SQL server Management Studio) 创建方式:交互式操作内容:创建学生课程数据库系统步骤 ...
数据库---初识sql语句
初识sql语句 SQL语言主要用于存取数据.查询数据.更新数据和管理关系数据库系统,SQL语言由IBM开发.SQL语言分为3种类型: DDL语句数据库定义语言: 数据库.表.视图.索引.存储 ...

随机推荐

团队作业10——项目复审与事后分析（Beta版本）
油炸咸鱼24点APP 团队作业10--事后诸葛亮分析; 团队作业10--Beta阶段项目复审;
团队作业八—第二次团队冲刺（Beta版本）第 2 天
一.每个人的工作 (1) 昨天已完成的工作昨天的工作主要是一些界面的设计,我们顺利完成了复杂模式题目数目界面.复杂模式做题界面.结果统计界面的具体代码编写,和一些细节的完善.还有日常冲刺博客的编辑. ...
201521123065 《Java程序设计》第4周学习总结
1. 本周学习总结 1.1 尝试使用思维导图总结有关继承的知识点. 1.2 使用常规方法总结其他上课内容类设计:属性设计类型为priate并初始化. 文档注释:以/*开始,以*/结束. 继承:存在的 ...
201521123081《java程序设计》第13周学习总结
本次作业参考文件正则表达式参考资料 1. 本周学习总结以你喜欢的方式(思维导图.OneNote或其他)归纳总结多网络相关内容. 参考资料:XMind 2. 书面作业 Q1. 网络基础 1.1 比较 ...
Java十二周总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 2. 书面作业将Student对象(属性:int id, String name,int age,doubl ...
Day-14：常用的内建模块
collections包含对tuple.list.dict等派生出新功能 namedtuple用来为tuple类型派生出一个新名字的tuple类,并提供用属性引出的功能. >>> f ...
利用Vim提供的正则去掉代码每行开头不想要的行号以及vi常见问题和应用技巧
看到一不错的代码片断,但奈何无论怎么拷贝,粘贴到VS里都是带行号的,300多行的代码手工删除行号与前面的空格可得耗不少时间...这时想起了无所不能的VIM,以及它的正则,它的替换功能.解决步骤: 1. ...
python之并发编程之多进程
一.共享数据进程间通信应该尽量避免使用本节所讲的共享数据方式 from multiprocessing import Manager,Process,Lock def work(dic,mutex) ...
Spring - Spring容器概念及其初始化过程
引言工作4年多,做了3年的java,每个项目都用Spring,但对Spring一直都是知其然而不知其所以然.鄙人深知Spring是一个高深的框架,正好近期脱离加班的苦逼状态,遂决定从Spring的官 ...
Spring02-AOP
1,动态代理,指的是通过一个代理对象创建需要的业务对象,然后在这个代理对象中统一进行各种操作. 步骤: 1)写一个类实现InvocationHandler接口: 2)创建要代理的对象 2,创建一个简单 ...

初识SQL Server2017 图数据库（一）

背景：

介绍：

小结

初识SQL Server2017 图数据库（一）的更多相关文章

随机推荐

热门专题