Apache Cassandra特性

Apache Cassandra由Facebook基于Amazon的Dynamo及其在Google的Bigtable上的数据模型设计开发的面相列的数据库,实现没有单点故障的Dynamo风格的复制模型和强大的“列族”数据模型,提供高可用性和最终一致性。
1、弹性可扩展性 - Cassandra是高度可扩展的; 它允许添加更多的硬件以适应更多的客户和更多的数据根据要求。
2、始终基于架构 - Cassandra没有单点故障,它可以连续用于不能承担故障的关键业务应用程序。
3、快速线性性能 - Cassandra是线性可扩展性的,即它为你增加集群中的节点数量增加你的吞吐量。因此,保持一个快速的响应时间。
4、灵活的数据存储 - Cassandra适应所有可能的数据格式,包括:结构化,半结构化和非结构化。它可以根据您的需要动态地适应变化的数据结构。
5、便捷的数据分发 - Cassandra通过在多个数据中心之间复制数据,可以灵活地在需要时分发数据。
6、事务支持 - Cassandra支持属性,如原子性,一致性,隔离和持久性(ACID)。
7、写入 - Cassandra被设计为在廉价的商品硬件上运行。 它执行快速写入,并可以存储数百TB的数据,而不牺牲读取效率。

Cassandra节点节点

Cassandra的设计目的就是通过多个数据节点实现大数据工作负载,并通过在多个数据节点保存数据副本来解决单点故障,群集中所有节点之间对等,数据分布在群集所有节点上。
1、所有群集节点角色相同且相互独立,能同时互联到其他节点。
2、所有群集节点都可以接受读取和写入请求
3、当某群集节点关闭时,可以通过其他群集节点读取与该节点数据相同的副本。
4、当新增或移除群集节点后,群集会自动进行数据均衡 PS1: 当某节点性能不足时,可以暂停该节点不接受读写请求。

===========================================================

Cassandra数据模型

群集(Cluster)
|---群集节点(Cluster Node)
|---键空间(Keyspace)
|---列族(Column Famliy)
|---普通列(Column)
|---超级列(Super Column)
|--子列(subColumn)

群集(Cluster)是Cassandra数据模型中最外层,包含多个群集节点,对外提供服务

群集节点(Cluster Node)用来存储数据副本,群集中所有节点功能相同。

键空间(Keyspace)是数据的最外层容器,一个键空间可用包含多个列族(Column Family)一个键空间包含以下基本属性:

  1、复制因子,设置在群集中存储多少份数据副本

  2、副本放置策略,设置数据副本与数据中心和机架的关系

列族(Column Family)是有序收集行的容器,每行又是一个有序的列聚合,在Cassandra中可以随时向列族中添加列,且不要求每行记录包含所有列。

Cassandra数据模型中列分为普通列和超级列:

普通列包含三个属性:键(name)\值(value)\时间戳(clock),其存储结构为:

超级列是一个特殊列,其存储的是子列的map,其存储结构为:

===========================================================

分区键和群集键

在Cassandra中主键可分为两类:
1、单列主键
2、符合主键 对于单列主键,该主键即分区键(Partition Key)。
对于符合主键,主键的第一部分为分区键(Partition Key),第二部分为群集键(Clustering Key)。 分区键(Partition Key)决定数据位于哪个分区,而群集键(Clustering Key)决定相同分区上的数据如何排序。 对于表:
CREATE TABLE DemoTable
(
C1 INT,
C2 INT,
C3 INT,
C4 INT,
data text,
PRIMARY KEY((C1,C2), C3,C4)
);
则C1+C2作为分区键,然后同一分区中数据按照C3和C4进行排序。

===========================================================

Cassandra的数据模型和RDBMS的数据模型的区别:

==========================================================

摘抄自:https://www.w3cschool.cn/cassandra/

==========================================================

Cassandra基础的更多相关文章

  1. Cassandra基础3

    cassandra读性能优化:1.禁用read repair每次读操作,无论读请求设置读一个节点还是多个节点,cassandra返回给客户端最新的数据后,都会后台对比所有副本的数据并对差异数据进行修复 ...

  2. Cassandra基础2

    ========================================================= gossip协议1.点对点(peer to perr)的网络通信协议,节点间地位相同 ...

  3. 使用DataStax Java驱动程序的最佳实践

    引言 如果您想开始建立自己的基于Cassandra的Java程序,欢迎! 也许您已经参加过我们精彩的DataStax Academy课程或开发者大会,又或者仔细阅读过Cassandra Java驱动的 ...

  4. 技术基础 | 监测Apache Cassandra的简明方式——MCAC

    点击这里在GitHub上访问我们,以便深入了解DataStax的开源项目--Apache Cassandra指标收集器(Metric Collector for Apache Cassandra, o ...

  5. 技术基础 | Cassandra RBAC助你打击“虚拟海盗”,让他们对数据“战利品”望而不得

    现如今,我们称虚拟世界里的海盗们为"黑客",他们所追寻的战利品就是在你数据库某处的数据.   而我们能够保证你的数据安全的工具之一,就是"Cassandra基于角色的访问 ...

  6. 技术基础 | Apache Cassandra 4.0基准测试

    Apache Cassandra 4.0已经发布了Beta版,这是第一个支持JDK 11及更高JDK版本的Cassandra版本.   时延对于Apache Cassandra用户来说是个显而易见的关 ...

  7. 技术基础 | 在Apache Cassandra中改变VNodes数量的影响

    Apache Cassandra中num_tokens的默认值在4.0版本中将会有变化!这看起来好像只是在CHANGES.txt文件中做了个小小的改动,但实际上这个改动将会对集群的日常运维有着深远的影 ...

  8. sstable, bigtable,leveldb,cassandra,hbase的lsm基础

    先看懂文献1和2 1. 先了解sstable.SSTable: Sorted String Table [2] [10] WiscKey:  类似myisam, key value分离, 根据ssd优 ...

  9. 技术基础 | 改进版的Apache Cassandra客户端请求路由

    最近我们在客户端的驱动程序中引入了一些变更,这些变更会影响传入的请求在Apache Cassandra集群内的分发方式.   新的默认负载均衡算法即将随驱动程序推出,这些算法将有助于缩短长尾延迟,并提 ...

随机推荐

  1. java修饰符用法

    public:本类可使用,子类可使用,同一包内的类可使用,不同包内的类可使用 protected:本类可使用,子类可使用(不同包内的子类也可使用),同一包内的类可使用 default(当不写修饰符时) ...

  2. c语言中printf("%x",-1);为什么会输出-1的十六进制补码??

    计算机存储的时候是以补码的形式存进去的,输出来在以你原码的形式输出(这个形式就是你设置的形式)! 比如: -1 (32位模式) 存: 1 000000000000000000000000000000 ...

  3. leetcode python 003

    ## 给定一个字符串,求其最长无重复的子字符串##给定“abcabcbb”,答案是“abc”,长度为3.##给定“bbbbb”,答案是“b”,长度为1.##鉴于“pwwkew”,答案是“wke”,长度 ...

  4. 打开和写入word文档

    一. 使用win32读取word内容 # -*- coding: utf-8 -*- from win32com import client as wc def readDocx2(): word = ...

  5. HTTP网页过程

    HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤: (1)    建立TCP连接 在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立 ...

  6. tp5 生成缩略图片

    我先说下我的思路,先把正常图片存到服务器,再通过代码将服务器上的大图压缩,生成新的小图替代大图 下面上代码 前台HTML代码 <div class="upload-btn"& ...

  7. 2--Python入门--Python数据集合类型--列表

    在基础数据类型的基础上,Python有6中数据集合的类型: 列表list,最常用的数据类型,以[]为标识 元组tuple,和list很相似,但是不能二次赋值,用()标识 集合set,和list类似,但 ...

  8. 神州数码RIP路由协议

    实验要求:熟练掌握RIP配置方法 拓扑如下 R1 enable 进入特权模式 config 进入全局模式 hostname R1 修改名称 interface s0/1 进入端口 physical-l ...

  9. apache php upload file

    /********************************************************************************* * apache php uplo ...

  10. zedboard开发板上移植opencv代码(立体匹配)

    前言 公司要做立体匹配相关的项目,已有matlab和c++版本,可是不能做到实时显示立体信息,想要硬件实现实时,无奈本渣也是个硬件的新手,先按照实验室lyq同学的思路在zedboard开发板的纯ARM ...