集群机制

一致性哈希(数据一致性)

Token

Range

Partitoner

Gossip协议(流言,无中心获取领导者)

用于在环内节点之间传播状态信息

周期运行,每次在环中随机挑选一个对象节点,发起会话

每次会话传送三条消息

Phi增量故障检测算法

Snitch(机架感知)

复制策略

Cassandra的数据存储

  1) commit log: 保存对数据库的DML操作。记录的是操作动作,不是数据(redo)

    · 进行写操作时,首先要写commit log

    · 只有操作被写入 commit log 的数据,才算写入成功

    · 当发生掉电,实例崩溃等问题的时候,可以使用commit log 进行回复

  memtable:

    · 数据操作成功写入到 commit log后,就开始写入内存中的memtable

    · memtable中的数据达到一定阈值后,就开始写入硬盘中的 SSTable,然后内存中重新建立一个memtable接收下一批数据

    · 上述刷写过程是非阻塞的

    · 查询时先查询memtable

   SSTable:

    · 起源于Google的Bigtable

    · 墓碑: 删除数据并不是物理删除,实际上打删除标记,软删除

    · 压紧: 对用户透明,数据库自己控制。(墓碑打标记行删除 / 重建索引)

    · Bloomfilter(布隆过滤器):相比其他的数据结构,Bloom Filter再空间和时间方面都有巨大的优势,Bloom Filter存储空间和插入/查询时间都是常数。另外,Hash函数相互之间没有关系,方便由硬件并行实现,Bloom Filter不需要存储元素本身,再某些对保密要求非常严格的场合有优势。

  2) data:

  3) saved_caches:

集群配置

安装JAVA环境

部署Cassandra安装包

修改Cassandra配置文件,设置集群名

规划IP地址,设置作为seed的IP

决定snitch

Cassandra还可以支持多数据中心集群

修改其它可能的配置

启动Cassandra并加入集群

安装过程: 节点1

一、安装JAVA

二、设置JAVA_HOME环境变量

三、解压Cassandra安装包

四、创建/var/lib/cassandra和/var/log/cassandra目录并改变属主,如果目录已经存在先进行清理

五、修改配置文件 conf/cassandra.yaml

cluster_name: 'cluster01'

num_tokens: 256

seeds: "192.168.1.100"        --种子机

listen_address: 192.168.1.100

rpc_address: 192.168.1.100

rpc_port: 9160

rpc_keepalive: true

endpoint_snitch: SimpleSnitch  --假设所有服务器都在一个机架

六、启动Cassandra

安装过程:节点2

一、安装过程与节点1类似

二、修改配置文件略有不同

三、Seeds写节点1的IP

四、启动节点2

副本放置策略

简单策略

旧网络拓扑策略(机架感知设定)

网络拓扑策略 (用户自己设定)

  Snitch(指定机架结构)

    · Simple Snitch:通过IP地址判断

    · PropertyFileSnitch: 指定IP属于哪个数据中心,哪个机架

副本因子

  创建keyspace时候指定

  create keyspace excelsior with replication = {'class':'SimpleStrategy', 'replication_factor' : 3};

  create keyspace "Excalibur" with replication = {'class':'NetworkTopologyStrategy','dc1':3,'dc2':2};

Cassandra 集群配置的更多相关文章

  1. 数据源管理 | 分布式NoSQL系统,Cassandra集群管理

    本文源码:GitHub·点这里 || GitEE·点这里 一.Cassandra简介 1.基础描述 Cassandra是一套开源分布式NoSQL数据库系统.它最初由Facebook开发,用于储存收件箱 ...

  2. 基于docker创建Cassandra集群

    一.概述 简介 Cassandra是一个开源分布式NoSQL数据库系统. 它最初由Facebook开发,用于储存收件箱等简单格式数据,集GoogleBigTable的数据模型与Amazon Dynam ...

  3. Ubuntu 14.04中Elasticsearch集群配置

    Ubuntu 14.04中Elasticsearch集群配置 前言:本文可用于elasticsearch集群搭建参考.细分为elasticsearch.yml配置和系统配置 达到的目的:各台机器配置成 ...

  4. Redis 3.0 Cluster集群配置

    Redis 3.0 Cluster集群配置 安装环境依赖 安装gcc:yum install gcc 安装zlib:yum install zib 安装ruby:yum install ruby 安装 ...

  5. MongoDB高可用集群配置的方案

    >>高可用集群的解决方案 高可用性即HA(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性. ...

  6. MySQL Cluster 7.3.5 集群配置实例(入门篇)

    一.环境说明: CentOS6.3(32位) + MySQL Cluster 7.3.5,规划5台机器,资料如下: 节点分布情况: MGM:192.168.137. NDBD1:192.168.137 ...

  7. MySQL Cluster 7.3.5 集群配置参数优化(优化篇)

    按照前面的教程:MySQL Cluster 7.3.5 集群配置实例(入门篇),可快速搭建起基础版的MySQL Cluster集群,但是在生成环境中,还是有很多问题的,即配置参数需要优化下, 当前生产 ...

  8. 关于ActiveMQ的几种集群配置

    ActiveMQ的几种集群配置. Queue consumer clusters 此集群让多个消费者同时消费一个队列,若某个消费者出问题无法消费信息,则未消费掉的消息将被发给其他正常的消费者,结构图如 ...

  9. solrCloud+tomcat+zookeeper集群配置

    solrcolud安装solrCloud+tomcat+zookeeper部署  转载请出自出处:http://eksliang.iteye.com/blog/2107002 http://eksli ...

随机推荐

  1. C++ 优先队列 priority_queue

    平时定义的时候,直接上就完事了: priority_queue<int>Q; 默认大根堆. 之前很菜的时候不知道小根堆怎么写,还在考场上干过加个负号甩到大根堆里面去的蠢事. 它的完整形式呢 ...

  2. USACO1.6 Number Triangles [dp-简单dp]

    题目传送门 回忆童年 /* ID: Starry21 LANG: C++ TASK: ariprog */ #include<iostream> #include<string> ...

  3. Visual Subst - 简单将任意文件夹挂载模拟成驱动器盘符硬盘分区的小工具

    随着电脑的使用,硬盘里的资料一天比一天多,也越来越杂乱.一些朋友为了方便文件管理,会考虑重新分区,让C.D.E等盘符分别担任不同的角色.不过,不分区的话也有一些小工具可以帮你实现. Visual Su ...

  4. python logger 日志模块

    logger 日志 """logging配置""" import osimport logging.config # 定义三种日志输出格式 ...

  5. List<HashMap<String,String>> list, 根据hashmap中的某个键的值排序

    来源https://blog.51cto.com/zhaodan/1725249 //可以使用Collections.sort(List list, Comparator c)来实现 这里举例hash ...

  6. Java Web开发技术教程入门-初识动态网页

    这段时间学校搞了一个"阅战阅勇"的阅读活动,奖品还是挺丰富的~于是,奔着这些奖品,我去图书馆借了这本<Java Web开发技术教程>.一是为了那些丰富的奖品,二是为了回 ...

  7. Mac中如何查看电脑的IP地址

    方法一:使用ifconfig命令 方法二:在charles中查看 Charles 的顶部菜单的 “Help”->”Local IP Address”,即可在弹出的对话框中看到 IP 地址,如下图 ...

  8. java实现spark常用算子之cogroup

    import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spa ...

  9. 深入理解java虚拟机(3)垃圾收集器与内存分配策略

    一.根搜索算法: (1)定义:通过一系列名为"GC Roots"的对象作为起点,从这些起点开始向下搜索,搜索走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连的时 ...

  10. VMware三种连接方式bridge, nat, host-only

    大家在安装完虚拟机后,默认安装了两个虚拟网卡,VMnet1和 VMnet8,其他的未安装(当然也可以手动安装其他的).其中VMnet1是host网卡,用于host方式连接网络的.VMnet8是NAT网 ...