入门大数据---Redis集群分布式学习
Redis是什么?
官方介绍:
Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。 它支持多种类型的数据结构,如 字符串(strings), 散列(hashes), 列表(lists), 集合(sets), 有序集合(sorted sets) 与范围查询, bitmaps, hyperloglogs 和 地理空间(geospatial) 索引半径查询。 Redis 内置了 复制(replication),LUA脚本(Lua scripting), LRU缓存(LRU eviction),事务(transactions) 和不同级别的 磁盘持久化(persistence), 并通过 Redis哨兵(Sentinel)和集群自动 分区(Cluster)提供高可用性(high availability)。
一句话总结:Redis是一个支持多种类型的内存数据库,它可以实现分布式高可用.
BSD许可:是加州大学推出的开源协议,使用软件必须原作者许可证。
数据库:是按照数据结构来组织,存储和管理数据的仓库。
字符串:比如 "hello world"
就是一个字符串
散列:比如e10adc3949ba59abbe56e057f20f883e
就是根据MD5进行加密得到的哈希值。
列表:比如List<String> list=new ArrayList<String>();
这就是一个列表。
集合:比如Set<String> list=new HashSet<String>();
这就是一个集合
有序集合:比如SortedSet<String> sortedSet=new TreeSet<String>();
关于ArrayList,HastSet,SortedSet的区别,我写了个Demo,参考: https://www.cnblogs.com/shuai7boy/p/12467318.html
复制:指的是主从复制。
LUA脚本:是采用C语言编写的用来扩展应用的一种脚本。
LRU缓存:是一个选择最近很少使用的页面进行淘汰的算法。
磁盘持久化:将内存中的 数据持久化到磁盘。
哨兵:监控服务器运行情况,当检测到某台服务器长时间没回应,则让备份服务器去替代它。
自动分区:把数据自动分发到多台服务器。
高可用:一台服务器挂掉,可以有备份服务器来顶上去。
集群是什么?
让多台电脑处理同一个逻辑就叫做集群,一起办大事哈哈哈~
集群有几个术语需要了解下:
主从架构:
主备架构:
按槽位取模:
无主模式:
脑裂:
分布式是什么?
把一个逻辑进行拆分,分发到不同机器上执行叫做分布式,分担你点任务哈哈哈~
比如上面讲到的按槽位取模就属于分布式,这个是分布式存储。另外我们玩的英雄联盟,你的大招,需要的皮肤,播放的音效就有可能是多台机器提供的,这个就分担了计算能力。 包括我们知道的 阿法狗下围棋,也是一个集群一起运算的,一台机器再牛逼,也赶不上一群服务器,人多力量大~
Redis集群架构
Redis Sentinel(Redis 哨兵)为Redis提供高可用性。实际上,这意味着使用Sentinel可以创建Redis部署,该部署可以在没有人工干预的情况下抵抗某些类型的故障。
Redis Sentinel还提供其他附带任务,例如监视,通知,并充当客户端的配置提供程序。
这是宏观上Sentinel功能的完整列表(即,大图):
- 监控。Sentinel会不断检查您的主实例和副本实例是否按预期工作。
- 通知。Sentinel可以通过API通知系统管理员或其他计算机程序,其中一个受监视的Redis实例出了问题。
- 自动故障转移。如果主服务器未按预期工作,则Sentinel可以启动故障转移过程,在该过程中将副本升级为主服务器,将其他附加副本重新配置为使用新的主服务器,并通知使用Redis服务器的应用程序要使用的新地址。连接时。
- 配置提供程序。Sentinel充当客户端服务发现的授权来源:客户端连接到Sentinels,以询问负责给定服务的当前Redis主服务器的地址。如果发生故障转移,Sentinels将报告新地址。
这是一个非常简单的设置,其优点是易于调整以提高安全性。它基于三个框,每个框同时运行Redis进程和Sentinel进程。
+----+
| M1 |
| S1 |
+----+
|
+----+ | +----+
| R2 |----+----| R3 |
| S2 | | S3 |
+----+ +----+
如果主M1发生故障,则S2和S3将就该故障达成协议,并能够授权故障转移,从而使客户端能够继续。
在每个Sentinel设置中,由于Redis使用异步复制,因此始终存在丢失某些写入的风险,因为给定的已确认写入可能无法到达被提升为主服务的副本。但是,在上述设置中,由于客户端被旧的主服务器分区,因此存在较高的风险,如下图所示:
+----+
| M1 |
| S1 | <- C1 (writes will be lost)
+----+
|
/
/
+------+ | +----+
| [M2] |----+----| R3 |
| S2 | | S3 |
+------+ +----+
Redis持久化
首先持久化什么意思?持久化就是使用一定策略记录内存中有什么。
为什么会有持久化?因为Redis操作的数据一般都是放在缓存的,但是为了保证服务器宕机重启数据不丢失,采用了一定策略保存数据,也叫持久化。
Redis提供了两种持久化方式,一种是RDB,一种是AOF。
RDB是根据你设定的固定时间点或者多少秒执行依次来持久化数据,并且新的持久化文件会覆盖掉老的文件。文件名默认是dump.rdb。
AOF是默认每秒记录你做了哪些操作,这个相当于一个日志记录,默认日志名是appendonly.aof。
等重启的时候会根据dump.db或者appendonly.aof将数据恢复到内存。
上面是我针对集群分布式和Redis的一些理解,具体操作可以参考Redis官网
另外推荐一篇我认为不错的博客。
入门大数据---Redis集群分布式学习的更多相关文章
- 大数据Hadoop-Spark集群部署知识总结(一)
大数据Hadoop-Spark集群部署知识总结 一.启动/关闭 hadoop myhadoop.sh start/stop 分步启动: 第一步:在hadoop102主机上 sbin/start-dfs ...
- 王雅超的学习笔记-大数据hadoop集群部署(十)
Spark集群安装部署
- 大数据——Hadoop集群坏境CentOS安装
前言 前面我们主要分析了搭建Hadoop集群所需要准备的内容和一些提前规划好的项,本篇我们主要来分析如何安装CentOS操作系统,以及一些基础的设置,闲言少叙,我们进入本篇的正题. 技术准备 VMwa ...
- [转]大数据hadoop集群硬件选择
问题导读 1.哪些情况会遇到io受限制? 2.哪些情况会遇到cpu受限制? 3.如何选择机器配置类型? 4.为数据节点/任务追踪器提供的推荐哪些规格? 随着Apache Hadoop的起步,云客户 ...
- 大数据 -- Hadoop集群环境搭建
首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网 ...
- 部署开启了Kerberos身份验证的大数据平台集群外客户端
转载请注明出处 :http://www.cnblogs.com/xiaodf/ 本文档主要用于说明,如何在集群外节点上,部署大数据平台的客户端,此大数据平台已经开启了Kerberos身份验证.通过客户 ...
- 一台虚拟机,基于docker搭建大数据HDP集群
前言 好多人问我,这种基于大数据平台的xxxx的毕业设计要怎么做.这个可以参考之前写得关于我大数据毕业设计的文章.这篇文章是将对之前的毕设进行优化. 个人觉得可以分为两个部分.第一个部分就是基础的平台 ...
- 大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
- 大数据 --> Kafka集群搭建
Kafka集群搭建 下面是以三台机器搭建为例,(扩展到4台以上一样,修改下配置文件即可) 1.下载kafka http://apache.fayea.com/kafka/0.9.0.1/ ,拷贝到三台 ...
随机推荐
- 小谢第8问:ui框架的css样式如何更改
目前有三种方法, 1.使用scss,增加样式覆盖,但是此种方法要求css的className需要与框架内的元素相一致,因此修改时候需要特别注意,一个父级的不同就可能修改失败 2.deep穿透,这种方法 ...
- day08 for循环与字符串掌握操作
# 1.什么是for循环# 循环就是重复做某件事情,for循环是python提供第二种循环机制# 2.为何:理论上for循环可以做的事情while循环也可以做# for循环再循环取值(遍历取值)比wh ...
- wavenet重要概念
带洞因果卷积 https://img-blog.csdn.net/20181021210509222?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dl ...
- Maven+JSP+SSM+Mysql实现的音乐网站
项目简介 项目来源于:https://gitee.com/coder_ze/iMusic 本系统基于Maven+JSP+SSM+Mysql实现的音乐网站.主要实现的功能有音乐播放.下载.上传等几个模块 ...
- Java并发编程 (十) 多线程并发拓展
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 一.死锁 1.死锁的定义 所谓的死锁是指两个或两个以上的线程在等待执行的过程中,因为竞争资源而造成的一种 ...
- Java实现 蓝桥杯 算法提高 特等奖学金(暴力)
试题 算法提高 特等奖学金 问题描述 土豪大学每年都会给学生颁发巨额的特等奖学金,当然,获奖的前提是要足够优秀.这所大学有n名学生,他们中的每个人都会在m门必修课的每门课上获得一个百分制的整数成绩(0 ...
- linux性能监控工具nmon生成HTML报告-EasyNmon
一.关于easyNmon说明 为了方便多场景批量性能测试,用golang写了个监控程序,可以通过get url方式启动和停止nmon服务,非常适合配合Loadrunner性能测试框架和jmeter使用 ...
- webpack+vue+.vue组件模板文件 所需要的包
{ "name": "webpack-study02", "version": "1.0.0", "de ...
- 数据结构之链表(Linked list)
说明:如果仔细阅读完全文后,可能感觉有些不统一,这里先说明下原因. 链表尾引用不统一:在介绍单链表时,只有一个链表首部的引用(head) 指向第一个节点.你看到后面关于双链表及循环列表时,除了指向第一 ...
- 搜索相关性算法在 DiDi Food 中的搜索
导读:今天给大家分享的主题是搜索匹配问题在 DiDi Food 中的一些探索与应用.本文首先介绍了搜索相关性的一些背景,之后介绍了业界常见的三种匹配模型,以及在DiDi Food业务中的模型效果对比. ...