『集群』005 Slithice 基于 集群 的 自动容错
Slithice 基于 集群 的 自动容错
Slithice容错概述:
Slithice 支持 非集群 的 独立服务端;
支持 基于 中央服务器 的 集群服务端;
支持 基于 自定义配置 的 集群服务端;
在容错方面, 独立服务端 不支持 容错:出现错误,就得不到正确结果;
中央服务器 或 自定义配置 的 集群,是支持容错的:一台服务端执行异常,会自动转交 另外服务端 执行
—— 直到 所有可供调度的 服务端 全部错误,才会返回 错误信息;
自动容错原理:
在 《004 Slithice 集群分布式(多个客户端,基于中央服务器的多个集群服务端).doc》 中,
我们已经 见到了 基于 集群服务端 的调度,在此 不再多举案例;
比如,客户端 启动时,通过 配置获取方式(比如 中央服务器) 得到一个配置:
>Action_001 可以交由 Service_001、Service_002、Service_003,Service_004 四个服务端处理;
>Action_002 可以交由 Service_002、Service_003,Service_004 三个服务端处理;
>Action_003 可以交由 Service_002,Service_004 两个服务端处理;
>Service_001 通讯类型 Socket,调度概率 是 100
>Service_002通讯类型 Socket,调度概率 是 50
>Service_003通讯类型 WebService,调度概率 是 50
>Service_004通讯类型 WCF,调度概率 是 300
>但是 客户端 是 WinCE 平台,只支持 Socket,WebService 两种通讯方式;
>于是 客户端 就将 Service_004 最开始就 排除啦;
这时,客户端 需要 执行 Action_001 并得到 结果;
>分析出 Service_001、Service_002、Service_003 都可以处理;
>按照 调度概率 随机返回一个 服务端,比如说是 Service_002;
>这时 Service_002 宕机,执行重试3次,最终确定 失败;
>设置 Service_002 调度概率 为 49;
>按照 调度概率 从 Service_001、Service_003 中 随机返回一个 服务端,比如说 Service_001;(Service_002 会被排除)
>这时,Service_001 执行成功,返回结果 并设置 Service_001 的 调度概率 为 101;
然后,客户端 需要 执行 Action_003 并得到结果;
>分析出 Service_002 只有一个服务端可以处理;
>向 Service_002 调度,执行重试3次,最终确定 失败;
>设置 Service_002 调度概率 为 48;
>没有 其他 可供调度 的 服务端 —— 只有返回 执行错误;
集群容错效果:
最终,我们会发现:
>不支持 通讯方式 的 服务端 初始化时 就会 被排除;
>频繁错误的 服务端 的 调度概率 会 越来越小;
>出现 执行错误时,任务 会被 自动交给 另外的 服务端 处理;
>同一个任务,已经执行 出错的 服务端 在 任务转交 时 会被排除;
>只有 全部错误,才会 最终返回错误;
舒小龙
2014-01-29 13:34
『集群』005 Slithice 基于 集群 的 自动容错的更多相关文章
- 『集群』001 Slithice 服务器集群 概述
Slithice 服务器集群 概述 Slithice是做什么的 Slithice 是一个 跨平台 的 分布式架构 框架: 旨在简化 分布式开发 的开发难度,节省 开发成本 和 后期维护成本: 并提供 ...
- 『集群』004 Slithice 集群分布式(多个客户端,基于中央服务器的集群服务)
Slithice 集群分布式(多个客户端,基于中央服务器的多个集群服务端) 案例Demo展示: 集群架构图 如下: 如上图,上图 展示了 这个集群 的 结构: >一个中央服务器(可以有多个),负 ...
- 『集群』002 Slithice 集群配置工具 的使用
Slithice 集群配置工具 的使用 Slithice集群配置工具 主界面 在测试 Slithice 的 Demo 中,我配置了 7个服务端: 一个 WCF 的 中央服务端: 两个 WCF 的 成员 ...
- 『集群』003 Slithice 最简分布式(多个客户端,一个独立服务端)
Slithice 最简分布式(多个客户端,一个独立服务端) 案例Demo 展示: 我们搭建一个 可以 独立运行 的 服务端:然后 多个客户端 并发链接 这个 服务端 完成 分布式逻辑: 服务器 独立运 ...
- 『集群』006 Slithice 后期改进 和 Slithice可能存在的BUG
Slithice 后期改进 和 Slithice可能存在的BUG Slithice 可能存在的 BUG: >Slithice 暂时 没有 对 循环调度 进行控制:不正确的 配置 可能导致 调度死 ...
- 『GreenPlum系列』GreenPlum 4节点集群安装(图文教程)
目标架构如上图 一.硬件评估 cpu主频,核数推荐CPU核数与磁盘数的比例在12:12以上Instance上执行时只能利用一个CPU核资源进行计算,推荐高主频 内存容量 网络带宽重分布操作 R ...
- 『练手』005 Laura.SqlForever历史遗留 的 架构思想缺陷
005 Laura.SqlForever历史遗留 的 架构思想缺陷 我们 比较一下 Laura.WinFramework 和 Laura.XtraFramework 的差异: Laura.WinFra ...
- 多云混合云之多集群统一管理:基于阿里云ACK统一纳管多个不同Kubernetes集群
目前阿里云云原生产品家族已经支持多集群管理功能,允许使用阿里云容器服务Kubernetes(简称ACK)控制台或kubectl命令接入.统一纳管其他公有云.客户IDC自建K8s集群,集中管理部署K8s ...
- [转]搭建高可用mongodb集群(二)—— 副本集
在上一篇文章<搭建高可用MongoDB集群(一)——配置MongoDB> 提到了几个问题还没有解决. 主节点挂了能否自动切换连接?目前需要手工切换. 主节点的读写压力过大如何解决? 从节点 ...
随机推荐
- 关于Kafka监控方案的讨论
之前在知乎上尝试过回答这个问题,后来问的人挺多,干脆在博客里面保存一下. 目前Kafka监控方案看似很多,然而并没有一个"大而全"的通用解决方案.各家框架也是各有千秋,以下是我了解 ...
- Go语言Context(设计及分析)
context简单概述: Go服务器的每个请求都有自己的goroutine,而有的请求为了提高性能,会经常启动额外的goroutine处理请求,当该请求被取消或超时,该请求上的所有goroutines ...
- Python数据结构应用4——搜索(search)
Search是数据结构中最基础的应用之一了,在python中,search有一个非常简单的方法如下: 15 in [3,5,4,1,76] False 不过这只是search的一种形式,下面列出多种形 ...
- Docker常见故障
— Docker虚拟化故障 — Docker虚拟化主要有三类故障: 应用故障:应用执行状态与预期不一致. 容器故障:无法正确创建.停止.更新容器等. 集群故障:集群创建失败.更新失败.无法连接等. — ...
- 【重学计算机】操作系统D1章:计算机操作系统概述
1. 计算机软硬件系统 冯诺伊曼结构 以运算单元为核心,控制流由指令流产生 程序和数据存储在主存中 主存是按地址访问,线性编址 指令由操作码和地址码组成 数据以二进制编码 其他:参考<重学计算机 ...
- Python-定时爬取指定城市天气(一)-发送给关心的微信好友
一.背景 上班的日子总是3点一线,家里,公司和上班的路径,对于一个特别懒得我来说,经常遇到上班路上下雨了,而我却没带伞,多么痛的领悟.最近对python有一种狂热的学习热情,写了4年多的C++代码,对 ...
- Python爬虫入门教程 59-100 python爬虫高级技术之验证码篇5-极验证识别技术之二
图片比对 昨天的博客已经将图片存储到了本地,今天要做的第一件事情,就是需要在两张图片中进行比对,将图片缺口定位出来 缺口图片 完整图片 计算缺口坐标 对比两张图片的所有RBG像素点,得到不一样像素点的 ...
- LDA && NCA: 降维与度量学习
已迁移到我新博客,阅读体验更佳LDA && NCA: 降维与度量学习 代码实现放在我的github上:click me 一.Linear Discriminant Analysis(L ...
- selinux学习
一.基本概念 1.TE模型的安全上下文 所有的操作系统访问控制都基于主体.客体,以及与他们相关的访问控制属性. 在selinux中,访问控制属性叫做安全上下文.所有对象(文件.进程间通信通道.套接字. ...
- EFCore中 join on的不同
当 多条件 left join on 时 LEFT OUTER JOIN on new { u.UserId, ue.ExamId } equals new { sac.UserId, sac.Exa ...