ixcache的蜜汁突发故障
公元2018年 7月29日 晚上21点整,我司一直正常运行的ixcache线路异常断开。
???
公司业务包含提供互联网接入服务,所以这个现象将会导致用户上网体验变差,网速变慢,看视频的速度下降等等,所以组织交给我一个重要的任务——在最快的时间内恢复。
我,
我内心有点慌,
毕竟我一个月以前才刚到这个公司啊,我还是个刚刚毕业的孩子啊,我,,,#¥%……&*!@#¥
不说了,慌是解决不了任何问题的。正事要紧。。
案发现场截图如下:
(其中,下载是正常的因为我们做了策略在6点前会将下载的速率控制在1M以内。)
刚好29号当天晚上10点要物业停电检修,11点才恢复电力。
所以它的诡异之处在于,没停电之前就故障了,然后停电来电这个动作相当于对设备进行了一次重启操作,导致ixcache恢复了。但是之后半个小时之后又死了,死的非常彻底,导致我后来无论是重启设备还是重启服务还是重启panabit都一副死样。
好嘛,找原因嘛。
我先在ixcache技术支持的群问了下大佬们,马上就有个管理回答我的问题,还让我把地址给他,他远程给我整整。由于是内网,所以用的是teamview。
大佬一顿操作猛如虎
告诉我
应该是你的ip不对。
emmmm
我处于礼貌,道谢,下线。
ip?可是一直用的都是这个ip啊?所以我当时的内心有点不信。
然后看了下内网到这个输出口能不呢通,结果,不能。为什么?
原因是pa对线路做了nat。
简要说下吧懒得打字。
就是各种找原因。升级。检查硬件。检查硬盘。检查数据。
最终得出一个结论:
找不到原因。。
嗨没事,找不到原因就算了,我直接重装不就完了吗,顶多再重新配置一下。
考虑到大佬说的ip问题--输出口和下载口不能同一个网段,同时内网用户要跟输出口通信,并且不能和内网用户同一个网段。
对这句话的三个与条件我考虑了两天(其实是有其他事耽搁了)终于决定:用10.21.0.0 的网段。
接下来就是见证奇迹的时刻。
首先将ixcache的地址改了,有图形化的界面直接敲就是了,提交。
第二步
在pa将接口线路-wan线路设置一下。
具体参数忘了,看图
第三步,配置缓存设备和牵引策略。
记住目标缓存要设置为自己后来的新配的线路。
最后一步就是配置策略路由了。
到这里,我在看i下cache的线路流量,就已经有流量过了。
做到这里,我的内心久久不能平静,因为
原因特么到底是啥!
所以说重启解决80%的问题,重装解决90%的问题,买新的解决99.9%的问题[滑稽]
不管了恢复了就好。
拜拜。
注:除了第一张图其他的图都是事后截的所以不是故障图。
有问题欢迎指出讨论
相关ixcache教程:http://forum.panabit.com/thread-10878-1-1.html
ixcache的蜜汁突发故障的更多相关文章
- 云计算之路-阿里云上:13:43-13:44之间RDS故障影响了全站的正常访问
抱歉!13:43-13:44之间,由于阿里云RDS(云数据库)出现2分钟突发故障,影响了全站的正常访问,给大家带来了麻烦,望大家谅解! 故障期间,应用程序日志中记录的错误信息如下: System.Da ...
- 一次dell R420 电源故障引发的“血案”
说“血案”有写夸张了,其实是也就熬了一夜的通宵,做运维的伤不起啊,作为一名运维工程师,像这种服务器突发故障半夜起床的情况属于家常便饭,见怪不怪了,开始说正事: 前几天半夜12点左右,收到服务器宕机的消 ...
- 云计算之路-阿里云上: RDS实例CPU跑满引发的故障
今天上午 10: 40 左右,我们所使用的阿里云 RDS 实例的 CPU 突然飙高到近 100% ,造成大量数据库查询操作缓慢.超时,在这个恶劣条件下大量 memcached 缓存无法建立,这样的雪上 ...
- 故障公告:IIS应用程序池停止工作造成博客站点无法访问
非常抱歉,今天凌晨博客站点负载均衡中所有3台服务器的IIS应用程序池突然停止工作,造成 1:20-7:45 左右博客站点无法正常访问,由此给您带来很大的麻烦,请您谅解. 服务器操作系统是 Window ...
- [网站公告]18:07-18:20阿里云SLB故障造成网站不能正常访问
(注:由于阿里云SLB管理控制台监控数据不准,实际故障时间是18:07-18:20.) 17:55-18:2018:07-18:20,我们使用的阿里云SLB(负载均衡)中有3台出现突发故障,造成全站无 ...
- 【腾讯Bugly干货分享】微信终端跨平台组件 mars 系列(二) - 信令传输超时设计
本文来自于腾讯Bugly公众号(weixinBugly),未经作者同意,请勿转载,原文地址:http://mp.weixin.qq.com/s/9DJxipJaaBC8yC-buHgnTQ 作者简介: ...
- 1 张图秒懂 Nova 16 种操作 - 每天5分钟玩转 OpenStack(44)
前面我们讨论了 Instance 的若干操作,有的操作功能比较类似,也有各自的适用场景,现在是时候系统地总结一下了. 如上图所示,我们把对 Instance 的管理按运维工作的场景分为两类:常规操作和 ...
- 轻量级开源嵌入式关系数据库sqlite基本使用及接口初识
preface,先闲来扯下蛋: 嵌入式数据库,NoSQL的是BerkeleyDB和InnoDB,leveDb.TC(个人较不熟悉),关系型嵌入式是SQLite; 服务器性质的NoSQL服务器,如Red ...
- SQL Server AlwaysON从入门到进阶(1)——何为AlwaysON?
本文属于SQL Server AlwaysON从入门到进阶系列文章 本文原文出自Stairway to AlwaysOn系列文章.根据工作需要在学习过程中顺带翻译以供参考.系列文章包含: SQL Se ...
随机推荐
- keepalived+nginx高可用实现
1.keepalived介绍 keepalived最初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了实现高可用的VRRP功能.keepalived除了能 ...
- About set HDU - 4680
https://vjudge.net/problem/HDU-4680 一直想写,终于写完了... 要点: 这个set不需要去重 操作4的做法就是暴力枚举取的数(最开始两个取set中最小两个,设这次取 ...
- Hadoop工作流不足(六)
不多说,直接上干货! 为此,需要第三方框架.如Azkaban或Oozie! Azkaban https://azkaban.github.io/ 具体,见我的博客,Azkaban概念学习系列.http ...
- 启动hadoop时报root@localhost's password: localhost: Permission denied, please try again.错误。
背景:在装完hadoop及jdk之后,在执行start-all.sh的时候出现root@localhost's password:localhost:permission denied,please ...
- re正则表达式公式讲解3
1.分组匹配 用()把需要分组的类型括起来,如下 import re m = re.search("([a-z]+)([0-9]+)","alex123" ...
- 【数据分析 R语言实战】学习笔记 第五章 数据的描述性分析(下)
5.6 多组数据分析及R实现 5.6.1 多组数据的统计分析 > group=read.csv("C:/Program Files/RStudio/002582.csv") ...
- python中的get函数
>>> a={1:'a',2:'b'}>>> print a.get(1)a>>> print a.get(3)None
- 更新centos系统的python版本
因今天安装一程序需要用到python高版本,所以升级来系统自带的python. 先查询下系统的python版本是多少. #python -V 显示出来的是2.4.3,太老了,现在升级到比较稳定的版本3 ...
- 洛谷 P2053 [SCOI2007]修车
题目描述 同一时刻有N位车主带着他们的爱车来到了汽车维修中心.维修中心共有M位技术人员,不同的技术人员对不同的车进行维修所用的时间是不同的.现在需要安排这M位技术人员所维修的车及顺序,使得顾客平均等待 ...
- umask命令
umask——显示.设置文件的缺省权限 the user file-creation mask 命令所在路径:Shell内置命令 示例1:显示缺省权限 # umask -S 参数S的作用是以rwx形式 ...