我们业务的 Cacti 已经运作了几年,添加的图形越来越多,意味着获取的数据越多服务器的压力就越大,如果某一个进程遇到了瓶颈,所有图形都出不了图,就要被领导吊死,所以我们运维人员常常都要多巡检,是否出现问题。 在这么大的业务量我是不敢去升级系统版本了,而且现在的 Cacti 新版听说已经跟旧版 Cacti 不是同一批人维护的,万一升级了导致数据全没了怎么办,那就只能维持现状。在这一年中,遇到的错误都可以修复,就简单说说我见过的故障以及当初的应急处理方法。 当然,重启可以解决 95% 的问题。我下面写的是我见过的故障,如果未来遇到没有.....

阅读全文...

在我工作的时候,我们运维人员通过之前同事做的链路监控平台来第一时间了解公司所有设备的链路在线情况,只要设定好需要关注的交换机接口,再通过轮询的方式查询所有接口的 `ifOperStatus` 这个 OID 节点,返回是 UP/Down 就会做出相关动作。 但说实在,因为我没有机会接触到旧监控平台的源码,只能研究了下前端,我还以为是用 AJAX 获取后端 json 再展示到前端,没想到是收到了信息就直接写到 html 页面中,实在是有点简单粗暴。如果我们运维人员需要添加监控,要使用 SVN 版本控制功能来实现上架与下架监控,方便是很方便,但.....

阅读全文...

Zabbix 常用配置笔记

April 13, 2020
每天上班的时候刚有新任务需要搭个节点或者实现某个需求之时,总会忘记这玩意怎么搞来着,搞到明明之前做过的东西还得百度一次才会,没用啊没用啊,还是自己写个归纳好一点,免得以后一个一个翻了。 ## Zabbix-Agent/Proxy 开不了服务 先关掉 SELinux ,不然无法启动,命令如下。 #临时关闭 setenforce 0 #永久关闭 vi /etc/selinux/config SELINUX=disable #查看情况,如果输出结果为 0 则关闭成.....

阅读全文...

我在公司工作了 1 年半多,但公司的日志服务器我真的是很少摸过,都是前辈大佬们留下来的遗物,已经 1 年多没有怎么维护过了。我们的日志服务器主要是自动收集各核心设备的告警信息,并展示到我们的监控墙中,并存储到硬盘中以便往后查询。 我比较了其他日志服务器平台,还是不如 Kiwi Syslog 直接方便,毕竟在 Windows 就能直接用了,所以先作为本次的主角 ## 搭建 Kiwi Syslog 日志服务器的实现原理是,在服务器开启 UDP 514 端口(可以开 TCP/SNMP trip),再配置远程设备的信息系统,指定到日志服务.....

阅读全文...

> 1000 年前,大家要求同存异; > 10 年前,一千个人眼中就有一千个哈姆雷特; > 现在,去他妈的一千个人,只有老子懂哈姆雷特。 > —— 也不知是谁先说的,转群里大佬言论 每天看微博、贴吧或某些社交平台,总是有各种圈子互怼,或圈子内闹事,“爷就是不服你的观点,给爷爬”。圈内的人巴不得被攻击的憨批赶紧滚出圈子或人间蒸发,直到被攻击的人终于不闹事或服气了事情才算是完结了。 这种事每日都会发生,对我来说,今天某游有个 nt 发表 zz 言论,昨天某管圈又在找中之人麻烦,明天某黄油圈又来汉化斗争问题。而我只是这个圈子中.....

阅读全文...

## 阅前须知 1. 由于该网站太顶风作案,域名我和谐了,懂的自然懂 2. 我还在学 py,代码过于辣鸡甚至没有优化,调用方法完全乱套 ## 背景 由于用公司研发部同事基于 Java 开发的某网站查询的爬虫用得太爽了,搞到我自己都想抄一份试试了,并在此之前通过百度“抄了”很多方法做了个多线程查询接口的小程序就有点膨胀了(其实代码还是一坨屎,而不需要太多字符串处理) 同事做的虽然速度很快,还特意为验证码做了训练识别率超高也很快,后来我反编译同事的源码发现用了阿里云的 OCR 服务,爷懂了,这就是在线识别的速度吗,爷i了(.....

阅读全文...

在公司某个平台升级后,导出数据再也不能用 navicat 导出了,毕竟厂商都换成 Elasticsearch 数据库,我懂个屁,那就只能老实用平台自带的导出功能实现每周导出需求。可是啊,他们设定的导出只能单文件导出60000行,导致50W的内容都要拆分几十个文件。 在初期我是用 WPS 批量合并表格,再删除重复项,再继续合并(Excel 有最大行数限制),光是把所有节点的内容导出了都要用40分钟,实在是太没效率了。没有办法,只有自动化才能解放效率,然后我就开始抄网上的代码实现关于 python 表格的内容了。 ## 代码 (202.....

阅读全文...