爬虫版网络质量图

作为一个规模还比较小的互联网公司的苦逼运维,时不时地会遇到各地的网络质量问题。虽然有 Zabbix 等 ping loss 监控等,但大概率也只能反映出 Zabbix Server 与被监控机器之间网络问题,而业务可是全国各地都有用户访问的。 之前在某个 QQ 群里看到过合作公司 »

socket 与 slab dentry

有一台机器,监控发现经常出现内存不足的情况,如下: 可以看到 32G 内存,可用内存大概就剩下 6500M 左右。本来剩个 6G 内存问题倒不大,但是问题是系统上的业务进程基本上没使用多少内存,从 ps 命令输出的结果来看所有进程加起来大概也就用了不到 5G: # ps aux »

auditd 监控进程被 kill

最近某业务进程多次无缘无故被 kill,但查看系统日志和业务日志都没有发现线索,所以使用 auditd 来进行进程行为审计监控。 一般来说,审计 kill signal 可以进行如下配置:修改 /etc/audit/audit.rules 文件,添加: -a exit,alway »

SuSE 10 编译 PHP-5.6.30

有几台旧机器,用的是原来腾讯开放平台上的腾讯改过的 SuSE 10: Linux VM_suse 2.6.32.57-tlinux_xenU-1.1.rc8-state #1 SMP Wed Feb 20 15:07:57 CST 2013 x86_64 x86_64 x86_6 »

PyTorch 学习:线性回归

简单的一个机器学习应用到日常的游戏运维工作:通过游戏的在线人数来预测游戏服的 CPU 利用率。 首先从 bosun 获取数据,在线人数和对应的 CPU 利用率,注意归一化: import json import requests online_payload = 'q("su »

MySQL 5.7 CPU 抖动问题的不完全处理过程

问题 我们内网有台机器,MySQL 版本为: Server version: 5.7.17-11 Percona Server (GPL), Release 11, Revision f60191c 读写压力并不大,大概是每十分钟有个定时任务写入一定数量的数据: 然而 CPU »

使用Keras卷积神经网络

这篇文章记录如何用 Keras 实现 卷积神经网络 CNN,并训练模型用于图片分类;以及 CNN 中一些超参的调整和自己的理解。 数据集 http://www.ivl.disco.unimib.it/activities/large-age-gap-face-verificati »

使用scikit-learn和Keras建立房价估价模型

之前曾写过一篇抓取 搜房网 (fang.com) 房源数据并用 tflean 搭建神经网络进行房价分类的文章。 本文算是上面这篇文章的第二个版本:使用 scikit-learn 和 Keras 来对广州二手房房源数据搭建 回归模型 进行房源价格的估价。 数据抓取 相比于第一次抓取 »

BearyChat 监控机器人

本来想试下 slack,不过经 寂寞哥 介绍,测试了 slack 的中国“克隆版” BearyChat。 本文主要测试了将 bosun 和 BearyChat 机器人结合起来,可以让 bosun 发送告警信息 到 BearyChat,或者在 BearyChat 中输入简单指令让 »

Zabbix Go 接口

最近在写一个集合 Bosun 和 Zabbix 上报警的简单看板。 因为之前用了 Go 来写,所以就想用 Go 来写 Zabbix 的接口。到 github 上搜了下,找到了很多 Zabbix Go接口。 最后根据我自己的需要,我选择了 https://github.com/rd »