新⼊职⼀家公司,公司平台不错 但⾃动化⽔准⽐较低,现有的监控平台不够完善,巡检⼯作还需要每天线下⼿动进⾏,不仅耗费⼤量的⼈⼒,巡检效果也不理想,于是想到⾃⼰写个巡检⼯具,将⾃⼰从每天的⼯作中释放出来系统规划:
1、平台:⽀持Linux + Windows2、功能要求:1、巡检功能:基础信息巡检
1、硬盘、内存、CPU2、服务状态
3、⾃⽣服务端⼝检查
4、到指定服务器的端⼝可⽤性检查5、web ⽹站访问可⾏性
暂时想到这么些 后续有更多想法再补充。 linux 平台可以使⽤shell, windows 可以调⽤powershell ,完美
数据处理功能:
数据收集:提供统⼀平台将每台服务器的巡检报告统⼀到⼀台服务器,经过研究,确认可以通过Ansible 实现。
数据清洗:Ansible 收集的⽇志信息有⼀定的标准,但还不具备直接适⽤的条件,这⾥想到使⽤Python 开发⼀个脚本来完成⽇志⽂件的清洗⼯作,提取有效信息。
数据分析:提取的⽂件只是检查结果,这些结果释放符合我们的预期,怎么才能将有价值的信息体现出来,同样,使⽤Python 实现。
数据处理:最后是结果处理,巡检只是发现问题,还得将问题及时反馈给到相关运维的同事,这⾥我想到了邮件。 于是基于Python 调⽤邮件模块。
按照这个规划,貌似⼀切都是可⾏的
因篇幅问题不能全部显示,请点此查看更多更全内容