# 运维总控接入手册
# 版本更新
| 日期 | 版本 | 备注 |
|---|---|---|
| 新 2020-08-31 | 0.0.1 | 发布运维平台测试版。 |
# 简介
在我司业务向互联网转型与繁多的传统政企项目运维困难的背景下,要求有效解决新型产品和传统产品的运维,建设一套可解决多产品快速反馈向的,面向领导层、运营、运维与开发的运维总控平台,是提高运维工作效率,建设快速响应机制的总要前提。
基于互联网模式建设运维总控平台,完成新旧产品的应用与服务实例相对实时监控,完成新旧产品的服务运维日志采集与分析,可相对自由配置各项监控和日志分析告警和预警策略,实现个人或团体运维总控大屏。
本设计方案旨在技术层面详述运维总控平台,面向项目管理、需求、UI、开发、测试、运维人员,指导技术人员搭建架构,指导开发人员完成功能开发。
# 应用技术
# 技术选型
- 项目管理工具:maven
- 运行环境:java 1.8.X
- 项目框架:中台2.1
- 部署架构:微服务架构
- 缓存数据库:redis
- 关系型数据库:mysql
- 非关系型数据库:elasticsearch
- 数据持久化:mybatis、mybatis-plus
- 消息队列:RabbitMQ
- 定时器:Quartz
- 文件存储模式:NFS
- 服务注册中心:Nacos
# 开放接口
# 网络架构图

# 词条简述
| 名词 | 说明 |
|---|---|
| 产品 | 指开发出来的一整套完成的生态软件 |
| 应用 | 指产品售卖给客户或自营产品部署后的软件 |
| 服务 | 指应用下运行的服务集群 |
| 服务实例 | 指单个运行的服务 |
| 运营 | 是指我司运营平台,包含了运营中心和运维总控 |
| 运维总控 | 特指运维总控相关的服务,区别于运营服务 |
# 功能说明
# 在线监控
在线监控功能是指对应用各个服务的实例进程是否正常运行的校验。实例正常运行时,会将校验信息通过运维总控api,推送到运维总控。
运维总控通过对在线校验信息最后反馈时间,与全局服务策略配置或服务策略配置的健康反馈间隔时间对比,得出实例在线状态:健康、延迟、脱机。从而向上推算服务和应用的在线情况。并根据服务策略(全局及、服务级),向相关服务关注人员推送告警消息。
核心流程:

在线监控界面:

接入流程:
前往运维总控-工具-心跳包查阅。
# 任务调度
任务调度功能是指接入调度包的服务,依赖自定义配置定时远程调用服务方法。
应用接入调度核心包,向运维分控汇报待机状态,运维分控读取自定义配置,根据指定策略从注册的”机器列表“挑选服务,通过rpc远程调用带参执行指定任务。
核心流程:

运维分控任务调度界面:

接入流程:
前往运维总控-工具-任务调度查阅。
# 版本说明
# v-0.0.1
发布日期:2021-09-01
发布内容:
1、本版本属于内测/demo版本。
2、开放接口实现了实例心跳推送接口、登录日志采集接口、执行日志采集接口、错误日志采集接口。
3、网页端实现了应用在线监控。
4、运维总控服务实现了默认全局告警推送、默认推送模板和策略配置用于测试。