# 运维总控接入手册

# 版本更新

日期 版本 备注
2020-08-31 0.0.1 发布运维平台测试版。

# 简介

avatar 在我司业务向互联网转型与繁多的传统政企项目运维困难的背景下,要求有效解决新型产品和传统产品的运维,建设一套可解决多产品快速反馈向的,面向领导层、运营、运维与开发的运维总控平台,是提高运维工作效率,建设快速响应机制的总要前提。

基于互联网模式建设运维总控平台,完成新旧产品的应用与服务实例相对实时监控,完成新旧产品的服务运维日志采集与分析,可相对自由配置各项监控和日志分析告警和预警策略,实现个人或团体运维总控大屏。

本设计方案旨在技术层面详述运维总控平台,面向项目管理、需求、UI、开发、测试、运维人员,指导技术人员搭建架构,指导开发人员完成功能开发。

# 应用技术

# 技术选型

  • 项目管理工具:maven
  • 运行环境:java 1.8.X
  • 项目框架:中台2.1
  • 部署架构:微服务架构
  • 缓存数据库:redis
  • 关系型数据库:mysql
  • 非关系型数据库:elasticsearch
  • 数据持久化:mybatis、mybatis-plus
  • 消息队列:RabbitMQ
  • 定时器:Quartz
  • 文件存储模式:NFS
  • 服务注册中心:Nacos

# 开放接口

运营中心开放API

# 网络架构图

avatar

# 词条简述

名词 说明
产品 指开发出来的一整套完成的生态软件
应用 指产品售卖给客户或自营产品部署后的软件
服务 指应用下运行的服务集群
服务实例 指单个运行的服务
运营 是指我司运营平台,包含了运营中心和运维总控
运维总控 特指运维总控相关的服务,区别于运营服务

# 功能说明

# 在线监控

在线监控功能是指对应用各个服务的实例进程是否正常运行的校验。实例正常运行时,会将校验信息通过运维总控api,推送到运维总控。

运维总控通过对在线校验信息最后反馈时间,与全局服务策略配置或服务策略配置的健康反馈间隔时间对比,得出实例在线状态:健康、延迟、脱机。从而向上推算服务和应用的在线情况。并根据服务策略(全局及、服务级),向相关服务关注人员推送告警消息。

核心流程: avatar

在线监控界面: avatar

接入流程:

前往运维总控-工具-心跳包查阅。

# 任务调度

任务调度功能是指接入调度包的服务,依赖自定义配置定时远程调用服务方法。

应用接入调度核心包,向运维分控汇报待机状态,运维分控读取自定义配置,根据指定策略从注册的”机器列表“挑选服务,通过rpc远程调用带参执行指定任务。

核心流程: avatar

运维分控任务调度界面: avatar

接入流程:

前往运维总控-工具-任务调度查阅。

# 版本说明

# v-0.0.1

发布日期:2021-09-01
发布内容:
1、本版本属于内测/demo版本。
2、开放接口实现了实例心跳推送接口、登录日志采集接口、执行日志采集接口、错误日志采集接口。
3、网页端实现了应用在线监控。
4、运维总控服务实现了默认全局告警推送、默认推送模板和策略配置用于测试。