AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

优云蒋君伟:自动化运维成本仍然很高

  • 2017-09-24
  • 本文字数:2978 字

    阅读完需:约 10 分钟

9 月 10 日 -11 日,上海光大国际会展中心隆重举办了“2017 上海站 CNUTCon 全球运维技术大会”。本次大会的主题是“智能时代的新运维”,各个公司为观众带来了他们关于该主题的思考,并分享了他们的实践经历。InfoQ 有幸邀请了杭州优云软件有限公司的产品副总裁蒋君伟老师接受我们的采访。谈到对自动化运维未来的展望,蒋老师表示自动化运维必然是大势所趋,但是因为相关技术债务的存在,自动化运维的成本还很高。那优云自己的技术与产品是如何去做高效运维的呢?本次采访带你了解一二。

InfoQ:与其它同类产品相比,优云有哪些优势?

蒋君伟:要介绍优云的产品优势,我想可以简单说明一下优云是如何来的。优云来自广通,广通公司成立于 2003 年,14 年以来一直专注于运维领域,广通的产品也随着运维行业的趋势发展,从最初的监控、CMDB、ITIL 到 APM,行业的客户也深入到政府、金融、运营商领域,我们对用户运维痛点与上一代运维产品的瓶颈,有深刻认识。

所以,2016 年,广通成立全资子公司,推出了新一代运维产品线优云,与同类产品相比,我们有以下优势:

1. 平台化:打通运维场景,避免运维信息孤岛与运维工具碎片化的情况
2. 自动化:结合自动化操作编排,实现故障自愈与运维自助式服务
3. 社交化:通过 ChatOps App,由运维机器人辅助运维人员,随时随地完成运维工作
4. 大数据:内置运维数据分析算法,有效解决数据中心容量规划难题
5. 分布式:支持水平扩展,可随资源规模增长而增加管理能力

InfoQ:优云产品采用了哪些核心技术?

蒋君伟:优云产品的核心技术包括:

1、 安全、稳定、低负载、易扩展的采集代理平台

采集代理是运维体系中非常重要的落地工具,由于企业用户的环境非常复杂,所以采集代理在技术设计需要非常注意:

  • 优云 Agent 主要使用 Python 与 Java 技术平台实现,所以在服务器的兼容性上有很大保障;
  • 为兼容被防火墙与网闸隔离的网络,Agent 总是单向对 Server 发起连接,拉取作业或上报结果,这种方式也可以让 Agent 集群形成一个网状级联,兼容多级网络;
  • 同时 Agent 会主动降低进程的优先级,以降低 CPU 消耗,控制内存与磁盘使用,将对部署服务器的影响降到最低;
  • Agent 使用强引擎弱脚本的设计思路,内置了 ssh/wmi/snmp/ipmi 等交互协议,允许用户快速使用 shell/python/groovy 等脚本快速扩展 Agent 能力。

2、 可视化埋点技术

优云 UEM 产品可以实现用户 Web 端与移动端的用户操作体验监控,不像传统的用户体验监控产品,我们不需要预先埋点,我们可以帮助产品经理生成用户的操作热区,并直接在产品界面上操作,决定要关注哪些用户的操作行为。这个埋点依赖两个部份完成:

用户交互数据的全量抓取技术:通过在应用端部署前端 agent js, agent 会监听页面中的相关操作,比如点击事件,超链接等,将相关数据(比如来源、去向)全部记录下来,并每隔 1 分钟进行上报,由服务端存储分析。
用户界面元素标记技术:可以直接在被监控应用端进行框选,设置页面元素标记,这些元素会和全量采集的数据进行匹配(比如通过匹配 css 选择器、文本等)。通过这种可视化标记的方式就可以直接关注用户需要的数据,无须开发者手动对页面元素进行埋点。

3、全链路监控技术

优云 UEM 与 APM,已经将用户端的操作与服务端对此操作的执行过程结合在一起,通过 UEM 的用户端请求染色,可以跟踪每一个请求操作到服务端,针对服务端的常用 RPC 协议,如 http/dubbo/rmi 等,也可以通过嵌入式 agent 进行染色与跟踪。因此,一笔操作所经过的每一个计算节点与数据存储节点的调用堆栈,我们都可以捕捉到,并能呈现分析其中的瓶颈节点与代码。

4、 图像质量分析算法

优云 VideoMon 产品使用的图像与视频质量分析算法,可以快速完成摄象头成像质量的分析,其中诊断的准确性与快速是技术关键。使用信号波动检查、像素灰度值分析、非灰色像素集中区域分析、图像弱边缘数分析等算法,来实现视频信号丢失检测、偏色检测、清晰度异常检查等功能。

InfoQ:谈谈对全栈双态运维解决方案的具体理解?

蒋君伟:这里有两个关键词:

1. 全栈

全栈体现了解决方案的覆盖面是完整的,运维的对象,可以从基础架构到业务应用;从物理资源到云资源;从用户端到服务端的全链路运维。

2. 双态

双态则有两层含义。从技术层上来说,双态要求产品能同时进行传统 IOE 架构的运维,以及 x86 架构的云资源运维;从管理上来说,应能支撑 ITIL 与 DevOps 这两种运维体系。

我认为全栈双态运维解决方案,应该能满足这两个关键词。

InfoQ:优云产品解决方案已经应用到了哪些行业和哪些客户中?具体效果如何?

蒋君伟:自 16 年 7 月发布我们的产品后,很多用户都非常踊跃,到目前我们也实施了不少典型案例:

1、 某金融双态方案,实现云资源交付的服务自助化

金融目前是最典型的双态运维场景了,一方面金融核心系统要保持非常稳定,是稳态,另一方面移动支付渠道又要求应用的迭代与响应非常敏捷,是敏态。

通过优云的 Monitor,我们实现了传统业务与互联网业务的全栈监控;并且通过 ITSM 实现流程自助服务,业务部门提交的资源申请工单,在审批通过时,借助 CMDB 与 Automation,实现业务部门的资源交付、应用部署自助化。

2、 某部委业务大数据分析监控方案

此客户全国拥有数万的站点需要上报业务数据,这些数据的处理要求非常高的时效性与准确性。由于站点的规模变大、数据种类增加以及数据监控粒度的增加,旧的业务支撑保障系统已无法满足对业务数据的实时监控需求。

优云 Store 运维数据平台具有大数据分析能力,能实现这些上报的业务数据实时流数据处理,结合 CMDB 中的站点基本信息,实现监控指标的多个管理维度分析,并通过 Show 大屏可视化呈现全国的数据质量。

3、 某海外平安城市运维项目

平安城市中存在大量的 IT 设备与海量的物联网设备需要运维管理,其运维团队对于整个城市的摄象头故障总是头痛不已,一直处于被动运维的状态。

优云 VideoMon 能快速完成上万路的摄象头图像质量分析监控,大量减少运维团队的巡检成本。对存在故障的结点,优云 Alert 通过告警热图功能,从地域、类型、业务等多个维度,为用户呈现故障分布情况,快速帮助用户找到问题根源,缩短故障修复时间。

InfoQ:谈谈对自动化运维的展望。

蒋君伟:自动化运维必然是大势所趋,并且会越来越快地改变我们的运维工作,目前我们所处的时代是一个旧与新的过渡时代,就像集装箱发明后的航运业一样。

在集装箱刚开始被发明出来的阶段,大家从心理到技术上都没有作好准备,包括货主、公路、铁路、港口、吊车到轮船,都没有为集装箱做好配套。但由于几个关键事件,集装箱的标准化,以及随之配套的操作、运输手段,很快就改变了全世界。

我们现在也是,虽然容器及服务、函数及服务技术已经出现,但我们还有太多的历史债务需要偿还,所以现在的标准化与自动化的收益还不明显,自动化运维的成本还很高

但随着历史债务的解决,新的应用研发、运维手段,都会围绕着这些新技术配套起来,到时候自动化运维就非常容易实施与获得巨大收益。

最后,我们运维人员也会像码头工人一样,需要改变我们的技术工作内容与深度,否则就会被下岗。

嘉宾介绍

蒋君伟,优云产品副总裁,IT 运维领域的十年老兵,先后研发了网络管理、系统管理、CMDB、ITSM 等产品,并成功建设了国内多个全国性的网络管理与运维管理项目。现从事优云新一代数据中心运维产品研发工作,主要负责产品线规划、核心技术研发、研发团队建设与运维咨询等工作。

2017-09-24 20:243722

评论

发布
暂无评论
发现更多内容

现在已经卷到需要问三色标记了吗?

艾小仙

量化网格策略交易软件,马丁倍投策略机器人

中国呼叫中心与卓越客服产业峰会,百度智能客服再提行业创新

百度大脑

解决方案 行业创新

并发王者课-青铜7:顺藤摸瓜-如何从synchronized中的锁认识Monitor

MetaThoughts

Java 多线程 并发

2021 全球技术领导力峰会 融云布道技术领导力进阶之路

融云 RongCloud

走向机器智能时代:移动机器人的困局与创新

晨山资本

机器人 移动机器人 AMR

从零开始学习ThingJS之创建App对象

ThingJS数字孪生引擎

可视化 3D可视化 数字孪生

眼观六路耳听八方还不知疲倦?数仓智能运维服务体系是怎么做到的?

华为云开发者联盟

数据库 数据仓库 监控 智能运维 数据库监控

5 月 28 日 - 29 日阿里云峰会视频云专场直播预告

阿里云CloudImagine

阿里云 音视频

活动预告 _ 即构×火山引擎:泛娱乐社交音视频技术实践沙龙

ZEGO即构

工业4.0加速实现“数物相合”,可视化工厂节省时效高达85%

一只数据鲸鱼

人工智能 数据可视化 工业互联网 智慧工厂 智能生产

MySQL事务处理特性的实现原理

华为云开发者联盟

MySQL 数据库 innodb 事务 隔离

鸿蒙轻内核M核源码分析:数据结构之任务排序链表

华为云开发者联盟

鸿蒙 数据结构 任务排序链表 双向链表数组 鸿蒙轻内核

获得业内一致好评!华山版Java性能优化全栈手册“登场”

Java架构追梦

Java 阿里巴巴 架构 性能优化 华山版

用Python在树莓派上播放音乐

IT蜗壳-Tango

5月日更

Bugless 异常监控系统 (iOS端)

37手游iOS技术运营团队

ios iOS Developer 崩溃分析 bugless

高可用DevHa实践,告诉你生产环境0性能故障是如何做到的!

TakinTalks稳定性社区

压测 性能调优 全链路压测 系统稳定高可用 性能压测

从源码角度研究Java动态代理

叫我阿柒啊

动态代理 代理模式 rmi

服务可达,达者为先,产品发布会嘉宾精彩观点分享!

博睿数据

博睿数据 数据链DNA 服务可达

英特尔院士斯旺:由外而内重塑芯片设计

E科讯

【玩转PDF】贼稳,产品要做一个三方合同签署,我方了!

牧小农

JVM

webRTC的标准与发展

anyRTC开发者

音视频 WebRTC RTC

博睿数据2021战略发布巡展,开辟IT运维创新路径

博睿数据

博睿数据 数据链DNA 服务可达

低代码实现传统装饰企业的管理跃迁

华为云开发者联盟

低代码 华为云 计算 低代码开发 AppCube

编曲新手可以用什么编曲软件?

奈奈的杂社

编曲 编曲宿主 编曲软件

🍃【SpringCloud基础使用】Nacos与Gateway实现动态路由

码界西柚

nacos SpringCloud Gateway 5月日更 自定义配置

答应我,别再学Swing框架了好吗?

北游学Java

Java spring swing

我厂与张家港市达成全面战略合作,共推数据中心和城市智能化转型

百度大脑

数据中心 城市智能化

1小时内被全网疯转 29.8w 次,最终被所有大V协力封杀!

Java架构师迁哥

用图数据库可视化探索 Chia Network 区块链数据

古思为

区块链 可视化 图数据库

appium 入门参考

37手游iOS技术运营团队

ios 测试 自动化测试 iOS Developer

优云蒋君伟:自动化运维成本仍然很高_DevOps & 平台工程_雨多田光_InfoQ精选文章