您当前的位置:首页资讯销售管理正文

十万服务器秒级管控 腾讯云如何将AIOps用于日常管理?

放大字体  缩小字体 发布日期:2013-09-13 浏览次数:6009

 

1 编者按

AIOps,是指基于算法的 IT运维(Algorithmic IT Operations),由 Gartner定义的新类别,源自业界之前所说的 ITOA(IT Operations and Analytics)。我们已经到达了这样的一个时代,数据科学和算法正在被用于自动化传统的 IT运维任务和流程。算法被集成到工具里,帮助企业进一步简化运维工作,把人们从耗时又容易出错的流程中解放出来。

在过去的几年间,Docker、OpenStack、Puppet 等新技术不断涌现和流行,以及 CI/CD、DevOps 等理念的落地生根,利用智能化运维手段帮助提升了运维的效率,减少因人工和流程操作而引起的运维故障成为企业破局自动化运维束缚的最佳途径,“AIOps”(Algorithmic IT Operations)由此应运而生。

腾讯云基于海量的网络业务,在互联网门户时代、WEB2.0时代、移动互联网时代的历史变迁当中,历经不同形态产品的技术挑战,逐步积累沉淀了一套成熟的智能运维体系和运维策略,实现了超过 20万台的设备规模的秒级管控。

本文将结合腾讯云织云体系的构建历程,详细讲解腾讯云是如何通过整合数据的智能存储和分析,对 IT系统中各个环节的问题进行快速定位、故障排除和预测,为其他企业的 AIOps落地实践提供一些方法、思路和解决方案。

2 腾讯云自动化运维体系及其构建思路

腾讯云的智能化运维体系并非是一蹴而就,AIOps 涉及的技术,从 AI 的角度,主要包括机器学习算法,以及大数据相关的技术,从 Ops 的角度,主要是运维自动化与运维监控的相关技术。因此,AIOps 一定是建立在高度完善的运维自动化基础之上的,只有 AI 没有 Ops,谈不上 AIOps。在谈 AIOps之前,我们先来看看腾讯云自动化运维体系的整体运维框架。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!

0条 [查看全部]  相关评论