1、监控系统的实现机理不同
传统的监控系统是以独立的第三方商业软件作为输出的。比如IBM的Tivoli Monitor或HP的OpenView。监控系统是以外挂的方式来采集被监控的软件产品的日志并做到集中的ECC大屏呈现。在云计算的世界里,每个云产品,比如ECS云服务器,其作为可以独立输出的产品服务单元,云产品自身已经带有完备的监控功能。换句话说:云产品的配置管理已经落到了每个云产品的内部,云产品的监控能力与产品的配置项是紧耦合的关系。云厂商需要做的是设置一个统一的监控平台界面(Uni-Manager),把各个云产品的监控能力加以封装,以客户比较熟悉的ECC的形式输出。
2、风险的控制机理不同
传统运维的风险预防主要集中在执行严格的变更和发布管控和审批流程,以及针对风险的治理能力。风险的发现主要来自监控的指标体系的设置,以及事件的定级和指标触发的应急响应。故障恢复也有赖于频繁的应急演练,这里*括特定故障的应急演练和整个数据中心级的切换演练。
有别于传统运维严把变更和发布审批,云计算的运维更加强调通过白屏化的操作和脚本化的驱动来降低和规避风险。基本实现全局故障1分钟发现,5分钟定位和10分钟解决。云环境下的风险管理也会*括诸如风险预防、风险发现、故障定位、故障恢复和故障复盘的全流程,只是云环境更加强调自动化脚本或平台的作用,把变更或发布脚本在云计算的产研侧写完,这样就可以做到可重复执行和受故障影响的业务自动恢复。通过平台的管控和脚本的触发实现变更或发布的可灰度、可监控(白屏化)和可回滚。可灰度即对应DevOps提到的金丝雀发布,可回滚即对应DevOps的蓝绿部署。故而云环境的风险控制是依赖DevOps全自动化的部署流水线来实现的。
3、自动化成熟度不同
云计算的资源虚拟化和资源池化的特性本身为自动化运维提供了很好的技术保障。在云环境下遇到网络DDOS(拒绝服务)安全攻击或重大故障时,自动化的业务限流或业务流量的自主切换变得非常容易实现。甚至为了确保业务全链路的安全,可以采取部分业务功能自动降级的处理,比如某券商软件可以把已引入故障的查客户积分的功能暂时跳过,确保主业务链路的证券产品买卖服务功能的可用。除此之外,云环境还可以如DevOps所提倡的不时人为注入故障(Chaos Monkey)的操作,验证在重大故障来临可以以自动化方式恢复业务的能力,充分体现云环境的产品鲁棒性。
总之,云环境下的运维更加强调白屏化和脚本驱动,以DevOps部署流水线的方式来规避或降低变更或发布的风险。ITIL 4的部署管理实践可以通过DevOps部署流水线的方式来落地,故而企业的IT服务管理在未来的指导原则是不断打造基于云计算的产品能力来实现业务的持续交付和自动化运维的能力。
以上是小编为大家整理的传统运维和云运维的本质区别有哪些的具体内容介绍,有想要学习运维的人员可以来做个相关的学习了解,希望对大家的学习有一定的帮助,想要了解更多运维学习相关的知识可以继续关注小编为大家带来的后续文章更新。