您当前的位置: 首页 >  devops

凌云时刻

暂无认证

  • 0浏览

    0关注

    1437博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

阿里云弹性计算专家杨红军:应用管理,云上资源DevOps最佳实践

凌云时刻 发布时间:2022-08-30 18:12:34 ,浏览量:0

2022 年 7 月 25 日,「云上自动化运维 CloudOps 系列沙龙_第二弹」正式开启。阿里云弹性计算技术专家杨红军带来了主题分享《应用管理:云上资源 DevOps 最佳实践》,本文根据其演讲内容整理而成,主要分为三个部分:云上资源管理和运维的工具、应用分组维度资源的管理、应用分组维度资源的运维和监控。

云上资源管理和运维的工具

在这里插入图片描述

目前,围绕 ECS 的管控和运维出现了五大问题。

第一,随着业务的发展,企业云上资源数量和种类不断增加,对管理带来了挑战。

第二,资源的使用方、财务方对“基于管理视角分账及成本优化”的诉求明显。

第三,随着越来越多的业务方使用,如何安全地使用云账号和资源,对资源管理者带来了挑战。

第四,随着资源规模的增加,如何高效地管理运维提升效率,为运维人员带来挑战。

第五,云资源管理、运维的入口过多,无法找到最佳实践。 在这里插入图片描述

为了解决云上资源管控和运维的痛点,必须实现标准化、自动化、数据化、流程化。要实现分组分权管理,打通账号权限,加快实现审批流程化。在自动化方面,要进一步提升效率,减少人肉操作,保证定时告警运维,时刻注意资源的使用情况。

应用分组维度资源的管理

在这里插入图片描述

应用分组主要涉及三个概念:

第一,应用分组的配置。在每个应用下创建一些不同的分组,可以根据不同的环境或地域创建,从而实现多部署环境、多架构的分组。

第二,资源管理。支持在分组资源里,导入需要的资源,导入应用分组场景化、支持弹性扩缩容。

第三,资源运维。当在资源分组时,出现漏洞或安全风险,通过安全和风险管理,触发监控和事件机制。除此之外,还支持 CICD 代码的编译部署能力。 在这里插入图片描述

为了解决云资源数量多、种类多、管理难度大、管控入口不好找等问题。阿里云支持三十多种云资源的导入,对云资源进行统一管理。

为了解决众多产品割裂的问题,阿里云通过分组管理,把最佳实践放在一起,方便大家快速使用这些能力。为了解决资源分权、分账问题,阿里云通过标签能力,把所有的资源关联到一起。用户可以在账号的费用中心,查看你当前资源的费用分布情况,每月账单等。 在这里插入图片描述

以钉钉场景为例,把一部分 ECS 挂载到负载均衡上。通过应用分组,选择钉钉应用,直接创建应用。在创建过程中,所有关联关系以资源站的形式,自动创建。然后,这些资源会自动导入到应用分组,方便用户后续的管控。 在这里插入图片描述

接下来,讲一讲弹性扩缩容。应用管理把弹性伸缩进行集成。每个应用分组可以直接关联一个弹性伸缩组。用户可以根据业务,制定弹性伸缩的规则。系统会按照伸缩规则,进行扩缩容。

除此之外,弹性伸缩支持自动加入 RDS,自动关联 SLB/ALB,伸缩配置、生命周期挂钩。

应用分组维度资源的运维和监控

在这里插入图片描述

自动化运维支持分组级别的资源运维,能够关联资源事件和告警,用户可以任意编排运维任务,灵活可扩展。

在实例管理方面,常用的运维任务有发送远程命令、上传文件、磁盘清理、启动实例、停止实例等。在镜像管理方面,主要支持更新镜像、删除镜像、创建镜像。在 OOS 运维编排的自定义模板中,自动化运维支持定时开关机、带宽临时升级、定时执行任意模板。自动化运维支持 120 多种云产品阈值告警,40 多种云产品系统事件告警。 在这里插入图片描述

接下来,讲一讲监控和事件。如果把某些资源,导入到应用分组,可以查看所有的监控,比如某分组下 CPU 的利用率,负载均衡指标等等。印象特深,用户还可以配备告警相关的能力,云监控能力等。

除此之外,事件运维集成了五个系统事件。包括计划内运维事件、非预期运维事件、实例费用事件、实例安全事件,以及实例因底层升级需迁移事件。 在这里插入图片描述

在安全风险管理中,主要包括漏洞扫描,基线和云平台的配置检测。其中,漏洞扫描会定期自动扫描 Linux 软件漏洞,windows 软件漏洞,应用漏洞,以及应急漏洞。 在这里插入图片描述

如上图所示,用户在代码构建时,需要绑定云效企业,新建流水线,授权发布 ECS,然后关联流水线,进行代码扫描、构建、部署、测试。最后,发布到 Kubornetes 集群,阿里云容器服务,阿里云 ECS 或自有主机。

在这里插入图片描述

今天的分享主要希望帮助大家从一个新的角度思考与理解运维及管控。让大家从资源维度,转化到应用分组视角,重新认识运维及管控。

应用分组可以导入所有资源,并对这些资源进行管控和运维。除此之外,应用分组支持弹性伸缩、自动化运维、监控告警、资源管控等能力。

Q&A

有哪些因素会促使一个组织或企业考虑引入 DevOps?

答:如果企业资源管控的数量较大,业务较复杂,运维成本较高。可以使用 DevOps 的自动化工具,实现降本增效。

在 DevOps 中会遇到哪些安全相关的问题?

答:如果跟用户权限相关,可以让不同权限的用户去执行自动化相关的工作。可以通过标签,赋予不同的权限。

自动化功能的 API 是否开放?

答:是的。包括资源导入、云监控、弹性扩缩容等能力,都是 Open API 的能力。可以直接通过阿里云或者 SDK 调用。

在业务增长的过程中,可能遇到哪些难以解决的问题?

答:随着业务成长,用户分权分账,可以通过分组或不同的标签,关联不同的角色。随着资源的增长,可以在应用分组或者用户编排控制台,设置一些自动化的工作。通过可视化、监控告警、弹性扩缩容等能力,提高资源的利用率,节约成本。

阿里云弹性计算专家杨红军:应用管理,云上资源DevOps最佳实践

关注
打赏
1663816507
查看更多评论
立即登录/注册

微信扫码登录

0.0477s