凌云时刻
运维和SRE团队,承载着重要的职责,其工作内容复杂而广泛,从应用部署、性能和可用性监控、告警、值班,到容量规划、业务支撑等都有涉及,随着云原生、容器化和微服务的快速发展,迭代节奏愈发加快,对于运维和SRE也提出了更多的挑战。
- 国内运维和SRE团队面临常见困境
- 监控分析平台需要解决的数据问题
- 构建监控分析平台方案选择
监控分析平台的挑战
实际场景模拟
云上一体化服务选择
本文从操作系统实际调用角度(以CentOS Linux release 7.5操作系统为示例),力求追根溯源看IO的每一步操作到底发生了什么。
关于如何查看系统调用,Linux可以使用 strace 来查看任何软件的系统调动(这是个很好的分析学习方法):strace -ff -o ./out java TestJava
··· ···
????????????点击查看全文
阿里云实时数据加工服务的设计及实践本次分享主要介绍阿里云超大规模下实时数据加工服务的应用场景、架构设计、性能优化等全方位技术设计,以及多个最佳实践方案。
优秀程序员都有一个共同的习惯,打日志!一方面,日志可以供自身使用,比如排查程序错误、跟踪数据链路等等;另一方面,日志还可以供数据分析师等其他人使用。
通常,各个数据分析师的关注点不同,对原始日志的格式和内容需求往往不同。针对上述场景,根据数据分析师的不同需求,修改打印日志的程序代码,线上运行环境可靠性风险高,程序员工作量大。为保证日志的一致性,所有线上机器均需升级到最新程序,实时性较差。
··· ···
????????????点击查看全文
机器学习落地的五个阶段一直以来都有一种声音:机器学习是不是值得?
机器学习落地难,一个模型的训练通常要跨越数个季度,人力物力的投入和其后的运营维护成本巨大,出现过很多质疑的声音。
如今,科学与技术都来到了一个新时代,面对这一问题也可以重新思考。在工程的角度上,我结合自身工作经历,将机器学习落地方法总结为以下几个阶段:
传统方式
专家模型
半自动建模
半自动训练
主动学习
????????????点击查看全文
可能是阿里最古老的流程引擎:PMC的架构与设计分享现在很多做流程工作或者调研流程引擎的人可能都已经没有听说过 PMC 了,但它在早期阿里工作流中确实是⼀个重要的角色。
有一个说法是当时阿里内外刚刚准备做自己的第一个工作流系统,Activiti 在那时也才刚出来不久,然后内外的早期开发者们经过调研,决定自研一个流程引擎,这样改起来更加方便。
若干年之后,阿里的业务越来越广泛,很多 toB 业务兴起,流程中有很多 toB 系统的重要组件,大家不想从零开始做,于是借鉴起步更早的阿里内外的经验,将 PMC 的代码 copy 一份部署便开始了自己的业务。目前我所知道的就包括钉钉审批、政务等等,经过这些年的发展,这几份 copy 代码应该都有了不少的区别,不过整体架构上应该都是差不多的。
如今,流程引擎的选择已经越来越多了,Activiti,Flowable, Camunda 或者帝奇的 SmartEngine,他们都比 PMC 更加开放,也拥有更加优秀的设计,或者更加遵守 BPMN 规范,基本上也不会有人再去 copy PMC 的代码了。不过,学习 PMC 的设计依旧能带给我们⼀些流程方面的启发。
··· ···
????????????点击查看全文
你可能还想看
1. 凌云一周看点 | 什么是云原生数据库;因云而生的云原生网络;大型团队如何从0到1自建SRE体系;空间数据模型之从CAD到BIM
2. 凌云一周看点 | 混合云多Region架构;云上用户定制化网络;边缘云全站加速;什么是操作系统的云原生
END
每日收获前沿技术与科技洞见
投稿及合作请联系邮箱:lingyunshike@163.com