您当前的位置: 首页 >  嵌入式

阿里云云栖号

暂无认证

  • 0浏览

    0关注

    5305博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

IoT日志利器:嵌入式日志客户端(C Producer)发布

阿里云云栖号 发布时间:2017-12-26 11:59:48 ,浏览量:0

摘要: 2017年12月19日至20日,2017云栖大会·北京峰会在国家会议中心召开,飞天智能是贯穿云栖大会不变的主题,云计算、大数据、人工智能、物联网等热门话题备受各方关注。其中阿里云日志服务发布的嵌入式日志采集客户端(C Producer Library) 就是其中解决物联网日志采集、分析难的利器。

2017年12月19日至20日,2017云栖大会·北京峰会在国家会议中心召开,飞天智能是贯穿云栖大会不变的主题,云计算、大数据、人工智能、物联网等热门话题备受各方关注。其中阿里云日志服务发布的嵌入式日志采集客户端(C Producer Library) 就是其中解决物联网日志采集、分析难的利器。

背景 IoT(Internet of Things)正在高速增长,越来越多设备开始逐步走进日常生活(例如智能路由器、各种电视棒、天猫精灵、扫地机器人),让我们体验到智能领域的便利。距Gartner预测,到2020年末预计会有200亿智能设备,可见该领域的巨大市场。

图片描述 作为IoT/嵌入式工程师,除了需要深厚的开发功底外,面对海量的设备,如何有能力管理、监控、诊断这些“黑盒”设备至关重要。我们总结了嵌入式开发需求,主要有以下几点:

数据采集:如何实时采集分散在全球各地的百万/千万级设备上的数据? 调试:如何使用一套方案既满足线上数据采集以及开发时的实时调试? 线上诊断:某个线上设备出现错误,如何快速定位设备,查看引起该设备出错的上下文是什么? 监控:当前有多少个设备在线?工作状态分布如何?地理位置分布如何?出错设备如何实时告警? 数据实时分析:设备产生数据如何与实时计算、大数据仓库对接,构建用户画像?

图片描述 思考以上问题的解决方案,我们发现在传统软件领域那一套手段面临IoT领域基本全部失效,主要挑战来自于IoT设备这些特点:

数目多:在传统运维领域管理1W台服务器属于一家大公司了,但10W在线对于IoT设备而言只是一个小门槛 分布广:硬件一旦部署后,往往会部署在全国、甚至全球各地 黑盒:难以登陆并调试,大部分情况属于不可知状态 资源受限:出于成本考虑,IoT设备硬件较为受限(例如总共只有32MB内存),传统PC领域手段往往失效 针对不同端的数据采集 日志服务(原SLS) 客户端Logtail在X86服务器上有百万级部署,可以参见文章:Logtail技术分享 : 多租户隔离技术+双十一实战效果,Polling + Inotify 组合下的日志保序采集方案。除此之外我们还有以下几种方式:

移动端SDK:Android/IOS平台数据采集,一天已有千万级DAU Web Tracking(JS):类似百度统计,Google Analytics 轻量级采集方式,无需签名 在IoT领域,我们从多年Logtail的开发经验中,汲取其中精华的部分,并结合IoT设备针对CPU、内存、磁盘、网络、应用方式等特点,开发出一套专为IoT定制的日志数据采集方案:C Producer

图片描述

C Producer特点 C Producer Library 继承Logtail稳定、边界特点,可以定位是一个“轻量级Logtail”,虽没有Logtail实时配置管理机制,但具备除此之外70%功能,包括:

提供多租户概念:可以对多种日志(例如Metric,DebugLog,ErrorLog)进行优先级分级处理,同时配置多个客户端,每个客户端可独立配置采集优先级、目的project/logstore等 支持上下文查询:同一个客户端产生的日志在同一上下文中,支持查看某条日志前后相关日志 并发发送,断点续传:支持缓存上线可设置,超过上限后日志写入失败 还有一些专门为IoT准备功能,例如:

本地调试:支持将日志内容输出到本地,并支持轮转、日志数、轮转大小设置 细粒度资源控制:支持针对不同类型数据/日志设置不同的缓存上线、聚合方式 日志压缩缓存:支持将未发送成功的数据压缩缓存,减少设备内存占用 图片描述

功能优势 C-Producer是量身为IoT定制的方案,因此会有一些特定考虑:

图片描述

客户端高并发写入:可配置的发送线程池,支持每秒数十万条日志写入,详情参见性能测试 低资源消耗:每秒20W日志写入只消耗70% CPU;同时在低性能硬件(例如树莓派)上,每秒产生100条日志对资源基本无影响 客户端日志不落盘:既数据产生后直接通过网络发往服务端 客户端计算与 I/O 逻辑分离:日志异步输出,不阻塞工作线程 支持多优先级:不通客户端可配置不同的优先级,保证高优先级日志最先发送。 本地调试:支持设置本地调试,便于您在网络不通的情况下本地测试应用程序。 在以上场景中,C Producer Library 会简化您程序开发的步骤,您无需关心日志采集细节实现、也不用担心日志采集会影响您的业务正常运行,大大降低数据采集门槛。

为了有一个感性认识,我们对C-Producer 方案与其他嵌入式采集方案做了一个对比,如下:

图片描述

整体解决方案 C-Producer + 日志服务可以给IoT带来什么?答案是:IoT日志解决方案:

规模大

支持亿级别客户端实时写入 支持 PB/Day 数据量 速度快

采集快:0延迟:写入0延迟,写入即可消费

查询快:一秒内,复杂查询(5个条件)可处理10亿级数据 分析快:一秒内,复杂分析(5个维度聚合+GroupBy)可聚合亿级别数据 对接广

与阿里云各类产品无缝打通 各种开源格式存储、计算、可视化系统完美兼容 图片描述

如何使用 一个应用可创建多个producer,每个producer可包含多个client,每个client可单独配置目的地址、日志level、是否本地调试、缓存大小、自定义标识、topic等信息。

参见github地址 图片描述

性能测试 环境配置:传统X86服务器,树莓派(低功耗环境),配置分别如下:

图片描述

C-Producer配置 ARM(树莓派)

缓存:10MB 聚合时间:3秒 (聚合时间、聚合数据包大小、聚合日志数任一满足即打包发送) 聚合数据包大小:1MB 聚合日志数:1000 发送线程:1 自定义tag : 5 X86

缓存:10MB 聚合时间:3秒 (聚合时间、聚合数据包大小、聚合日志数任一满足即打包发送) 聚合数据包大小:3MB 聚合日志数:4096 发送线程:4 自定义tag : 5 ​

日志样例 10个键值对,总数据量约为600字节 9个键值对,数据量约为350字节

__source__:  11.164.233.187  
__tag__:1:  2  
__tag__:5:  6  
__tag__:a:  b  
__tag__:c:  d  
__tag__:tag_key:  tag_value  
__topic__:  topic_test  
_file_:  /disk1/workspace/tools/aliyun-log-c-sdk/sample/log_producer_sample.c  
_function_:  log_producer_post_logs  
_level_:  LOG_PRODUCER_LEVEL_WARN  
_line_:  248  
_thread_:  40978304  
LogHub:  Real-time log collection and consumption  
Search/Analytics:  Query and real-time analysis  
Interconnection:  Grafana and JDBC/SQL92  
Visualized:  dashboard and report functions  

测试结果 X86平台结果 C Producer可以轻松到达90M/s的发送速度,每秒上传日志20W,占用CPU只有70%,内存140M 服务器在200条/s,发送数据对于cpu基本无影响(降低到0.01%以内) 客户线程发送一条数据(输出一条log)的平均耗时为:1.2us 图片描述

树莓派平台结果 在树莓派的测试中,由于CPU的频率只有600MHz,性能差不多是服务器的1/10左右,最高每秒可发送2W条日志 树莓派在20条/s的时候,发送数据对于cpu基本无影响(降低到0.01%以内) 客户线程发送一条数据(输出一条log)的平均耗时为:12us左右(树莓派通过USB连接到PC共享网络) 图片描述

一些典型场景可以参见云栖论坛 和最佳实践。

关注
打赏
1664438436
查看更多评论
立即登录/注册

微信扫码登录

0.0575s