实时大数据OLAP技术一直是大数据几座最陡峭和难以征服的技术高峰之一,因为在海量数据、实时性、复杂的OLAP技术和系统复杂性之间达到平衡本身就是一件很困难的事情。为了解决这个难题,各大互联网和技术公司都各自出了不同的解决方案,但都会存在这样或那样的问题,因此一直都没有公认或事实上的技术方案。不过,当Druid项目横空出世后,这一切都得到了改变:它近乎完美地解决了以上所有的技术矛盾点,从而它迅速在技术和工业圈传播开来。然而,由于Druid技术比较新,资料比较少,因此很多用户遇到了很多学习的困难。
在本场Chat中,第一本Druid技术书《Druid实时大数据分析原理与实践》的作者将会深入浅出地介绍Druid技术原理、他在大规模Druid集群的实际使用经验和技巧,想必一定能够帮助大家彻底掌握住实时大数据OLAP技术的精髓。
实录提要:
- Druid 和 Spark Stream 、Clickhouse 的区别?
- 有实例介绍如何读入数据、如何处理吗?
- Druid 如何使用 bitmap?
- Druid 是否有推荐的图形化方式?
- Druid 目前支持的操作还是比较少的,数据保存后,是否能重新被其他工具利用?
- 实际生产中,适合和哪些其他工具组合?
- Druid 有资源隔离吗,不同查询之间会不会相互影响,有哪些坑?
- 不同查询量级,肯定对资源消耗不同,如何保证每个查询都能在秒级返回结果?
- 介绍下 Hadoop、Spark 和这个开源平台最适合使用的场景吗?
阅读全文: http://gitbook.cn/gitchat/activity/58e985ac0bfcf8be585b857a
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。