您当前的位置: 首页 >  hive

梁云亮

暂无认证

  • 1浏览

    0关注

    1211博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Hive 压缩

梁云亮 发布时间:2020-02-22 14:16:09 ,浏览量:1

Map输出压缩

开启map输出阶段压缩可以减少job中map和Reduce task间数据传输量。

示例:

  1. 开启hive中间传输数据压缩功能 hive (default)>set hive.exec.compress.intermediate=true; 在这里插入图片描述
  2. 开启mapreduce中map输出压缩功能 hive (default)>set mapreduce.map.output.compress=true; 在这里插入图片描述
  3. 设置mapreduce中map输出数据的压缩方式 hive (default)>set mapreduce.map.output.compress.codec=org.apache.hadoop.io.compress.SnappyCodec; 在这里插入图片描述
  4. 执行查询语句 在这里插入图片描述
  5. 查看是否压缩 打开网址:http://hcmaster:8088/cluster 在这里插入图片描述 单击History连接 在这里插入图片描述 在打开的页面中搜索compress.codec 在这里插入图片描述
Reduce输出压缩

示例:

  1. 开启hive最终输出数据压缩功能 hive (default)>set hive.exec.compress.output=true; 在这里插入图片描述
  2. 开启mapreduce最终输出数据压缩 hive (default)>set mapreduce.output.fileoutputformat.compress=true; 在这里插入图片描述
  3. 设置mapreduce最终数据输出压缩方式 hive (default)> set mapreduce.output.fileoutputformat.compress.codec = org.apache.hadoop.io.compress.SnappyCodec; 在这里插入图片描述
  4. 设置mapreduce最终数据输出压缩为块压缩 在这里插入图片描述
  5. 测试一下输出结果是否是压缩文件 hive (default)> insert overwrite local directory ‘/opt/module/datas/distribute-result’ select * from emp distribute by deptno sort by empno desc; 在这里插入图片描述
  6. 再次执行第4步中,设置 hive (default)> set mapreduce.output.fileoutputformat.compress.type=BLOCK;然后测试 在这里插入图片描述 结果: 在这里插入图片描述
关注
打赏
1665409997
查看更多评论
立即登录/注册

微信扫码登录

0.1175s