博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive 表存取 json 数据
阅读量:5935 次
发布时间:2019-06-19

本文共 836 字,大约阅读时间需要 2 分钟。

hot3.png

1. 建表

create table json_temp(  appkey string,   jsondata string  )   row format delimited   fields terminated by '|'   stored as textfile ;

2. 导入数据

appkey001|{"count":2,"usage":91273,"pkg":"com.example.gotest"} 

appkey001|{"count":234,"usage":9876,"pkg":"com.example.gotest"}
appkey001|{"count":34,"usage":5432,"pkg":"com.example.msg"}

load data local inpath '/home/bigdata/my/test-json-data.log' overwrite into table json_temp;

3. 查询数据

-- 使用 get_json_object 函数select t.appkey, get_json_object(t.jsondata,'$.count'), get_json_object(t.jsondata,'$.usage') from json_temp t;-- 使用 lateral view + json_tuple 函数select t1.appkey, t2.* from json_temp t1 lateral view json_tuple(t1.jsondata,'count','usage') t2 as t2_count, t2_usage;

查出的来结果如下 

appkey001    2    91273

appkey001    234    9876
appkey001    34    5432

转载于:https://my.oschina.net/zdtdtel/blog/1616120

你可能感兴趣的文章
人工智能与智能系统中的先驱人物
查看>>
动态ARP表项建立条件
查看>>
iOS scrollView 手动布局不能从顶部显示解决方法 oc or swift都是这个道理
查看>>
Scrapy items的介绍与使用
查看>>
React Native Android Gradle 编译流程浅析(一)
查看>>
陈松松:如何保证做出有价值的视频,让用户喜欢观看
查看>>
博为峰Java技术文章 ——JavaSE Swing使用数组和Vector创建下拉列表框
查看>>
linux rsync同步命令
查看>>
对apache中并发控制参数prefork理解和调优
查看>>
MP114配合微软UC简单DEMO
查看>>
framework
查看>>
seaweedfs-02
查看>>
网络改造方案集(锦集)
查看>>
马上就到圣诞节了,该计划做点什么呢?
查看>>
git 项目开发使用
查看>>
linux内核中的struct rlimit结构体详解
查看>>
小试牛刀:使用Python模拟登录知乎
查看>>
2013 8.27 ciso模拟器交换机配置1
查看>>
LINUS小结
查看>>
高效使用vs2012之自定义控件-添加命令
查看>>