牛骨文教育服务平台(让学习变的简单)
博文笔记

Hive几种数据导入方式

创建时间:2014-10-28 投稿人: 浏览次数:11879

 好久没写Hive的那些事了,今天开始写点吧。今天的话题是总结Hive的几种常见的数据导入方式,我总结为四种:
(1)、从本地文件系统中导入数据到Hive表;
(2)、从HDFS上导入数据到Hive表;
(3)、从别的表中查询出相应的数据并导入到Hive表中;
(4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。
我会对每一种数据的导入进行实际的操作,因为纯粹的文字让人看起来很枯燥,而且学起来也很抽象。好了,开始操作!

  一、从本地文件系统中导入数据到Hive表
  先在Hive里面创建好表,如下:

1 hive> create table wyp
2     > (id int, name string,
3     > age int, tel string)
4     > ROW FORMAT DELIMITED
5     > FIELDS TERMINATED BY " "
6     > STORED AS TEXTFILE;
7 OK
8 Time taken: 2.832seconds

这个表很简单,只有四个字段,具体含义我就不解释了。本地文件系统里面有个/home/wyp/wyp.txt文件,内容如下:

1 [wyp@master~]$ cat wyp.txt
2 1      wyp     25     13188888888888
3 2      test    30     13888888888888
4 3      zs      34     899314121

wyp.txt文件中的数据列之间是使用 分割的,可以通过下面的语句将这个文件里面的数据导入到wyp表里面,操作如下:

1
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。