[1142]hive中如何新增字段

2年前 (2022) 程序员胖胖胖虎阿

291 0 0

文章目录

- 新增字段
- - 1、方法1
  - - cascade知识
  - 2、方法2 （适用于外部表）
  - 3、方法3（下下策）
- 修改字段
- 删除列

新增字段

1、方法1

alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE;
 
alter table 表名 add columns (列名 string COMMENT '新添加的列')；
 
 
hive表中指定位置增加一个字段
 
分两步，先添加字段到最后（add columns），然后再移动到指定位置（change）
 
alter table 表名 add columns (列名 string comment '当前时间'); -- 正确，添加在最后
alter table 表名 change 列名 string after 指定位置的列名; -- 正确，移动到指定位置,address字段的后面

添加之后字段由于hive底层是文件和系列化的设计，因此查数据会发现新增的列在所有已有列的后面

CASCADE会刷历史分区字段

cascade知识

cascade的中文翻译为“级联”，也就是不仅变更新分区的表结构（metadata），同时也变更旧分区的表结构。
对于删除操作也是，级联删除表中的信息，当表A中的字段引用了表B中的字段时，一旦删除B中该字段的信息，表A的信息也自动删除。（当父表的信息删除，子表的信息也自动删除）
标准语法如下：

2、方法2 （适用于外部表）

当分区过多的情况下，直接使用alter就行增加字段会报错

第一步：删除分区，当分区过多可以写个for循环

alter table table_name drop if exists partition(par_col=col_name)

第二步：使用alter操作就行添加字段，这时候就不会因为分区过多报错

第三步：进行修复分区

msck repair table 表名;

3、方法3（下下策）

创建新表修改表名，进行存储原表数据

将原表进行drop，再对新表进行改名操作

ALTER TABLE old_name RENAME TO new_name;

修改字段

alter table table_name change column 已有列 修改名称 类型 comment '';

删除列

Hive不能直接删除列，不然底层系列化就乱了，我们可以通过replace语句来替换整张表的字段，达到同样的效果

alter table table_name replace columns(column_1 string);

语句中只写想要保留的字段就可以

参考：
https://blog.csdn.net/qq_42456324/article/details/120202236
https://blog.csdn.net/weixin_51613454/article/details/123400693
https://wenku.baidu.com/view/b9c6c8d9f405cc1755270722192e453610665b6c.html
https://blog.csdn.net/hell_oword/article/details/123600004
https://blog.csdn.net/m0_48283915/article/details/113318482