大数据-Hive-自定义UDF-数据类型映射
什么是数据类型映射
在设计时Java与Hive考虑不同,出现Hive与Java的数据类型不一致的现象。在开发Hive UDF时,需要显式地定义Java数据类型,例如String 、Int等类型。
当Hive数据类型与Java数据类型一致时当然没有问题,皆大欢喜,但是当两者数据类型不一致时,可能出现UDF使用报错的情况
数据类型对照
Hive类型 | Java原始类型 | Java包装类 | hadoop.io.Writable |
---|---|---|---|
tinyint | byte | Byte | ByteWritable |
smallint | short | Short | ShortWritable |
int | int | Integer | IntWritable |
bigint | long | Long | LongWritable |
string | String | - | Text |
boolean | boolean | Boolean | BooleanWritable |
float | float | Float | FloatWritable |
double | double | Double | DoubleWritable |
数组和Map
Hive类型 | Java类型 |
---|---|
array | List |
Map<K, V> | Map<K, V> |
THE END