7.2.4 Paimon Catalog¶
1 使用须知¶
-
数据放在
hdfs
时,需要将core-site.xml
,hdfs-site.xml
和hive-site.xml
放到FE
和BE
的conf
目录下。优先读取conf
目录下的hadoop
配置文件,再读取环境变量HADOOP_CONF_DIR
的相关配置文件。 -
当前适配的
Paimon
版本为0.8
。
2 创建 Catalog¶
Paimon Catalog
当前支持两种类型的 Metastore
创建 Catalog
:
-
filesystem
(默认),同时存储元数据和数据在filesystem
。 -
hive metastore
,它还将元数据存储在Hive metastore
中。用户可以直接从Hive
访问这些表。
2.1 基于 FileSystem 创建 Catalog¶
2.1.1 HDFS¶
SQL | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
|
2.1.2 MINIO¶
SQL | |
---|---|
1 2 3 4 5 6 7 |
|
2.1.3 OBS¶
SQL | |
---|---|
1 2 3 4 5 6 7 |
|
2.1.4 COS¶
SQL | |
---|---|
1 2 3 4 5 6 7 |
|
2.1.5 OSS¶
SQL | |
---|---|
1 2 3 4 5 6 7 |
|
2.2 基于 Hive Metastore 创建 Catalog¶
SQL | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
|
2.3 基于 Aliyun DLF 创建 Catalog¶
该功能自 2.1.7
和 3.0.3
版本支持。
SQL | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
3 列类型映射¶
Paimon Data Type | Doris Data Type | Comment |
---|---|---|
BooleanType | Boolean | |
TinyIntType | TinyInt | |
SmallIntType | SmallInt | |
IntType | Int | |
FloatType | Float | |
BigIntType | BigInt | |
DoubleType | Double | |
VarCharType | VarChar | |
CharType | Char | |
VarBinaryType, BinaryType | String | |
DecimalType(precision, scale) | Decimal(precision, scale) | |
TimestampType,LocalZonedTimestampType | DateTime | |
DateType | Date | |
ArrayType | Array | 支持Array嵌套 |
MapType | Map | 支持Map嵌套 |
RowType | Struct | 支持Struct嵌套(2.0.10 和 2.1.3 版本开始支持) |
4 常见问题¶
-
Kerberos
问题-
确保
principal
和keytab
配置正确。 -
需在
BE
节点启动定时任务(如crontab
),每隔一定时间(如12
小时),执行一次kinit -kt your_principal your_keytab
命令。
-
-
Unknown type value
:UNSUPPORTED
这是
Doris 2.0.2
版本和Paimon 0.5
版本的一个兼容性问题,需要升级到2.0.3
或更高版本解决,或自行patch
-
访问对象存储(
OSS
、S3
等)报错文件系统不支持在
2.0.5
(含)之前的版本,用户需手动下载以下jar
包并放置在${DORIS_HOME}/be/lib/java_extensions/preload-extensions
目录下,重启BE
。-
访问
OSS
:paimon-oss-0.6.0-incubating.jar
-
访问其他对象存储:
paimon-s3-0.6.0-incubating.jar
2.0.6
之后的版本不再需要用户手动放置。 -