External Catalog

External Catalog 是 Lakehouse 的联邦查询入口,将外部数据系统(Hive、Databricks、Snowflake 等)的元数据目录映射到 Lakehouse,让你用标准 SQL 直接查询外部数据,无需复制数据。

与 External Schema 的区别:External Catalog 是独立的顶层目录,用三层命名

catalog.schema.table
catalog.schema.table
访问;External Schema 是挂载到当前工作空间的 Schema,用两层命名
schema.table
schema.table
访问,更适合将 Hive 数据库融入现有工作空间。详见组织层级

支持的数据源

数据源连接方式
Apache HiveHive Metastore URIs
Databricks Unity CatalogDatabricks API
Iceberg REST CatalogIceberg REST API
Snowflake Open CatalogIceberg REST API + OAuth

使用场景

  • 跨平台联邦查询:同时查询 Lakehouse 本地数据和 Hive/Databricks 中的数据,无需 ETL
  • 数据湖原地加速:数据保留在 OSS/HDFS,用 Lakehouse 替代 Spark/Hive 做 ETL 或替代 Presto/Trino 做 Ad hoc 查询
  • 渐进式迁移:迁移过程中通过 External Catalog 保持业务连续性,验证数据一致性后再切换

权限

目前创建的 External Catalog 只有

instance_admin
instance_admin
角色可以查询。

相关文档

联系我们
预约咨询
微信咨询
电话咨询
邮件咨询