工作空间级 Information Schema 存储当前工作空间内的元数据,通过
information_schema.<视图名>
information_schema.<视图名>
访问,只返回当前工作空间的数据。
-- 示例:查看当前工作空间下所有表
SELECT table_schema, table_name, table_type FROM information_schema.tables;
-- 示例:查看最近 1 小时的作业历史
SELECT job_id, status, execution_time, job_text
FROM information_schema.job_history
WHERE start_time > NOW() - INTERVAL 1 HOUR;
SCHEMAS
记录当前工作空间下所有 Schema 的信息。
| 字段 | 类型 | 说明 |
|---|
catalog_name
catalog_name | STRING | 所属工作空间名称 |
schema_name
schema_name | STRING | Schema 名称 |
type
type | STRING | Schema 类型,如 MANAGED
MANAGED 、SHARED
SHARED 、EXTERNAL
EXTERNAL |
schema_creator
schema_creator | STRING | 创建者账号名 |
create_time
create_time | TIMESTAMP_LTZ | 创建时间 |
last_modify_time
last_modify_time | TIMESTAMP_LTZ | 最后修改时间 |
comment
comment | STRING | 注释 |
properties
properties | MAP<STRING,STRING> | 创建时设置的属性 |
TABLES
记录当前工作空间下所有表的信息。
| 字段 | 类型 | 说明 |
|---|
table_catalog
table_catalog | STRING | 所属工作空间名称 |
table_schema
table_schema | STRING | 所属 Schema 名称 |
table_name
table_name | STRING | 表名称 |
table_creator
table_creator | STRING | 创建者账号名 |
table_type
table_type | STRING | 表类型,如 MANAGED_TABLE
MANAGED_TABLE 、DYNAMIC_TABLE
DYNAMIC_TABLE 、MATERIALIZED_VIEW
MATERIALIZED_VIEW 、VIRTUAL_VIEW
VIRTUAL_VIEW 、SEMANTIC_VIEW
SEMANTIC_VIEW 、EXTERNAL_TABLE
EXTERNAL_TABLE |
row_count
row_count | BIGINT | 行数(VIEW 为 NULL) |
bytes
bytes | BIGINT | 数据大小(字节,VIEW 为 NULL) |
create_time
create_time | TIMESTAMP_LTZ | 创建时间 |
last_modify_time
last_modify_time | TIMESTAMP_LTZ | 最后修改时间 |
is_partitioned
is_partitioned | BOOLEAN | 是否分区表 |
is_clustered
is_clustered | BOOLEAN | 是否分桶表 |
comment
comment | STRING | 注释 |
properties
properties | MAP<STRING,STRING> | 创建时设置的属性 |
data_lifecycle
data_lifecycle | INT | 数据生命周期(天),NULL 表示未设置 |
COLUMNS
记录当前工作空间下所有表的字段信息。
| 字段 | 类型 | 说明 |
|---|
table_catalog
table_catalog | STRING | 所属工作空间名称 |
table_schema
table_schema | STRING | 所属 Schema 名称 |
table_name
table_name | STRING | 所属表名称 |
column_name
column_name | STRING | 字段名称 |
column_default
column_default | BOOLEAN | 默认值 |
is_nullable
is_nullable | BOOLEAN NOT NULL | 是否允许 NULL |
data_type
data_type | STRING | 字段类型 |
comment
comment | STRING | 字段注释 |
is_primary_key
is_primary_key | BOOLEAN NOT NULL | 是否主键 |
is_clustering_column
is_clustering_column | BOOLEAN NOT NULL | 是否分桶列 |
create_time
create_time | TIMESTAMP_LTZ | 创建时间 |
VIEWS
记录当前工作空间下所有普通视图的信息。
| 字段 | 类型 | 说明 |
|---|
table_catalog
table_catalog | STRING | 所属工作空间名称 |
table_schema
table_schema | STRING | 所属 Schema 名称 |
table_name
table_name | STRING | 视图名称 |
table_creator
table_creator | STRING | 创建者账号名 |
view_definition
view_definition | STRING | 创建视图的 SQL 定义 |
create_time
create_time | TIMESTAMP_LTZ | 创建时间 |
last_modify_time
last_modify_time | TIMESTAMP_LTZ | 最后修改时间 |
comment
comment | STRING | 注释 |
USERS
记录当前工作空间下的用户信息。
| 字段 | 类型 | 说明 |
|---|
workspace_name
workspace_name | STRING | 工作空间名称 |
user_name
user_name | STRING | 用户账号名 |
role_names
role_names | STRING | 用户拥有的角色,多个角色以逗号分隔 |
create_time
create_time | TIMESTAMP_LTZ | 用户加入工作空间的时间 |
email
email | STRING | 用户邮箱 |
telphone
telphone | STRING | 用户电话 |
comment
comment | STRING | 注释 |
properties
properties | MAP<STRING,STRING> | 创建时设置的属性 |
ROLES
记录当前工作空间下的角色信息。
| 字段 | 类型 | 说明 |
|---|
workspace_name
workspace_name | STRING | 工作空间名称 |
role_name
role_name | STRING | 角色名称 |
user_names
user_names | STRING | 被授予该角色的用户名,多个用逗号分隔 |
comment
comment | STRING | 注释 |
properties
properties | MAP<STRING,STRING> | 创建时设置的属性 |
CONNECTIONS
记录当前工作空间下的连接对象信息。
| 字段 | 类型 | 说明 |
|---|
workspace_name
workspace_name | STRING | 所属工作空间名称 |
connection_name
connection_name | STRING | 连接名称 |
connection_kind
connection_kind | STRING | 连接类型,如 STORAGE_CONNECTION
STORAGE_CONNECTION 、STORAGE
STORAGE 、CATALOG
CATALOG 、API
API |
type
type | STRING | 数据源类型,如 FILE_SYSTEM
FILE_SYSTEM 、CLOUD_FUNCTION
CLOUD_FUNCTION 、OSS
OSS 、KAFKA
KAFKA 、MESSAGE_QUEUE
MESSAGE_QUEUE 、DATABRICKS_UNITY_CATALOG
DATABRICKS_UNITY_CATALOG |
provider
provider | STRING | 云厂商,如 OSS
OSS 、COS
COS 、S3
S3 、aliyun
aliyun 、tencent
tencent |
region
region | STRING | 连接所在区域,如 cn-shanghai
cn-shanghai 、ap-beijing
ap-beijing |
source_creator
source_creator | STRING | 创建者账号名 |
create_time
create_time | TIMESTAMP_LTZ | 创建时间 |
last_modify_time
last_modify_time | TIMESTAMP_LTZ | 最后修改时间 |
comment
comment | STRING | 注释 |
properties
properties | MAP<STRING,STRING> | 创建时设置的属性 |
VOLUMES
记录当前工作空间下的 Volume 信息。
| 字段 | 类型 | 说明 |
|---|
volume_catalog
volume_catalog | STRING | 所属工作空间名称 |
volume_schema
volume_schema | STRING | 所属 Schema 名称 |
volume_name
volume_name | STRING | Volume 名称 |
volume_url
volume_url | STRING | 挂载路径(内部 Volume 为空) |
volume_region
volume_region | STRING | Volume 所在区域 |
volume_type
volume_type | STRING | Volume 类型,如 MANAGED
MANAGED (内部)或 EXTERNAL
EXTERNAL (外部) |
volume_creator
volume_creator | STRING | 创建者账号名 |
connection_name
connection_name | STRING | 引用的 Connection 名称(内部 Volume 为空) |
comment
comment | STRING | 注释 |
properties
properties | MAP<STRING,STRING> | 创建时设置的属性 |
create_time
create_time | TIMESTAMP_LTZ | 创建时间 |
last_modify_time
last_modify_time | TIMESTAMP_LTZ | 最后修改时间 |
JOB_HISTORY
记录当前工作空间下的作业执行历史。
| 字段 | 类型 | 说明 |
|---|
workspace_name
workspace_name | STRING | 工作空间名称 |
workspace_id
workspace_id | BIGINT | 工作空间 ID |
job_id
job_id | STRING | 作业 ID |
job_name
job_name | STRING | 作业名称 |
job_creator
job_creator | STRING | 提交作业的用户账号名 |
status
status | STRING | 作业状态,如 SUCCEED
SUCCEED 、FAILED
FAILED 、CANCELLED
CANCELLED |
cru
cru | DOUBLE | 消耗的计算资源(CRU·时) |
error_message
error_message | STRING | 失败时的错误信息 |
job_type
job_type | STRING | 作业类型,如 SQL_JOB
SQL_JOB 、COMPACTION_JOB
COMPACTION_JOB |
job_sub_type
job_sub_type | STRING | 作业子类型 |
job_text
job_text | STRING | 执行的 SQL 文本 |
start_time
start_time | TIMESTAMP_LTZ | 开始时间 |
end_time
end_time | TIMESTAMP_LTZ | 结束时间 |
execution_time
execution_time | DOUBLE | 执行时长(秒,精确到毫秒) |
input_bytes
input_bytes | BIGINT | 实际扫描的数据量(字节) |
output_bytes
output_bytes | BIGINT | 输出数据量(字节) |
input_objects
input_objects | STRING | 输入对象名称 |
output_objects
output_objects | STRING | 输出对象名称 |
input_tables
input_tables | STRING | 输入表名称 |
output_tables
output_tables | STRING | 输出表名称 |
cache_hit
cache_hit | BIGINT | 从缓存中读取的数据量(字节) |
rows_produced
rows_produced | BIGINT | 处理的总行数 |
rows_inserted
rows_inserted | BIGINT | 插入行数 |
rows_updated
rows_updated | BIGINT | 更新行数 |
rows_deleted
rows_deleted | BIGINT | 删除行数 |
virtual_cluster
virtual_cluster | STRING | 使用的计算集群名称 |
job_config
job_config | STRING | 提交时设置的参数 |
job_priority
job_priority | STRING NOT NULL | 作业优先级 |
query_tag
query_tag | STRING | 用户设置的查询标签 |
client_info
client_info | STRING | 客户端信息(来源于 JDBC、CLI、Web 等) |
pt_date
pt_date | STRING | 分区日期,用于按日过滤 |
MATERIALIZED_VIEW_REFRESH_HISTORY
记录当前工作空间下物化视图的刷新历史。
| 字段 | 类型 | 说明 |
|---|
workspace_name
workspace_name | STRING | 工作空间名称 |
schema_name
schema_name | STRING | 所属 Schema 名称 |
materialized_view_name
materialized_view_name | STRING | 物化视图名称 |
cru
cru | DOUBLE | 刷新消耗的计算资源(CRU·时) |
virtual_cluster_name
virtual_cluster_name | STRING | 使用的计算集群名称 |
status
status | STRING | 刷新状态,如 SUCCEED
SUCCEED 、FAILED
FAILED |
scheduled_start_time
scheduled_start_time | TIMESTAMP_LTZ | 计划刷新时间 |
start_time
start_time | TIMESTAMP_LTZ | 实际开始时间 |
end_time
end_time | TIMESTAMP_LTZ | 结束时间 |
error_code
error_code | STRING | 错误码 |
error_message
error_message | STRING | 失败时的错误信息 |
pt_date
pt_date | DATE | 分区日期,用于按日过滤 |
AUTOMV_REFRESH_HISTORY
记录当前工作空间下 Auto Materialized View 的刷新历史。
| 字段 | 类型 | 说明 |
|---|
workspace_name
workspace_name | STRING | 工作空间名称 |
schema_name
schema_name | STRING | 所属 Schema 名称 |
materialized_view_name
materialized_view_name | STRING | 物化视图名称 |
cru
cru | DOUBLE | 刷新消耗的计算资源(CRU·时) |
status
status | STRING | PROCESSING
PROCESSING 、SUCCEEDED
SUCCEEDED 、FAILED
FAILED 、CANCELLED
CANCELLED |
mv_process_type
mv_process_type | STRING NOT NULL | BUILD
BUILD (首次构建)或 REFRESH
REFRESH (增量刷新) |
start_time
start_time | TIMESTAMP_LTZ | 开始时间 |
end_time
end_time | TIMESTAMP_LTZ | 结束时间 |
build_from_workspace
build_from_workspace | STRING | 源表所在工作空间名称 |
job_id
job_id | STRING | 对应的作业 ID |
error_message
error_message | STRING | 失败时的错误信息 |
pt_date
pt_date | STRING | 分区日期,用于按日过滤 |