Information Schema(工作空间级)

工作空间级 Information Schema 存储当前工作空间内的元数据,通过

information_schema.<视图名>
information_schema.<视图名>
访问,只返回当前工作空间的数据。

-- 示例:查看当前工作空间下所有表 SELECT table_schema, table_name, table_type FROM information_schema.tables; -- 示例:查看最近 1 小时的作业历史 SELECT job_id, status, execution_time, job_text FROM information_schema.job_history WHERE start_time > NOW() - INTERVAL 1 HOUR;

SCHEMAS

记录当前工作空间下所有 Schema 的信息。

字段类型说明
catalog_name
catalog_name
STRING所属工作空间名称
schema_name
schema_name
STRINGSchema 名称
type
type
STRINGSchema 类型,如
MANAGED
MANAGED
SHARED
SHARED
EXTERNAL
EXTERNAL
schema_creator
schema_creator
STRING创建者账号名
create_time
create_time
TIMESTAMP_LTZ创建时间
last_modify_time
last_modify_time
TIMESTAMP_LTZ最后修改时间
comment
comment
STRING注释
properties
properties
MAP<STRING,STRING>创建时设置的属性

TABLES

记录当前工作空间下所有表的信息。

字段类型说明
table_catalog
table_catalog
STRING所属工作空间名称
table_schema
table_schema
STRING所属 Schema 名称
table_name
table_name
STRING表名称
table_creator
table_creator
STRING创建者账号名
table_type
table_type
STRING表类型,如
MANAGED_TABLE
MANAGED_TABLE
DYNAMIC_TABLE
DYNAMIC_TABLE
MATERIALIZED_VIEW
MATERIALIZED_VIEW
VIRTUAL_VIEW
VIRTUAL_VIEW
SEMANTIC_VIEW
SEMANTIC_VIEW
EXTERNAL_TABLE
EXTERNAL_TABLE
row_count
row_count
BIGINT行数(VIEW 为 NULL)
bytes
bytes
BIGINT数据大小(字节,VIEW 为 NULL)
create_time
create_time
TIMESTAMP_LTZ创建时间
last_modify_time
last_modify_time
TIMESTAMP_LTZ最后修改时间
is_partitioned
is_partitioned
BOOLEAN是否分区表
is_clustered
is_clustered
BOOLEAN是否分桶表
comment
comment
STRING注释
properties
properties
MAP<STRING,STRING>创建时设置的属性
data_lifecycle
data_lifecycle
INT数据生命周期(天),NULL 表示未设置

COLUMNS

记录当前工作空间下所有表的字段信息。

字段类型说明
table_catalog
table_catalog
STRING所属工作空间名称
table_schema
table_schema
STRING所属 Schema 名称
table_name
table_name
STRING所属表名称
column_name
column_name
STRING字段名称
column_default
column_default
BOOLEAN默认值
is_nullable
is_nullable
BOOLEAN NOT NULL是否允许 NULL
data_type
data_type
STRING字段类型
comment
comment
STRING字段注释
is_primary_key
is_primary_key
BOOLEAN NOT NULL是否主键
is_clustering_column
is_clustering_column
BOOLEAN NOT NULL是否分桶列
create_time
create_time
TIMESTAMP_LTZ创建时间

VIEWS

记录当前工作空间下所有普通视图的信息。

字段类型说明
table_catalog
table_catalog
STRING所属工作空间名称
table_schema
table_schema
STRING所属 Schema 名称
table_name
table_name
STRING视图名称
table_creator
table_creator
STRING创建者账号名
view_definition
view_definition
STRING创建视图的 SQL 定义
create_time
create_time
TIMESTAMP_LTZ创建时间
last_modify_time
last_modify_time
TIMESTAMP_LTZ最后修改时间
comment
comment
STRING注释

USERS

记录当前工作空间下的用户信息。

字段类型说明
workspace_name
workspace_name
STRING工作空间名称
user_name
user_name
STRING用户账号名
role_names
role_names
STRING用户拥有的角色,多个角色以逗号分隔
create_time
create_time
TIMESTAMP_LTZ用户加入工作空间的时间
email
email
STRING用户邮箱
telphone
telphone
STRING用户电话
comment
comment
STRING注释
properties
properties
MAP<STRING,STRING>创建时设置的属性

ROLES

记录当前工作空间下的角色信息。

字段类型说明
workspace_name
workspace_name
STRING工作空间名称
role_name
role_name
STRING角色名称
user_names
user_names
STRING被授予该角色的用户名,多个用逗号分隔
comment
comment
STRING注释
properties
properties
MAP<STRING,STRING>创建时设置的属性

CONNECTIONS

记录当前工作空间下的连接对象信息。

字段类型说明
workspace_name
workspace_name
STRING所属工作空间名称
connection_name
connection_name
STRING连接名称
connection_kind
connection_kind
STRING连接类型,如
STORAGE_CONNECTION
STORAGE_CONNECTION
STORAGE
STORAGE
CATALOG
CATALOG
API
API
type
type
STRING数据源类型,如
FILE_SYSTEM
FILE_SYSTEM
CLOUD_FUNCTION
CLOUD_FUNCTION
OSS
OSS
KAFKA
KAFKA
MESSAGE_QUEUE
MESSAGE_QUEUE
DATABRICKS_UNITY_CATALOG
DATABRICKS_UNITY_CATALOG
provider
provider
STRING云厂商,如
OSS
OSS
COS
COS
S3
S3
aliyun
aliyun
tencent
tencent
region
region
STRING连接所在区域,如
cn-shanghai
cn-shanghai
ap-beijing
ap-beijing
source_creator
source_creator
STRING创建者账号名
create_time
create_time
TIMESTAMP_LTZ创建时间
last_modify_time
last_modify_time
TIMESTAMP_LTZ最后修改时间
comment
comment
STRING注释
properties
properties
MAP<STRING,STRING>创建时设置的属性

VOLUMES

记录当前工作空间下的 Volume 信息。

字段类型说明
volume_catalog
volume_catalog
STRING所属工作空间名称
volume_schema
volume_schema
STRING所属 Schema 名称
volume_name
volume_name
STRINGVolume 名称
volume_url
volume_url
STRING挂载路径(内部 Volume 为空)
volume_region
volume_region
STRINGVolume 所在区域
volume_type
volume_type
STRINGVolume 类型,如
MANAGED
MANAGED
(内部)或
EXTERNAL
EXTERNAL
(外部)
volume_creator
volume_creator
STRING创建者账号名
connection_name
connection_name
STRING引用的 Connection 名称(内部 Volume 为空)
comment
comment
STRING注释
properties
properties
MAP<STRING,STRING>创建时设置的属性
create_time
create_time
TIMESTAMP_LTZ创建时间
last_modify_time
last_modify_time
TIMESTAMP_LTZ最后修改时间

JOB_HISTORY

记录当前工作空间下的作业执行历史。

字段类型说明
workspace_name
workspace_name
STRING工作空间名称
workspace_id
workspace_id
BIGINT工作空间 ID
job_id
job_id
STRING作业 ID
job_name
job_name
STRING作业名称
job_creator
job_creator
STRING提交作业的用户账号名
status
status
STRING作业状态,如
SUCCEED
SUCCEED
FAILED
FAILED
CANCELLED
CANCELLED
cru
cru
DOUBLE消耗的计算资源(CRU·时)
error_message
error_message
STRING失败时的错误信息
job_type
job_type
STRING作业类型,如
SQL_JOB
SQL_JOB
COMPACTION_JOB
COMPACTION_JOB
job_sub_type
job_sub_type
STRING作业子类型
job_text
job_text
STRING执行的 SQL 文本
start_time
start_time
TIMESTAMP_LTZ开始时间
end_time
end_time
TIMESTAMP_LTZ结束时间
execution_time
execution_time
DOUBLE执行时长(秒,精确到毫秒)
input_bytes
input_bytes
BIGINT实际扫描的数据量(字节)
output_bytes
output_bytes
BIGINT输出数据量(字节)
input_objects
input_objects
STRING输入对象名称
output_objects
output_objects
STRING输出对象名称
input_tables
input_tables
STRING输入表名称
output_tables
output_tables
STRING输出表名称
cache_hit
cache_hit
BIGINT从缓存中读取的数据量(字节)
rows_produced
rows_produced
BIGINT处理的总行数
rows_inserted
rows_inserted
BIGINT插入行数
rows_updated
rows_updated
BIGINT更新行数
rows_deleted
rows_deleted
BIGINT删除行数
virtual_cluster
virtual_cluster
STRING使用的计算集群名称
job_config
job_config
STRING提交时设置的参数
job_priority
job_priority
STRING NOT NULL作业优先级
query_tag
query_tag
STRING用户设置的查询标签
client_info
client_info
STRING客户端信息(来源于 JDBC、CLI、Web 等)
pt_date
pt_date
STRING分区日期,用于按日过滤

MATERIALIZED_VIEW_REFRESH_HISTORY

记录当前工作空间下物化视图的刷新历史。

字段类型说明
workspace_name
workspace_name
STRING工作空间名称
schema_name
schema_name
STRING所属 Schema 名称
materialized_view_name
materialized_view_name
STRING物化视图名称
cru
cru
DOUBLE刷新消耗的计算资源(CRU·时)
virtual_cluster_name
virtual_cluster_name
STRING使用的计算集群名称
status
status
STRING刷新状态,如
SUCCEED
SUCCEED
FAILED
FAILED
scheduled_start_time
scheduled_start_time
TIMESTAMP_LTZ计划刷新时间
start_time
start_time
TIMESTAMP_LTZ实际开始时间
end_time
end_time
TIMESTAMP_LTZ结束时间
error_code
error_code
STRING错误码
error_message
error_message
STRING失败时的错误信息
pt_date
pt_date
DATE分区日期,用于按日过滤

AUTOMV_REFRESH_HISTORY

记录当前工作空间下 Auto Materialized View 的刷新历史。

字段类型说明
workspace_name
workspace_name
STRING工作空间名称
schema_name
schema_name
STRING所属 Schema 名称
materialized_view_name
materialized_view_name
STRING物化视图名称
cru
cru
DOUBLE刷新消耗的计算资源(CRU·时)
status
status
STRING
PROCESSING
PROCESSING
SUCCEEDED
SUCCEEDED
FAILED
FAILED
CANCELLED
CANCELLED
mv_process_type
mv_process_type
STRING NOT NULL
BUILD
BUILD
(首次构建)或
REFRESH
REFRESH
(增量刷新)
start_time
start_time
TIMESTAMP_LTZ开始时间
end_time
end_time
TIMESTAMP_LTZ结束时间
build_from_workspace
build_from_workspace
STRING源表所在工作空间名称
job_id
job_id
STRING对应的作业 ID
error_message
error_message
STRING失败时的错误信息
pt_date
pt_date
STRING分区日期,用于按日过滤
联系我们
预约咨询
微信咨询
电话咨询
邮件咨询