Studio

Studio 既是云器 Lakehouse 的 Web 管理控制台,也是一套 Serverless 数据服务平台。你在界面上配置的数据同步任务、SQL 调度任务、Python 脚本,背后由云器托管的 Serverless 基础设施负责执行,因此通常不需要单独管理底层计算资源。数据工程师、分析师和管理员可以在同一个界面中衔接数据接入、开发、调度、运维和消费相关工作。

先按目标开始

如果你已经带着明确目标来到 Studio,可以先从下面这些更接近实际工作的入口开始,而不必先从菜单结构倒推。

我要构建一条数据管道

可参考:

  1. Studio 对象关系与生命周期
  2. 数据同步概述
  3. 任务开发与调度
  4. 任务调度和实例执行方式
  5. 任务和实例运维

我要搭建一个数仓

可参考:

  1. Studio 对象关系与生命周期
  2. 任务开发与调度
  3. 动态表任务
  4. 任务调度依赖关系
  5. 数据目录

我要接入一个新数据源并持续同步

可参考:

  1. 数据同步概述
  2. 数据源管理
  3. 数据源支持范围
  4. 实时同步任务离线同步任务

我要上线一个稳定运行的任务

可参考:

  1. 如何让 Agent 更准确地操作 Studio
  2. Studio 上线检查与排障路径
  3. Studio 高影响操作指南
  4. 任务调度和实例执行方式
  5. 任务调度依赖关系
  6. 任务和实例运维
  7. 监控告警

我要排查失败任务或异常链路

可参考:

  1. Studio 上线检查与排障路径
  2. Studio 高影响操作指南
  3. 任务和实例运维
  4. 补数任务
  5. 监控告警
  6. 监控项口径说明

我要让 Agent 协助我操作 Studio

可参考:

  1. Studio 对象关系与生命周期
  2. 如何让 Agent 更准确地操作 Studio
  3. Data Engineering Agent
  4. Data Analytics Agent

我要查看和治理数据资产

可参考:

  1. 数据目录
  2. 数据质量
  3. 权限申请
  4. 审批工单

如果你现在更希望按 Studio 的模块来查功能,也可以继续往下看各模块入口。

Data Agent — AI 智能体

Studio 内置 Data Agent,为开发、运维和治理场景提供自然语言交互入口,帮助用户更高效地使用 Lakehouse 和 Studio。你可以直接用自然语言描述目标,由 Agent 协助理解需求、补充上下文、组织步骤,并在权限、工具开放范围和确认流程允许的前提下协助完成部分操作。

典型场景:

  • ETL 开发辅助:描述数据加工需求,Agent 协助生成 SQL 任务并补充调度建议
  • 自然语言取数:直接问"最近 7 天各地区的订单金额",Agent 协助生成 SQL 并返回结果
  • 日常运维问答:问"当前有哪些失败的任务",Agent 协助查询并给出处理建议
  • 数据洞察生成:上传数据或指定表,Agent 协助生成分析报告

六大功能模块

数据同步
可视化配置 40+ 数据源的实时 CDC 同步和离线批量同步,适合需要较少手工编码的数据接入场景。支持 MySQL、PostgreSQL、Oracle、Kafka 等主流数据源。

数据同步概述

任务开发(IDE)
内置 SQL / Python / Shell 编辑器,支持组合任务、循环任务、条件分支,一站式完成数据加工逻辑开发。

任务开发与调度

任务调度
Cron 定时调度 + 上下游依赖管理,支持历史数据补跑,任务执行状态实时可见。

任务调度依赖关系

工作区(SQL 查询)
交互式 SQL 编辑器,支持多 Tab、结果可视化、查询历史,适合即席分析和数据探查。

工作区

运维监控
查看任务运行历史、日志、失败原因,配置异常告警通知,掌握数据管道健康状态。

任务和实例运维

数据目录
浏览和管理表结构、字段注释、数据血缘,支持权限申请和审批工单。

数据目录


我要把外部数据同步进来

推荐:数据同步模块,支持 40+ 种数据源,可视化配置,适合以较少手工编码的方式完成数据接入。

场景方案参考文档
关系型数据库(MySQL / PG / Oracle 等),实时同步实时同步任务(CDC)实时同步任务
整库同步,多表一起迁移多表实时同步多表实时同步完整指南
离线定期同步(T+1 或按小时)离线同步任务离线同步任务
不确定用哪种数据源查看支持范围数据源支持范围

我要开发数据处理任务

推荐:任务开发模块(IDE),支持 SQL、Python、Shell,可以组合编排。

场景方案参考文档
写 SQL 做数据加工SQL 任务任务开发与调度
需要 Python 处理逻辑Python 任务Python 任务
多个任务串联,有依赖关系组合任务组合任务
循环处理多个分区或对象For each 循环任务For each 循环任务
条件分支(if/else 逻辑)分支任务分支任务
增量计算,自动维护结果表动态表任务动态表任务

我要配置定时调度

推荐:任务调度模块,支持 Cron 表达式和上下游依赖管理。

场景参考文档
设置任务定时执行任务调度和实例执行方式
配置任务间的依赖关系任务调度依赖关系
历史数据补跑补数任务

我要查看任务运行状态 / 排查问题

推荐:运维监控模块

场景参考文档
查看任务运行历史和日志任务和实例运维
配置异常告警通知监控告警
了解监控指标含义监控项口径说明

我要做数据查询和分析

场景方案参考文档
交互式 SQL 查询工作区工作区
查询结果可视化分析(Notebook)分析
查看和管理表结构数据目录数据目录

我要管理计算资源

场景参考文档
创建、启停 VCluster计算集群
查看历史作业资源消耗作业历史
了解规格代码含义计算集群规格说明

我要管理权限和审批

场景参考文档
申请数据权限权限申请
处理审批工单审批工单

第一次使用 Studio?

按这个顺序上手:

  1. Lakehouse Studio 快速导览 — 5 分钟了解界面布局
  2. Lakehouse Studio 入门指南 — 完成第一个完整流程
  3. Studio 概述 — 深入了解各模块功能
  4. Studio 对象关系与生命周期 — 理解工作区、目录、任务、组合任务、任务组、调度、发布和实例之间的关系
  5. 如何让 Agent 更准确地操作 Studio — 理清目录、对象 ID、发布边界、影响范围和二次复核的表达方式
  6. Studio 上线检查与排障路径 — 上线前先看哪些信息,出现异常时先沿着什么路径排查
  7. 用 Studio 做成一件事 — 用目标语言理解接入、开发、编排、上线、监控和治理的整体路径
联系我们
预约咨询
微信咨询
电话咨询
邮件咨询