Studio
Studio 既是云器 Lakehouse 的 Web 管理控制台,也是一套 Serverless 数据服务平台。你在界面上配置的数据同步任务、SQL 调度任务、Python 脚本,背后由云器托管的 Serverless 基础设施负责执行,因此通常不需要单独管理底层计算资源。数据工程师、分析师和管理员可以在同一个界面中衔接数据接入、开发、调度、运维和消费相关工作。
先按目标开始
如果你已经带着明确目标来到 Studio,可以先从下面这些更接近实际工作的入口开始,而不必先从菜单结构倒推。
我要构建一条数据管道
可参考:
我要搭建一个数仓
可参考:
我要接入一个新数据源并持续同步
可参考:
我要上线一个稳定运行的任务
可参考:
我要排查失败任务或异常链路
可参考:
我要让 Agent 协助我操作 Studio
可参考:
我要查看和治理数据资产
可参考:
如果你现在更希望按 Studio 的模块来查功能,也可以继续往下看各模块入口。
Data Agent — AI 智能体
Studio 内置 Data Agent,为开发、运维和治理场景提供自然语言交互入口,帮助用户更高效地使用 Lakehouse 和 Studio。你可以直接用自然语言描述目标,由 Agent 协助理解需求、补充上下文、组织步骤,并在权限、工具开放范围和确认流程允许的前提下协助完成部分操作。
典型场景:
- ETL 开发辅助:描述数据加工需求,Agent 协助生成 SQL 任务并补充调度建议
- 自然语言取数:直接问"最近 7 天各地区的订单金额",Agent 协助生成 SQL 并返回结果
- 日常运维问答:问"当前有哪些失败的任务",Agent 协助查询并给出处理建议
- 数据洞察生成:上传数据或指定表,Agent 协助生成分析报告
六大功能模块
|
数据同步 → 数据同步概述 |
任务开发(IDE) → 任务开发与调度 |
任务调度 → 任务调度依赖关系 |
|
工作区(SQL 查询) → 工作区 |
运维监控 → 任务和实例运维 |
数据目录 → 数据目录 |
我要把外部数据同步进来
推荐:数据同步模块,支持 40+ 种数据源,可视化配置,适合以较少手工编码的方式完成数据接入。
| 场景 | 方案 | 参考文档 |
|---|---|---|
| 关系型数据库(MySQL / PG / Oracle 等),实时同步 | 实时同步任务(CDC) | 实时同步任务 |
| 整库同步,多表一起迁移 | 多表实时同步 | 多表实时同步完整指南 |
| 离线定期同步(T+1 或按小时) | 离线同步任务 | 离线同步任务 |
| 不确定用哪种数据源 | 查看支持范围 | 数据源支持范围 |
我要开发数据处理任务
推荐:任务开发模块(IDE),支持 SQL、Python、Shell,可以组合编排。
| 场景 | 方案 | 参考文档 |
|---|---|---|
| 写 SQL 做数据加工 | SQL 任务 | 任务开发与调度 |
| 需要 Python 处理逻辑 | Python 任务 | Python 任务 |
| 多个任务串联,有依赖关系 | 组合任务 | 组合任务 |
| 循环处理多个分区或对象 | For each 循环任务 | For each 循环任务 |
| 条件分支(if/else 逻辑) | 分支任务 | 分支任务 |
| 增量计算,自动维护结果表 | 动态表任务 | 动态表任务 |
我要配置定时调度
推荐:任务调度模块,支持 Cron 表达式和上下游依赖管理。
| 场景 | 参考文档 |
|---|---|
| 设置任务定时执行 | 任务调度和实例执行方式 |
| 配置任务间的依赖关系 | 任务调度依赖关系 |
| 历史数据补跑 | 补数任务 |
我要查看任务运行状态 / 排查问题
推荐:运维监控模块。
| 场景 | 参考文档 |
|---|---|
| 查看任务运行历史和日志 | 任务和实例运维 |
| 配置异常告警通知 | 监控告警 |
| 了解监控指标含义 | 监控项口径说明 |
我要做数据查询和分析
| 场景 | 方案 | 参考文档 |
|---|---|---|
| 交互式 SQL 查询 | 工作区 | 工作区 |
| 查询结果可视化 | 分析(Notebook) | 分析 |
| 查看和管理表结构 | 数据目录 | 数据目录 |
我要管理计算资源
| 场景 | 参考文档 |
|---|---|
| 创建、启停 VCluster | 计算集群 |
| 查看历史作业资源消耗 | 作业历史 |
| 了解规格代码含义 | 计算集群规格说明 |
我要管理权限和审批
| 场景 | 参考文档 |
|---|---|
| 申请数据权限 | 权限申请 |
| 处理审批工单 | 审批工单 |
第一次使用 Studio?
按这个顺序上手:
- Lakehouse Studio 快速导览 — 5 分钟了解界面布局
- Lakehouse Studio 入门指南 — 完成第一个完整流程
- Studio 概述 — 深入了解各模块功能
- Studio 对象关系与生命周期 — 理解工作区、目录、任务、组合任务、任务组、调度、发布和实例之间的关系
- 如何让 Agent 更准确地操作 Studio — 理清目录、对象 ID、发布边界、影响范围和二次复核的表达方式
- Studio 上线检查与排障路径 — 上线前先看哪些信息,出现异常时先沿着什么路径排查
- 用 Studio 做成一件事 — 用目标语言理解接入、开发、编排、上线、监控和治理的整体路径
