入门指导
按角色选择你的入门路径,一般 30 分钟内可以跑通第一个场景。
数据工程师
目标:把数据接进来,跑通 ODS → DWD → ADS 加工链路
Step 1 — 跑通核心功能(30 分钟)
Step 2 — 接入你的数据
| 数据来源 | 推荐方式 |
|---|---|
| MySQL / PG / Oracle,实时 CDC | Studio 实时同步任务 |
| 整库迁移,多表一起同步 | 多表实时同步 |
| 对象存储(OSS / S3 / COS) | Pipe 持续导入 · COPY INTO |
| Kafka 消息流 | Kafka Pipe |
| 本地 CSV / Excel 文件 | 上传本地数据 |
Step 3 — 构建数据加工链路
Dynamic Table 增量计算 · Studio 任务开发与调度 · Data Engineering Agent(自然语言开发 ETL、管理任务)· 端到端 CDC 完整示例
Step 4 — 连接外部工具
数据分析师
目标:连上数据,跑 SQL,用 AI 辅助分析
Step 1 — 跑第一条 SQL(5 分钟)
Step 2 — 连接你的工具
| 工具类型 | 连接方式 |
|---|---|
| FineBI / PowerBI / Tableau 等 BI 工具 | JDBC 驱动 |
| DataGrip / DBeaver / Navicat 等客户端 | MySQL 协议 |
| Python 脚本 | SQLAlchemy |
| 终端命令行 | 命令行客户端 |
Step 3 — 进阶分析
AI / 算法工程师
目标:构建向量检索、RAG 知识库、AI 增强分析
Step 1 — 了解 Lakehouse AI 能力
Step 2 — 选择你的场景
| 场景 | 入口 |
|---|---|
| 语义搜索 / RAG 知识库 | AI 的数据准备 · 向量检索 |
| 在 SQL 里调用 LLM | AI 函数(AI_COMPLETE / AI_EMBEDDING) |
| 管理和切换多个 LLM 模型 | AI Gateway |
| 自然语言对话式数据分析 | Data Analytics Agent |
| 自然语言开发 ETL、管理任务、运维诊断 | Data Engineering Agent |
| Python 数据处理 + AI 推理 | Zettapark 快速上手 |
平台管理员
目标:开账号、分权限、搭环境
- 快速新增和管理用户 — 创建用户、分配角色
- 快速新建和使用工作空间 — 工作空间隔离与配置
- 快速管理工作空间下的用户 — 工作空间级权限管理
- 使用工作空间构建数据开发环境 — 为团队搭建完整的数据开发环境
- 快速配置和使用监控告警规则 — 任务失败、性能异常告警
AI Agent / 自动化程序
目标:通过确定性接口调用数据能力,构建自动化数据流水线
| 场景 | 推荐接入方式 |
|---|---|
| SQL 执行与结果获取 | cz-cli sql · Python connector |
| 任务调度与触发 | cz-cli task / runs refill |
| Studio 任务开发与数据源管理 | cz-cli task create/save · Studio 任务开发 · Studio 数据集成 |
| 场景 | 推荐接入方式 |
|---|---|
| Python 数据读写 | Zettapark · clickzetta-connector |
| 业务语义层查询 | 语义视图 |
| 与专业数据子 Agent 协作 | cz-cli agent run |
| 浏览器自动化 Web Agent | Singclaw |
按功能快速上手
| 我想做的事 | 入口 |
|---|---|
| 快速体验产品核心功能 | Lakehouse 快速入门体验 |
| 了解 Studio 界面布局 | Lakehouse Studio 快速导览 |
| 上传本地 CSV 文件 | 快速上传导入本地数据 |
| 从 MySQL / PG 实时 CDC 同步 | Studio 实时同步任务 |
| 创建定时同步任务 | 快速创建同步任务导入数据 |
| 挂载 OSS / S3 / COS 对象存储 | External Volume |
| 配置 ETL 调度流程 | 快速配置编排和周期调度 ETL 流程 |
| 联邦查询数据湖(Hive / Iceberg) | External Catalog 联邦查询 |
| 配置数据质量规则 | 快速配置和使用数据质量规则 |
| 配置监控告警 | 快速配置和使用监控告警规则 |
| 体验引擎性能(TPC-H) | 通过 TPC-H 样例数据体验引擎性能 |
| 编写复杂业务分析 SQL | SQL 使用指南 |
| 用 AI 对话分析数据 | Data Analytics Agent(DataGPT) |
| 用 AI 开发 ETL / 管理任务 | Data Engineering Agent |
| 构建向量检索 / RAG 知识库 | 向量检索 |
| 用 Python 处理数据(Zettapark) | Zettapark 快速上手 |
| 从 Spark 迁移到 Lakehouse | 迁移指南 |
联系我们
