入门指导

按角色选择你的入门路径，一般 30 分钟内可以跑通第一个场景。

数据工程师

目标：把数据接进来，跑通 ODS → DWD → ADS 加工链路

Step 1 — 跑通核心功能（30 分钟）

Step 2 — 接入你的数据

Step 3 — 构建数据加工链路

Step 4 — 连接外部工具

JDBC 驱动 · cz-cli 命令行 · SQLAlchemy · Python SDK

目标：连上数据，跑 SQL，用 AI 辅助分析

Step 1 — 跑第一条 SQL（5 分钟）

Step 2 — 连接你的工具

工具类型	连接方式
FineBI / PowerBI / Tableau 等 BI 工具	JDBC 驱动
DataGrip / DBeaver / Navicat 等客户端	MySQL 协议
Python 脚本	SQLAlchemy
终端命令行	命令行客户端

Step 3 — 进阶分析

Data Analytics Agent（DataGPT） · SQL 使用指南 · TPC-H 样例数据体验性能

目标：构建向量检索、RAG 知识库、AI 增强分析

Step 1 — 了解 Lakehouse AI 能力

Lakehouse AI 概述

Step 2 — 选择你的场景

场景	入口
语义搜索 / RAG 知识库	AI 的数据准备 · 向量检索
在 SQL 里调用 LLM	AI 函数（AI_COMPLETE / AI_EMBEDDING）
管理和切换多个 LLM 模型	AI Gateway
自然语言对话式数据分析	Data Analytics Agent
自然语言开发 ETL、管理任务、运维诊断	Data Engineering Agent
Python 数据处理 + AI 推理	Zettapark 快速上手

目标：开账号、分权限、搭环境

目标：通过确定性接口调用数据能力，构建自动化数据流水线

场景	推荐接入方式
SQL 执行与结果获取	cz-cli sql · Python connector
任务调度与触发	cz-cli task / runs refill
Studio 任务开发与数据源管理	cz-cli task create/save · Studio 任务开发 · Studio 数据集成

场景	推荐接入方式
Python 数据读写	Zettapark · clickzetta-connector
业务语义层查询	语义视图
与专业数据子 Agent 协作	cz-cli agent run
浏览器自动化 Web Agent	Singclaw

我想做的事	入口
快速体验产品核心功能	Lakehouse 快速入门体验
了解 Studio 界面布局	Lakehouse Studio 快速导览
上传本地 CSV 文件	快速上传导入本地数据
从 MySQL / PG 实时 CDC 同步	Studio 实时同步任务
创建定时同步任务	快速创建同步任务导入数据
挂载 OSS / S3 / COS 对象存储	External Volume
配置 ETL 调度流程	快速配置编排和周期调度 ETL 流程
联邦查询数据湖（Hive / Iceberg）	External Catalog 联邦查询
配置数据质量规则	快速配置和使用数据质量规则
配置监控告警	快速配置和使用监控告警规则
体验引擎性能（TPC-H）	通过 TPC-H 样例数据体验引擎性能
编写复杂业务分析 SQL	SQL 使用指南
用 AI 对话分析数据	Data Analytics Agent（DataGPT）
用 AI 开发 ETL / 管理任务	Data Engineering Agent
构建向量检索 / RAG 知识库	向量检索
用 Python 处理数据（Zettapark）	Zettapark 快速上手
从 Spark 迁移到 Lakehouse	迁移指南

联系我们