作者:七良 云器科技 联合创始人 & CPO
导读
数据平台越来越强大,但使用门槛依然很高——业务人员需要懂SQL,临时分析要等数据团队,系统运维需要专业技能。
云器Lakehouse集 成开源数据工程智能体Datus ,用户可实现用自然语言和大数据系统对话 。
例如数据分析师可以问“检查昨天的作业状态”,Datus自动诊断问题并给出修复建议。问“上周促销效果怎么样”,3分钟得到完整分析;从1天到3分钟,数据平台的分析师获得了一个专属的辅助agent,帮助他完成复杂的开发、运维、调度等工作。
这就是Datus与云器Lakehouse集成的价值:降低数据使用门槛,通过AI更全面拓展数据分析师与架构师的能力边界 。
作为企业核心的平台工具,云器Lakehouse通过统一架构降低了平台建设和维护的门槛,Datus在这个技术底座上进一步降低数据使用门槛。业务人员不用学SQL就能查数据,数据工程师说句话就能管系统。两者结合,技术底座的简化与智能交互的赋能相互协同,真正实现全员数据能力。
什么是Datus
Datus是一个开源的数据工程智能体(open-source data engineering agent),专为数据系统构建可演化的上下文环境。Datus代表了数据工程的范式转变:从传统的“构建表和数据管道”转向“为分析师和业务用户提供具有领域感知能力的智能代理”。
简单来说,Datus让你用自然语言和数据库对话,无需编写SQL。
核心价值:
- 降低使用门槛 :业务人员无需学SQL,自然语言自动转换为查询并执行;
- 提高分析效率 :查询时间从30分钟降至3分钟,上下文学习让准确率持续提升;
- 超越数据查询 :通过MCP协议调用系统工具,作业监控、性能分析也能说人话。
两种使用方式:
Datus-CLI :面向数据工程师的命令行工具
Datus-Chat :面向分析师和业务用户的Web界面
Datus如何与云器Lakehouse协同工作
┌─────────────────────────────────────────────────────────────────┐
│ User Interface Layer │
├──────────────────────────────┬──────────────────────────────────┤
│ Datus-CLI │ Datus-Chat │
│ (Command Line) │ (Web Interface) │
│ ┌─────────────────────────┐ │ ┌─────────────────────────────┐ │
│ │ • Natural Lang Query │ │ │ • Multi-turn Conversations │ │
│ │ • SQL Generation │ │ │ • Subagent Selection │ │
│ │ • MCP Tool Invocation │ │ │ • Feedback Mechanisms │ │
│ └─────────────────────────┘ │ └─────────────────────────────┘ │
└──────────────────────────────┴──────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────┐
│ Datus Agent Core │
├─────────────────────────────────────────────────────────────────┤
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────────────┐ │
│ │ AI Models │ │ Subagents │ │ Context Management │ │
│ │ │ │ │ │ │ │
│ │ • Qwen │ │ • lakehouse │ │ • Database Schema │ │
│ │ • DeepSeek │ │ • mcp_agent │ │ • Query History │ │
│ │ • OpenAI │ │ │ │ • Embedding Vectors │ │
│ │ • Claude │ │ │ │ • Knowledge Base │ │
│ └─────────────┘ └─────────────┘ └─────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
│
┌────────────────┴────────────────┐
▼ ▼
(Datus-Lakehouse) (MCP Protocol)
┌─────────────────────────┐ ┌─────────────────────────┐
│ Data Layer │ │ Tool Extension │
├─────────────────────────┤ ├─────────────────────────┤
│ ClickZetta Lakehouse │◄─────┤ ClickZetta MCP Server │
│ │ │ │
│ ┌─────────────────────┐ │ │ ┌─────────────────────┐ │
│ │ • Data Storage │ │ │ │ • Instance Mgmt │ │
│ │ • Compute Engine │ │ │ │ • Job Monitoring │ │
│ │ • SQL Execution │ │ │ │ • System Ops │ │
│ │ • Metadata Mgmt │ │ │ │ • Analytics │ │
│ └─────────────────────┘ │ │ └─────────────────────┘ │
│ │ │ │
│ Connection: │ │ Connection: │
│ • Service Endpoint │ │ • HTTP Transport │
│ • Username/Password │ │ • SSE Transport │
│ • Instance/Workspace │ │ • Tool Filtering │
└─────────────────────────┘ └─────────────────────────┘
(Datus + Lakehouse架构图)
三层架构解析
用户交互层
- Datus-CLI :数据工程师命令行工具,适合开发、调试、自动化场景。
- Datus-Chat :分析师和业务用户Web界面,友好的对话式交互。
Datus Agent核心
- AI模型层 : 支持多种大语言模型,可根据任务类型选择最适合的模型。
- 子代理管理 : 不同的智能代理负责不同的业务场景。
- 上下文管理 : 维护数据系统的知识图谱和查询上下文。
数据与工具层
- 云器Lakehouse : 提供数据存储、计算和SQL执行能力。
- 云器Lakehouse MCP Server : 云器Lakehouse官方提供的MCP服务器,通过标准化协议扩展系统能力,提供高级管理和分析工具。
连接关系
1、Datus↔云器Lakehouse :标准数据库连接,SQL查询和元数据获取
2、Datus↔云器MCP Server :MCP协议,调用高级管理和分析工具
3、MCP Server↔云器Lakehouse :MCP Server管理底层数据平台
集成价值:降低数据使用门槛
Datus + 云器Lakehouse:让数据查询人人可用
云器Lakehouse提供强大的数据处理能力,与Datus集成后,带来四大核心价值:
1、降低使用门槛
业务人员无需学习SQL,直接用自然语言提问。传统方式需要写复杂的SQL语句,现在只需问"最近一周各品类的销售额TOP10",Datus自动生成SQL并返回结果。
价值量化 :业务用户数据自助率从15%提升至60%,无需SQL培训即可上手。
2、提高分析效率
自然语言查询大幅减少数据探索时间。简单查询从15分钟降至1分钟,临时分析从30分钟降至3分钟,多轮探索从2小时降至15分钟。
典型场景 :数据分析师问"分析Q4销售情况",Datus返回分析结果后,继续追问"哪个月增长最快"、"分析11月各品类的贡献",整个过程10分钟完成,传统方式需要1-2小时。
3、智能化洞察
Datus不只返回数据,还提供智能分析和建议。用户问"分析上月销售数据",Datus会指出核心指标完成情况、关键发现(如哪些品类表现突出、哪些需要关注),以及具体的业务建议。
4、中文友好
针对中文语境优化,理解GMV、UV、DAU等业务术语,支持"上个月"="最近30天"="11月"等多种表达,结果用中文自然呈现。
Datus + 云器Lakehouse MCP Server:让系统管理也能说人话
通过云器官方MCP Server,Datus的能力从数据查询扩展到系统管理:
1、实例管理
用自然语言切换环境和实例。传统方式需要SSH登录、执行多条命令,现在只需说"切换到生产环境的华东区实例",Datus自动完成切换并显示实例状态。
2、作业监控
智能诊断作业问题。问"昨天有哪些作业失败了?为什么失败?",Datus自动分析日志,给出失败原因、根因分析和修复建议。
价值量化 :运维巡检时间从2小时降至15分钟,问题诊断速度提升5倍,非技术人员也能完成基础运维。
3、系统运维
用自然语言查询系统状态。说"检查系统健康状况",Datus返回CPU、内存、磁盘使用率,以及查询量、平均响应时间等关键指标。
4、高级分析
智能分析性能趋势。问"分析最近一周的查询性能趋势",Datus自动识别性能瓶颈,给出具体优化建议,并可自动执行优化。
5、工作流自动化
将复杂流程封装为简单指令。说"帮我做一次完整的系统巡检并生成报告",Datus自动执行实例检查、作业监控、性能分析、安全检查等一系列操作,生成报告并发送。
谁适合用这个方案
如果你是数据分析师
每天被各种临时需求淹没?写SQL、调试、等待查询、解释结果,忙到没时间思考业务本身?
Datus让你从重复劳动中解放出来。用自然语言快速探索数据,多轮对话深入分析,把时间花在洞察业务上,而不是写SQL上。查询时间从30分钟降到3分钟,你会发现一天能做的事情多了好几倍。
如果你是业务人员
想看数据,但不懂SQL?每次都要找数据团队,等半天才能拿到结果,有时候还要反复沟通好几轮?
现在你可以自己动手了。直接问"上周促销效果怎么样"、"哪个渠道转化率最高",3分钟得到答案。不用学SQL,不用等人,想看什么数据随时问,决策速度提升10倍。
如果你是数据工程师
系统出问题了,要SSH登录、查日志、分析原因,半天才能定位到问题?日常巡检要盯着一堆监控面板?
试试用自然语言管理系统。问"昨天哪些作业失败了",Datus自动诊断给出修复建议;说"检查系统健康状况",所有关键指标一目了然。把精力放在架构优化和创新上,别浪费在重复运维上。
如果你是决策者
每次开会前都要临时找人拉数据?等到数据出来,讨论的最佳时机已经过了?
装个Datus Chat在手机上,随时随地问数据。早会前问一句"昨天核心指标怎么样",马上心中有数。发现异常立即追问,不用等报告,数据驱动决策变成了现实。
快速开始:15分钟上手体验
第一步:准备云器Lakehouse环境
1、注册云器账号
- 访问 https://yunqi.tech
- 注册并获取免费试用额度
2、创建实例
- 在控制台创建一个测试实例
- 记录连接信息(endpoint、用户名、密码)
第二步:安装和配置Datus
# 安装Datus Agent
pip install datus-agent
# 初始化配置
datus config init --provider clickzetta
# 按提示输入云器实例连接信息
配置文件示例:
# ~/.datus/config.yaml
lakehouse:
service_endpoint: "https://your-instance.clickzetta.com"
username: "your_username"
password: "${LAKEHOUSE_PASSWORD}" # 建议用环境变量
instance: "your-instance"
workspace: "default"
第三步:第一个查询
方式1:命令行
datus ask "展示数据库中有哪些表"
方式2:交互模式
datus chat
> 有哪些数据表?
> 查询sales_fact表的前10行
> 分析最近一周的销售趋势
方式3:Web界面
# 启动Web服务
datus serve --port 8080
# 浏览器访问 http://localhost:8080
15分钟你能体验到
✅ 用自然语言查询数据
✅ 看到SQL是如何自动生成的
✅ 感受Datus的智能程度
✅ 体验云器Lakehouse的查询速度
✅ 尝试MCP工具的系统管理能力
总结:实现全员数据能力
从"技术门槛"到"人人可用"
通过云器Lakehouse与Datus的集成,我们实现了数据使用方式的根本性转变:
| 对比维度 | 传统模式 | Datus + 云器模式 |
|---|---|---|
| 数据查询 | 需要懂SQL | 自然语言查询,无需SQL |
| 临时分析 | 等待数据团队响应 | 即问即答,3分钟得到结果 |
| 系统运维 | 需要专业技能 | 自然语言管理,人人可为 |
| 业务用户 | 依赖技术团队 | 数据自主,自助率60% |
| 数据团队 | 疲于应付重复需求 | 专注创新和高价值工作 |
| 决策速度 | 小时级到天级 | 分钟级 |
正如云器科技CEO喻思成所说:"让数据和AI更普惠,像煤气炉一样触手可及——不需要专业团队,不需要开源自建,只管提需求,其他的交给平台。"
集成方案的独特价值
云器Lakehouse与Datus的集成不是简单的功能叠加,而是1+1>2的协同效应。
双通道设计 让数据查询和系统管理完美结合。通过Datus-ClickZetta连接器,用户可以稳定可靠地查询数据;通过MCP协议,用户还能调用云器的系统管理工具。数据分析和系统运维在同一个自然语言界面完成,不需要在多个系统间切换。
三层架构 满足不同角色的需求。用户层提供CLI和Chat双入口,数据工程师用命令行,业务用户用Web界面;智能层包含AI模型调度、子代理管理和上下文学习,让Datus越用越聪明;平台层由云器Lakehouse和MCP Server提供坚实的技术底座。
全场景覆盖 让这个方案真正适用于企业的各种需求。无论是简单的数据查询,还是复杂的探索分析;无论是系统监控,还是性能优化;无论是一次性查询,还是自动化工作流,Datus + 云器Lakehouse都能胜任。
免费体验云器Lakehouse:
云器Lakehouse+Datus集成指南:
https://yunqi.tech/documents/Datus_Lakehouse_Integrated_Guide
🎁 新用户专享福利
✅ 1 TB 存储 · 1 CRU时/天计算 · 1 年全托管体验
➤ 即刻访问云器官网领取:https://www.yunqi.tech/product/one-year-package


