产品
解决方案
客户案例
资源中心
活动中心
关于我们
免费资源包
HOT
AI × Lakehouse:云器Lakehouse + Datus 从SQL查询到自然语言交互,扩展数据团队的能力边界
数据见闻
2025年12月10日
云器 Lakehouse 集成 Datus,自然语言交互打通数据查询与运维,拓展全员数据能力。

作者:七良 云器科技 联合创始人 & CPO

导读

数据平台越来越强大,但使用门槛依然很高——业务人员需要懂SQL,临时分析要等数据团队,系统运维需要专业技能。

云器Lakehouse集 成开源数据工程智能体Datus ,用户可实现用自然语言和大数据系统对话

例如数据分析师可以问“检查昨天的作业状态”,Datus自动诊断问题并给出修复建议。问“上周促销效果怎么样”,3分钟得到完整分析;从1天到3分钟,数据平台的分析师获得了一个专属的辅助agent,帮助他完成复杂的开发、运维、调度等工作。

这就是Datus与云器Lakehouse集成的价值:降低数据使用门槛,通过AI更全面拓展数据分析师与架构师的能力边界

作为企业核心的平台工具,云器Lakehouse通过统一架构降低了平台建设和维护的门槛,Datus在这个技术底座上进一步降低数据使用门槛。业务人员不用学SQL就能查数据,数据工程师说句话就能管系统。两者结合,技术底座的简化与智能交互的赋能相互协同,真正实现全员数据能力。

什么是Datus

Datus是一个开源的数据工程智能体(open-source data engineering agent),专为数据系统构建可演化的上下文环境。Datus代表了数据工程的范式转变:从传统的“构建表和数据管道”转向“为分析师和业务用户提供具有领域感知能力的智能代理”。

简单来说,Datus让你用自然语言和数据库对话,无需编写SQL。

核心价值:

  • 降低使用门槛 :业务人员无需学SQL,自然语言自动转换为查询并执行;
  • 提高分析效率 :查询时间从30分钟降至3分钟,上下文学习让准确率持续提升;
  • 超越数据查询 :通过MCP协议调用系统工具,作业监控、性能分析也能说人话。

两种使用方式:

Datus-CLI :面向数据工程师的命令行工具

Datus-Chat :面向分析师和业务用户的Web界面

Datus如何与云器Lakehouse协同工作


┌─────────────────────────────────────────────────────────────────┐
│                      User Interface Layer                       │
├──────────────────────────────┬──────────────────────────────────┤
│         Datus-CLI            │         Datus-Chat               │
│      (Command Line)          │       (Web Interface)            │
│  ┌─────────────────────────┐ │  ┌─────────────────────────────┐ │
│  │ • Natural Lang Query    │ │  │ • Multi-turn Conversations  │ │
│  │ • SQL Generation        │ │  │ • Subagent Selection        │ │
│  │ • MCP Tool Invocation   │ │  │ • Feedback Mechanisms       │ │
│  └─────────────────────────┘ │  └─────────────────────────────┘ │
└──────────────────────────────┴──────────────────────────────────┘
                                │
                                ▼
┌─────────────────────────────────────────────────────────────────┐
│                     Datus Agent Core                            │
├─────────────────────────────────────────────────────────────────┤
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────────────┐ │
│ │ AI Models   │ │ Subagents   │ │     Context Management      │ │
│ │             │ │             │ │                             │ │
│ │ • Qwen      │ │ • lakehouse │ │ • Database Schema           │ │
│ │ • DeepSeek  │ │ • mcp_agent │ │ • Query History             │ │
│ │ • OpenAI    │ │             │ │ • Embedding Vectors         │ │
│ │ • Claude    │ │             │ │ • Knowledge Base            │ │
│ └─────────────┘ └─────────────┘ └─────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
                                │
               ┌────────────────┴────────────────┐
               ▼                                 ▼
    (Datus-Lakehouse)                 (MCP Protocol)
┌─────────────────────────┐      ┌─────────────────────────┐
│      Data Layer         │      │    Tool Extension       │
├─────────────────────────┤      ├─────────────────────────┤
│  ClickZetta Lakehouse   │◄─────┤ ClickZetta MCP Server   │
│                         │      │                         │
│ ┌─────────────────────┐ │      │ ┌─────────────────────┐ │
│ │ • Data Storage      │ │      │ │ • Instance Mgmt     │ │
│ │ • Compute Engine    │ │      │ │ • Job Monitoring    │ │
│ │ • SQL Execution     │ │      │ │ • System Ops        │ │
│ │ • Metadata Mgmt     │ │      │ │ • Analytics         │ │
│ └─────────────────────┘ │      │ └─────────────────────┘ │
│                         │      │                         │
│ Connection:             │      │ Connection:             │
│ • Service Endpoint      │      │ • HTTP Transport        │
│ • Username/Password     │      │ • SSE Transport         │
│ • Instance/Workspace    │      │ • Tool Filtering        │
└─────────────────────────┘      └─────────────────────────┘

(Datus + Lakehouse架构图)

三层架构解析

用户交互层

  • Datus-CLI :数据工程师命令行工具,适合开发、调试、自动化场景。
  • Datus-Chat :分析师和业务用户Web界面,友好的对话式交互。

Datus Agent核心

  • AI模型层 : 支持多种大语言模型,可根据任务类型选择最适合的模型。
  • 子代理管理 : 不同的智能代理负责不同的业务场景。
  • 上下文管理 : 维护数据系统的知识图谱和查询上下文。

数据与工具层

  • 云器Lakehouse : 提供数据存储、计算和SQL执行能力。
  • 云器Lakehouse MCP Server : 云器Lakehouse官方提供的MCP服务器,通过标准化协议扩展系统能力,提供高级管理和分析工具。

连接关系

1、Datus↔云器Lakehouse :标准数据库连接,SQL查询和元数据获取

2、Datus↔云器MCP Server :MCP协议,调用高级管理和分析工具

3、MCP Server↔云器Lakehouse :MCP Server管理底层数据平台

集成价值:降低数据使用门槛

Datus + 云器Lakehouse:让数据查询人人可用

云器Lakehouse提供强大的数据处理能力,与Datus集成后,带来四大核心价值:

1、降低使用门槛

业务人员无需学习SQL,直接用自然语言提问。传统方式需要写复杂的SQL语句,现在只需问"最近一周各品类的销售额TOP10",Datus自动生成SQL并返回结果。

价值量化 :业务用户数据自助率从15%提升至60%,无需SQL培训即可上手。

2、提高分析效率

自然语言查询大幅减少数据探索时间。简单查询从15分钟降至1分钟,临时分析从30分钟降至3分钟,多轮探索从2小时降至15分钟。

典型场景 :数据分析师问"分析Q4销售情况",Datus返回分析结果后,继续追问"哪个月增长最快"、"分析11月各品类的贡献",整个过程10分钟完成,传统方式需要1-2小时。

3、智能化洞察

Datus不只返回数据,还提供智能分析和建议。用户问"分析上月销售数据",Datus会指出核心指标完成情况、关键发现(如哪些品类表现突出、哪些需要关注),以及具体的业务建议。

4、中文友好

针对中文语境优化,理解GMV、UV、DAU等业务术语,支持"上个月"="最近30天"="11月"等多种表达,结果用中文自然呈现。

Datus + 云器Lakehouse MCP Server:让系统管理也能说人话

通过云器官方MCP Server,Datus的能力从数据查询扩展到系统管理:

1、实例管理

用自然语言切换环境和实例。传统方式需要SSH登录、执行多条命令,现在只需说"切换到生产环境的华东区实例",Datus自动完成切换并显示实例状态。

2、作业监控

智能诊断作业问题。问"昨天有哪些作业失败了?为什么失败?",Datus自动分析日志,给出失败原因、根因分析和修复建议。

价值量化 :运维巡检时间从2小时降至15分钟,问题诊断速度提升5倍,非技术人员也能完成基础运维。

3、系统运维

用自然语言查询系统状态。说"检查系统健康状况",Datus返回CPU、内存、磁盘使用率,以及查询量、平均响应时间等关键指标。

4、高级分析

智能分析性能趋势。问"分析最近一周的查询性能趋势",Datus自动识别性能瓶颈,给出具体优化建议,并可自动执行优化。

5、工作流自动化

将复杂流程封装为简单指令。说"帮我做一次完整的系统巡检并生成报告",Datus自动执行实例检查、作业监控、性能分析、安全检查等一系列操作,生成报告并发送。

谁适合用这个方案

如果你是数据分析师

每天被各种临时需求淹没?写SQL、调试、等待查询、解释结果,忙到没时间思考业务本身?

Datus让你从重复劳动中解放出来。用自然语言快速探索数据,多轮对话深入分析,把时间花在洞察业务上,而不是写SQL上。查询时间从30分钟降到3分钟,你会发现一天能做的事情多了好几倍。

如果你是业务人员

想看数据,但不懂SQL?每次都要找数据团队,等半天才能拿到结果,有时候还要反复沟通好几轮?

现在你可以自己动手了。直接问"上周促销效果怎么样"、"哪个渠道转化率最高",3分钟得到答案。不用学SQL,不用等人,想看什么数据随时问,决策速度提升10倍。

如果你是数据工程师

系统出问题了,要SSH登录、查日志、分析原因,半天才能定位到问题?日常巡检要盯着一堆监控面板?

试试用自然语言管理系统。问"昨天哪些作业失败了",Datus自动诊断给出修复建议;说"检查系统健康状况",所有关键指标一目了然。把精力放在架构优化和创新上,别浪费在重复运维上。

如果你是决策者

每次开会前都要临时找人拉数据?等到数据出来,讨论的最佳时机已经过了?

装个Datus Chat在手机上,随时随地问数据。早会前问一句"昨天核心指标怎么样",马上心中有数。发现异常立即追问,不用等报告,数据驱动决策变成了现实。

快速开始:15分钟上手体验

第一步:准备云器Lakehouse环境

1、注册云器账号

2、创建实例

  • 在控制台创建一个测试实例
  • 记录连接信息(endpoint、用户名、密码)

第二步:安装和配置Datus

# 安装Datus Agent
pip install datus-agent
# 初始化配置
datus config init --provider clickzetta
# 按提示输入云器实例连接信息

配置文件示例:

# ~/.datus/config.yaml
lakehouse:
  service_endpoint: "https://your-instance.clickzetta.com"
  username: "your_username"
  password: "${LAKEHOUSE_PASSWORD}"  # 建议用环境变量
  instance: "your-instance"
  workspace: "default"

第三步:第一个查询

方式1:命令行

datus ask "展示数据库中有哪些表"

方式2:交互模式

datus chat
> 有哪些数据表?
> 查询sales_fact表的前10行
> 分析最近一周的销售趋势

方式3:Web界面

# 启动Web服务
datus serve --port 8080
# 浏览器访问 http://localhost:8080

15分钟你能体验到

✅ 用自然语言查询数据

✅ 看到SQL是如何自动生成的

✅ 感受Datus的智能程度

✅ 体验云器Lakehouse的查询速度

✅ 尝试MCP工具的系统管理能力

总结:实现全员数据能力

从"技术门槛"到"人人可用"

通过云器Lakehouse与Datus的集成,我们实现了数据使用方式的根本性转变:

对比维度传统模式Datus + 云器模式
数据查询需要懂SQL自然语言查询,无需SQL
临时分析等待数据团队响应即问即答,3分钟得到结果
系统运维需要专业技能自然语言管理,人人可为
业务用户依赖技术团队数据自主,自助率60%
数据团队疲于应付重复需求专注创新和高价值工作
决策速度小时级到天级分钟级

正如云器科技CEO喻思成所说:"让数据和AI更普惠,像煤气炉一样触手可及——不需要专业团队,不需要开源自建,只管提需求,其他的交给平台。"

集成方案的独特价值

云器Lakehouse与Datus的集成不是简单的功能叠加,而是1+1>2的协同效应。

双通道设计 让数据查询和系统管理完美结合。通过Datus-ClickZetta连接器,用户可以稳定可靠地查询数据;通过MCP协议,用户还能调用云器的系统管理工具。数据分析和系统运维在同一个自然语言界面完成,不需要在多个系统间切换。

三层架构 满足不同角色的需求。用户层提供CLI和Chat双入口,数据工程师用命令行,业务用户用Web界面;智能层包含AI模型调度、子代理管理和上下文学习,让Datus越用越聪明;平台层由云器Lakehouse和MCP Server提供坚实的技术底座。

全场景覆盖 让这个方案真正适用于企业的各种需求。无论是简单的数据查询,还是复杂的探索分析;无论是系统监控,还是性能优化;无论是一次性查询,还是自动化工作流,Datus + 云器Lakehouse都能胜任。

免费体验云器Lakehouse

https://yunqi.tech

云器Lakehouse+Datus集成指南:

https://yunqi.tech/documents/Datus_Lakehouse_Integrated_Guide


🎁 新用户专享福利

✅  1 TB 存储 · 1 CRU时/天计算 · 1 年全托管体验

➤ 即刻访问云器官网领取:https://www.yunqi.tech/product/one-year-package

image.png

云器Lakehouse现已开放注册
欢迎申请体验,每个账号开通会获赠一定金额的代金券,助您快速试用体验。如需更多代金券额度,请您联系商务获取。
预约咨询
微信咨询
电话咨询