对话式 AI 数据分析工具:DataGPT
DataGPT 是一款构建于云原生 Lakehouse 架构及其他数据平台之上的下一代智能体(Agentic)分析助手。它将 AI 的认知能力与企业级数据深度融合,超越简单的查询功能,该智能体能够通过自然语言构建动态 AI 仪表板,提供超越传统僵化 BI 工具的富有想象力的可视化灵活性。它还能主动将上下文 AI 洞察嵌入关键图表指标中,即时揭示异常与趋势,在静态的报表中展示发现隐秘的数据洞察。

概念体系:
核心概念: 核心概念体系由两大主要部分组成:数据资产(Data Assets)与分析域(Analysis Domains)。
数据资产 作为企业级分析的基础设施,它涵盖了所有可用于智能分析的核心要素,并经由 DataGPT 语义层(Semantic Layer)进行增强:
-
数据表: 来自 Lakehouse 的结构化基础数据源。
-
DataGPT 语义层要素:
- 指标体系: 基于数据表构建的标准化度量指标。
- 业务术语: 统一的命名规范与解释性定义,旨在为智能体(Agent)提供上下文环境。
-
仪表板: 利用 AI 基于语义层和数据表构建的可视化分析面板。
-
文档: 支持 Agentic RAG 问答的知识文档集合。
-
索引: 为数据表字段建立的索引,旨在加速检索。
:-: 
用户角色及职责划分:
DataGPT系统专为满足数据分析场景中的两大核心用户群体而设计:数据开发人员和业务分析人员。这两类用户在数据价值挖掘过程中承担着独特且相辅相成的职能:
- 数据开发人员:主导数据全生命周期管理,包括数据接入、质量管控、模型构建和语义层设计(涵盖指标体系与答案构建器),并持续优化问答体验。他们利用系统功能,准备数据以供业务分析人员使用。
- 业务分析人员:作为系统核心用户,通过自然语言交互方式深入探索数据,快速获取业务洞察和决策支持。通过反馈流程,他们与数据开发人员沟通,以进一步细化和探索数据,从而获得更深入的理解和洞察。
技术架构:
多源、多类型的数据通过入仓与入湖等方式进入 Lakehouse 系统(若选择 Lakehouse 作为数据引擎):
- 元数据依据数据仓库的权限体系进行统一管理与访问控制。
- 数据通过我们集成的统一引擎(Single Engine)与 AI 引擎完成转换处理与信息抽取。
- 抽取结果以表、向量与倒排索引等形式落库,构建面向智能体的 RAG 准备层(Agentic RAG Preparation Layer)。随后,这些数据由 DataGPT 语义层(Semantic Layer)进一步处理,完成自动化特征分析、知识图谱构建与索引抽取。
- 基于 DIKW 模型,Agentic RAG 层提供“信息(Information)”,而 DataGPT 语义层通过对上下文进行标注、组织与摘要,将其提升为“知识(Knowledge)”。该架构使智能体能够自主规划与推理,为生成式 AI 应用奠定坚实基础。
- Agentic RAG:语义范式的转移
DataGPT 超越了线性的“先检索后生成”流程。通过实施 Agentic RAG,我们将 LLM 从被动的文本生成器转变为分析域(Analysis Domain)内主动的推理智能体(Reasoning Agent)。
-
LLM 驱动的理解: DataGPT 不再单纯依赖向量距离(余弦相似度),而是利用 LLM 的内部认知来解读用户意图。模型会判断“需要什么”,而不仅仅是匹配关键词。
-
主动编排: 智能体充当分析域内的中枢大脑。它自主决定与哪些对象交互:
- 是否需要通过 SQL 查询 数据表(Table)
- 是否需要读取特定的 文件(File)
- 是否需要检查 指标(Metric)定义
-
迭代优化: 如果初步检索的信息不足,智能体将进行自我修正。它执行多步推理以获取额外的上下文,确保最终答案全面且准确。 通过将检索逻辑内化到 LLM 本身,DataGPT 解决了传统 RAG 的局限性:
-
语义保真度: 我们利用模型对业务逻辑和细微差别的多维理解,突破了标准向量搜索的“天花板”。
-
复杂问题解决: 智能体能够处理多跳查询,综合不同数据类型的信息(例如,将仪表板中的销售额下降与文件中的市场报告相关联)。
-
动态适应: 随着分析域中新资产的增加,智能体能够实时调整其推理策略,无需依赖僵化的硬编码索引规则。
-
免费版本限制说明:
感谢您使用云器 DataGPT。目前您使用的是免费版本,为确保您充分了解产品状态,特此说明:
-
当前版本中的功能属于产品早期特性,我们保留对功能进行优化、调整或变更的权利。
-
基于产品发展规划,部分功能可能会升级为付费服务或调整服务范围。在此类变更发生前,我们将提前通知受影响的用户。
-
免费使用期间,产品功能有如下限制:

如您对产品有任何建议,欢迎随时按以下联系方式反馈。
-
电话:400-6767-862
-
企业微信:

