DataGPT 快速入门

开通 DataGPT 服务

  • 在管理中心”首页”中找到 DataGPT 产品卡片,点击“免费开通”按钮。

  • 弹出窗口中会默认指定云服务商阿里云和地域华东2(上海)。系统提供了 “同时开通阿里云-华东2(上海)的 Lakehouse 实例作为默认数据源” 选项:
    • 勾选(推荐新用户):将自动开通阿里云-华东2(上海) Lakehouse 作为默认数据源,无需手动配置。
    • 不勾选:系统不会自动开通华东2(上海)地区的 Lakehouse 实例,可以在服务开通后,在数据源管理页面手动添加。请注意,此情况下 DataGPT 不会包含预置的样例数据

  • 点击“开通”,稍等片刻后即可进入使用界面

完成服务开通后,您可以通过多种方式开启DataGPT数据分析体验。为帮助您快速上手,我们提供以下分析路径:

方式一:使用样例分析域

利用样例数据集提问:我们已为您准备了一个配置完善的样例数据集,包含了完整的表配置和指标体系。您可以直接开始提问,快速体验智能分析能力。同时,这个样例也可以作为模板,帮助您创建适合自己业务场景的分析域。

进入产品主页 ,在主页面找到标有”样例”的分析域,点击“开始分析”进入分析主页,就可以开始提问。

方式二:基于自己的数据进行分析

系统支持多种数据格式的导入,包括 CSV、Text、Excel、PDF 等。您可以创建独立的分析域,将数据导入后即可进行智能分析和问答。

本案例将以巴西著名电商平台Olist的真实业务数据为例,展示系统的数据分析能力。我们将导入以下核心数据文件:

核心业务数据

olist_orders_dataset.csv.gz (订单主表)

olist_order_items_dataset.csv.gz (订单商品明细)

olist_order_payments_dataset.csv.gz (支付信息)

olist_products_dataset.csv.gz (商品信息)

用户与商家数据

olist_customers_dataset.csv.gz (客户信息)

olist_sellers_dataset.csv.gz (卖家信息)

这些数据文件采用了gzip压缩格式(.gz)以提升传输效率,系统会自动进行解压和识别处理。数据之间通过订单号(order_id)、商品编号(product_id)等关键字段建立关联关系,形成完整的业务分析数据链路。

Step1: 新建分析域

Step2: 基础配置

  • 分析域名称:用户需填写分析域名称,例如 "巴西 Olist 电商数据分析"
  • 数据源:选择 LAKEHOUSE 作为底层数据平台(默认)

其它选项保持默认。点击确认创建分析域。

Step3: 添加数据

  • 新建分析域之后,会弹出提示添加数据,点击添加数据 -> 表,点击开始添加
  • 选择“上传文件”,添加上述几份文件到系统中。点击下一步开始解析

  • 点击下一步上传数据:

  • 自动数据语义层构建:
    • 数据自动画像:自动分析数据集的基础统计特征,包括数据分布、缺失值、异常值等关键指标
    • 列描述、别名的智能补充:说明:对于别名,系统已生成别名建议,选择后生效
    • 列类型自动识别:连续性(Continuous)、类别型(Categorical)、时间和日期(Date_And_Time)、分区(Partition)和其它(Other)
    • 列用途:过滤条件(FILTER)、时间过滤条件(DATETIME_FILTER)、维度(DIM)、度量(MEASURE)
    • 关联关系自动识别:如果上传的表数量超过1张,将自动判断关联关系
    • 自动指标推荐:自动生成具有业务含义的指标

数据准备就绪后,就可以用自然语言的方式开始问答。

联系我们
预约咨询
微信咨询
电话咨询