阿里云私有存储配置

本指南将帮助您在阿里云对象存储服务(OSS)上配置BYOS(私有存储),使ClickZetta Lakehouse能够使用您的OSS存储桶作为数据存储位置。

前提条件

  • 拥有阿里云账号并开通OSS服务
  • 了解您的ClickZetta Lakehouse实例所在的云平台和地域(Region)
  • 拥有OSS存储桶的管理权限

步骤一:准备OSS存储桶

创建新存储桶(推荐)

如果您选择创建新的存储桶专用于ClickZetta Lakehouse:

  1. 登录阿里云OSS控制台

    访问:https://oss.console.aliyun.com

  2. 点击"创建Bucket"

配置Bucket基本信息

配置项设置值说明
Bucket名称自定义(如:my-company-lakehouse全局唯一,建议包含用途标识
地域与Lakehouse实例相同⚠️ 关键要求:必须选择与ClickZetta Lakehouse实例相同的地域
存储类型标准存储避免使用低频或归档存储,频繁读取会产生超额取回费用
存储冗余类型本地冗余存储(LRS)可根据需求选择同城冗余(ZRS)
读写权限私有确保数据安全
服务端加密Lakehouse会自行管理加密,全局加密可能影响性能。
版本控制关闭避免产生额外费用
定时备份关闭对象存储内的备份由于缺少元数据u,单独备份出的数据不可读。如需备份,可使用Lakehouse的time travel功能进行备份。

使用已有存储桶

如果您选择使用已有的存储桶:

验证地域配置

存储桶必须与ClickZetta Lakehouse实例在同一地域(Region)。例如:- Lakehouse实例在:阿里云华东2(上海)- OSS Bucket必须在:华东2(上海)

您的服务实例所在“云服务商和地域”信息可在服务实例首页查询到:

选择存储路径

您可以选择以下方式之一:

方式一:使用整个Bucket(推荐

适用场景:Bucket专用于Lakehouse

方式二:使用Bucket下的特定目录

适用场景:需要在同一Bucket中隔离不同用途的数据


数据安全警告

1. 请确保所选路径不与其他业务系统共用;

2. ClickZetta Lakehouse会对该路径下的文件进行读、写、删除操作;

3. 共用路径可能导致:

  • 数据被意外删除或覆盖
  • 影响其他业务系统的正常运行
  • 数据一致性问题

建议:为Lakehouse创建独立的Bucket或使用独立的目录。

记录必要信息

请记录以下信息,后续配置时需要使用:

  • Bucket名称
  • Bucket所在地域
  • 存储路径(如使用子目录)
  • 您的阿里云主账号ID

查看主账号ID的方法:

  1. 登录阿里云控制台
  2. 点击右上角头像
  3. 在"账号信息"中查看"账号ID"

步骤二:配置Bucket访问策略

1. 进入Bucket管理页面

  • 在OSS控制台找到您的Bucket
    • 点击Bucket名称进入详情页

2. 进入权限控制页面

  • 点击左侧菜单"权限控制" → "Bucket授权策略"
  • 点击"添加授权"

3. 配置授权策略

选择"自定义授权",填写以下信息:

配置项设置值
授权资源acs:oss:*:*:your-bucket-name/*acs:oss:*:*:your-bucket-name/your-path/*
授权用户填写ClickZetta Lakehouse的主账号ID:1384322691904283
授权操作选择"完全控制"
条件不设置

为什么需要完全控制权限

ClickZetta Lakehouse需要该路径下的完全控制权限来确保能正常进行数据的增删和读写功能。

完成上述配置后,即可将您的私有存储路径和云平台主账号ID用于私有存储的新建中。

联系我们
预约咨询
微信咨询
电话咨询