云器 Lakehouse 计费说明

计费方式概述

云器 Lakehouse 是基于云原生建设的一体化数据平台,平台会记录您在数据同步、数据分析、存储和网络数据传输等场景下消耗的资源,并按照计算、存储、网络数据传输三种类型,根据服务发生的云平台和地域,向您收取相应的费用。

云器 Lakehouse 的计量计费主要基于以下几个方面:

  • 计算资源:计算资源的计费单元为 CRU* ,1CRU/时 代表在某一云平台的一个服务区域以同样的算力运行 1 小时。您在云器 Lakehouse 使用通用型、分析型、同步型计算集群所进行的数据同步或数据分析,使用 Python、Shell 脚本处理的任务,系统自动处理的自动物化视图(Auto_MV)、数据压缩、作业任务调度等操作,均会产生计算资源的消耗。云器会根据实际消耗的算力用量进行计量计费。
  • 存储资源:存储资源的计费单元为 GiB,其根据您在云器 Lakehouse 上实际使用的存储容量进行计费。以下场景会占用存储容量: 1)在 Lakehouse 中以表、物化视图等形式存储的数据; 2)数据表生命周期内已删除但未清理的数据; 3)查询结果的缓存。其中第 2 项、第 3 项当前仅计量,暂免收费。
  • 网络数据传输:网络数据传输的计费单元为 GB,其根据实际产生的网络数据流量进行计费。以下场景会产生网络数据传输费用:1)公网的数据查询,数据查询结果的全量下载;2)云器 Lakehouse 与其他数据源之间互相的数据传输;3)通过 Internet 、跨 VPC 的网络连接、专线或者其他网络打通过程。其中针对 Internet 网络流量,仅计量从 Lakehouse 流出的网络数据传输量,上传数据至 Lakehouse 不收费。

计费方式

1. 按需计费

在云器 Lakehouse 中,各类资源均是灵活扩展、按需使用的,您只需按照实际使用的资源量进行付费。

资源类型计量方式结算扣费周期
计算资源按秒计量,以 CRU 为单位每小时
存储资源全天 24 小时采样,取平均容量每天
网络数据传输按实际产生的流量计量每小时

此模式主要通过 Lakehouse 控制台充值余额进行抵扣。由于不同云平台、区域下,资源的价格不同,计算、存储和网络数据传输的单价也会存在差异。价格请参考下文的计费原理与定价表,具体以系统内实际账单为准。您可以通过“费用中心”-“计费账单”页面查看资源使用情况及费用明细。

2. 包年预付费

云器 Lakehouse 也可为企业客户提供指定资源规格,按年预付费的计费方式。包年预付费时,计算和存储资源的单价可提供相应折扣,详情请联系云器销售人员。

计费原理

1. 计算资源计费

计算资源的计费项包括:通用型计算集群、分析型计算集群、同步型计算集群、任务调度和 Serverless 作业 5 种,计算资源的计费周期以小时为单位

计算资源各计费项的计费原理如下:

  • 通用型计算集群

当通用型计算集群启动至“运行中”状态,即开始根据集群的规格大小和实例数,产生对应的 CRU 消耗,当该计算集群进入“停止中”状态,则停止产生 CRU 消耗。

通用型计算资源的最小规格为 1CRU,最大规格为 256CRU,规格步长为 1CRU。下表为通用型计算集群的规格及对应的每小时 CRU 消耗:

计算集群规格每小时CRU消耗(CRU*时)
11
22
33
44
55
......
256256
  • 分析型计算集群

分析型计算集群的计费原理与通用型计算集群相同,从“运行中”状态的开启时间进行计量,直至进入“停止中”状态。

分析型计算集群在规格的基础上,支持按实例数自动弹缩。当查询并发超过当前所有实例可承载的最大并发数时,系统会自动扩容实例。每弹缩扩容出一个实例,即会增加一个同等规格分析型计算集群的消耗。当减少一个实例后仍可满足当前并发时,系统会自动缩容,并减少分析型计算资源消耗。分析型集群创建时默认开启弹性伸缩模式,实例默认最小值为 1,最大值为 2,您也可以手动设置实例最小值和实例最大值来实现自动扩缩容功能,最多可以创建25个实例。

分析型计算资源的最小规格为 1CRU,最大规格为 256CRU,规格步长为 2n CRU。下表为分析型计算集群 1 到 5 个实例时,每小时 CRU 消耗,更多实例数以此类推:

计算集群规格1个实例 每小时消耗2个实例 每小时消耗3个实例 每小时消耗4个实例 每小时消耗5个实例 每小时消耗
11 CRU*时2 CRU*时3 CRU*时4 CRU*时5 CRU*时
22 CRU*时4 CRU*时6 CRU*时8 CRU*时10 CRU*时
44 CRU*时8 CRU*时12 CRU*时16 CRU*时20 CRU*时
88 CRU*时16 CRU*时24 CRU*时32 CRU*时40 CRU*时
1616 CRU*时32 CRU*时48 CRU*时64 CRU*时80 CRU*时
3232 CRU*时64 CRU*时96 CRU*时128 CRU*时160 CRU*时
6464 CRU*时128 CRU*时192 CRU*时256 CRU*时320 CRU*时
128128 CRU*时256 CRU*时384 CRU*时512 CRU*时640 CRU*时
256256 CRU*时512 CRU*时768 CRU*时1024 CRU*时1280 CRU*时
  • 同步型计算集群

同步型计算集群用于运行数据同步任务,包括离线同步和实时同步。多个同步任务可提交至同一个同步型计算集群中,以复用资源。同步型计算集群的计费原理与通用型计算集群相同,从“运行中”状态的开启时间进行计量,直至进入“停止中”状态。

注意,同步型计算集群当前处于试运行阶段。在此期间,为了便于您更精细地管理和核算离线与实时业务的成本,系统会以数据同步作业为单位,依据实际资源消耗,将账单明细分别记录在 “离线同步”和“实时同步”计费项,此计费模式下 CRU*时 单价不变。在创建同步型集群时,可使用“规格预估”功能来帮助判断。

离线同步任务可自动唤起同步型计算集群,任务完成后则自动停止;实时同步任务则需要将其所在的同步型计算集群一直保持“运行中”状态。

同步型计算集群正式运行后,数据集成费用会合并至“同步型计算集群”计费项中。新的计费模式发生变更时,我们将提前一个月通知您,确保您有充足的时间进行业务评估。

正式运行后同步型计算集群会对资源规格的选择做限制,最小规格为 0.25CRU,最大规格为 256CRU,规格步长为 0.25CRU。下表为同步型计算集群的规格及对应的每小时 CRU 消耗:

计算集群规格每小时CRU消耗
0.250.25 CRU*时
0.50.5 CRU*时
0.750.75 CRU*时
11 CRU*时
1.251.25 CRU*时
......
256256 CRU*时
  • 任务调度

任务调度计费主要涵盖两类场景:一类是 Python、Shell 等脚本任务执行时产生的调度计算资源消耗;另一类是离线同步、实时同步任务在作业提交和调度管理过程中产生的少量计算资源消耗。

任务调度没有固定的最小规格和步长限制,在所有场景下,任务调度带来的实际资源消耗都会以 CRU*时 为单位生成计费账单。

对于 Python、Shell 等脚本任务,系统会根据任务分配的计算资源和实际运行时长进行计量。计量周期从任务执行启动开始,到任务执行结束为止。

对于离线同步任务,云器 Lakehouse 会提供少量计算资源用于作业提交和调度管理。这部分资源在离线同步任务启动后开始计量,作业排队等待期间不消耗,且在任务执行期间持续存在。

对于实时同步任务,云器 Lakehouse 同样会提供少量计算资源用于作业提交和调度管理。这部分资源在实时集成任务启动后开始计量,并在任务正式运行后结束,该时间段内的计算资源消耗均会被计量。

  • Serverless 作业

Serverless 作业是指无需用户主动创建计算集群实例,由云器 Lakehouse 提供公共计算资源来处理客户计算需求的作业统称。其包含查询作业调度、数据压缩、自动物化视图等。

当前 Serverless 作业的 CRU*时 单价与通用型计算集群相同。

2. 存储资源计费

存储费用根据您在 Lakehouse 平台实际使用的存储容量进行计量计费,存储的计费周期以天为单位

当您在 Lakehouse 数仓中写入数据后,写入的数据及其部分元数据信息会在 Lakehouse 中占用存储容量。Lakehouse 统计您的数据实际占用的存储用量,它将于一天之内多次采样,并以当天采样的存储容量的平均值,作为当天的存储容量计量数值,进行计费。

当您使用 Lakehouse 的 Time Travel 功能时,为了保障数据的多版本、可恢复,Lakehouse 会自动为您的数据进行多版本备份存储。此时产生的多版本备份数据将产生相应的存储费用,并按照存储容量单价收费。

当您进行 SQL 查询时,为降低重复查询的计算资源消耗,会对查询结果进行缓存,以存储成本换取计算资源的节省。这部分存储使用会计入“结果缓存 (Result Cache) ”,按照存储容量单价收费。

当前 Time Travel 结果缓存 (Result Cache) 暂不收费,后续计费状态发生变更时,我们将提前一个月通知您。

3. 网络数据传输计费

当您使用 Lakehouse 作为数据源向外部进行网络数据传输时,如通过公网下载、导出数据,会产生网络数据传输费用。网络数据传输以实际产生的传输数据量进行计量计费,其计费周期以小时为单位

当您使用其他数据源,通过 Internet 网络向 Lakehouse 进行网络数据传入时,其使用的网络传输流量不会产生费用。

当您使用专线、Private Link 或其他网络产品实现跨云厂商、跨地域或跨 VPC 网络打通时,网络打通本身会产生数据传输费用。这部分费用由于网络的打通方式不同会产生多方计费,产生在云器 Lakehouse 侧的网络数据传输费用由云器收取,在您的云平台账号中产生的网络数据传输费用则由云平台直接收取。

4. 其他云资源计费

云器 Lakehouse 在进行元数据管理,解析 SQL 语句、生成查询计划、调度和分配查询任务,以及对数据文件进行合并、清理等操作时,均会消耗云资源。Lakehouse 会对这些云资源的消耗进行计量,当前限时免费,后续计费状态发生变更时,我们将提前一个月通知您。

定价

本章节展示 Lakehouse 按量计费中,其 SaaS 模式在各资源的详细定价。

除 SaaS 模式外,Lakehouse 还支持私有部署,具体价格及方案请联系云器销售人员。

1. 计算资源价格

云厂商区域单价
阿里云上海3.5元/CRU*时
新加坡0.8 美元/CRU*时
腾讯云北京3.5元/CRU*时
上海3.5元/CRU*时
广州3.5元/CRU*时
AWS北京9.95元/CRU*时
新加坡1.24 美元/CRU*时

2. 存储资源价格

云厂商区域存储容量价格
阿里云上海0.12元/GiB/月
新加坡0.017美元/GiB/月
腾讯云北京0.12元/GiB/月
上海0.12元/GiB/月
广州0.12元/GiB/月
AWS北京0.195元/GiB/月
新加坡0.025美元/GiB/月

注意,由于存储的计费周期以天为单位,上表显示的月单价按照 30 天进行折算扣费。

3. 网络数据传输资源价格

云厂商区域网络数据传输价格
阿里云上海0.8 元/GB
新加坡0.081 美元/GB
腾讯云北京0.8 元/GB
上海0.8 元/GB
广州0.8 元/GB
AWS北京0.933 元/GB
新加坡0.12 美元/GB

常见场景下的计费示例

通用型计算集群计费示例

以 SaaS 模式下阿里云上海标准版服务实例为例:

  • 一个规格为 2CRU 的通用型计算集群,运行 1 小时,若 每CRU*时单价为 3.5 元,产生的费用为

    • 1 小时 * 2CRU * 3.5 元/CRU*时 = 7 元
  • 一个规格为 1CRU 的通用型计算集群,运行 1 分 20 秒(约 1.33 分钟),若每CRU*时单价为 3.5 元,产生的费用为

    • 1.33/60 分钟 * 1CRU * 3.5 元/CRU*时 = 0.078 元
  • 一个规格为 1CRU 的通用型计算集群,10:00-10:02 运行 2 分钟,另一个规格为 2CRU 的通用型计算集群,10:00-10:10 运行 10 分钟,若 每CRU*时单价为 3.5 元,产生的费用为

    • (2/60 分钟 * 1CRU * 3.5 元/CRU*时) + (10/60 分钟 * 2CRU * 3.5 元/CRU*时) = 0.117 元 + 1.167 元 = 1.284 元

分析型计算集群计费示例

以 SaaS 模式下阿里云上海标准版服务实例为例:

  • 一个规格为 1CRU 的分析型计算集群,分别以 1 个实例运行了 30 分钟,又以 2 个实例运行了 30 分钟,若 每CRU*时单价为 3.5 元,产生的费用为
    • (30/60 分钟 * 1 个实例 * 1CRU * 3.5 元/CRU*时) + (30/60 分钟 * 2 个实例 * 1CRU * 3.5 元/CRU*时) = 1.75 元 + 3.5 元 = 5.25 元

离线同步任务计费示例

在当前试运行期间,离线同步任务不单独收费,只收取任务提交至同步型计算集群的运行费用。离线同步任务会自动唤起同步型计算集群。

离线同步任务需要消耗资源调度与并发执行的计算资源,一个离线任务通常至少需要约 0.05CRU 的调度资源,总计消耗至少约 0.1CRU (0.05CRU + 1 * 0.05CRU)。由此推算,5个单并发的离线同步任务可刚好用满一个规格为 0.5CRU 的同步型计算集群资源。

以 SaaS 模式下阿里云上海标准版服务实例为例:

  • 一个单并发离线同步任务运行 10 分钟,其每小时实际计算资源消耗为 0.1CRU,若 每CRU*时单价为 3.5 元,产生的费用为

    • 10/60 分钟 * 0.1CRU * 3.5 元/CRU*时 = 0.058 元
  • 一个单并发离线同步任务于 10:00-10:10 分运行 10 分钟,每小时实际消耗资源 0.1CRU,另一个 5 并发的离线同步任务于 10:05-10:25 运行 20 分钟,每小时实际消耗资源 0.3CRU,若 每CRU*时单价为 3.5 元,产生的费用为

    • (5/60 分钟 * 0.1CRU * 3.5 元/CRU*时) + (5/60 分钟 * 0.4CRU * 3.5 元/CRU*时) + (15/60 分钟 * 0.3CRU * 3.5 元/CRU*时) = 0.029 元 + 0.117 元 + 0.263 元 = 0.409 元

实时同步任务计费示例

试运行期间,除了离线同步任务会统计其计算资源消耗,实时同步任务所消耗的同步型计算资源也会被单独计量。

不同于离线同步任务,实时同步任务启动后会持续运行,并在内存中进行实时数据缓存与状态管理。因此,实时任务的执行资源消耗不与并发数呈简单的线性关系,而是主要取决于数据处理的复杂度与所需的状态缓存大小。一个单并发实时同步任务至少会带来约 0.05CRU 的调度资源消耗和约 0.0625 CRU 的执行消耗,每小时一共至少消耗约 0.1125CRU。

以 SaaS 模式下阿里云上海服务实例为例:

  • 一个单并发实时同步任务运行 24 小时,每小时实际消耗资源 0.1125CRU,则需要拉起的最小单位计算集群规格是 0.25CRU,若 每CRU*时单价为 3.5 元,产生的费用为

    • 24 小时 * 0.1125CRU * 3.5 元/CRU*时 = 9.45 元
  • 一个每小时实际消耗 1CRU 的多并发实时同步任务于 1月1日- 5日 运行了 5 天,另一个每小时消耗 2CRU 的多并发实时同步任务于 1月3日- 10日 运行了 8 天,每CRU*时单价为 3.5 元,产生的费用为

    • (2*24 小时 * 1CRU * 3.5 元/CRU时) + (324 小时 * 3CRU * 3.5 元/CRU时) + (524 小时 * 2CRU * 3.5 元/CRU*时) = 168 元 + 756 元 + 840 元 = 1764 元

同步型计算集群价格计费示例

试运行结束后,将以此标准进行同步型计算集群计费。

以 SaaS 模式下阿里云上海服务实例为例:

  • 一个规格为 2CRU 的同步型集群,运行 1 小时,若 每CRU*时单价为 3.5 元,产生的费用为

    • 1 小时 * 2CRU * 3.5 元/CRU*时 = 7 元
  • 一个每小时实际消耗 0.2CRU 的实时同步任务于 1月1日- 5日 运行了 5 天,而在 1 月 2 日 0:00-1:00 还执行了 1 个小时的实际消耗为 0.1 CRU 的离线同步任务,每CRU*时单价为 3.5 元,此时产生的费用为

    • “固定”模式总费用为 5*24 小时 * 0.5CRU * 3.5 元/CRU*时 = 210 元
    • “弹性伸缩”模式总费用为 (1*24 小时 * 0.25CRU * 3.5 元/CRU*时) + (1 小时 * 0.5CRU * 3.5 元/CRU*时) + ( (23+3*24)小时 * 0.25CRU * 3.5 元/CRU*时) = 21 元 + 1.75 元 + 83.125 元 = 105.875 元

由上述例子可见,为了更好地节省同步型计算资源费用,建议多复用同步型计算集群的资源,并避免使用超大规格的同步型计算集群。

任务调度- Python 脚本任务计费示例

Python 脚本任务执行时,会根据任务执行时长和消耗的计算资源进行计费。一般情况下,一个 Python 脚本执行 1 小时,所使用的计算资源为 0.125 CRU。

以 SaaS 模式下阿里云上海服务实例为例:

  • 一个 Python 脚本任务执行时间为 10 分钟,若每CRU*时单价为 3.5 元,产生的费用为
    • 10/60 分钟 * 0.125CRU * 3.5 元/CRU*时 = 0.073 元

存储容量计费示例

以 SaaS 模式下阿里云上海服务实例为例:

  • 一个工作空间内全天的存储容量最低点为 910GiB ,最高点为 1100GiB ,全天平均值为 1000GiB,若存储容量每月单价为 0.12 元(每月按照 30 天计算),当天产生的存储费用为
    • 1/30 月 * 1000GiB * 0.12 元/GiB/月 = 4 元

网络数据传输计费示例

以 SaaS 模式下阿里云上海服务实例为例:

  • 某任务带来的网络数据传输下行流量为 10GB,若网络数据传输每小时单价为 0.8 元,该任务产生的网络数据传输费用为
    • 10GB * 0.8 元/GB = 8 元

联系我们
预约咨询
微信咨询
电话咨询