SQL 函数
云器 Lakehouse 内置丰富的 SQL 函数库,覆盖数值计算、字符串处理、时间操作、复杂类型、聚合与窗口分析,以及向量检索、BITMAP 人群圈选等 AI 和分析场景专用函数。
函数分类
核心计算
| 分类 | 说明 |
|---|
| 操作符 | 算术、比较、逻辑、位运算操作符 |
| 数学函数 | ABS、ROUND、CEIL、FLOOR、POWER、LOG 等数值计算 |
| 条件函数 | IF、IFF、CASE WHEN、COALESCE、NULLIF、NVL 等条件判断 |
| 类型转化函数 | CAST、TRY_CAST 及各类型转换函数 |
字符串与正则
| 分类 | 说明 |
|---|
| 字符串函数 | CONCAT、SUBSTR、TRIM、REPLACE、SPLIT、LENGTH 等 |
| 正则函数 | REGEXP_LIKE、REGEXP_EXTRACT、REGEXP_REPLACE 等 |
| 加密与脱敏函数 | MD5、SHA256、AES 加解密、数据脱敏 |
| HASH 函数 | HASH、MURMUR_HASH 等散列函数 |
时间与日期
| 分类 | 说明 |
|---|
| 时间函数 | DATE_ADD、DATE_DIFF、DATE_FORMAT、CONVERT_TIMEZONE、CURRENT_TIMESTAMP 等 |
复杂类型
| 分类 | 说明 |
|---|
| ARRAY 函数 | ARRAY_AGG、ARRAY_CONTAINS、EXPLODE、SORT_ARRAY 等 |
| MAP 函数 | MAP_KEYS、MAP_VALUES、MAP_CONTAINS_KEY 等 |
| STRUCT 函数 | STRUCT 构造与字段访问 |
| JSON 函数 | JSON_VALUE、JSON_EXTRACT、JSON_OBJECT、JSON_ARRAY 等 |
| 高阶函数 | TRANSFORM、FILTER、AGGREGATE、REDUCE 等 Lambda 函数 |
聚合与窗口
| 分类 | 说明 |
|---|
| 聚合函数 | COUNT、SUM、AVG、MAX、MIN、PERCENTILE、CORR 等 |
| 窗口函数 | ROW_NUMBER、RANK、LAG、LEAD、SUM OVER、NTILE 等 |
AI 与分析专用
AI Functions 是云器 Lakehouse 的原生 AI 能力,直接在 SQL 中调用大语言模型和 Embedding 模型,无需离开数据平台即可完成文本理解、向量化、内容生成等任务。所有 AI 函数第一个参数均为
model
model
,格式为
'endpoint:模型名'
'endpoint:模型名'
(通过
AI Gateway 配置)。
完整说明与示例:AI 函数使用指南 · AI 函数概述 · AI Gateway 配置
| 分类 | 说明 |
|---|
| 向量函数 | 向量距离计算(cosine_distance、l2_distance 等)、向量相似度搜索 |
| 搜索函数 | 全文检索评分函数,配合倒排索引使用 |
| BITMAP 函数 | BITMAP_AND、BITMAP_OR、BITMAP_CARDINALITY 等人群圈选与 UV 统计 |
数据库与系统
| 分类 | 说明 |
|---|
| 上下文函数 | CURRENT_USER、CURRENT_DATABASE、VERSION 等会话信息 |
| 表函数 | EXPLODE、GENERATE_SERIES、UNNEST 等返回表的函数 |
| 文件函数 | Volume 文件操作相关函数 |
| 分区函数 | 分区裁剪与分区元数据查询函数 |
其他
| 分类 | 说明 |
|---|
| GEO 函数 | 地理空间计算:距离、坐标转换等 |
| IP 函数 | IP 地址解析、归属地查询等 |
| BIT 函数 | BIT_COUNT、SHIFTLEFT、SHIFTRIGHT 等位操作函数 |
相关文档