SQL 函数

云器 Lakehouse 内置丰富的 SQL 函数库,覆盖数值计算、字符串处理、时间操作、复杂类型、聚合与窗口分析,以及向量检索、BITMAP 人群圈选等 AI 和分析场景专用函数。


函数分类

核心计算

分类说明
操作符算术、比较、逻辑、位运算操作符
数学函数ABS、ROUND、CEIL、FLOOR、POWER、LOG 等数值计算
条件函数IF、IFF、CASE WHEN、COALESCE、NULLIF、NVL 等条件判断
类型转化函数CAST、TRY_CAST 及各类型转换函数

字符串与正则

分类说明
字符串函数CONCAT、SUBSTR、TRIM、REPLACE、SPLIT、LENGTH 等
正则函数REGEXP_LIKE、REGEXP_EXTRACT、REGEXP_REPLACE 等
加密与脱敏函数MD5、SHA256、AES 加解密、数据脱敏
HASH 函数HASH、MURMUR_HASH 等散列函数

时间与日期

分类说明
时间函数DATE_ADD、DATE_DIFF、DATE_FORMAT、CONVERT_TIMEZONE、CURRENT_TIMESTAMP 等

复杂类型

分类说明
ARRAY 函数ARRAY_AGG、ARRAY_CONTAINS、EXPLODE、SORT_ARRAY 等
MAP 函数MAP_KEYS、MAP_VALUES、MAP_CONTAINS_KEY 等
STRUCT 函数STRUCT 构造与字段访问
JSON 函数JSON_VALUE、JSON_EXTRACT、JSON_OBJECT、JSON_ARRAY 等
高阶函数TRANSFORM、FILTER、AGGREGATE、REDUCE 等 Lambda 函数

聚合与窗口

分类说明
聚合函数COUNT、SUM、AVG、MAX、MIN、PERCENTILE、CORR 等
窗口函数ROW_NUMBER、RANK、LAG、LEAD、SUM OVER、NTILE 等

AI 与分析专用

AI Functions 是云器 Lakehouse 的原生 AI 能力,直接在 SQL 中调用大语言模型和 Embedding 模型,无需离开数据平台即可完成文本理解、向量化、内容生成等任务。所有 AI 函数第一个参数均为

model
model
,格式为
'endpoint:模型名'
'endpoint:模型名'
(通过 AI Gateway 配置)。

函数说明
AI_COMPLETE通用 LLM 补全,支持自定义 Prompt,适合复杂推理、代码生成等自定义场景,支持图像输入
AI_EMBEDDING将文本转为高维向量(ARRAY<FLOAT>),用于语义检索、RAG、推荐、聚类
AI_CLASSIFY将文本或图像归入用户定义的类别,无需编写 Prompt,支持 29+ 语言
AI_EXTRACT从非结构化文本或图像中按指定字段提取结构化 JSON,无需编写 Prompt
AI_SENTIMENT情感倾向分析,返回 positive / negative / neutral,支持多语言
AI_SUMMARIZE生成文本摘要,支持
max_words
max_words
控制摘要长度
AI_TRANSLATE文本翻译,源语言自动检测,支持 20+ 语言互译
AI_FIX_GRAMMAR自动修复语法、拼写和标点错误,支持中英文及多语言混合
AI_MASK识别并脱敏 PII 敏感信息,用
[MASKED]
[MASKED]
替换,标签由用户自定义
AI_SIMILARITY计算两段文本的余弦相似度,返回 [0, 1] 分值
AI_TRANSCRIBE将音频文件转录为纯文本(ASR),支持中英文等多语言

完整说明与示例:AI 函数使用指南 · AI 函数概述 · AI Gateway 配置

分类说明
向量函数向量距离计算(cosine_distance、l2_distance 等)、向量相似度搜索
搜索函数全文检索评分函数,配合倒排索引使用
BITMAP 函数BITMAP_AND、BITMAP_OR、BITMAP_CARDINALITY 等人群圈选与 UV 统计

数据库与系统

分类说明
上下文函数CURRENT_USER、CURRENT_DATABASE、VERSION 等会话信息
表函数EXPLODE、GENERATE_SERIES、UNNEST 等返回表的函数
文件函数Volume 文件操作相关函数
分区函数分区裁剪与分区元数据查询函数

其他

分类说明
GEO 函数地理空间计算:距离、坐标转换等
IP 函数IP 地址解析、归属地查询等
BIT 函数BIT_COUNT、SHIFTLEFT、SHIFTRIGHT 等位操作函数

相关文档

文档说明
数据类型各类型说明,了解函数输入输出类型
SQL 函数使用指南常用场景函数速查与使用技巧
AI 函数(AI_COMPLETE / AI_EMBEDDING)在 SQL 中调用 LLM 和向量 Embedding
联系我们
预约咨询
微信咨询
电话咨询
邮件咨询