ClickZetta SQLAlchemy 适配器
clickzetta-connector-python
为 SQLAlchemy 提供的 ClickZetta Lakehouse 的 dialect 适配器,它允许使用 SQLAlchemy 接口编写的代码或上层应用轻松地与 ClickZetta Lakehouse 进行交互。
安装
通过 pip 安装 clickzetta-connector-python
:
pip install clickzetta-connector-python -U
快速入门
执行 SQL 查询
from sqlalchemy import create_engine
from sqlalchemy import text
# 创建 ClickZetta Lakehouse 的 SQLAlchemy 引擎实例
engine = create_engine(
"clickzetta://username:password@instance.api.clickzetta.com/workspace?schema=schema&vcluster=default"
)
# 执行 SQL 查询
sql = text("SELECT * FROM ecommerce_events_multicategorystore_live;")
# 使用引擎执行查询
with engine.connect() as conn:
result = conn.execute(sql)
for row in result:
print(row)
示例:使用 PyGWalker 对 Lakehouse 数据进行可视化分析
PyGWalker 是一个可以将 pandas 和 polars 数据框转换为 Tableau 风格的用户界面,以进行数据可视化探索的工具。它简化了 Jupyter Notebook 数据分析和数据可视化工作流程,只需添加一行代码即可实现。
from sqlalchemy import create_engine
from sqlalchemy import text
import pandas as pd
import pygwalker as pyg
# 创建 ClickZetta Lakehouse 的 SQLAlchemy 引擎实例
engine = create_engine(
"clickzetta://username:password@instance.api.clickzetta.com/workspace?schema=schema&vcluster=default"
)
# 执行 SQL 查询
sql = text("SELECT * FROM ecommerce_events_multicategorystore_live;")
# 使用引擎执行查询并获取结果
with engine.connect() as conn:
result = conn.execute(sql)
df = pd.DataFrame(result.fetchall(), columns=result.keys())
# 使用 PyGWalker 对 DataFrame 进行可视化分析
walker = pyg.walk(df)