ClickZetta SQLAlchemy 适配器

clickzetta-connector-python 为 SQLAlchemy 提供的 ClickZetta Lakehouse 的 dialect 适配器,它允许使用 SQLAlchemy 接口编写的代码或上层应用轻松地与 ClickZetta Lakehouse 进行交互。

安装

通过 pip 安装 clickzetta-connector-python

pip install clickzetta-connector-python -U

快速入门

执行 SQL 查询

from sqlalchemy import create_engine
from sqlalchemy import text

# 创建 ClickZetta Lakehouse 的 SQLAlchemy 引擎实例
engine = create_engine(
    "clickzetta://username:password@instance.api.clickzetta.com/workspace?schema=schema&vcluster=default"
)

# 执行 SQL 查询
sql = text("SELECT * FROM ecommerce_events_multicategorystore_live;")

# 使用引擎执行查询
with engine.connect() as conn:
    result = conn.execute(sql)
    for row in result:
        print(row)

示例:使用 PyGWalker 对 Lakehouse 数据进行可视化分析

PyGWalker 是一个可以将 pandas 和 polars 数据框转换为 Tableau 风格的用户界面,以进行数据可视化探索的工具。它简化了 Jupyter Notebook 数据分析和数据可视化工作流程,只需添加一行代码即可实现。

from sqlalchemy import create_engine
from sqlalchemy import text
import pandas as pd
import pygwalker as pyg

# 创建 ClickZetta Lakehouse 的 SQLAlchemy 引擎实例
engine = create_engine(
    "clickzetta://username:password@instance.api.clickzetta.com/workspace?schema=schema&vcluster=default"
)

# 执行 SQL 查询
sql = text("SELECT * FROM ecommerce_events_multicategorystore_live;")

# 使用引擎执行查询并获取结果
with engine.connect() as conn:
    result = conn.execute(sql)
    df = pd.DataFrame(result.fetchall(), columns=result.keys())

# 使用 PyGWalker 对 DataFrame 进行可视化分析
walker = pyg.walk(df)

联系我们
预约咨询
微信咨询
电话咨询