使用SQLAlchemy连接并使用Clickzetta Lakehouse

简介

SQLAlchemy是Python编程语言中的一个SQL工具箱和对象关系映射(ORM)系统。它为Python应用程序开发提供了全面而灵活的SQL功能,使得数据库操作更加便捷。Clickzetta Lakehouse作为一款高性能的数据仓库服务,现已支持SQLAlchemy,使得用户可以更加轻松地进行数据操作和分析。

安装

要使用SQLAlchemy连接Clickzetta Lakehouse,首先需要在您的Python环境中安装clickzetta-sqlalchemy包。使用以下命令进行安装: 安装命令(确保当前环境不需要使用clickzetta-sqlalchemy和clickzetta-connector,需要卸载掉避免依赖冲突):

pip uninstall -y clickzetta-sqlalchemy clickzetta-connector && pip install clickzetta-connector-python

配置连接参数

在使用SQLAlchemy连接Clickzetta Lakehouse时,需要提供正确的连接参数。连接参数的格式如下:

clickzetta://<user_login_name>:<password>@<lakehouse_instance_name>.api.clickzetta.com/<workspace_name>?schema=<target_schema>&virtualcluster=<your_vcluster_name>

其中,各参数的含义如下:

  • <user_login_name>:您的Clickzetta Lakehouse登录用户名。
  • <password>:您的Clickzetta Lakehouse登录密码。
  • <lakehouse_instance_name>:您的Clickzetta Lakehouse实例名称。
  • <workspace_name>:您的Clickzetta Lakehouse工作空间名称。
  • <target_schema>:您希望访问的目标模式(schema)名称。
  • <your_vcluster_name>:您的虚拟集群(virtual cluster)名称。

连接示例

clickzetta://Alice:xxxx@1a2b3c4d.api.clickzetta.com/myworkspace?schema=public&virtualcluster=default_vc

使用Apache Superset连接Clickzetta Lakehouse

在本节中,我们将介绍如何使用Apache Superset连接Clickzetta Lakehouse并进行数据查询及BI分析。

前置条件

  • 确保已成功安装clickzetta-sqlalchemy包。
  • 确保Apache Superset已成功安装并启动。

配置连接

  1. 打开Apache Superset,进入数据库列表页面。
  2. 点击右上角的"添加数据库"按钮,选择"其他"数据库类型。
  3. 在"SQLALCHEMY URI"字段中,填写上述配置的Clickzetta Lakehouse连接参数。
  4. 点击"测试连接",确保连接成功。

配置Superset连接

数据查询及BI分析

连接成功后,您可以使用Apache Superset进行数据查询和BI分析。例如:

  1. 创建一个新的仪表板,并添加图表组件。
  2. 在图表配置页面中,选择刚刚配置的Clickzetta Lakehouse数据库连接。
  3. 编写SQL查询语句,例如:
SELECT
  orders.order_id,
  orders.customer_id,
  orders.order_date,
  orders.total
FROM
  orders
WHERE
  orders.order_date BETWEEN '2022-01-01' AND '2022-12-31';
  1. 点击"执行查询",查看查询结果。
  2. 根据需要调整图表样式和配置,完成BI分析。

Superset数据查询及BI分析

通过以上步骤,您可以轻松地使用Apache Superset连接Clickzetta Lakehouse,实现数据查询和BI分析。

联系我们
预约咨询
微信咨询
电话咨询