导出数据到本地

本文档详细介绍了如何将表中数据下载到本地。

目前 Lakehouse 支持两种下载模式:

  1. 使用 Lakehouse Studio 的可视化下载界面。
  2. 使用 JDBC 客户端工具,通过 GET 命令下载文件到本地。

使用 Lakehouse Studio 的可视化下载界面

在数据开发中,执行 SQL 后,可以将结果下载为 Excel 或 CSV 文件。同时,由于界面显示的结果集限制为 10000 条,如果想下载全部数据,可以点击“下载全部 CSV 文件”,如下图所示:

使用 GET 命令下载数据

  1. 前置条件

  2. 将表中数据导出到本地

     --将数据导出到内部user volume中
     COPY INTO USER VOLUME  SUBDIRECTORY 'tmp/'  FROM  TABLE mytable file_format = (type = CSV);;
     
     -- 查看导出的文件
     SHOW  USER VOLUME DIRECTORY;
    +-------------------+------------------------------------------------------------------------------------------------------------+------+---------------------+
    |   relative_path   |                                                    url                                                     | size | last_modified_time  |
    +-------------------+------------------------------------------------------------------------------------------------------------+------+---------------------+
    | tmp/part00001.csv | oss://xxxx/tmp/part00001.csv | 5    | 2024-11-14 19:44:37 |
    +-------------------+------------------------------------------------------------------------------------------------------------+------+---------------------+
    
     --下载文件
     GET  USER VOLUME FILE 'tmp/part00001.csv' to  './';
     --删除volume中文件,避免占用存储
     remove user volume file 'tmp/part00001.csv';
     SHOW  USER VOLUME DIRECTORY;
    +---------------+-----+------+--------------------+
    | relative_path | url | size | last_modified_time |
    +---------------+-----+------+--------------------+
  3. 将查询结果导出到本地

     --将数据导出到内部user volume中

COPY INTO USER VOLUME SUBDIRECTORY 'tmp/' FROM (select 1) file_format = (type = CSV); SHOW USER VOLUME DIRECTORY;

-- 查看导出的文件
SHOW  USER VOLUME DIRECTORY;

+-------------------+------------------------------------------------------------------------------------------------------------+------+---------------------+ | relative_path | url | size | last_modified_time | +-------------------+------------------------------------------------------------------------------------------------------------+------+---------------------+ | tmp/part00001.csv | oss://xxxx/tmp/part00001.csv | 5 | 2024-11-14 19:44:37 | +-------------------+------------------------------------------------------------------------------------------------------------+------+---------------------+

--下载文件
GET  USER VOLUME FILE 'tmp/part00001.csv' to  './';
--删除volume中文件,避免占用存储
remove user volume file 'tmp/part00001.csv';
SHOW  USER VOLUME DIRECTORY;

+---------------+-----+------+--------------------+ | relative_path | url | size | last_modified_time | +---------------+-----+------+--------------------+

联系我们
预约咨询
微信咨询
电话咨询