deltaLakeCluster Table Function
Это расширение табличной функции deltaLake.
Позволяет параллельно обрабатывать файлы из таблиц Delta Lake в Amazon S3 одновременно с нескольких узлов указанного кластера. На инициаторе создаётся подключение ко всем узлам в кластере, и каждый файл динамически распределяется между ними. Рабочий узел запрашивает у инициатора следующую задачу для обработки и обрабатывает её. Это повторяется до тех пор, пока все задачи не будут выполнены.
Синтаксис
deltaLakeS3Cluster — это псевдоним deltaLakeCluster, оба используются с S3.
Аргументы
cluster_name— имя кластера, которое используется для формирования набора адресов и параметров подключения к удалённым и локальным серверам.- Описание всех остальных аргументов аналогично описанию аргументов в эквивалентной табличной функции deltaLake.
- Необязательный параметр
extra_credentialsможно использовать для передачиrole_arnдля ролевого доступа в ClickHouse Cloud. См. Secure S3 для выполнения шагов настройки.
Возвращаемое значение
Таблица с указанной структурой для чтения данных с кластера из указанной таблицы Delta Lake в S3.
Виртуальные столбцы
_path— путь к файлу. Тип:LowCardinality(String)._file— имя файла. Тип:LowCardinality(String)._size— размер файла в байтах. Тип:Nullable(UInt64). Если размер файла неизвестен, значение —NULL._time— время последнего изменения файла. Тип:Nullable(DateTime). Если время неизвестно, значение —NULL._etag— ETag файла. Тип:LowCardinality(String). Если ETag неизвестен, значение —NULL.