deltaLakeCluster テーブル関数
これは deltaLake テーブル関数の拡張です。
指定したクラスタ内の多数のノードから、Amazon S3 上の Delta Lake テーブルのファイルを並列処理できるようにします。イニシエーターはクラスタ内のすべてのノードへの接続を確立し、各ファイルを動的に割り振ります。ワーカーノードは、処理すべき次のタスクについてイニシエーターに問い合わせ、そのタスクを処理します。すべてのタスクが完了するまで、これが繰り返されます。
構文
deltaLakeS3Cluster は deltaLakeCluster のエイリアスで、どちらも S3 用です。
引数
cluster_name— リモートおよびローカルサーバーへのアドレスや接続パラメータのセットを構成するために使用されるクラスタの名前。- その他すべての引数の説明は、同等の deltaLake テーブル関数における引数の説明と同一です。
- オプションの
extra_credentialsパラメータを使用して、ClickHouse Cloud でロールベースアクセス用のrole_arnを渡すことができます。設定手順については、Secure S3 を参照してください。
返される値
S3 内の指定された Delta Lake テーブルのうち、クラスタからデータを読み取るために指定された構造を持つテーブル。
仮想カラム
_path— ファイルへのパス。型:LowCardinality(String)。_file— ファイル名。型:LowCardinality(String)。_size— ファイルのサイズ (バイト単位) 。型:Nullable(UInt64)。ファイルサイズが不明な場合、値はNULLになります。_time— ファイルの最終更新時刻。型:Nullable(DateTime)。時刻が不明な場合、値はNULLになります。_etag— ファイルの ETag。型:LowCardinality(String)。ETag が不明な場合、値はNULLになります。