quantileTDigestWeighted
数値データシーケンスに対して、t-digest アルゴリズムを用いておおよその 分位数 を計算します。各要素の重みを考慮します。最大誤差は 1% です。メモリ消費量は log(n) に比例し、ここで n は値の数です。
この関数のパフォーマンスは、quantile や quantileTiming よりも劣ります。State サイズと精度の比率という観点では、この関数は quantile よりも優れています。
結果はクエリの実行順序に依存し、非決定的です。
1 つのクエリ内で異なるレベルの複数の quantile* 関数を使用する場合、内部状態は結合されません(つまり、クエリは本来よりも非効率に動作します)。このような場合は、代わりに quantiles 関数を使用してください。
注記
quantileTDigestWeighted の使用は、非常に小さなデータセットに対しては推奨されておらず、大きな誤差につながる可能性があります。このような場合は、代わりに quantileTDigest の利用を検討してください。
構文
エイリアス: medianTDigestWeighted.
引数
level— 分位数のレベル。省略可能なパラメータ。0 から 1 までの定数の浮動小数点数です。levelの値として[0.01, 0.99]の範囲を使用することを推奨します。デフォルト値: 0.5。level=0.5のとき、この関数は中央値を計算します。expr— 数値データ型、Date または DateTime を結果とするカラム値に対する式。weight— シーケンス要素の重みを含むカラム。重みは値の出現回数です。
戻り値
- 指定したレベルの近似分位数。
型:
例
クエリ:
結果:
関連項目