Skip to main content
Edit this page

uniqHLL12

HyperLogLog アルゴリズムを使用して、異なる引数値の概算数を計算します。

uniqHLL12(x[, ...])

引数

この関数は可変数のパラメータを取ります。パラメータは TupleArrayDateDateTimeString、または数値型である可能性があります。

戻り値

実装の詳細

この関数は次のように実装されています:

  • 集計内のすべてのパラメータに対しハッシュ計算を行い、それを用いて計算を実行します。

  • HyperLogLog アルゴリズムを使用して、異なる引数値の数を概算します。

      2^12 の5ビットセルが使用されます。状態のサイズはわずかに2.5KBを超えます。小さなデータセット(<10K要素)の場合、結果はあまり正確ではありません(最大約10%の誤差)。しかし、高いカーディナリティを持つデータセット(10K-100M)の場合、結果は非常に正確で、最大誤差は約1.6%です。100M以上では、推定誤差が増加し、非常に高いカーディナリティを持つデータセット(1B+要素)に対しては非常に不正確な結果を返します。
  • 決定的な結果を提供します(クエリ処理の順序に依存しない)。

この関数の使用はお勧めしません。ほとんどの場合、uniq または uniqCombined 関数を使用してください。

関連項目