trswkz
1
ECサイト内の全購入データの一覧をデータセットとして持っているときに
"ユーザごとの購入金額の分布"をヒストグラムで表示したいと考えています。
| ユーザID | 購入金額 | 購入日時 |
といったものを想定していただいて大丈夫です。
その際に、SQLでいうところの "SELECT ユーザID, SUM(購入金額) FROM TABLE GROUP BY ユーザID"のようにユーザ毎の購入金額の合計を算出し、そちらの分布を表示したいです。
今、sumOver(購入金額, [ユーザID], PRE_AGG) として計算フィールドを作り、ヒストグラムに入れてみたところ、カウントがレコード数になってしまいます。
仮に1ユーザが1000円の購入を10回しただけのデータの場合、(9000-10000]の部分は数値が10(=購入回数)となってしまいます。これを1(=ユーザ数)としたいです。
Wakana
2
@trswkz
QuickSight Communityに投稿いただき、ありがとうございます!
ヒストグラムは、数値フィールドの分布を表現できますが、その数値データの(バケット化した)絶対数を使用します。
代替案としては、ユーザ毎の購入金額の分布であれば、購入金額をバケット分類する以下のような計算フィールドを作成し、
ifelse(
purchase<=100, '0-100',
purchase<=200, '101-200',
purchase<=300, '201-300',
purchase<=400, '301-400',
purchase<=500, '401-500',
'501-')
垂直棒グラフのX軸に指定し、値とグループに、ユーザIDを入れて、カウント集計とさらに集計することで、満たすことができるように思います。
1 Like