ワードクラウドの表示について

ワードクラウドの表示方法についての質問となります。

例えば、"商談結果"のようなテキストフィールドを使用すると、
商談結果の内容ごとに表示されますが、特定の単語に集約して
表示する方法(計算フィールド)や、機能はありますでしょうか?

@yo.oy
ご質問いただきありがとうございます。

特定の単語に集約して表示する方法

というのは具体的には、どのようなことを期待されているのでしょうか?
詳細をお聞かせいただけないでしょうか?

Word Cloudの基本的な振る舞いは、 Amazon QuickSight - Visualization Basics (Japanese) のワークショップの、 ビジュアル、計算フィールドの作成 の、「5)売上データをプロダクト別に比較表示」の箇所が該当します。

ご返信ありがとうございます。

例えば、各レコードの"商談結果"フィールドに以下のような情報があったとします。
・価格が理由で失注に至った。競合のA社が受注内定したとのこと。
・品質面はポジティブな反応であったが、納入開始の納期がマッチせず、採用見送りとなった。
・トップ間での面談時に、要望価格まで値下げすることを○○部長が表明し、受注になった。

"商談結果"をワードクラウドに使用した際、例えば
・価格
・納期
・品質
等々、特定のワードが自動で表示されるイメージで質問させていただきました。

上記をQuicksightの標準機能での対応可否、もしくは関数を使っての表現可否につきアドバイスをいただけますと幸いです。

@yo.oy さん、ワードクラウドはGROUP BYのフィールドに指定したディメンション内の値をそのまま表示する仕組みとなります。そのため、ご説明頂いたように文章を単一のキーワードにサマライズして表示することはQuickSight単体ではできませんが、データの前処理工程で工夫をすることで実現は可能かと思います。

例えばAWSでは Amazon Bedrock と言う様々な生成AIのモデルをAPIで利用できるサービスがあります。データセットの商談結果フィールドを基に、商談結果の決定要因を単一のキーワードとして出力し、データセットに付加することができます。

以下はイメージしやすいよう、Bedrockのコンソール上でAnthropic Claude 3.5 Sonnet v2というモデルを使って試した例です。

ご覧いただけるように、各行に対してキーワードのフィールドが付与できており、このフィールドをワードクラウドのGROUP BYフィールドで利用することで最終的にはご要望を実現できると考えています。

ちなみにデータセットが大規模な場合には各モデルに定められたトークン数制限に抵触する可能性があるため、一定のレコード数に分割して上記例のようなプロンプトを分割数分だけ実行する必要があります。Bedrockにはバッチ推論機能もあり、予めS3上に用意しておいたデータを元に大量の推論を一括で、かつオンデマンドに比べ50%OFFの料金で実行することができるため、このようなデータの前処理に適しています。

QuickSightの範囲を出る話にはなってしまいましたが、ご検討いただけますと幸いです。

1 Like

QuickSight Communityにご質問いただき、ありがとうございます。
@ytakahr さんの返答で解決しておりますでしょうか?
Solutionとしてマークさせていただきますが、もし解決していないようでしたら、改めてご質問頂けると幸いです。

返信が遅くなり申し訳ございません。
ご教示いただきありがとうございました。