IBM Watson Explorerを利用した コグニティブ プラットフォーム サービス Magic Insight

ブログ

2018.06.14

意外と知られていない、ファセットに表示されている「頻度」とは

意外と知られていない、ファセットに表示されている「頻度」とは

弊社の新入社員をはじめ、Watson Explorerを使い始めのお客様に聞くと、
9割の方が「知らなかった」という反応が返ってくる「頻度」。
今日はその頻度に関する分析結果をご紹介します。

今までのブログでも、頻度は「件数」として取り扱ってきました。
この件数について問題です。例えば次の5つの文章を分析した場合、Watson Explorerはどのように件数をカウントすると思いますか。

意外と知られていない、ファセットに表示されている「頻度」とは

このように、キーワードの出現回数ではなく、キーワードを含む文章の件数が表示されますよ!

件数に関するよくあるお問い合わせ その1

例えば、先ほどの例で、「走行」と「エンジン」のどちらかを含む文章に絞り込んだときに
5件+3件=8件になるはずなのに、どうして8件にならないの?というお問い合わせをよくいただきます。

件数に関するよくある問い合わせ その1

こちらはもうブログの読者さんなら分かると思いますが、走行とエンジン両方のを含む文章はどちらにもカウントされています。
そのため、単純に足した数にはならないのです。

件数に関するよくあるお問い合わせ その2

このキーワードは表示させたくないのですが、除外できますよね?というご質問もよくいただきます。
ファセットで、あるキーワードを選択して除外(and not)の虫メガネマークをクリックすると
そのキーワードを除外することになります。
しかしながら、除外されるのはキーワードでなく
文章が除外されるという認識を持っていることが大切です。

件数に関するよくある問い合わせ その1

例えば、今回の例で「ギア」についてはこのファセットに表示させたくないので除外してしまおう!と除外をしてしまうと、「ギア」を含む文章全体が分析対象から除外されてしまいます。
こうなってしまうと重要な文章も除外してしまうこともありえます。
そのため、除外をしたい場合には慎重な判断が必要になります。

「ギア」を含む文章全体が分析対象から除外されてしまいます。

今日は初歩的な内容ではありましたが、分析をこれから始める方にとっては重要なことなのでご紹介いたしました。
このブログを読んでいただき、少しでもWatson Explorerへの理解が深まると嬉しいです。

Top
eNetSolutions