#03■訪問目的のデータ化
検索エンジン経由での来訪では、検索テキスト文がアクセスログに記録されます。
この検索文を単語(形態素)に分割し、「全来訪者×全検索語」の行列を作ります。
行列内の各数値は、各来訪者がその検索語によって来訪した回数です。
つまり、この行列は「個々の来訪者が求めている情報内容」を表しています。
そして、この行列と、先ほどの「来訪者のページ閲覧パターン」を表す行列の間に、
「行方向に来訪者が並んでいる」という共通性があり、1つに連結できます。
実際に連結すると次のようになります。
さらに、「サイトが発信する情報内容」を表す行列とも、「Page1〜PageX」の部分を共有しているので、
3つの行列は大きな1つの行列にまとめることができます。
この大きな行列は、「来訪者のページ閲覧パターン」を媒介として、「個々の来訪者が求めている情報内容」と「
サイトが発信する情報内容」を関係づけるような行列である、ということができます。
これに先ほどと同様の計算を行えば、来訪者たちの求めるものに、サイト側の発信情報が どのように対応しているのかを表す 次のようなマップが得られます。
グレー色の文字が「サイトが発信している情報」で、 赤色の文字は「来訪者の検索語」を表します。 文字の大きさは、いずれも回数(つまり重要度)を表します。
この例では左上に「30分でわかる」の赤色文字があります。「30分でわかる量子力学」という検索ワードで 来訪した人が、同じく左上方向に多数重なって表示されている専門的なページ群を閲覧していることを示します。 これらの人々は「30分でわかる量子力学」というサイト名称を既に知っている、一部の常連です。
右下方向、赤色表示の「参考書」を求めて来訪した場合は、やはり右下の書籍紹介コーナーを中心に 体験している様子が確認できます。 すぐそばに「入門書」や「書籍」などのグレー文字、 つまり発信内容も見えますので、このセグメントのニーズに、きちんと対応できていることがわかります。
そして、圧倒的に多くの人が、左下方向から、「量子力学」や「量子」を求めて来訪していることが分ります。 この左下方向には、トップページと、そのトップページから誘導されるメインコンテンツの最初の2ページ部分 が見えます。
ひとつのサイトが、多彩なセグメントに、それぞれ異なった体験を実現している様を、 このように可視化できます。 それぞれのセグメントごとに、どのようなページを追加すればよいのか、その戦略を考えるための俯瞰図として 活用できます。
似たようなページは、同じ場所に重なって配置されてしまいます。
逆に、必要なページが欠落していると、その空間が空いて表示されます。
空白となっている場所の周囲を見渡して、何が必要なのかを考えられます。