コンテンツの良し悪しを測定するKPIを作る

WEARでコーディネートを投稿している。最初のうちは毎日「いいね」がついたりして気分が良いのだが、コーディネートが蓄積されてくると「これは自分なりにどれくらい良い成績が取れているのだろうか」ということが気になりだす。そこで、成績を元にパフォーマンスの良いコーディネートだけを残し悪いコーディネートを整理する方法がないか考えてみた。いわゆるKPIの作成である。

指標作りにに正解はないとは思うのだが、当初は指標というのは目的を持って作らないとダメなんだなと思った。しかし、やってみるうちに指標づくりそのものが学習なのではないかと思い直した。つまり、コンテンツ作りで最初から「こういうゴールを設定しよう」などと思えるものではなく、ゴールのイメージを作りながらコンテンツを作るのが正しいあり方なのではないかと思ったのだ。

さて、WEARにはページビュー、ハートマーク、SAVEという3つの指標がある。ハートマークは挨拶代わりにつけて行く人が多く、実際に参考にしたいものはSAVEされるということになっている。これらはそれぞれ違った概念なので、これを総合的に評価するのはなかなか難しい。数学が得意であれば、毎回簡単にイメージ化ができるようになるのかもしれないが、高校数学で挫折したという暗い過去があるのだ。高校は理系クラスだったが、国語の先生から「バカか」と言われ、実際には文系の大学に進学したという苦い経験があり、数学にはトラウマを持っている。

そこで、まずエクセルを広げて全ての数字を記入することにした。24コーディネート入るページが7つあるのでだいたい160程度のコーディネートがあったと思う。最初はハートマークとSAVEの数を数えてそれを偏差値化しようと考えた。全体の標準偏差を出してから「平均との距離」/「標準偏差」とするとそれぞれの偏差値が出るというのは、グーグルで検索してわかった。

偏差値を出すのは比較をやりやすくするためだ。それぞればらつきが違っているはずなので、そのままでは比較ができないのである。だが、このやり方をしても二つの指標をどの割合で混ぜて良いかがわからない。これは100点満点ではないという事情がある。つまり国語と算数のテストで偏差値を出すときには両方が100点満点であれば100と100で混ぜて200点満点にすればいいのだが、いいねには満点がないので、それができないのである。

そこでページビューからの割合で偏差値を出すという方法を考えた。

もちろんページビューそのものを指標に使うという方法もあるのだが、これは却下した。例えば中高年に大人気のウルトラライトダウンなどはページビューが伸びるがハートマークやSAVEは増えない。多分、自分で着方を検索する人は多いのだろうが他人のコーディネートを参考にしたりコミュニティでのプレゼンスを高めるためにハートマークを押す人は少ないのである。実はファッションの世界に「流行しているもの」と「みんなが着用したがっているもの」の間に違いがある。

ちなみにブログだと「初動が稼げるもの」と「長く読まれるもの」の間に違いがあり「いいね」がもらえるものも違っている。「いいね」を指標にしたいところなのだが、識者や人気のある人が回覧すると顕著に伸びることがあり、必ずしも文章の良し悪しの指標にはならない。だから、何を目的にして文章を書くのかということを考えながらやらないと、適切な指標が選べない。

さて、途中経過で「偏差値まで出すのは大げさなのではないか」と思ったのだが、残念ながら作業の仮定ではこれ以外の方法を見つけられなかった。冒頭に確認したように、複数の指標を足すときに全てが100点満点であればそれを単純に足し合わせればよい。例えば合格点が70点になるように設問を設定すればより正確な計測システムが作れるだろう。しかし、WEARの場合はどれくらいの露出があるかわからないので満点が出せない。

時期によっても違いがあるようだ。刈り込んだ後の投稿をハートマークとSAVEの獲得割合で座標にプロットしてみた。

青は最近のコーディネートで赤は始めた当時のものである。どうやらハートマークとSAVEの間には相関がないようだ。全体に、SAVEされたりハートマークをつけたりしてもらえる率が上がっていることがわかる。同じ水準で過去のものをみると全て足切りされてしまう。

こうなる仮説はいろいろ考えられる。

  • 最近、フォロワーが増えて挨拶代わりにハートマークがつけてもらえることが増えた。
  • ファッションについて詳しくなり高評価が得られるようになった。
  • 過去のほうがページビューが高いのでその分だけ反応率が減る。

お金が絡む評価ならきっちりと分析する必要があると思うのだが、あくまでも趣味なので「成長したんだな」と思うことにした。これについては古いデータを棄却せずに撮っておけば良かったと思った。作業するときにワークシートを上書きしてしまったのである。

偏差値を出すためには全ての数字を足し合わせなければならなくなるので、計測システムが複雑になる。これを自動化する方法を考えてみたのだが思い浮かばない。WEARはデータをエクスポートする機能がないからだ。だが、いったん指標が作れればその指標に合わせて足切りをすればいいのではないかと思った。この場合ハートマークが60%程度あれば合格でSAVEは6%くらいが合格ということになり、SAVEは参考にしても良いが無視しても構わない。これならば暗算も簡単である。

もう少し真面目にやったらどうなるのかと思ってRを持ち出してクラスター分析をしてみた。ただ、Rは普段から使うようにしておかないと簡単なこと(例えばデータフレームを作る)などがわからなくなる。今回もCSVを読み込むべきところをテキストで読み込んでしまい、その後の作業ができずに15分ほど悩んでしまった。

k-means法(理屈は難しいのだが、単にkmeansという関数を使えば分析自体は簡単にできてしまう)でグルーピングしたところやはりSAVEは関係がなさそうだ。Rだと露出の50%程度のところで切ればなんとなく足切りができそうである。

このようにデータを統計処理することによりなんとなく目標が見えてくる。今は50%程度の獲得率しかないのだが、これを上げて行けば良いということがわかる。こうした指標作りを通して目標が作れるので活動がより具体的にできる。

今回ポイントになるのは数学が苦手な人でもパソコンさえあれば容易に統計処理ができるということである。

Google Recommendation Advertisement