2010年7月7日水曜日

ハッシュタグの「参入障壁指数」について仮説を立ててみた。

タイムライン上でハッシュタグを見つけた場合、「使ってみようかなぁ」と思えるものと「これは、使う気になれないなぁ」と思えるものがあるのでは?と感じることがある。
「このハッシュタグ、機会があれば使ってみようかなぁ」と思えるハッシュタグの指標を実際のタイムライン上のtweetから判別して数値化できないか?と考えた。
もちろん、100%数値化できるとは考えていない。あくまでも参考値の指標として、出せればよいと思っている。

「このハッシュタグ、機会があれば使ってみようかなぁ」と思える指標を「ハッシュタグの参入障壁指数」と定義してみる。
「ハッシュタグの参入障壁指数」をどのように出せばよいか下記仮説を立ててみた。

「ハッシュタグの参入障壁指数」=( 「ある1日の当該ハッシュタグでツイートしたアカウント数」÷「ある1日の当該ツイート数」)× 100

私の仮説では、そのハッシュタグを付けてtweetしやすい状態(参入障壁がない状態)では、ハッシュタグの参入障壁指数は
「1」に近づき、そのハッシュタグを付けてtweetし難い状態(参入障壁が高い状態)では、ハッシュタグの参入障壁指数は「0」に近づくのではないかと考えた。

実際にどのように集計したか、以下に示す。

7月7日の「#twiNagoya」の「ハッシュタグの参入障壁指数」を求める。
まず、ハッシュタグクラウドで「#twiNagoya」を検索する。















左下の「データ出力」を押下する。















7月7日の「CSV形式」を押下する。
















・出力されたデータをExcelに貼り付ける。
・Excel上部メニューの「データ」を選択する。
・上部真ん中より少し右にある「区切り位置」を選択する。



















・「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」
を選択して「次へ」を押下する。

















左上の「区切り文字」の欄を「カンマ」のみチェックして「次へ」を押下する。
















・各項目ごとにセルが別れたら、1行目に行を挿入する。


















1行目の「A」列から「E」列にA,B,C,D,Eと入力する。
A列を選択した状態で、上から2段目のメニューの真ん中辺りにある「並べ替え(A⇒Z)」を押下し、
A列を昇順に並べ替える。



上部2段目メニューの右にある「小計」を選択する。

「グループの基準」:A
「集計の方法」:データの個数
「集計するフィールド」:Aのみチェック
「現在の集計表と置き換える」のみチェック

と設定し、「OK」を押下する。








「B2」のセルの数値が、「ある1日の当該ツイート数」となる。















次に、「ある1日の当該ハッシュタグでツイートしたアカウント数」を求める。

・「小計」ボタン押下後にできたセルの左側にある上部の「2」(赤丸がついているところ)を押下して不要な行を折り畳む。

・メモ帳を開く。
・A列を全て選択しコピーする。
・メモ帳にコピーした文字を全て選択(「ctrl」+「A」を押下)後、ExcelのSheet2にコピーする。



・1行目、2行目を除いた行数を数える。
・この場合は、291(293-2)行だった。

・この行数が、「ある1日の当該ハッシュタグでツイートしたアカウント数」となる。

















従って、


「ハッシュタグの参入障壁指数」 (291÷513)×100 = 56.72

となる。

私個人の感覚だと「ハッシュタグの参入障壁指数」が60を超えていると、気軽にそのハッシュタグをつけてtweetできると考える。つまり、「#twiNagoya」はハッシュタグの参入障壁がないともいいきれないし、あるとはいいきれない。

ちなみに、「#ohayo」ハッシュタグの「参入障壁指数」は76.10である。

実際は、「#twiNagoya」のハッシュタグは中京圏の多くの人が気軽にタグをつけてtweetしていると思われる。気軽にtweetできる「ハッシュタグの参入障壁指数」の閾値を下げてもよいのかもしれない。


他のハッシュタグの「ハッシュタグの参入障壁指数」をサンプリングし、参入障壁の閾値を出していきたい。ただ、この計算式以外の条件も付加しなければと考えている。


その他、「ハッシュタグの参入障壁」に関する測定法、ご意見などありましたらお願いいたします。


0 件のコメント:

コメントを投稿