サンプルデモ03 関連キーワードフィルターを使って好きなツイートに絞り込む

サンプルデモ03 関連キーワードフィルターを使って好きなツイートに絞り込む


阿修羅ワークス
阿修羅ワークス
次は関連キーワードフィルターを使った方法です。
はい。お願いします。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
関連キーワードフィルターはキーワード検索のゆらぎを補正する役割があります。
キーワード検索のゆらぎというのはなんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
ゆらぎというのは、例えば検索キーワードに「受験に」というキーワードを指定したとします。 さて、このキーワードで取得できるツイートはどういうものでしょうか?
うーん、「受験に」ですから合格したというツイートが取得できるんでしょうか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
そうですね。「受験に」と続けば接続詞的に「合格」というようなツイートが取得できます。しかし、逆に「失敗」というツイートも取得できてしまいますよね。これがゆらぎです。
あっなるほど。「受験に」だけだと曖昧過ぎて合格したとか失敗したとか、落ちたというツイートも出てくるわけですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
そういうことですね。 ちょっとやってみましょうか。

投稿データを見てみる

ほんとだー。いろんなタイプの受験に関するツイートが取得できますね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
はい。これを恣意的に「受験に○○で大変」という内容だけをフィルタリングしてみますね。

投稿データを見てみる

おおっー。見事に受験で苦労して大変みたいなツイートだけが出てきましたね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
はい。 このように関連キーワードフィルターはツイートをフィルタリングすることができます。 さきほどの例は文中に「大変」というキーワードを含んだツイートだったのですが、次は文頭、つまり文の最初が特定のキーワードで始まるツイートだけに絞り込んでみましょう。 試しに「大学」で始まるツイートを探してみます。

投稿データを見てみる

あっほんとですね。でも、さっきよりは全然少ない結果になりましたね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
そうですね。文中よりも文頭にあるキーワードが来る方が確率が低くなるので取得できるツイートも激減します。 最後に文末、つまり文章の最後が特定のキーワードで終わるツイートだけに絞り込んでみましょう。 試しに「…」で終わるツイートを探してみます。

投稿データを見てみる

これもちゃんと取得できましたね。 やっぱり文末を指定すると絞り込まれ過ぎちゃうんですね。
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
あとはTwitter検索のオプションである-(マイナス)記号を付けて否定検索なんかと組み合せるともっと狙ったツイートが取得できますよ。
へぇーーー奥が深いですねぇ!
ランファ
ランファ