ゲット・ツイート・イン 関連性のないツイートが表示される | ワードプレス魔改造屋

ゲット・ツイート・イン 関連性のないツイートが表示される

こちら設定の「14. タイトルをキーワードとして使う際の連結単語数」を「3」に設定しているのですが最初の単語のみでツイートを収集し表示されています。

例えばこちらのタイトルですと⇨【画像】旨いラーメンチェーンランキングがこちらwww「あの店」が無い模様www

「画像・旨い・ラーメン」と検索履歴に表示されていても、実際は最初の「画像」のみで検索しているようです。その結果まったく関連性のないツイートが表示されています。

それと、NGワードや置き換え辞書も機能していないようです。「画像」などをNGワードや置き換え辞書で登録しても「画像」で検索してしまいます。

一度初期化してデフォルト設定でも使用してみましたが同じ症状になりましたのでこちらからご報告させていただきます。

お忙しいところ大変恐縮ですがどうか改善していただけますと幸いです。

コメント

  1. 2020/05/26(火) 17:35:36
    検索と辞書がおかしいということですね。
    こちらでも検証させて頂きます。
  2. 2020/05/29(金) 16:03:12
    新機能を実装したバージョンをリリースしました。

    > こちら設定の「14. タイトルをキーワードとして使う際の連結単語数」を「3」に設定しているのですが最初の単語のみでツイートを収集し表示されています。
    >
    > 例えばこちらのタイトルですと⇨【画像】旨いラーメンチェーンランキングがこちらwww「あの店」が無い模様www
    >
    > 「画像・旨い・ラーメン」と検索履歴に表示されていても、実際は最初の「画像」のみで検索しているようです。その結果まったく関連性のないツイートが表示されています。


    私の方で再現したところタイトルが「【画像】旨いラーメンチェーンランキングがこちらwww「あの店」が無い模様www」という場合は初期設定では「画像」「ラーメンチェーンランキング」「がこちら」

    という3語に分割されます。

    「17. コンテンツ境界」は「漢字とひらがなとカタカナ」
    「16. タイトルをキーワードとして使う際の単語の最低文字数」は「2」となっています。
    ※「16. タイトルをキーワードとして使う際の単語の最低文字数」は新機能として実装しました。


    「画像 ラーメンチェーンランキング がこちら」で検索すると同様のタイトルのツイートが検索されますが、「7. 類似のツイートを削除するか」を「する」にしておくと重複ツイートが削除されます。
    結果的に2020年5月29日現在、こちらのツイートが1件だけ表示されます。

    https://twitter.com/cherrybomb2018/status/1265135521472315392?s=20


    確かに「画像」という単語は一般的過ぎるので「画像」をNGワードに入れておけば

    「ラーメンチェーンランキング」「がこちら」「あの」

    の3語で検索されるようになります。


    ただし、NGワードについては検索した後のツイートにNGワードが含まれている場合に表示しない、という機能でしたので、新規に「18. タイトルをキーワードとして使う際に含めないNGワード」機能を追加実装しました。

    「18. タイトルをキーワードとして使う際に含めないNGワード」に入力されたキーワードは、タイトルをキーワードとして使う際のキーワードからは除外されます。

    一方で、ツイート本文にNGワードが含まれていたら除外する設定は「19. ツイート本文に含めないNGワード」となりました。

    「18. タイトルをキーワードとして使う際に含めないNGワード」には一般的過ぎて含めると絞り込みができなくなるような単語を登録してフィルタリングするようにして下さい。


    また、NGワードや置き換え辞書がうまく機能していなかった件ですが、PHPのバージョンが上がり変数の型を厳しく見るようになったためでした。
    こちらは修正済みです。


    「タイトルをキーワードとして使う」機能のアドバイスですが、タイトルから自動的に取得しているため、必ずしも適切な検索ワードになるとは限りません。この辺、AIを搭載しているわけではないので日本語の難しさなどもあって、組み合わせによっては期待する検索結果にならない場合があります。ご了承下さい。

    「17. コンテンツ境界」を「漢字とカタカナ」にすることで解消する場合もあります。
    あるいはテーマが決まっていれば「5. ランダムキーワード」に特定のキーワードを仕込んでおくことで補正が効く可能性があります。


    なお、検索履歴はダッシュボードのトップに「Getwin稼働概要」というウィジェットが表示されているはずですので、その中の「検索履歴」を見ると使用されたキーワードが分かります。
    参考にしてみてください。

記事に戻る

コメントを残す

CAPTCHA