WP Rss Scrapeing Post グーグルアラートで別の本文が表示される件 | ワードプレス魔改造屋

WP Rss Scrapeing Post グーグルアラートで別の本文が表示される件

お世話になっております。

グーグルアラートでキーワード登録して、RSSフィードを取得して、投稿しているのですが、
別の記事内容のコンテンツが表示されていることに気が付きました。

例えば3記事投稿された場合、以下のような感じで本文だけが重複投稿しています。

・記事タイトル1
・本文1

・記事タイトル2
・本文1

・記事タイトル3
・本文1

これをタイトルに応じた本文を表示するにはどうすれば良いでしょうか。

コメント

  1. 2020/08/20(木) 06:57:21
    ちょっと意味が捉えきれないので、スクリーンショットを送ってもらってもいいでしょうか?
    一緒に取得しているRSSフィードURLをお知らせ下さい。

    また、この現象が起きる頻度と条件などの考察があれば合わせてお書き下さい。
  2. 2020/08/20(木) 13:09:45

    サイトURL
    https://kimetsuantenna.com

    フィードURL
    https://www.google.com/alerts/feeds/12458572249284713596/1418853164723535469


    頻度は7記事ごとくらいで、同じ本文が連続しているで、

    スケジュール間隔の頻度で、一番上の記事の

     <div class=\"wp_rss_scrapeing_post-content\"> が

    読み込まれているのではないか?と思います。

  3. 2020/08/20(木) 13:12:51
    共通投稿設定と上級投稿設定のキャプチャーです。
  4. 2020/08/20(木) 13:15:00
    テンプレート設定と、環境設定と、個別フィードの上級設定のキャプチャーです。
  5. 2020/08/20(木) 15:32:59
    原因としてはRSSフィードに含まれるフィード自体が重複しているためだと思われます。

    例えば「歌うま声優、第1位は誰?『鬼滅の刃』21巻のイラストが泣ける…【7月人気記事ランキング】」という記事ですが、URLを開いてみると2種類あって以下の通りです。

    https://news.merumo.ne.jp/article/genre/9981795
    https://news.nicovideo.jp/watch/nw7923002

    同じ記事を別のサイトが引用しているわけですが、本文が微妙に構造が違うため同一投稿という判定はされません。
    Googleアラートの設定で重複したタイトルの記事を取得しないようにすることができれば検討してみてください。

    残念ながらプラグイン側では現在、手動にて消す以外は方法はありません。
  6. 2020/08/20(木) 16:23:30
    ご返信ありがとうございます。

    >原因としてはRSSフィードに含まれるフィード自体が重複しているためだと思われます。

    フィードが重複しない場合でも
    (同じ記事を別のサイトが引用せず、タイトルと本文が別コンテンツでも)

    こちらで投稿する本文だけは連続で重複して投稿されます。

    こちらでは、ひとまずテンプレートから
    <div class=\\\"wp_rss_scrapeing_post-content\\\">を外して、本文を表示せず、
    タイトルと引用元だけを投稿する設定にしてみようと思います。
    • 2020/08/20(木) 21:08:59
      この現象は最初から起こっていたのでしょうか?
      または最初は問題がなく、ある時から発生していたでしょうか?

      RSSの取得はWordPress内蔵のライブラリを使っていますが、ある時から発生したのであれば、WordPress内蔵のライブラリに問題がある可能性があります。
      先日、WordPressがバージョンアップした際にRSS関連もバージョンアップされていました。その辺も影響している可能性もあります。
  7. 2020/08/23(日) 14:24:03
    >この現象は最初から起こっていたのでしょうか?
    または最初は問題がなく、ある時から発生していたでしょうか?

    確認したところ、最初からのようです。
    とりあえず今は色々設定を変更して試みているところです。

  8. 2020/08/24(月) 14:43:58
    テンプレートの設定をから
    に変えて様子を見たところ、
    上手くいっているようです。
    • 2020/08/24(月) 14:53:44
      あーなるほど、そういうことですね。
      GoogleアラートのRSSフィードは特殊な(複数のサイトからコンテンツをキュレーションしている)ようなので、にデータが入っているようです。
      こちらを使ってうまくいくようであれば使い続けてみてください。

記事に戻る

コメントを残す