WP Rss Scrapeing Post Googleアラート取得時にHTMLタグを置き換える方法について | ワードプレス魔改造屋

WP Rss Scrapeing Post Googleアラート取得時にHTMLタグを置き換える方法について

お世話になっております。
ご質問がございます。

フィード登録で、サイトではなく、

グーグルアラートでキーワード登録したものをRSS取得しているのですが、

書き換え設定を有効にして登録しても、

本文に、<b>キーワード</b> と、

タグが表示して投稿されてしまいます。

この<b>と</b>タグは消すことが出来ないのでしょうか。

ちなみに、ビジュアルモードでは、<b>キーワード</b>と表示され、

テキストモードでは、<b>キーワード</b> と表示されます。

設定は以下のようにしています。

・共通の上級投稿設定では、
20. タイトルを書き換える文字列
24. 本文を書き換える文字列 に、

<b>::
</b>::
<b>::
</b>::
<b>キーワード</b>::キーワード
<b>キーワード</b>::キーワード

と色々試して設定しています。

・個別フィード登録設定でも、上級設定の
置き換え文字列(対象文字列::置換文字列。改行で複数指定)に

<b>::
</b>::
<::
b::
/b::
>::
<b::
</b::
<b>キーワード</b>::キーワード

と設定しています。

ここでは、

<b> と </b> は、

登録しても、

<b> と </b>

に変換されます。

コメント

  1. 2020/07/28(火) 23:26:13
    こちらでも試してみますので、GoogleアラートのRSSフィードURLを教えて下さい。

    上記の方法で消えない場合は取得している文書構造が見えているものと違う場合が考えられます。
  2. 2020/07/29(水) 21:31:17
    お世話になっております。
    • 2020/07/30(木) 07:18:46
      返信が途中で途切れているようですが続きはなんだったでしょうか?
  3. 2020/07/31(金) 13:01:54
    お世話になっております。

    GoogleアラートのRSSフィードURLはこちらです。

    https://www.google.com/alerts/feeds/12458572249284713596/1418853164723535469

    お手数おかけします。
    • 2020/07/31(金) 23:31:50
      試してみたところタイトルと本文にbタグが含まれるデータがありますね。
      結論から先に書くと、本文の書き換えはテンプレートのプレースホルダ「RSS_CONTENT」のみを対象にしていました。
      そのためそれ以外のRSSタイトルの置き換えは除外していました。

      通常、RSSタイトルにタグを含めるということはないと考えていたのですが、今回のようなケースを想定して、本文に含まれる全てのプレースホルダを本文書き換えの対象としました。

      新バージョン1.6.1にて対応済みです。アップデートをして下さい。

      なお、書き換え設定は「上級投稿設定」の「本文の書き換え」を「有効」にして、
      「本文を書き換える文字列」に

      <b>::
      </b>::

      とすれば削除されます。
      お試し下さい。
  4. 2020/08/03(月) 12:50:25


    お世話になっております。

    プラグインを更新しても依然として、
    タイトルも本文も<b>と</b>が含まれて投稿されています。


    設定は、上級投稿設定で、

    19. タイトルの書き換えを「有効」。
    20. タイトルを書き換える文字列
    <b>::
    </b>::


    23. 本文の書き換えを「有効」。
    24. 本文を書き換える文字列
    <b>::
    </b>::

    にしています。


    RSSフィード登録の設定も

    置き換え文字列(対象文字列::置換文字列。改行で複数指定)で、
    <b>::
    </b>::

    にしています。


    他に別の設定が必要なのでしょうか。

    • 2020/08/03(月) 13:31:52
      [ 上級投稿設定 ] の「20. タイトルを書き換える文字列」を空欄にして
      「21. タイトルを書き換える正規表現」に以下を記述してみてください。

      /<b>/::
      /<\/b>/::

      同じく本文の書き換え「24. 本文を書き換える文字列」を空欄にして
      「26. 本文を書き換える正規表現」に以下を記述して保存してみてください。

      /<b>/::
      /<\/b>/::


      その他、個別のRSSフィード登録の「上級設定」アコーディオンを開き「正規表現で削除するパターン」にも同じく

      /<b>/::
      /<\/b>/::

      と入力して保存して下さい。

      これで新規投稿からどうなるか様子を見て下さい。
  5. 2020/08/04(火) 09:54:35
    お世話になっております。

    上記のように設定と個別フィード登録に、
    入力して様子見しましたが、
    依然として<b>と</b>が表示されて投稿されています。
    • 2020/08/04(火) 10:04:40
      とすると、なにか前提が間違っている可能性が高いですね。
      [ 投稿設定 ] と [ 上級投稿設定 ] のスクリーンショットを撮ってアップロードしてみてください。
      設定を一通り確認させて頂きます。

      投稿編集画面(エディタ)とフロント(ブログ)側から見たスクリーンショットもお願いします。
      以上4枚のスクリーンショットを撮って下さい。


      また、[ 投稿設定 ] → 「6. タイトルの先頭に付ける文字列」に「こんにちは」と付けてみて、新規投稿されるタイトルの先頭全てに「こんにちは」がつくかチェックして下さい。

      最後に、他のプラグインやテーマが影響している可能性も考えられるので、デモサイトに登録してこれまで教えた置き換え方法を試してみてください。

      ▼デモサイト
      https://wp-rss-scraping-post.wp-pl-demo.site/demo/
    • 2020/08/04(火) 10:13:04
      応急処置も紹介しておきます。
      bタグがテキストの見た目が太字になることだけであれば、テーマのスタイルシートを変更することで回避できます。
      以下のようにスタイルシートを記述します。

      b { font-weight: normal; }

      テーマにスタイルシートを記述する方法はネットで検索するとたくさん出てくるので検索してみて下さい。

      ▼【ワードプレス】追加CSSを使ってカスタマイズしてみよう!
      https://www.akaeho.net/wordpress-edit-css/
  6. 2020/08/04(火) 11:23:01
    お世話になっております。

    [ 投稿設定 ] と [ 上級投稿設定 ] のスクリーンショットをアップします。

    お手数おかけいたします。

    [ 投稿設定 ] → 「6. タイトルの先頭に付ける文字列」に「こんにちは」と付けたので、
     ↑こちらは数時間後に確認してみます。


    ・bタグがテキストの見た目が太字になることだけであれば、テーマのスタイルシートを変更することで回避できます。

     ↑こちらは、見た目が太字になるのではなく、
    <b>と</b>が文字として表示される感じです。
    • 2020/08/04(火) 12:26:34
      原因分かりました。

      [ 投稿設定 ] → 「9.RSSデータのHTMLタグを無害化する」を「する」にしているとタグをエスケープした文字列に変換します。
      そのため、既に置き換え対象が山括弧ではなくなっているため置き換え候補から漏れていると思われます。

      「9.RSSデータのHTMLタグを無害化する」を「しない」にして置き換えを試してみて下さい。

      ▼参考資料 HTMLのタグをエスケープする方法
      https://hacknote.jp/archives/6935/
  7. 2020/08/04(火) 11:25:20
    画像アップロードの続きです。
  8. 2020/08/05(水) 12:03:26

    設定して確認しましたが、無事に投稿されているみたいです。

    お手数おかけいたしました。

    どうもありがとうございました。

記事に戻る

コメントを残す