トップへ
プラグイン購入
お試し体験版
お知らせ
お問い合せ
スクレイピングプレスのセレクタで削除するパターン(セレクタ::置換文字列 改行で複数指定)で指定タグが削除できない

スクレイピングプレスのセレクタで削除するパターン(セレクタ::置換文字列 改行で複数指定)で指定タグが削除できない


【その疑問や悩みについてネット検索で調査済みですか?】

はい

【その疑問や悩みはマニュアルには載っていないことですか?】

はい

【阿修羅ワークスのプラグインは全て最新ですか?】

はい

【結果として今どうなっていますか?】

セレクタで削除するパターン(セレクタ::置換文字列 改行で複数指定)で指定タグが削除できないです。
セレクタの指定の仕方が間違っているのかと思い、シンプルなdivやh1などで指定しても削除された形跡がないです。

そもそもの理解として、の中にあるスクレイピングした情報の中にあるタグを指定して、余計なタグを消して整形したいと考えていました。

1.の中でbodyタグ全体を指定してがつっと情報を取得する。
2.余計なタグがたくさんあるので、「セレクタで削除するパターン」という部分でいらない部分を消し、
3.必要な部分をテンプレートで追加

という使い方をしたいのですが何かアドバイスいただけると幸いです。

【何をしたらそうなったか直前の操作や変更箇所について教えて下さい。】

「セレクタで削除するパターン(セレクタ::置換文字列 改行で複数指定)」で
h1::アイキャッチ
div::ほほ

でなどと入力して検証したが、想定した挙動をしなかった。

【以前はどのような状態でしたか?】

動いていない。

【どのような状態になればいいと考えていますか?】

例えば、

<time class=\"update_day\" datetime=\"2020-11-29\"> 2020-11-29 更新</time><!–ソーシャルここから–>

というタグが取得していたとして、

time.class::\"\"

とするとこのタグの部分のみ削除されるという認識でいます。