Webスクレイピング

Pythonテキスト処理!文章中からHTMLタグを取り除いてみた

前回当ブログでは、WebスクレイピングをするためにWebサイトにリクエストを送信して情報を取得する方法を紹介しました。しかし得られた情報はHTMLであるため様々なHTMLタグが密集していて、欲しい情報を抽出するにはもう少し処理が必要のようです。ここではHTMLタグを除去する方法を紹介します。

続きを読む