テキスト処理

Python動画編集!動画に位置制御したテロップを入れる方法

動画をYoutube等にアップロードする場合、ユーザビリティを考えてテロップを入れたい時があります。動画編集のソフトは有料無料様々ありますが、プログラムを自分で組むことができれば、細かい演出も自由自在です。ここではPythonで動画の任意の位置・時間にテロップを入れる方法を紹介します。

続きを読む

Pythonで画像に日本語文字を入れる方法

Pythonで画像処理をする場合はOpenCVが便利ですが、細かい機能はPillow等のライブラリが優秀だったりします。ここではPillowを使って日本語フォントを任意画像に描画する方法を紹介します。

続きを読む

PythonでGoogle検索タイトルとURL一覧を抽出してみた

近年Google検索は完全に情報収集の基本になっています。Webスクレイピングで自動情報収集をする場合、Google検索結果を扱えるようになると世界中の情報をシステマティックに処理できるようになります。ここでは、Google検索で得られるタイトルとURLを一覧で取得する方法を紹介します。

続きを読む

Python/Seleniumで便利なxpath検索をする方法!

PythonのSeleniumでWebスクレイピングを行う時、HTMLをどう効率良く分析するかが分析の焦点になります。xpathをトリガにした検索方法を使うと非常に簡単に目的の情報を抽出することができます。ここではseleniumのxpathによる検索方法を紹介します。

続きを読む

PythonのBeautifulSoupでWebスクレイピング!

PythonでWebにリクエストを送信し情報を取得した後、意味のある解析を行うためには適切にHTMLから情報を削ぎ落さなければなりません。ここではBeautifulSoup4を使った簡単なWebスクレイピング技術を紹介します。

続きを読む

Pythonテキスト処理!文章中からHTMLタグを取り除いてみた

前回当ブログでは、WebスクレイピングをするためにWebサイトにリクエストを送信して情報を取得する方法を紹介しました。しかし得られた情報はHTMLであるため様々なHTMLタグが密集していて、欲しい情報を抽出するにはもう少し処理が必要のようです。ここではHTMLタグを除去する方法を紹介します。

続きを読む