Chrome

SeleniumのChromeをバックグラウンドで起動する方法

PythonでSeleniumを使うと、Google Chromeを自動操作することが可能です。実際にChromeが画面上に立ち上がる動作をしますが、決まった操作であればあえてPC画面に表示させる必要はありません。ここではSeleniumでChromeを使う時に画面に何も表示させないヘッドレス起動の方法を紹介します。

続きを読む

SeleniumのChromeをシークレットモードで起動する

PythonのSeleniumパッケージを使ってChromeを自動操作できることがわかりましたが、Chromeはユーザの操作履歴によってGoogle検索のランキングが変わるという特性があります。ここでは履歴情報を使わないPythonによるシークレットモードでChromeを起動する方法を紹介します。

続きを読む

PythonでGoogle検索タイトルとURL一覧を抽出してみた

近年Google検索は完全に情報収集の基本になっています。Webスクレイピングで自動情報収集をする場合、Google検索結果を扱えるようになると世界中の情報をシステマティックに処理できるようになります。ここでは、Google検索で得られるタイトルとURLを一覧で取得する方法を紹介します。

続きを読む

Chrome拡張!XPath Helperのインストールと使い方

PythonでWebスクレイピングのコーディングをしていると、xpathによる情報抽出が便利であるとわかりました。しかしHTMLの構造を毎回解析するのはやっかいです。Chrome拡張機能である「XPath Helper」を使えば簡単に任意要素のxpathを取得することが可能です。

続きを読む