ペアプロット(行列散布図)は多変量データの良い可視化手法です。seabornなら一発ですが、細かい可視化条件を付け難いため、ここではPythonのmatplotlibで自作し、相関係数によって背景色が変わるようにしてみました。
続きを読む前処理
Python/Pandasで時系列データを月毎に集計する方法
Pandasは機械学習の入力データ前処理で重宝されるPythonのライブラリです。ここではPandasデータフレームで読み込んだタイムスタンプ付きの時系列データを月毎に集計(合計・平均・最大値・最小値)する方法を紹介します。
続きを読むPython/sklearnで学習データの前処理!標準化と正規化
機械学習を使って学習や予測を行う際は、データの前処理は欠かすことのできないプロセスです。ここではデータの標準化と正規化の概要と必要性、Pythonとscikit-learnによるコーディング例を紹介します。
続きを読む