機械学習ではホールドアウト法として1つのデータセットから訓練データとテストデータを分けることをよく行います。ここでは、Pythonのscikit-learnに含まれるtrain_test_splitを使った簡単なデータ分割方法を紹介します。
続きを読むAI
【G検定チートシート】AI関連法律や動向含む試験当日のカンペ
JDLAが主催するディープラーニングG検定は試験時にGoogle検索や書籍の参照がOKなWeb検定です。ここでは筆者が受験時に素早く用語の参照ができるようメモを残しておきます。
続きを読むPythonで相関係数別に色分けするペアプロットを自作してみた
ペアプロット(行列散布図)は多変量データの良い可視化手法です。seabornなら一発ですが、細かい可視化条件を付け難いため、ここではPythonのmatplotlibで自作し、相関係数によって背景色が変わるようにしてみました。
続きを読む【G検定の学習】ディープラーニングの概要と具体的な手法
JDLAが主催するG検定ではディープラーニングの全体像や各種問題点、手法に関する問題が出題されます。ここでは、ディープラーニングの概要と具体的な手法の紹介をしていきます。
続きを読む「What is PyTorch?」チュートリアルをやってみた
ディープラーニングのフレームワークであるPyTorchをインストールしましたが、最初は右も左もわからない状態だと思います。そんな時はまず公式ページのチュートリアル「What is PyTorch?」で使い方を覚えましょう。
続きを読むディープラーニング初心者がPyTorchを選んだ3つの理由
PyTorchはPythonでディープラーニングのコードが簡単に書けるようになるフレームワークです。ここではディープラーニング初心者である筆者が数あるフレームワークからPyTorchを選んだ理由とインストール方法を紹介します。
続きを読むPython/Pandasで時系列データを月毎に集計する方法
Pandasは機械学習の入力データ前処理で重宝されるPythonのライブラリです。ここではPandasデータフレームで読み込んだタイムスタンプ付きの時系列データを月毎に集計(合計・平均・最大値・最小値)する方法を紹介します。
続きを読む【G検定の学習】機械学習の具体的な手法や概要のまとめ
JDLAが主催するG検定では、ディープラーニング以外の機械学習手法に関する設問も出題されます。ここでは、主な機械学習手法の全般を体系的にまとめることで検定対策を行います。
続きを読むPython/k-means法で教師なし学習!クラスタリング概要
教師なし学習であるクラスタリングにはk-means法という手法があります。ここではk-means法のアルゴリズム概要を説明し、簡単に計算が可能なscikit-learnを使ったPythonによるサンプルコードを紹介します。
続きを読むPython/sklearnのk近傍法!kNNで多クラス分類する
k近傍法(kNN法)は数ある機械学習手法の中でも簡単なアルゴリズムを持っています。ここではkNN法の概要とPython/scikit-learnによるコードで実際に簡単な分類問題を解く方法を習得することを目標とします。
続きを読む