データサイエンスの認知が高まるとともにデータ分析技術者の需要も高まってきました。Kaggleはコンペに参加することで、機械学習プログラミングのトレーニングも出来ます。ここでは始めの一歩としてKaggleアカウントの作成方法を紹介します。
こんにちは。wat(@watlablog)です。ここではデータサイエンティストの戦場かつ学び舎、Kaggleのアカウント新規作成方法を説明します!
Kaggleを始めるメリット
リアルなデータで機械学習の練習が出来る
データサイエンスの勉強を始めてまず直面する問題は、「練習問題がなかなか無い!」ということです。
当ブログのAIカテゴリでは、基本的な機械学習の手法をまとめていますが、そのほとんどは練習用に僕が作った仮想のデータです。
機械学習は未知のデータを予測するための手法であるため、作為的なデータでは訓練誤差も汎化誤差もご都合主義になりかねません。
Kaggleでは実在の企業や団体がリアルなデータを公開し、数多のデータサイエンティストが競い合った優秀なモデルを提供するというクラウド型のビジネスモデルです。
Kaggleに参加すると様々なデータセットをダウンロードすることが出来ます。これは全てがリアルワールドデータと呼ばれるデータセットであるため、練習におけるデータ不足に陥らないというメリットがあります。
上級者の戦略を学ぶことが出来る
Kaggleはコンペ(コンペティション:予測モデルを競い合う大会)で様々な問題に対しユーザが技術を競い合います。
実績に応じ、
Novice、Contributor、Expert、Master、Grandmasterといった称号を貰うことが出来ます。
特にExpertやMasterといった方々はデータ分析を本業としているプロも多く、初級データサイエンティストからすれば憧れとなります。
Kaggleでは、そんな上級者が実際に使ったコードが公開されていたり、コミュニティでディスカッションをしている所を僕達も見ることが出来ます。
機械学習はデータの前処理や特徴量エンジニアリングが最も重要とされているので、上級者がどういった戦略で特徴量を設計しどのような考えでモデルを選択しているかを知ることは、僕達初心者の最もためになるコンテンツだと思います。
賞金が出る
企業は実際に困っている問題についてKaggleにデータを提供し、ユーザからモデルを買うため、優秀なユーザには賞金が出るという意味になります。
(※賞金の無いコンペもあります)
これをモチベーションに技術を磨くというユーザも多くいるということで、人気要素の1つとなっています。
他にも就職に有利といったメリットも多数あります。
Kaggleの詳細については、以下の書籍にわかりやすく書かれているため、これからKaggleコンペ参加を考えている方は必読です。
Kaggleアカウントを新規作成する方法
Kaggleに参加するには新規にアカウントを作成しなければなりません。
まずは以下のリンクからKaggleの公式ページにアクセスしましょう。
しかし、海外サイトであるため当然全て英語です!参加するためには英語に慣れておく必要もありますが、ここでは本ページを見れば問題無いようにメモ程度に手順を残しておこうと思います。
公式ページにアクセスしたら、右上の「Register」(登録)をクリックします。
ここではメールアドレスによる登録を行います。他にもGoogleアカウントを利用して登録することも可能です。
「Register with your email」をクリックします。
次の画面で、
①自分のemailアドレスを入力、
②パスワードを入力、
③ユーザ名を入力、
④「ロボットではない」にチェックし、
⑤Nextをクリックします。
ここで、③のユーザ名は一度決めると変更が出来ないので注意(ランキング表示名は後で変更可能ですが、最初はこの名前になります)。
Privacy and Termsを読み、同意したら「I agree」をクリックします。
念のため日本語訳を載せておきます(DeepLによる約ですが(DeepLすごい))。
個人情報保護と利用規約
Kaggle:Privacy and Terms(DeepL翻訳)
Kaggleアカウントを作成するには、利用規約に同意する必要があります。
また、お客様がアカウントを作成する際には、以下の重要なポイントを含め、当社のプライバシーポリシーに記載されている通りにお客様の情報を処理します。
お客様がKaggleを使用する際に処理するデータ。
お客様がKaggleアカウントを設定すると、お客様のお名前やメールアドレスなどの情報が保存されます。
お客様がフォーラムの投稿やカーネルの共有などを行うためにKaggleを使用すると、お客様が作成した情報が保存されます。
我々は、クッキー、クリアGIF、またはウェブビーコンを含む様々なタイプの技術を使用して、当社のサービスにアクセスするために使用するアプリ、ブラウザ、およびデバイスに関する情報を収集します。
当社が処理する理由
当社では、このデータを、当社のプライバシーポリシーに記載されている目的のために処理します。
お客様が参加するコンテストの管理や、お客様がアップロードしたデータセットのホスティングなど、当社のサービスを提供するため。
不正や悪用から守ることでセキュリティを向上させる
Kaggleまたは我々が協力する第三者の活動に関連するメッセージを送信する
分析と測定を行い、当社のサービスがどのように利用されているかを理解する。
入力したメールアドレスに6文字のコードが届くため、「Six-digit code」に入力し、Nextをクリックします。
Welcomeページが表示されれば登録・アカウント作成完了です!
まとめ
今回はアカウント作成のみをまとめましたが、次回は実際にKaggleの利用方法やコンペの参加方法をまとめる予定です。
僕も2020年4月現在でまだ始めたばかりなので、是非一緒にKaggleを楽しみましょう!
これでKaggler…と呼ぶにはまだ早いですが、はやく言えるように(挫折しないように)したいですね!
Twitterでも関連情報をつぶやいているので、wat(@watlablog)のフォローお待ちしています!
コメント