qnqn雑記

個人の学習ログの域は超えておりませんので間違っている可能性があり確かな情報を求められる場合は専門書等々に当たってください。体系的な情報については管理者ホームページへ(https://qnqn1927.github.io/)

Intermediate Machine Learning Lesson 1

Kaggle Learn's Intermediate Machine Learning micro-course

以下の人に最適なコース

  • 機械学習の経験がある
  • モデルの質を素早く向上させる方法を学びたい

このマイクロコースで機械学習の専門知識を身につけることができる。 学べるものは以下。

  • 実世界のデータセットでしばしばみられるデータタイプに取り組むこと(欠損値、カテゴリカル変数)
  • 機械学習コードの質を向上させるパイプラインを設計すること
  • モデル検証のための高度なテクニックを使用すること(クロスバリデーション)
  • kaggleのコンテストで勝利するために広く使われている最先端のモデルを構築すること(XGBoost)
  • データサイエンスでよくある重要なミスを避けること(リーク)

Exercise: Introduction

  • the Housing Prices Competition for Kaggle Learn Usersのデータを使う
  • アイオワ州の住宅価格を予測する
  • 住宅のほぼすべての側面を説明する79の説明変数を使う

とりあえず案内に従い進める。進めること自体は難しくはないと思うけど身につかないので、何をやっているか頭の中でイメージを働かせながら頑張る。 多分すぐに忘れるので定期的に訪れて復習して定着させるw

とりあえずsubmitまで完了。 これは「Intro to Machine Learning」のおかげでそこそこ覚えてた!